目次:
- 大きなデータの有効性
- 有効なデータがあり、結果の真実性を証明できる場合、ニーズを満たすためにデータを「生きる」必要があるのはいつですか?標準的なデータ設定では、時間の経過とともに、データを扱うために重要なデータを理解しているため、データを何十年も保持することができます。あなたは、作業プロセスにマッピングされるデータ通貨と可用性に関するルールを確立しています。
ビデオ: Our Miss Brooks: Mash Notes to Harriet / New Girl in Town / Dinner Party / English Dept. / Problem 2024
大容量、高品位、高速度は、ビッグデータ。しかし、大規模データの他の特性も同様に重要です。特に、大規模なデータを運用プロセスに適用する場合は重要です。
-
妥当性: データは、意図された用途に対して正確かつ正確であるか?
-
真実性: 与えられた問題空間に対して結果は意味がありますか?
<! - 1 - > -
ボラティリティ: このデータを保存するのに必要な期間は?
大きなデータの有効性
正確な結果が必要です。しかし、ペタバイトのデータを分析する初期段階では、各データ要素の有効性について心配する必要はありません。大きなデータの最初のストリームは、実際にはかなり汚いかもしれません。初期段階では、すべての要素が有効であることを保証するよりも、この大規模なデータソース内の要素間に関係が存在するかどうかを確認することが重要です。
<!しかし、最初のデータ分析の一部が重要であると組織が判断した後、この大部分のデータの大部分を検証する必要があります。これは、これが運用条件に適用されるためです。データが探索的から実行可能に移行するとき、データを検証する必要があります。意思決定に結果を使用する場合は、大きなデータソースの有効性とその後の分析が正確でなければなりません。<! - 3 - >
有効な入力データに続いてデータを正しく処理すると、正確な結果が得られます。大きなデータでは、妥当性に関して特別な注意が必要です。例えば、医療では、患者の病気の症状に関連する可能性のある臨床試験のデータがあるかもしれません。しかし、その人を治療している医師は、臨床試験の結果を検証せずにそのまま受け入れることはできません。天気衛星が、世界の一部で嵐が始まっていることを示していると想像してください。その嵐はどのように個人に影響を与えますか?約50億人のユーザーが、Twitterストリームを分析して、暴風が地元住民に及ぼす影響を判断することは可能です。したがって、Twitterを気象衛星のデータと組み合わせて使用すると、研究者は天気予報の真実性を理解するのに役立ちます。
大きなデータの変動性
有効なデータがあり、結果の真実性を証明できる場合、ニーズを満たすためにデータを「生きる」必要があるのはいつですか?標準的なデータ設定では、時間の経過とともに、データを扱うために重要なデータを理解しているため、データを何十年も保持することができます。あなたは、作業プロセスにマッピングされるデータ通貨と可用性に関するルールを確立しています。
たとえば、一部の組織では、最新の1年間の顧客データとトランザクションをビジネスシステムに保存するだけの場合があります。これにより、必要なときにこの情報を迅速に取得できます。前年を見なければならない場合、ITチームは要求を尊重するためにオフラインストレージからデータを復元する必要があります。大きなデータでは、この問題は拡大されます。
ストレージが限られている場合は、大きなデータソースを参照して、収集する必要があるものと保存する必要がある期間を判断します。いくつかの大きなデータソースでは、迅速な分析のためにデータを収集するだけでよいでしょう。
その後、処理を続けるために情報をローカルに保存することができます。このデータすべてに十分なストレージがない場合は、データを「オンザフライ」で処理し、関連する情報をローカルに保存するだけです。大きなデータをどのくらいの期間利用可能にするかは、いくつかの要因によって決まります。
ソースに保管されているデータの量は?
-
データを繰り返し処理する必要がありますか?
-
データを処理し、追加データを収集し、処理を追加する必要がありますか?
-
データ保管が必要な規則や規制がありますか?
-
あなたの顧客は自分の仕事のためにあなたのデータに依存していますか?
-
データに価値があるのか、もはや関連性がなくなっていますか?
-
ビッグデータの量、種類、および速度のために、ボラティリティを理解する必要があります。一部の情報源では、データは常にそこに存在します。他の人にとっては、そうではありません。どのデータがそこにあるのか、大きなデータの保存要件とポリシーを定義するのに役立つ期間を理解することができます。
消費者としては、商品やサービスをいつ、どのように購入するかについて、大きなデータがより良いプロファイルを定義するのに役立ちます。患者として、大きなデータは、治療と健康維持のよりカスタマイズされたアプローチを定義するのに役立ちます。専門家として、大きなデータは、製品やサービスを設計して提供するためのより良い方法を特定するのに役立ちます。
これは、大きなデータが企業や組織の業務プロセスに統合されている場合にのみ発生します。