Bigの部分ダミーチートシートのデータ
大規模なデータにより、大量の異種データを適切な速度で適切なタイミングで保管、管理、操作することができます。適切な洞察を得るために、大きなデータは通常、
-
ボリューム: データ量
-
速度: データ処理速度
-
バラエティ: データの種類
<! - 1 - >
ビッグデータを3つのVに単純化すると便利ですが、誤解を招きすぎて過度に単純化する可能性があります。たとえば、比較的少量の複雑なデータを管理している場合や、大量の非常に単純なデータを処理している場合があります。その単純なデータは、すべて構造化されていても、すべて非構造化されていてもよい。
さらに重要なのは、第4のV、 真実である。 そのデータはビジネス価値を予測するのにどれだけ正確ですか?大きなデータ分析の結果は実際には意味がありますか?正確性と文脈の両方に基づいてデータを検証できる必要があります。革新的なビジネスは、膨大な量のデータをリアルタイムで分析して、その顧客の価値とその顧客に追加のオファーを提供する可能性を迅速に評価できるようにすることが必要な場合があります。ビジネス成果に影響を与えるためにリアルタイムで分析できる適切な金額とデータの種類を特定する必要があります。
<! - 2 - >ビッグデータは、電子メール、ソーシャルメディア、テキストストリームなどの構造化データや構造化されていないデータを含む、あらゆる種類のデータを取り入れています。この種のデータ管理では、企業は構造化データと非構造化データの両方を活用する必要があります。