ビデオ: The Map of Mathematics 2024
ダミーチートシートのビッグデータの一部
非構造化データは、構造は予測できません。非構造化データの例には、文書、電子メール、ブログ、デジタル画像、ビデオ、および衛星画像が含まれます。また、機械やセンサーによって生成されるデータも含まれます。実際に、非構造化データは、企業や社外にあるTwitterやFacebookなどのプライベートおよびパブリック・ソースのデータの大半を占めています。
<! - 1 - >これまで、大部分の企業はこの膨大な量のデータを取得したり保存したりすることができませんでした。それは単に高すぎたり、あまりにも圧倒的だった。たとえ企業がデータを取得することができたとしても、データを簡単に分析して結果を使用して意思決定を行うツールはありませんでした。これら膨大な量のデータを理解できるツールはごくわずかです。存在していたツールは、使用するのが複雑であり、妥当な時間枠で結果を出さなかった。
<! - 2 - >結局、このデータを分析するために多大な努力をしたがっていた人は、データのスナップショットを作成するように強制されました。これは、特定のスナップショットにないため、重要なイベントを逃すという望ましくない影響を与えます。
非構造化データからビジネス価値を得る方法としてますます評価されつつあるアプローチの1つは、 テキスト分析、 非構造化テキストの分析、関連情報の抽出、および構造化情報への変換様々な方法で活用される。分析および抽出プロセスは、計算言語学、統計、および他のコンピュータサイエンス分野で生まれた技術を利用しています。