目次:
ビデオ: あなたも動かないと超ヤバい【格差社会の8つの裏話】アマゾンやフェイスブックのGAFAとAIと5Gとビッグデータと量子コンピュータ 2024
すべてのデータをどのようにまとめればよいでしょうか?大規模なデータプロジェクトでは、構造化データと非構造化データで何をしたいのかによって、なぜ1つのテクノロジを別のテクノロジよりも選択できるのかが示されます。また、このデータを適切な場所に配置するために受信データ構造を理解する必要性を判断します。
ビッグデータのさまざまなデータタイプを管理する
ビッグデータの特性と、それぞれのデータ管理システムの種類を考慮する必要があります。
データ型を大きなデータ環境に統合する
ビッグデータのもう1つの重要な側面は、多くの場合、使用するすべてのデータを所有する必要がないことです。多くの例がポイントを作っています。あなたは、ソーシャルメディアのデータ、サードパーティの業界統計から得られたデータ、または衛星から来るデータを活用しているかもしれません。ソーシャルメディアについて考えると分かります。
<!多くの場合、さまざまな情報源を統合する必要があります。このデータは、すべての内部システム、内部ソースと外部ソース、または完全な外部ソースからのものである可能性があります。このデータの多くは、以前は除外されていた可能性があります。データはリアルタイムであなたに届く必要はありません。あなたはそれをたくさん持っているかもしれませんし、それは本質的に異質です。これは依然として大きなデータ問題となり得る。もちろん、膨大な量のデータを高い速度で見ているシナリオにも直面する可能性があります。
<!要するに、さまざまなデータソースを切断された情報サイロの集合として扱う場合、ビジネス価値を得ることができないという点です。
必要なコンポーネントには、コネクタとメタデータが含まれます。コネクタ
さまざまな大きなデータソースからデータを取り込むためのコネクタがいくつか必要です。たぶんあなたはTwitterのコネクタやFacebookのものがほしいかもしれません。たぶん、データウェアハウスから大規模なデータソースを統合して、これらの両方のデータソースを一緒に分析できるようにする必要があります。
メタデータ
このすべてのデータを統合するための重要な要素は、メタデータです。
メタデータ
は、会社のデータ(およびソフトウェア)コンポーネントの検索、アクセス、および使用方法を記述するために使用される定義、マッピング、およびその他の特性です。メタデータの一例は、口座番号に関するデータである。これには、番号、説明、データタイプ、名前、住所、電話番号、およびプライバシーレベルが含まれます。 メタデータを使用すると、データストアを整理し、新しいデータソースを扱うことができます。メタデータの考え方は新しいものではありませんが、大きなデータのコンテキストで変化し、進化しています。従来のメタデータの世界では、すべてのデータソースの単一のビューを提供するカタログを持つことが重要です。 しかし、これらのデータソースをすべて管理していない場合は、このカタログが異なる必要があります。基礎となるメタデータの理解に役立つ分析ツールが必要な場合があります。