ビデオ: Day 1 Keynote | Oculus Connect 6 2024
データウェアハウス、ビッグ・データ・スタックのレイヤー4、およびデータ・マートの付属品は、組織が意思決定者を支援するためにデータを最適化するために使用した主なテクニックでした。通常、データウェアハウスおよびマートには、さまざまなソースから集められた正規化されたデータが含まれており、ビジネスの分析を容易にするために組み立てられています。
データウェアハウスおよびマートは、レポートの作成と異種データ項目の視覚化を簡素化します。一般的には、リレーショナルデータベース、多次元データベース、フラットファイル、およびオブジェクトデータベース(基本的には任意のストレージアーキテクチャ)から作成されます。パフォーマンスが最優先事項ではない伝統的な環境では、基盤技術の選択は、企業データの分析、レポート作成、視覚化の要件によって促進されます。
<! - 1 - >データの編成と分析の準備が重要であるため、ほとんどのデータウェアハウスの実装はバッチ処理によって最新の状態に保たれます。問題は、バッチ・ロードされたデータ・ウェアハウスおよびデータ・マートが、多くのビッグ・データ・アプリケーションにとって不十分である可能性があることです。高速のデータストリームによって課されるストレスは、大規模なデータウェアハウスへのよりリアルタイムのアプローチを必要とする可能性が高いでしょう。
これは、分析データウェアハウスまたはデータマートをバッチプロセスで作成してフィードしないことを意味しません。むしろ、複数のデータウェアハウスまたはデータマートを持つことになり、アナリストと意思決定者の時間要件が反映されます。
<!多くのデータウェアハウスとデータマートは企業内のさまざまなソースから集められたデータで構成されているため、データのクレンジングと正規化に関連するコストも処理する必要があります。大きなデータを使用すると、いくつかの重要な違いがあります。従来のデータストリーム(トランザクション、アプリケーションなど)では、さまざまなデータが生成される可能性があります。
-
数多くの新しいデータソースも存在し、それぞれがある程度の操作を必要とするため、タイムリーでビジネスに役立ちます。
-
<! - 3 - >
コンテンツソースもクレンジングする必要があり、構造化されたデータで使用する場合とは異なる手法が必要になる場合があります。 -
歴史的に、データウェアハウスとデータマートの内容は組織され、戦略と計画を担当するビジネスリーダーに提供されました。大きなデータでは、新しいチームが意思決定にデータを活用しています。多くの大規模データの実装はリアルタイム機能を提供するため、企業はコンテンツを提供して、オペレーショナルロールを持つ個人が顧客サポート、販売機会、サービス停止などの問題にほぼリアルタイムで対応できるようにする必要があります。このように、大きなデータは、バックオフィスからフロントオフィスに行動を移すのに役立ちます。
既存の分析ツールとテクニックは、大きなデータを理解するのに非常に役立ちます。しかし、キャッチがあります。これらのツールの一部であるアルゴリズムは、潜在的にリアルタイムで異種のデータを大量に扱うことができなければなりません。これをサポートするためには、インフラストラクチャを設置する必要があります。また、分析ツールを提供するベンダーは、分散した実装全体でアルゴリズムが確実に動作するようにする必要があります。これらの複雑さのために、大きなデータを理解するのに役立つ新しいクラスのツールが必要です。
参照アーキテクチャのこの層には、3つのクラスのツールがある。彼らは意思決定者によって独立して、または集合的にビジネスを助けるために使用することができます。 3つのクラスのツールは、次のとおりです。
レポートとダッシュボード:
これらのツールは、“ユーザーフレンドリーな”様々な情報源からの情報の表現。従来のデータの世界では主流でしたが、この分野は大きなデータのために進化し続けています。使用されているツールのいくつかは、NoSQL(SQLだけではない)と総称される新しい種類のデータベースにアクセスできる従来のものです。
可視化:
-
これらのツールは、レポートの進化の次のステップです。出力は本質的に高度に対話的で動的な傾向があります。レポートと視覚化された出力の別の重要な違いは、アニメーションです。ビジネスユーザーは、マインドマップ、ヒートマップ、インフォグラフィックス、接続図などさまざまな視覚化手法を利用して、データの変化を見ることができます。レポートとビジュアライゼーションは、ビジネス活動の最後に発生します。 分析と高度な分析:
-
これらのツールはデータウェアハウスに到達し、人間が消費するためにデータを処理します。高度な分析では、既存のビジネスプラクティスに変革的でユニークな、または革新的な傾向やイベントを説明する必要があります。予測分析と感情分析は、この科学の良い例です。