大量の冷たいデータを格納するだけでなく、伝統的なデータウェアハウスでは、変換リソース(ELT)の作業負荷が増加していることがわかります。
Hadoopを前処理エンジンとして使用してデータ変換を処理するという考えは、貴重な処理サイクルが解放され、データウェアハウスが本来の目的に準拠することを可能にします。ここでも、Hadoopが従来のデータウェアハウスの導入を補完し、生産性を向上させる方法を見ています。
<!おそらく、Hadoopのデータ処理能力に完全に適合する変換作業があります。リレーショナルデータベースエンジン上でSQLを実行する方が良い選択肢となる代数的な段階的な作業では、多くの変換作業が行われています。私がHadoopでSQLを実行できるのであれば、それはクールではないでしょうか? " <! - 2 - >
HadoopのSQLは既にここにあります。 Hadoopのデータに対してSQLクエリを発行できるため、データフローに対するETLアプローチだけでなく、ELTのようなアプリケーションを導入することもできます。考慮すべきもう1つのハイブリッドアプローチは、Hadoopまたはデータウェアハウスで変換ロジックをどこで実行するかです。一部の組織では、倉庫での分析を実行することに懸念がありますが、リレーショナルデータベースはSQLを実行する上で優れており、Hadoopよりも変換を実行するための実用的な場所になる可能性があります。