ビデオ: Apache Drill Introduction 2024
Apache DrillはApacheインキュベータの候補プロジェクトです。 Apache Drillは特に病気ではありません。 Apache Software Foundation(ASF)の候補技術はすべて、インキュベーター・プロジェクトとして始まり、公式のASF技術になる。 Apache Incubatorについて読むことができます。ドリルについて読むことができます。
GoogleのDremelテクノロジに触発されているDrillのパフォーマンス目標は、10,000以上のサーバーに分散された1ペタバイト以上のデータに対してSQLクエリを有効にすることです。この図は、Apache Drillのアーキテクチャーを示しています。
<! - 1 - >Drillアーキテクチャのキーは、各データノードに配置されたDrillBitサーバーであることがわかります。各サーバーにはクエリパーサ、コンパイラ、オプティマイザ、およびランタイムが含まれていますが、Zookeeperサーバーによって指名されたマスタDrillBitサーバーがあり、クエリの実行を監督し、暫定結果セットをまとめて単一の出力のセット。
<! - 2 - >Dremelと同様に、DrillはMapReduceと共存し補完することができますが、MapReduceはApache Hiveのようにクエリを実行するために使用されません。代わりに、 Drillbits と呼ばれる実行エンジンがDrillコミュニティのメンバーによって開発されました。
このコミュニティは、リアルタイムのビジネスインテリジェンスダッシュボード、不正検出、およびその他の時間に敏感なユースケースなどのアプリケーションに対して、低レイテンシのクエリを提供することを目的としています。ドリルは、Avro、JSON、Googleプロトコルバッファなどのネストされたデータ型をサポートしています。これらのネストされたデータ型では、非常に大きな非正規化テーブルが可能です。
<! - 3 - >ドリル開発チームは、SQL2003準拠を対象とした広範なSQLサポートの提供にも取り組んでいます。最後に、DrillチームがHBaseサポートを提供しているため、ユーザーはSQLを使用してHBaseテーブルを照会できるようになります。