個人財務 Google DremelとHadoop - ダミー

Google DremelとHadoop - ダミー

ビデオ: Google I/O 2012 - Crunching Big Data with BigQuery 2025

ビデオ: Google I/O 2012 - Crunching Big Data with BigQuery 2025
Anonim

ほとんどの人にとって、 Dremel という用語は、家の周りのいろいろな職場でうまく機能する便利な高速、低トルクのツールに気づいています。しかし、GoogleがDremelを作成したことはご存知ですか?しかし、 別のハンドヘルド機械ツールを製作するのではなく、Googleは、大きなデータをインタラクティブに分析するための高速ソフトウェアツールを選択しました。 MapReduce、Google File System(HDFS)、BigTable(HBase参照)など、Hadoopエコシステムの一部にインスパイアされた他のGoogleテクノロジーと同様に、Googleは内部で使用するためにDremelを開発し、目的とデザイン技術の(言い換えれば、DremelはあなたのHadoopクラスタでダウンロードして使用できるものではありません。)

<! Googleは、ウェブクロールされた文書の分析、電子メールスパムの検出、アプリケーションクラッシュレポートの処理など、さまざまな業務にDremelを使用しています。 GoogleのBigQueryサービスは実際にDremelを使用します。

Googleは大量のデータをバッチ処理するためのMapReduce技術を設計しました。彼らのニーズが進展するにつれて、技術も向上しました。Googleは、大きなデータセットに対する対話型クエリのパフォーマンスを向上させるためにDremelを作成することに決めました。

<! MapReduceのアプローチはスケーラビリティとクエリフォールトトレランスを提供しますが、基本的にはバッチベースのシステムなので、小さなクエリ(データセット全体のうちのほんの一部のみを含むクエリ)の応答時間は、ユーザが期待するものではないことが多い。

Googleはインタラクティブクエリ用に設計されたクエリ実行テクノロジを開発しました。これはGoogleファイルシステム(GFS)上の中間サーバーで実行されます。 (GFSは、HadoopのファイルシステムであるApache HDFSのインスピレーションでした。)

<! - 3 - >

Hiveと同様に、DremelはSQLライクな言語(ほとんどのプログラマーにはよく知られています)を使用し、円柱データレイアウトを採用しています。 Dremelは、Apache Hiveにあるスケーラビリティとフォールト・トレランスを維持しながら、高速でインタラクティブなクエリ応答を提供します。 Dremelのホワイトペーパーでは、1兆行を超えるテーブルに対して数秒で集計クエリを実行する方法について説明しています。

Googleには内部で使用されているDremel技術がありますが、Dremel(「Drakkar Noir」にインスパイアされたすべての香水のようなもの)に触発されたすべての技術があります。

Google DremelとHadoop - ダミー

エディタの選択

を探る

を探る

遠く離れた場所でコンタクトを作るためにステーションを押す)は、すべてのハムラジオで2番目に古いアクティビティです。エーテルのどこかで、駅はいつも手の届かないところにあり、その駅に連絡するという挑戦がDX-ingの目的です。何千ものハムを横切っています...

エディタの選択

Excel 2007の開始と終了 - ダミー

Excel 2007の開始と終了 - ダミー

Microsoft Office Excel 2007には、プログラムを開始および終了するためのいくつかの方法があります。 [スタート]メニューまたはデスクトップショートカットを使用してExcelを開くことができます。 Excelを終了するには、Officeボタン、閉じるボタン、またはキーボードショートカットを使用します。 [スタート]メニューからExcel 2007を起動する。

Excelピボットテーブルの小計を抑制する - ダミー

Excelピボットテーブルの小計を抑制する - ダミー

Excelのピボットテーブルを使用すると、ダッシュボードとレポートの管理に時間を費やし、他の有益なことを行う時間を増やします。ピボットテーブルにフィールドを追加するたびに、Excelはそのフィールドの小計を追加します。ただし、小計を含めると小計を含めることができない場合もあります。

Excel 2007にあなたが印刷したいものを伝える - ダミー

Excel 2007にあなたが印刷したいものを伝える - ダミー

Excel 2007には、エリア。ワークエリア上の任意のセル選択を印刷領域として定義することができます。

エディタの選択

SharePoint 2010のダッシュボードデザイナ - ダミー

SharePoint 2010のダッシュボードデザイナ - ダミー

Business Intelligence(BI)サイトのホームページには、SharePoint 2010を使用するための2つのシナリオビジネスインテリジェンスのため。主な2つのシナリオは、Excel ServicesとPerformancePoint Servicesです。 Excel Servicesを使用すると、Excelスプレッドシートの一部をSharePointサイトに表示することができます。 Excel Servicesのサンプルを見ることができます。

SharePoint 2010検索ボックスWebパーツ、結果、および分析 - ダミー

SharePoint 2010検索ボックスWebパーツ、結果、および分析 - ダミー

サイトを検索する。エンドユーザーは、おそらく、すべてのSharePoint 2010サイトの右上隅にある使い慣れた検索ボックスを表示することに驚くことはありません。ユーザーはこの検索ボックスを使用して、表示しているサイトまたはリストを検索できます。サイトのカスタマイズされた検索エクスペリエンスが必要な場合があります。 By ...

SharePoint 2010リストタイプ - ダミー

SharePoint 2010リストタイプ - ダミー

SharePoint 2010は、情報の追跡に使用できるさまざまな種類のリストを提供します。リストは、ExcelスプレッドシートまたはAccessデータベースの表に似ています。最初に作成したときに空白のスプレッドシートとは異なり、SharePointにはいくつかの事前定義リストが用意されています。これらのリストには、列とフォームが含まれています。