個人財務 グラフ処理Hadoopのダミー

グラフ処理Hadoopのダミー

目次:

ビデオ: R言語(統計解析ソフト) Handling Matrix 5 (Japanese) 2024

ビデオ: R言語(統計解析ソフト) Handling Matrix 5 (Japanese) 2024
Anonim

新しくNoSQLテクノロジーが登場するのは、グラフデータの保存と処理です。コンピュータ科学者は何十年にもわたってグラフ解析技術を開発してきたので、この声明は古いニュースだと考えるかもしれません。あなたが言うことはうまくいくかもしれませんが、新しいことは、Hadoopを使うことによって、大規模なグラフ分析を行うことができるということです。

グラフデータとは何ですか?データ用語の

グラフ は、個々のエンティティおよびそれらの関係の単なる表現である。グラフのエンティティは ノード (または 頂点 )と呼ばれ、グラフ内のエンティティ間の関係は エッジ (または 接続 >)。従来の行や列ではなく、グラフ内のデータセットを表すことで、オブジェクト間の関係を明確にする方法でデータを処理する方がはるかに簡単です。典型的なグラフの計算は、グラフ内の複数のノード間の最短パス距離、または単純に特定のノードと特定のタイプの接続を持つノードの数によって表されます。 <!グラフ分析のためのアプリケーション グラフデータベースの最もよく知られたアプリケーションは、既知のすべてのWebページ間のリンク関係を計算するGoogleのPageRankアルゴリズムです。 GoogleはWebを巨大なグラフとして表し、Webページはノードであり、あるページから別のページへのリンクはエッジとして表されます。 (Googleはグラフ分析プロジェクトを記述した論文(2010年にはPregel-backと書かれている)を公開し、富を共有しました。Googleが関心を持っていたグラフ処理には、各Webページのインバウンド接続の数が含まれていました。

<! Facebookは、HDFSに保存されたグラフを処理するために設計されたグラフ処理エンジンであるApache Giraph(Pregel紙に基づく)を使用していると発表したとき、2013年に大きな飛躍を遂げました。これはFacebookのユーザー(10億以上)とその友人(10億以上)のグラフを示し、Gipertの力を示しました。このスケールは驚異的です。あなたがFacebookで友人の推奨事項などの計算が必要な場合、グラフ処理エンジンよりも優れたツールは何ですか? Twitter、LinkedIn、OkCupid、Pinterestなど、注目すべきソーシャルメディアサイトの中心に分散グラフデータベースがあることは驚くことではありません。

<! - 3 - >

グラフ処理エンジンは、ソーシャルメディアサイトの多くの実用的な質問に簡単に答えることができます。 2つの例は、LinkedInがあなたと別のユーザーとの間の分離度が最短パス計算であることを示す方法です(2つのノード間で最も近い接続は何ですか?)、OkCupidが共通の関心を持つユーザーをどのように示すかは、協調フィルタリングの計算(特定のノードのセットに対する最も一般的な接続は何ですか?)です。

Hadoopでのグラフ分析

2014年春、Hadoopのグラフ分析は初期段階にとどまります。 Hadoop 2のYARNの登場により、Hadoopではグラフ解析やその他の特殊な処理技術が普及するようになります。この記事で言及されているソーシャルサイトの多くは、独自のグラフデータベースと処理エンジンを使用していますが、FacebookはGiraphの著名ユーザーです。 Facebookの(暗示された)承認の封印のため、GiraphはHadoopのグラフ分析に一般的な選択となっていますが、いくつかの制限があります。これは、データをグラフとしてクラスタのメモリにロードし、バッチ指向のクエリに最適化されているため、処理エンジンだけです。

もう1つのグラフ処理ソリューションは、Hadoop用のオープンソースのグラフ分析ツールセットをリリースしたAurelius社が提供しています。その提供の中心には、対話型クエリに最適化された持続層としてのHBaseを使用するグラフデータベースであるTitanと、TitanのグラフのスナップショットをHDFSに保存し、MapReduceジョブを実行するグ​​ラフ処理エンジンFaunus 。インタラクティブ(Titan)アプリケーションとバッチ(Faunus)アプリケーションの両方で、AureliusにはGremlinという共通のグラフトラバーサルAPIがあります。

最後に、Apache Sparkプロジェクトには、グラフデータの生成を可能にし、処理するSparkフレームワーク内のGraphXがあります。

グラフ処理Hadoopのダミー

エディタの選択

自転車の点検チェックリスト - ダミー

自転車の点検チェックリスト - ダミー

すぐに自転車の点検をするために数分。あなたの自転車を一時的に与えることは、あなたの次の乗り心地の安全性、快適性、そして楽しさを高めることができます。乗車準備の一環として、次の手順に従ってください:車輪のクイックリリースレバーを開閉して、確認します。

必須サイクリング用具 - ダミー

必須サイクリング用具 - ダミー

あなたはバイクの乗り心地をさらに楽しくするために何百万ものものを買うことができます。自転車用に必要なアクセサリーをいくつかご紹介します。ヘルメット:ヘルメットを着用することはオーストラリアとニュージーランドの法律です。

自転車の範囲を閲覧可能 - ダミー

自転車の範囲を閲覧可能 - ダミー

あなたはサイクリングをすることに決めましたが、その重要なキットを欠いている - バイク!あなたが望む自転車のタイプを正確に知っていない限り、良いアドバイスは、あなたの時間を費やして、自転車で何をするのか、どこに乗るのかを本当に考えてみることです。

エディタの選択

アプリとプライバシー - ダミーを特定する

アプリとプライバシー - ダミーを特定する

Spotifyアプリケーションに登録すると、あなたの個人的な詳細の一部にアクセスする。たとえば、Top10アプリを使用してプレイリストを公開するには、既存のFacebookアカウントにリンクする必要があります。このプロセス中、Facebookはあなたに特定の種類の共有を許可するかどうか尋ねます。

モバイル対応携帯電話を識別する - ダミー

モバイル対応携帯電話を識別する - ダミー

SpotifyモバイルはiPhoneで最も人気がありますが、優れたAndroidバージョン(basks Androidマーケットの5つ星評価のうち5つの評価では5位に入っています)が急速に追いついています。

特集 - ダミー

特集 - ダミー

スポットメイキングは、モバイルでも、あらゆる音楽への普遍的な即時アクセスを可能にしますデバイスまたはデスクトップコンピュータ。 Facebookは人々が古い友達と再会して新しい友達を作るのを助け、Spotifyの助けを借りて青春の歌を再発見し、友人や検索を通じて新鮮な音楽を発見しました。

エディタの選択

IOSアプリケーションでオブジェクト指向設計を使用する方法 - ダミー

IOSアプリケーションでオブジェクト指向設計を使用する方法 - ダミー

IOSは、動作がオブジェクトに関連付けられているプログラムを設計するさまざまな方法です。説明するために、紅茶とスープの作り方を検討することを検討してください。しかし、即座に代わりに活動に飛び込んではいけません。探偵が犯罪現場に入るように行動してください。

IOSアプリケーションでハイレベル抽象化を使用してビデオを再生する方法 - ダミー

IOSアプリケーションでハイレベル抽象化を使用してビデオを再生する方法 - ダミー

このセクションでは、MPMoviePlayerViewControllerクラスの高レベル抽象化を使用してiOSアプリケーションでビデオを再生する方法を説明します。 - (IBAction)playVideo:(id)sender {MPMoviePlayerViewController * moviePlayer = [[MPMoviePlayerViewController alloc] initWithContentURL:movieURL];このコードは、ビデオビューコントローラ内のTTTVideoViewControllerファイルからです。 [self presentMoviePlayerViewControllerAnimated:moviePlayer];}シンプルさ自体!必要なのはURLです。

IOSアプリケーションでJavaスクリプトオブジェクト表記を使用する方法 - ダミー

IOSアプリケーションでJavaスクリプトオブジェクト表記を使用する方法 - ダミー

JavaScript Object Notation (JSON)はiOSアプリのデータを表現する上で事実上の標準になっています。 JSONを使用して、Web上でデータを転送したり、長期保存データを保存および取得するためのフォーマットとして使用することができます。 JSONは、人間が読める形式であり、マシンが理解しやすい形式です。 JSONのデータは1つにまとめることができます...