個人財務 HadoopでのPig Latinアプリケーションフロー - ダミー

HadoopでのPig Latinアプリケーションフロー - ダミー

ビデオ: Hadoop Pig Tutorial For Beginners | What is Pig In Hadoop | Hadoop Pig Programming | Simplilearn 2025

ビデオ: Hadoop Pig Tutorial For Beginners | What is Pig In Hadoop | Hadoop Pig Programming | Simplilearn 2025
Anonim

Pig Latinは、データストリームとそれが流れるときにデータに適用される一連の変換を定義する dataflow 言語ですあなたのアプリケーションを通して。これは、一連の命令を記述する 制御フロー 言語(CやJavaなど)とは対照的です。

制御フロー言語では、ループや条件ロジック(if文のような)のような構文を使用します。あなたはPig Latinでループとif文を見つけることはできません。

<! Pigを使って作業することがMapやReduceプログラムを書かなくてはならない場合には、実際のP​​ig構文を見て始めてください:

A = LOAD 'データファイル。 TXT'; 。 B =グループ…; … C =フィルタ…; 。ダンプB; 。 「結果」にCを保存する。

この例のテキストの一部は、実際には英語のようです。少なくともこの時点ではあまり恐ろしいことではありません。順番に各行を見ると、Pigプログラムの基本的な流れを見ることができます。 (このコードは、スクリプトの一部でも、Gruntという対話シェルでも発行できます)。

<! - 2 - >

ロード:操作するデータを最初にロード(LOAD)します。
  1. <! - 1 - >

    一般的なMapReduceジョブと同様に、そのデータはHDFSに保存されます。 Pigプログラムがデータにアクセスするには、まずPigに使用するファイルを指示します。そのタスクでは、LOAD 'data_file'コマンドを使用します。

    ここで、 'data_file'はHDFSファイルまたはディレクトリを指定できます。ディレクトリが指定されている場合、そのディレクトリ内のすべてのファイルがプログラムにロードされます。

    <! - 3 - >

    データがPigにネイティブにアクセスできないファイル形式で格納されている場合は、オプションでUSING関数をLOAD文に追加して、読み込み可能なユーザー定義関数を指定できますデータを解釈して解釈する)。

    <! - 2 - >

    変換:変換のセットを使用してデータを実行します。変換のセットは、気になるものから遠く離れて、マップとリデュースのタスクのセットに変換されます。
  2. 変換ロジックは、すべてのデータ操作が行われる場所です。ここでは、関心のない行をフィルタリングし、2つのデータファイルセットを結合し、集計を構築するGROUPデータ、ORDER結果などを作成し、多くのことを行うことができます。

    <! - 3 - >

    ダンプ:最後に、結果をファイル
  3. または

    ストア

    (STORE)にダンプ(DUMP)してファイルのどこかに保存します。 通常、DUMPコマンドを使用して、プログラムをデバッグするときに出力を画面に送信します。プログラムが実稼働状態になると、DUMPコールをSTOREコールに変更するだけで、プログラムの実行結果は後で処理または分析するためにファイルに保存されます。

HadoopでのPig Latinアプリケーションフロー - ダミー

エディタの選択

Facebook上の人、アプリケーション、招待をブロックする方法 - ダミー

Facebook上の人、アプリケーション、招待をブロックする方法 - ダミー

設定は、Facebookで快適に過ごせるようにするための予防措置です。ブロックリストは通常​​、より反応的です。誰かがあなたのことを気にするFacebook上の何かをした場合、彼をブロックしたり、あなたが影響を及ぼす特定の行動をブロックすることを選ぶかもしれません。制限付きリスト、ユーザーブロック、ブロック...

Facebookのタイムラインカバーを変更する方法写真ダミー

Facebookのタイムラインカバーを変更する方法写真ダミー

Facebook、あなたのタイムラインはあなたの友人のものと比べて少し空白に見えるかもしれません。カバー写真が必要です。まもなくタイムラインがいっぱいになります。しかし、まず、人々があなたを見つけてあなたについて知ることができるように、基礎を記入したいと思っています。人々が最初にすることは...

正しいFacebookページタイプを選択する方法 - ダミー

正しいFacebookページタイプを選択する方法 - ダミー

サービス、またはビジネスを利用するには、Facebookのページオプションの賛否両論に気づく必要があります。あなたの6つの主要なオプションを見てみましょう:ローカルビジネスまたはプレースカンパニー組織または機関ブランドまたはプロダクトアーティストバンドまたは公共図エンターテインメント原因またはコミュニティ次の...

エディタの選択

他のKloutインフルエンサーを推薦する方法 - ダミー

他のKloutインフルエンサーを推薦する方法 - ダミー

インフルエンサーリストを使用してKloutが+ Kを与えると説明するアクションです。あなたのKloutスコアの一部は、他人から受け取った裏書の数に由来します。

あなたのソーシャルメディアメトリクスの目標を微調整する方法 - ダミー

あなたのソーシャルメディアメトリクスの目標を微調整する方法 - ダミー

ソーシャルメディア指標の目標を微調整するための販売漏れデータあなたの目標を微調整することの一部は、希望から​​マイルストーンに移行するまで、それらを磨くことです。人々がゴールを間違えていることのいくつかの例を以下に示します。これは希望、夢、偉大なものです。

Klout特典の電子メール通知を取得する方法 - ダミー

Klout特典の電子メール通知を取得する方法 - ダミー

Ifあなたは定期的にKloutを訪れる習慣ではないので、あなたはPerksの電子メールアラートを作成することができます。あなたがソーシャルメディアの世界でやっていることすべてを把握するのは難しいかもしれません。これはあなたのソーシャルメディア管理を簡素化するのに役立ちます。あなたがパルクの資格を得て、そして...

エディタの選択

Outlook 2002でパブリックフォルダで公開する - Microsoft ExchangeネットワークでOutlook 2002を使用する場合はダミー

Outlook 2002でパブリックフォルダで公開する - Microsoft ExchangeネットワークでOutlook 2002を使用する場合はダミー

パブリックフォルダを使用できます。パブリックフォルダは、グループ全体が見てアイテムを追加できる場所です。タスクや連絡先用のパブリックフォルダを持つことができます。

Outlookの迷惑メールフィルタを設定する方法 - ダミー

Outlookの迷惑メールフィルタを設定する方法 - ダミー

Outlookのオプション。非常に積極的に設定すると、迷惑メールが少なくなりますが、正当なメッセージを迷惑メールとマークすることがあります。それほど攻撃的ではないように設定すると、受信トレイにもっと迷惑をかけることになります。 Outlookに付属しています...

Outlook 2013で連絡先グループを作成する方法 - ダミー

Outlook 2013で連絡先グループを作成する方法 - ダミー

Outlook 2013で連絡先グループを作成する方法あなたのリストの名前を作り、あなたのシステムに保存した名前のコレクションから選ぶという単純な問題です。連絡先グループは電話番号とメールアドレス、電子メールアドレスだけを追跡しません。 ...