個人財務 Hadoopベースのランディングゾーン - ダミー

Hadoopベースのランディングゾーン - ダミー

ビデオ: Technology Stacks - Computer Science for Business Leaders 2016 2025

ビデオ: Technology Stacks - Computer Science for Business Leaders 2016 2025
Anonim

分析環境将来のように見えるかもしれませんが、Hadoopをベースにしたランディングゾーンのパターンを再び偶然見つけます。実際には、将来の企業がITコストを節約しようとしており、革新的なデータ分析のプラットフォームを提供するようになっているため、着陸地帯は 着陸地帯はどうですか?最も基本的なレベルでは、

ランディングゾーン は、企業の中にデータが格納される中心的な場所にすぎません。たとえば、運用データベースやログファイルを生成するシステムからデータを毎週抽出します。 Hadoopは、次の理由からデータを格納するための便利なリポジトリです。 <! - 1 - >

あらゆる種類のデータを扱うことができます。
  • 簡単に拡張できます。

  • 安価です。

  • Hadoopにデータを格納すると、さまざまな方法でデータのクエリ、分析、または処理を柔軟に行うことができます。

  • この図はストーリーの一部のみを示しており、決して完全ではありません。結局のところ、データがどのようにランディングゾーンからデータウェアハウスに移動するかなどを知る必要があります。

<! - 2 - >

データウェアハウスの近代化に関する議論の出発点は、組織がデータウェアハウスをどのように使用し、IT部門が直面している課題であるかにあります。

1980年代、組織は業務情報をリレーショナルデータベース(販売取引やサプライチェーンの状況など)に保存することができれば、ビジネスリーダーはこのリレーショナルデータからレポートを生成したいと考え始めました。最も初期のリレーショナルストアは運用データベースで、オンライントランザクション処理(OLTP)用に設計されているため、できるだけ早くレコードを挿入、更新、または削除することができました。

<! - 3 - >

これは、大規模なレポート作成および分析のための実用的でないアーキテクチャなので、Relational Online Analytical Processing(ROLAP)データベースは、このニーズを満たすために開発されました。これにより、まったく新しい種類のRDBMS(データウェアハウス

、別のエンティティであり組織の運用データストアと並んで存在する)の進化がもたらされました。 これは、トランザクションを効率的に処理するために設計された運用データストアと、繰り返し分析およびレポートをサポートするように設計されたデータウェアハウスを備えています。 データウェアハウスのストレスはますます高まっています。理由は次のとおりです。

他の倉庫やデータマートで使用するためにデータを変換する処理リソースの需要が増加しました。

革新的な分析の需要が増加しました。アナリストは、すでに実行されている定期的なレポートの上に、倉庫データに関する質問を提出する必要があります。これにより、重大な追加処理が発生する可能性があります。

  • この図では、図の右端にリストされているさまざまな種類の分析の主要リソースとして提示されたデータウェアハウスを見ることができます。 Hadoopはさまざまな着信データソースからのデータを格納するランディングゾーンの概念を紹介しています。

  • Hadoopランディングゾーンを有効にするには、さまざまなデータソースからHDFSにデータを書き込む必要があります。リレーショナルデータベースの場合、良い解決策はSqoopを使うことです。

  • しかし、データの着陸は始まりにすぎません。

多くのソースからランディングゾーンにデータを移動する際には、必然的に問題になるのはデータの品質です。企業は、重要な詳細が異なる多くの運用データベースを持つことが一般的です。たとえば、顧客は「D. 1つのデータベースではdeRoos、別のデータベースでは「Dirk deRoos」です。

もう一つの品質問題は、顧客や職員からの手作業によるデータ入力に大きく依存しているシステムにあります。ここでは、データフィールドのファーストネームやラストネームの切り替えやその他の誤解を見つけることは珍しくありません。

データウェアハウス環境では、データ品質の問題は大きな問題です。そのため、他のシステムからのデータがウェアハウスにロードされるときに処理されるため、多くの努力がクレンジングと検証ステップに入ります。

trust

:質問するデータが汚れている場合は、レポート内の回答を信頼できません。

Hadoopのランディングゾーンではさまざまなソースからさまざまなデータセットにアクセスできる可能性がありますが、データの品質とデータの信頼性を考慮する必要があります。

Hadoopベースのランディングゾーン - ダミー

エディタの選択

Facebook上の人、アプリケーション、招待をブロックする方法 - ダミー

Facebook上の人、アプリケーション、招待をブロックする方法 - ダミー

設定は、Facebookで快適に過ごせるようにするための予防措置です。ブロックリストは通常​​、より反応的です。誰かがあなたのことを気にするFacebook上の何かをした場合、彼をブロックしたり、あなたが影響を及ぼす特定の行動をブロックすることを選ぶかもしれません。制限付きリスト、ユーザーブロック、ブロック...

Facebookのタイムラインカバーを変更する方法写真ダミー

Facebookのタイムラインカバーを変更する方法写真ダミー

Facebook、あなたのタイムラインはあなたの友人のものと比べて少し空白に見えるかもしれません。カバー写真が必要です。まもなくタイムラインがいっぱいになります。しかし、まず、人々があなたを見つけてあなたについて知ることができるように、基礎を記入したいと思っています。人々が最初にすることは...

正しいFacebookページタイプを選択する方法 - ダミー

正しいFacebookページタイプを選択する方法 - ダミー

サービス、またはビジネスを利用するには、Facebookのページオプションの賛否両論に気づく必要があります。あなたの6つの主要なオプションを見てみましょう:ローカルビジネスまたはプレースカンパニー組織または機関ブランドまたはプロダクトアーティストバンドまたは公共図エンターテインメント原因またはコミュニティ次の...

エディタの選択

他のKloutインフルエンサーを推薦する方法 - ダミー

他のKloutインフルエンサーを推薦する方法 - ダミー

インフルエンサーリストを使用してKloutが+ Kを与えると説明するアクションです。あなたのKloutスコアの一部は、他人から受け取った裏書の数に由来します。

あなたのソーシャルメディアメトリクスの目標を微調整する方法 - ダミー

あなたのソーシャルメディアメトリクスの目標を微調整する方法 - ダミー

ソーシャルメディア指標の目標を微調整するための販売漏れデータあなたの目標を微調整することの一部は、希望から​​マイルストーンに移行するまで、それらを磨くことです。人々がゴールを間違えていることのいくつかの例を以下に示します。これは希望、夢、偉大なものです。

Klout特典の電子メール通知を取得する方法 - ダミー

Klout特典の電子メール通知を取得する方法 - ダミー

Ifあなたは定期的にKloutを訪れる習慣ではないので、あなたはPerksの電子メールアラートを作成することができます。あなたがソーシャルメディアの世界でやっていることすべてを把握するのは難しいかもしれません。これはあなたのソーシャルメディア管理を簡素化するのに役立ちます。あなたがパルクの資格を得て、そして...

エディタの選択

Outlook 2002でパブリックフォルダで公開する - Microsoft ExchangeネットワークでOutlook 2002を使用する場合はダミー

Outlook 2002でパブリックフォルダで公開する - Microsoft ExchangeネットワークでOutlook 2002を使用する場合はダミー

パブリックフォルダを使用できます。パブリックフォルダは、グループ全体が見てアイテムを追加できる場所です。タスクや連絡先用のパブリックフォルダを持つことができます。

Outlookの迷惑メールフィルタを設定する方法 - ダミー

Outlookの迷惑メールフィルタを設定する方法 - ダミー

Outlookのオプション。非常に積極的に設定すると、迷惑メールが少なくなりますが、正当なメッセージを迷惑メールとマークすることがあります。それほど攻撃的ではないように設定すると、受信トレイにもっと迷惑をかけることになります。 Outlookに付属しています...

Outlook 2013で連絡先グループを作成する方法 - ダミー

Outlook 2013で連絡先グループを作成する方法 - ダミー

Outlook 2013で連絡先グループを作成する方法あなたのリストの名前を作り、あなたのシステムに保存した名前のコレクションから選ぶという単純な問題です。連絡先グループは電話番号とメールアドレス、電子メールアドレスだけを追跡しません。 ...