個人財務 ストリーミングデータの流れ

ストリーミングデータの流れ

ビデオ: 【初級】AWSでのデータ収集、分析、そして機械学習 | AWS Summit Tokyo 2019 2025

ビデオ: 【初級】AWSでのデータ収集、分析、そして機械学習 | AWS Summit Tokyo 2019 2025
Anonim

それをすべて保存することは困難であり、不可能でさえあります。実際、それをすべて保存することは役に立たないかもしれません。インターネット上で1分以内に起こると予想されるもののいくつかの数字があります。

  • 1億5,000万通の電子メールが送信されました
  • 350,000件の新しいツイートがTwitterで送信されました。 Googleでリクエストされた400万件のクエリ
  • 700、Facebookのアカウントにログインしている人
  • <! - 1 - >
このような量があれば、増分分析のために一日中データを蓄積することは効率的ではないように思われるかもしれません。どこかに保管しておいて、それを次の日または翌日に分析するだけです(データベースとデータウェアハウスの典型的な広範なアーカイブ戦略です)。しかし、有益なデータ問合せでは、ストリーム内の最新のデータを尋ねる傾向があり、データが古くなると有用性が低下します(金融などの一部のセクタでは、1日が長時間かかることがあります)。

<!明示的に到着するデータがさらに増えると予想され(データの量は毎日増えます)、新しいデータをプッシュする際に、リポジトリからデータを取り出すことは不可能ではないにしても難しくなります。新しいデータが流入すると、リポジトリから古いデータを引き出すことは、シジフスの処罰に似ています。シシフスは、ギリシア神話のナレーションとして、神からの恐ろしい罰を受けました。ゼウス:丘の頂上に永遠に巨大な岩を巻くように強制され、毎回ロールバックするのを見るだけです。

<!ディスクに書き込むことが不可能なように、データが非常に高速かつ大量に到着することがあります。新しい情報は、ディスクに書き込むために必要な時間よりも早く到着します。ハードディスク。これは、大型ハドロン・コライダーなどの粒子加速器による粒子実験に典型的な問題であり、科学者はどのデータを保存するかを決定する必要があります。もちろん、キューが急速に成長し、維持することが不可能になるので、しばらくの間、データをキューに入れることはできますが、あまり長くはしないでください。たとえば、メモリに保持されていると、キューのデータがすぐにメモリ不足エラーに繋がります。新しいデータフローは古いデータに対する以前の処理を廃止し、遅延を解決するものではないため、膨大かつ変化するデータ量を即座に処理するための複数の戦略を考案しました。人々は大量のデータを処理するために3つの方法を使用します。

格納:

後で不明な質問に答えるのに役立つ可能性があるため、一部のデータが保存されます。この方法は、それがどれほど大量であってもすぐにそれを保存し、後でそれを非常に高速で分析する技術に依存しています。

要約:

一部のデータは要約されています。重要なデータだけが保持されます。

  • 消費: 残りのデータは、その使用量が予め決められているので消費される。アルゴリズムは即座にデータを読み取り、消化し、情報に変換することができます。その後、システムは永久にデータを忘れてしまいます。
  • 大量のデータがコンピュータシステムに到着したときには、ストリーミングデータ、データストリーム、データ消防ホースなど、水に比べて聞こえることがよくあります。 データストリームが水道水を消費するようなものであることを発見しました。タップを開くと、水をカップや飲料ボトルに保存したり、料理、食器の洗浄、プレートの洗浄、手洗いに使用できます。いずれにしても、水のほとんどまたはすべてがなくなっていますが、それは非常に有用で実際に重要であることがわかります。
ストリーミングデータの流れ

エディタの選択

Facebook上の人、アプリケーション、招待をブロックする方法 - ダミー

Facebook上の人、アプリケーション、招待をブロックする方法 - ダミー

設定は、Facebookで快適に過ごせるようにするための予防措置です。ブロックリストは通常​​、より反応的です。誰かがあなたのことを気にするFacebook上の何かをした場合、彼をブロックしたり、あなたが影響を及ぼす特定の行動をブロックすることを選ぶかもしれません。制限付きリスト、ユーザーブロック、ブロック...

Facebookのタイムラインカバーを変更する方法写真ダミー

Facebookのタイムラインカバーを変更する方法写真ダミー

Facebook、あなたのタイムラインはあなたの友人のものと比べて少し空白に見えるかもしれません。カバー写真が必要です。まもなくタイムラインがいっぱいになります。しかし、まず、人々があなたを見つけてあなたについて知ることができるように、基礎を記入したいと思っています。人々が最初にすることは...

正しいFacebookページタイプを選択する方法 - ダミー

正しいFacebookページタイプを選択する方法 - ダミー

サービス、またはビジネスを利用するには、Facebookのページオプションの賛否両論に気づく必要があります。あなたの6つの主要なオプションを見てみましょう:ローカルビジネスまたはプレースカンパニー組織または機関ブランドまたはプロダクトアーティストバンドまたは公共図エンターテインメント原因またはコミュニティ次の...

エディタの選択

他のKloutインフルエンサーを推薦する方法 - ダミー

他のKloutインフルエンサーを推薦する方法 - ダミー

インフルエンサーリストを使用してKloutが+ Kを与えると説明するアクションです。あなたのKloutスコアの一部は、他人から受け取った裏書の数に由来します。

あなたのソーシャルメディアメトリクスの目標を微調整する方法 - ダミー

あなたのソーシャルメディアメトリクスの目標を微調整する方法 - ダミー

ソーシャルメディア指標の目標を微調整するための販売漏れデータあなたの目標を微調整することの一部は、希望から​​マイルストーンに移行するまで、それらを磨くことです。人々がゴールを間違えていることのいくつかの例を以下に示します。これは希望、夢、偉大なものです。

Klout特典の電子メール通知を取得する方法 - ダミー

Klout特典の電子メール通知を取得する方法 - ダミー

Ifあなたは定期的にKloutを訪れる習慣ではないので、あなたはPerksの電子メールアラートを作成することができます。あなたがソーシャルメディアの世界でやっていることすべてを把握するのは難しいかもしれません。これはあなたのソーシャルメディア管理を簡素化するのに役立ちます。あなたがパルクの資格を得て、そして...

エディタの選択

Outlook 2002でパブリックフォルダで公開する - Microsoft ExchangeネットワークでOutlook 2002を使用する場合はダミー

Outlook 2002でパブリックフォルダで公開する - Microsoft ExchangeネットワークでOutlook 2002を使用する場合はダミー

パブリックフォルダを使用できます。パブリックフォルダは、グループ全体が見てアイテムを追加できる場所です。タスクや連絡先用のパブリックフォルダを持つことができます。

Outlookの迷惑メールフィルタを設定する方法 - ダミー

Outlookの迷惑メールフィルタを設定する方法 - ダミー

Outlookのオプション。非常に積極的に設定すると、迷惑メールが少なくなりますが、正当なメッセージを迷惑メールとマークすることがあります。それほど攻撃的ではないように設定すると、受信トレイにもっと迷惑をかけることになります。 Outlookに付属しています...

Outlook 2013で連絡先グループを作成する方法 - ダミー

Outlook 2013で連絡先グループを作成する方法 - ダミー

Outlook 2013で連絡先グループを作成する方法あなたのリストの名前を作り、あなたのシステムに保存した名前のコレクションから選ぶという単純な問題です。連絡先グループは電話番号とメールアドレス、電子メールアドレスだけを追跡しません。 ...