個人財務 データストリームの要素数を見つける方法 - ダミー

データストリームの要素数を見つける方法 - ダミー

ビデオ: Microsoft Ignite 2019 Vision Keynote 日本語同時通訳版 2025

ビデオ: Microsoft Ignite 2019 Vision Keynote 日本語同時通訳版 2025
Anonim

Bloomフィルタはストリームから到着するオブジェクトを追跡できますが、そこに存在するオブジェクトの数はわかりません。 1で満たされたビットベクトルは(ハッシュの数と衝突の確率に応じて)同じアドレスでハッシュされているオブジェクトの真の数を隠すことができます。特定のウェブサイトのページを何人の別個のユーザが見たか、または異なる検索エンジンのクエリの数を知りたい場合など、様々な状況において、オブジェクトの異なる数を知ることは有用である。すべての要素を格納し、その中に重複を見つけることは、特にストリームから来る何百万もの要素では機能しません。ストリーム内の別個のオブジェクトの数を知りたければ、依然としてハッシュ関数に頼る必要がありますが、アプローチには数字のスケッチが必要です。

<! - 1 - >

スケッチ

は、近似を取ることを意味します。つまり、不正確ではありませんが、完全に間違った値ではありません。近似値は実際の値がそれほど遠すぎないので許容できます。このスマートなアルゴリズムでは、確率と近似に基づく HyperLogLog は、ストリームから生成された数の特徴を観察します。 HyperLogLogは、コンピュータ科学者ナイジェル・マーティンとフィリップ・フラホレの研究から得られたものです。 Flajoletは、 Flajolet-Martin (またはLogLogアルゴリズム)の初期アルゴリズムを、より強力なHyperLogLogバージョンに改良しました。これは <! - 2 - >

ハッシュは、ストリームから受け取ったすべての要素を数値に変換します。
  1. アルゴリズムは、数値をコンピュータが使用する基本2の数値標準であるバイナリに変換します。
  2. このアルゴリズムは、2進数の最初の0の数と、それが見る最大数のトラックをカウントします。これは
  3. n です。アルゴリズムは、nを使用してストリーム内で受け渡される個別要素の数を推定する。異なる要素の数は2 ^ n
  4. です。 <! - 3 - > たとえば、文字列の最初の要素は
という語です。

アルゴリズムは整数値にハッシュし、結果を01101010としたバイナリに変換します。数字の先頭には1つのゼロしか表示されないため、アルゴリズムはそれを末尾のゼロの最大数として記録します。アルゴリズムは、バイナリ相当語が11101011と01101110である単語 parrot と Wolf を見て、nは変更しません。しかし、単語 cat が合格すると、出力は00101110になるので、nは2になります。別個の要素の数を推定するために、アルゴリズムは2 ^ n、つまり2 ^ 2 = 4を計算します。図はこのプロセスを示しています。 先行ゼロのみを数えます。 アルゴリズムのトリックは、ハッシュが(Bloomフィルタのように)均等に分布したランダムな結果を生成している場合、バイナリ表現を見ることで、一連のゼロが現れる確率を計算することができるということです。 1つの2進数が0になる確率は2の1であるため、0のシーケンスの確率を計算するには、0のシーケンスの長さの1/2倍の確率を掛けます:

50% 00 999で始まる数字に対して0 999 25%(1/2 * 1/2)の確率で始まる数に対して(1/2)確率を計算する。 k零で始まる数の000(9)(1/2)^ k確率で始まる5%(1/2 * 1/2 * 1/2)の確率。同じ番号)

HyperLogLogで見られる数字が少ないほど、不正確さが大きくなります。異なるハッシュ関数を使用してHyperLogLog計算を何度も使用し、各計算からの回答を平均化すると、精度が向上しますが、ハッシュに何度も時間がかかり、ストリームが高速です。代わりに、同じハッシュを使用できますが、ストリームをグループに分割します(たとえば、到着順序に基づいて到着するように要素をグループに分けるなど)。グループごとに、末尾のゼロの最大数を追跡します。最後に、各グループの個別要素の見積もりを計算し、すべての見積もりの​​算術平均を計算します。このアプローチは確率的な平均化であり、アルゴリズムをストリーム全体に適用するよりも正確な推定値を提供します。

データストリームの要素数を見つける方法 - ダミー

エディタの選択

SketchUpのステータスバー - ダミー

SketchUpのステータスバー - ダミー

SketchUpのステータスバーには、モデリング中に使用するコンテキスト情報が含まれています。モデリングウィンドウの下の狭い情報には、情報の良さが満載されています。コンテキスト固有の指示:ほとんどの場合、ここでは何をしているのかを確認するためにここでチェックします。モディファイアキー(組み合わせて使用​​するキーボードストローク)

スケッチツールにインテリジェントに反応するよう設計されたダミー

スケッチツールにインテリジェントに反応するよう設計されたダミー

ダイナミックコンポーネント(DC) SketchUpが提供する真の魔法に最も近いもの。あなたがそれらを拡大縮小するときに、伸ばしたり歪んだりするのではなく、寸法を変更するはずの部品は、他の部分はしません。

SketchUpの投影テクスチャ曲線にテクスチャを追加する方法 - 複雑な曲線に画像を描くためのダミー

SketchUpの投影テクスチャ曲線にテクスチャを追加する方法 - 複雑な曲線に画像を描くためのダミー

SketchUpのサーフェスには、このメソッドの代わりはありません。地形の塊は、複雑な曲面の良い例です - 凹凸、ねじれ、波紋、多方向。扱っているカーブが単純な押し出しよりも複雑な場合は、この画像マッピングテクニックを使用する必要があります。キー...

エディタの選択

QuickBooks 2013のアイテムリストにSales Tax ItemまたはGroupを追加する方法 - ダミー

QuickBooks 2013のアイテムリストにSales Tax ItemまたはGroupを追加する方法 - ダミー

販売税の対象となる商品を販売する場合、QuickBooks 2013請求書には、これらの売上税を請求して追跡する広告申込情報も含まれます。これを行うには、売上税明細を登録します。販売税項目を登録するには、新規項目ウィンドウを表示し、タイプ...から販売税項目を選択します。

QuickBooks 2012のアイテムリストにサービスアイテムを追加する方法 - ダミー

QuickBooks 2012のアイテムリストにサービスアイテムを追加する方法 - ダミー

QuickBooks 2012でサービスアイテムを使用して、サービスを表すアイテムを購入または請求します。たとえば、CPAは、個人や企業に対して納税申告書を作成します。納税申告書を準備するためにクライアントに請求する場合、納税申告書の請求書に表示される明細はサービス項目です。 ...

QuickBooks 2013のアイテムリストにサービスアイテムを追加する方法 - ダミー

QuickBooks 2013のアイテムリストにサービスアイテムを追加する方法 - ダミー

QuickBooks 2013のサービスアイテムを使用して、サービスを表すアイテムを購入または請求します。たとえば、CPAは、個人や企業に対して納税申告書を作成します。納税申告書を準備するためにクライアントに請求する場合、納税申告書の請求書に表示される明細はサービス項目です。 ...

エディタの選択

WordPressブログのユーザーと著者を管理する方法 - ダミー

WordPressブログのユーザーと著者を管理する方法 - ダミー

WordPressユーザーページには、あなたのブログのすべてのユーザーが表示されます。各ユーザーのユーザー名、名前、電子メールアドレス、ブログの役割、およびブログに投稿された投稿の数が表示されます。フォロワー:このデフォルトロールは、...

WordPress Permalinkをサーバーと連携させる方法 - ダミー

WordPress Permalinkをサーバーと連携させる方法 - ダミー

デフォルト以外のオプションを使用してWordPressサイトのパーマリンクの場合、WordPressは特定のルールまたはディレクティブを.txtファイルに書き込みます。あなたのWebサーバー上のhtaccessファイル。 permalinkによると、htaccessファイルはあなたのWebサーバーと交信して、パーマリンクをどのように提供すべきかを示します。

WordPressブログを修正する方法 - ダミー

WordPressブログを修正する方法 - ダミー

WordPressブログをインストールした後、それがリンクされているウェブサイトに合ったブログ。既存のテーマ(スキン)を変更したり、WordPressをインストールした後に使用できる代替語句を選択することができます。選択したテンプレートがメインWebサイトに似ていることを確認してください。ただし、WordPressは...