ビデオ: 2/17 VBA IE テーブルから金額抜き出しのテスト 2024
ストリーム内のオブジェクトを数える方法を学ぶと、最も頻繁に見つかったり、このアルゴリズムは、ハッシュ関数と近似スケッチを活用します。これは、複製されたオブジェクトをフィルタリングし、データストリームに現れた別個の要素を数えた後に行われます。
この手法を使用すると、検索エンジンで最も頻繁に検索されるクエリ、オンライン小売業者のベストセラーアイテム、ウェブサイトの人気のあるページ、または最も揮発性のある在庫を見つけるなどの問題を解決できます。売買された)。
<! - 1 - >データストリームに Count-Min Sketch という問題を解決します。それはただ1回のデータパスを必要とし、可能な限り少ない情報を格納します。このアルゴリズムは、実際の多くの状況(ネットワークトラフィックの分析や分散データフローの管理など)に適用されます。レシピでは、図に示すように、それぞれがビットベクトルに関連付けられた一連のハッシュ関数をBloomフィルタに似た方法で使用する必要があります。
<! - 2 - >- すべてのビットベクトルをすべての位置でゼロに初期化します。
- ストリームからオブジェクトを受け取るとき、各ビットベクトルにハッシュ関数を適用する。結果の数値アドレスを使用して、その位置の値をインクリメントします。
- オブジェクトにハッシュ関数を適用し、オブジェクトの頻度を推定するように要求されたときに、関連付けられた位置で値を検索する。ビットベクトルから受け取ったすべての値のうち、最小のものをストリームの周波数として取ります。