ビデオ: The Vietnam War: Reasons for Failure - Why the U.S. Lost 2024
予測分析行動に適用できる自己組織化グループの自然な例は、アリの食糧狩りのコロニーです。アリは集団的にトラックを最適化し、常に最短経路を食物標的にできるようにします。
あなたが行進しているアリの植民地を妨害し、それらが食物の標的に到達するのを阻止しようとしたとしても、彼らは迅速に戻り、同じ目標を避けて食物の標的に可能な限り最短の方法を見つける食べ物を探している間。すべての蟻が地面にフェロモンの痕跡を堆積させるので、この一様な行動が可能です。
<! - 1 - >巣の中で遊ぶアリの軍隊を考えてみましょう。彼らが食べ物を探し始めると、食べ物を見つける場所についての情報は全くありません。個々の蟻が食物を見つけるまで彼らはランダムに行進する。幸運な蟻(Ant Xと呼ぶ)は、その発見をアリの残りの部分に伝えなければならず、そうするためには、巣に戻る道を見つけなければなりません。
幸運にも、Ant Xは食べ物を探している間に独自のフェロモンを生産していました。それは巣に戻ってフェロモンの独自のトレイルに従うことができます。その巣に戻って、それ自身のフェロモン・トレイルに続いて、Ant Xはより多くのフェロモンを同じ道に置きます。
<! - 2 - >その結果、Ant Xのトレイルの香りは、他のアリのトレイルのなかでも最も強くなります。フェロモンの最も強い痕跡は、まだ食糧を探している他のすべてのアリを引き付けるでしょう。彼らは最も強い香りに従うでしょう。より多くのアリがアリXのトレイルに加わるにつれて、それにフェロモンを追加します。香りが強くなります。まもなく、他のすべてのアリには強い香りがあります。
いくつかのアリが同じ食物を発見した場合、最短経路を取ったアリは、より長い経路をたどるアリに比べてより多くの旅行をするため、より多くのフェロモンが最短経路で生産されます。個人行動と集団行動の関係は、啓発的な自然の例です。
<! - 3 - >すべてのドットはドキュメントを表します。黒い点は予測分析に関する文書であり、白い点は人類学に関する文書であると仮定する。異なるタイプの文書を表すドットは、5つのセルのグリッド内にランダムに分布している。
「アリ」は、同様の文書を検索するためにグリッドにランダムに配置されます。その中の値を持つすべてのセルは、「フェロモン」のインスタンスを表します。ドキュメントマトリックスを使用して、各セルの「フェロモン」値が対応する文書から計算されます。
さて、アリ集落の集団知能は、データを効果的にクラスタリングするためのモデルをどのように作り出しますか?答えは簡単なアナロジーです:アリは、データセット内のクラスタを検索しているのと同じように、環境内の食糧を探しています。大量のドキュメント内で類似のドキュメントを探しています。
トピックで整理したい文書のデータセットを考えてみましょう。同様の文書は同じクラスタ内にグループ化されます。ここで、アリ植民地が類似の文書をグループ化する方法のヒントを提供する場所があります。
ドキュメントをドットで表現できる2次元(2D)グリッドを想像してみてください。 2Dグリッドはセルに分割されています。各セルには、それに関連する「フェロモン」(値)があります。簡潔には、「フェロモン」値は、所与の細胞の各文書を区別する。ドットは、ランダムに最初に分布し、グリッド内のすべてのドットは一意の文書を表す。次のステップは、2次元グリッド上にランダムに他の点を配置し、その環境内の食物のアリの探索をシミュレートすることです。これらのドットは、最初はドキュメントと同じ2Dグリッドに散在しています。
グリッドに追加された新しいドットはそれぞれ、アリを表します。アリ・コロニー・アルゴリズムで
エージェント と呼ばれることが多いこれらの「アリ」は、2Dグリッド内を移動しています。それぞれの「アリ」は、ドキュメントがどこに最も適しているかに応じて、他のドット(ドキュメント)を取り上げたり、ドロップしたりします。この類推では、「食物」は、それらがクラスター化できるほど十分に類似した文書の形をとっている。 「アリ」はグリッド内をランダムに歩き回ります。ドキュメントに遭遇した場合は、ピックまたはドロップという2つのアクションのいずれかを実行できます。各セルには、問題のドキュメントの近くにある他のドキュメント(ドット)とドキュメントがどれほど似ているかを示す「フェロモンの強さ」があります。「アリ」は、ピックアップまたはドロップのいずれかです。
セル「3」の「アリ」は、白い「フェロモン」値が支配的であるため、黒いドットの文書を取り上げることに注意してください。値がセル4のもの(いくつかの黒い点)に近い(類似の)セルに移動します。検索は、クラスタが形成されるまで繰り返されます。実際には、「アリ」は、ドキュメントをピックアップするか、ドキュメントをドロップするという2つのアクションのいずれかを実行することによって、ドキュメントを1つのセルから別のセルに移動してクラスタを形成します。
"ant"はドキュメントをドロップする最良のセルをどのように決定しますか?答えは、セル内の値が「フェロモン」のように働き、2Dグリッド内のすべてのセルに、セル内のドキュメントを表す方法で計算できる数値が含まれていることです。
各文書は、数値の集合または数値のベクトルとして表されることに注意してください。ドキュメントに表示されるドキュメントが増えると、「フェロモンの強さ」(数値)が増加します。ドキュメントを表す数字がセルから移動すると、その値は減少します。