ビデオ: 著者が徹底解説!「EasyLanguageプログラミング入門」 2024
予測分析モデルでは、さまざまな統計、データマイニング、機械学習アルゴリズムを利用できます。モデルの目的を定義し、作業するデータを選択した後、アルゴリズムを選択するのに適しています。これらのアルゴリズムの中には、特定のビジネス上の問題を解決したり、既存のアルゴリズムを拡張したり、新しい機能を提供したりするために開発されたものがあります。次のようなビジネス上の問題に対処するために、さまざまなアルゴリズムから選択できます。
<! - 1 - >- たとえば、ソーシャルスフェアでの顧客のセグメンテーションやコミュニティの検出には、クラスタリングアルゴリズムが必要です。
- 顧客保持またはリコメンダリングシステムを開発するには、分類アルゴリズムを使用します。
- クレジット・スコアリングまたは時間駆動イベントの次の結果を予測するには、回帰アルゴリズムを使用します。
時間とリソースが許す限り、できるだけ多くのアルゴリズムを適切な型で実行する必要があります。異なるアルゴリズムの実行を比較すると、データやビジネスインテリジェンスがデータに埋め込まれているという驚くべき発見ができます。そうすることで、ビジネス上の問題をより詳細に把握することができ、データ内のどの変数が予測能力を持つかを識別するのに役立ちます。
<!いくつかの予測分析プロジェクトは、同じデータを操作するアンサンブルモデル、 モデル群を構築することで最も成功します。アンサンブルモデルは、事前定義されたメカニズムを使用して、すべてのコンポーネントモデルから結果を収集し、ユーザーに最終的な結果を提供します。モデルには、クエリ、シナリオの集合、決定木、または高度な数学的解析など、さまざまな形があります。さらに、特定のモデルは特定のデータと分析に最適です。決定ルールを使用して、特定のシナリオやトランザクションの結果を決定する分類アルゴリズムを使用して(たとえば)次のような質問に対処できます。 <! - 3 - >
この顧客はGoogleのマーケティングキャンペーンに反応する可能性が高いですか?
この送金は、マネーロンダリング制度の一部となる可能性がありますか?- この融資申請者は融資にデフォルトする可能性がありますか?
- 教師なしクラスタリングアルゴリズムを使用して、データセット内に存在する関係を見つけることができます。これらのアルゴリズムを使用して、顧客間で異なるグループを見つけたり、どのサービスをグループ化したり、どの製品をアップデートできるかなどを決定することができます。回帰アルゴリズムは、過去の価格を考慮して株式移動の傾向を予測するなど、連続データを予測するために使用できます。決定木、サポートベクターマシン、ニューラルネットワーク、ロジスティック、および線形回帰は、最も一般的なアルゴリズムのいくつかです。数学的な実装は異なりますが、これらの予測モデルは同等の結果を生成します。決定木は理解しやすいので、より一般的です。与えられた決定への道をたどることができます。
- 分類アルゴリズムは、ターゲットがわかっているときの分析タイプ(スパムメールの識別など)に適しています。一方、ターゲット変数が不明な場合は、クラスタリングアルゴリズムが最適です。それらを使用すると、グループメンバー間の類似性に基づいて、有意義なグループにデータをクラスタ化またはグループ化できます。これらのアルゴリズムは広く普及している。それらを実装する多くのツール、商用とオープンソースの両方があります。データの蓄積が加速して(つまり、大規模なデータが)、コスト効率の高いハードウェアやプラットフォーム(クラウドコンピューティングやHadoopなど)で予測分析ツールが活気づいています。データとビジネス目標だけでは、アルゴリズムを選択する際に考慮すべき要因はありません。あなたのデータ科学者の専門知識は、この時点で非常に大きな価値があります。仕事を完成させるアルゴリズムを選ぶことは、しばしば科学と芸術の複雑な組み合わせです。芸術の部分はビジネスドメインの経験と熟練から生まれ、正確にビジネス目標を達成できるモデルを特定する上で重要な役割を果たします。