目次:
- ビジュアライゼーションは、複雑なアイデアを効率的に伝える強力な方法です。ビジュアライゼーションを効果的に使用すると、作業しているデータを最初に探索して理解するのに役立ちます。グラフなどのビジュアルエイドも、モデルの出力を評価したり、予測モデルのパフォーマンスを比較したりするのに役立ちます。
- 強力な予測分析ツールは、市場でソフトウェアパッケージとして利用できます。彼らはプロセス全体をもっと簡単にするように設計されています。このようなツールを使用しなければ、モデルを最初から作成するのはすぐに時間がかかります。優れた予測分析ツールを使用すると、複数のシナリオを実行し、数回のクリックですべての結果を瞬時に比較することができます。ツールは、1つまたは複数のモデルを構築および評価するために必要な多くの時間を要する手順を迅速に自動化できます。
Anasse Bari、Mohamed Chaouchi、Tommy Jung
予測分析プロジェクトは、細部の実行と大画面の思考を組み合わせたものです。これらの便利なヒントやチェックリストは、プロジェクトをレールや森の外に保つのに役立ちます。
予測分析モデルの構築
成功した予測分析プロジェクトが段階的に実行されます。あなたがプロジェクトの詳細に没頭したら、次のような大きなマイルストーンを見てください:
<! - 1 - >-
ビジネス目標の定義
プロジェクトは、明確に定義されたビジネス目標を使用することから始まります。このモデルは、ビジネス上の問題に取り組むことになっています。その目的を明確に述べることで、プロジェクトの範囲を定義することができ、成功を測るための正確なテストを提供します。
-
データの準備
履歴データを使用してモデルをトレーニングします。データは通常、複数の情報源に分散されており、クレンジングと準備が必要な場合があります。データに重複レコードと異常値が含まれている可能性があります。分析とビジネス目的に応じて、それらを保持するか削除するかを決定します。また、データに欠損値があり、変換が必要な場合があり、目的に合った予測能力を持つ派生属性を生成するために使用される可能性があります。全体として、データの品質はモデルの品質を示します。
-
データのサンプリング
データをトレーニングセットとテストデータセットの2つのセットに分割する必要があります。トレーニングデータセットを使用してモデルを作成します。テストデータセットを使用して、モデルの出力の精度を検証します。そうすることは絶対に重要です。それ以外の場合は、モデルに限定されたデータセットを使用してモデルを訓練し、その特定のデータセットにのみ該当するすべての特性(信号とノイズの両方)が選択されるように、モデルをオーバーフィットするリスクがあります。特定のデータセットに対して過度に適合するモデルは、他のデータセットで実行すると惨めに実行されます。テストデータセットは、モデルのパフォーマンスを正確に測定する有効な方法を保証します。 <! - 9 - > モデルの構築
データやビジネス目標は、特定のアルゴリズムやモデルに適していることがあります。他の時には、最良のアプローチはあまり明確ではありません。データを探索するときにできるだけ多くのアルゴリズムを実行します。それらの出力を比較する。全体的な結果に基づいて、最終的なモデルを選択します。時には、データのアンサンブルを同時に実行し、出力を比較して最終モデルを選択する方がよい場合もあります。 -
モデルのデプロイ
モデルを構築したら、そのメリットを享受するためにモデルをデプロイする必要があります。そのプロセスは、他の部門との調整を必要とするかもしれません。展開可能なモデルの構築を目指してください。また、結果をビジネスの利害関係者に理解して説得力のある方法で提示してモデルを採用する方法を理解していることを確認してください。モデルをデプロイした後は、そのパフォーマンスを監視して改善し続ける必要があります。ほとんどのモデルは一定期間後に減衰します。新しく入手可能なデータでモデルを更新して、モデルを最新の状態に保ちます。
-
予測分析プロジェクトのデータソース
予測分析プロジェクトのデータは、さまざまなソースから取得できます。最も一般的な情報源の一部は、あなたの組織内にあります。他の共通ソースには、外部ベンダから購入したデータが含まれます。
内部データソースには、顧客の購入などのトランザクションデータが含まれます。
登録フォームからユーザーが入力した情報などの顧客プロファイル
顧客が
-
Clickstreamデータに応答したかどうか、顧客のウェブクリックのパターンを含む
-
電子メール、チャット、アンケート、顧客サービスコールなどの顧客との対話
-
テレマティクス、センサー、スマートメーターなどの機械生成データ
-
外部データソースには、Facebook、Twitter、LinkedInなどのソーシャルメディアが含まれます。Bloomberg、Thompson Reuters、Esri、Westlawなどのサブスクリプションサービス
-
複数の異種データソースのデータを予測モデルを使用すると、顧客の全体像をより正確に把握できるため、より正確なモデルが得られます。
-
予測分析を使用する場合の成功の確保
予測分析は、データを利用した明るい電球であると考えてください。予測分析の光(洞察)は、戦略を強化し、業務を合理化し、収益を向上させることができます。以下の4つの推奨事項は、予測分析のイニシアチブの成功を保証するのに役立ちます。
-
変化の文化を育む
-
予測分析は組織全体で採用されるべきである。組織は変化を受け入れるべきです。ビジネスの利害関係者は、予測分析プロジェクトから得られた知見を取り入れ、その結果を採用する準備が整うはずです。予測分析プロジェクトの結果は、ビジネスリーダーがそれに対処する意向がある場合にのみ有益です。
データサイエンスチームを作成する
予測分析ソリューションを確立してサポートすることのみが目的のデータサイエンスチームを雇います。ビジネスアナリスト、データ科学者、情報技術者を含むこの才能豊かな専門家チームは、フルタイムのプロジェクトでの作業に適しています。プロのバックグラウンドの範囲を含めると、他のドメインのチームに貴重な洞察をもたらすことができます。組織内のさまざまな部門のチームメンバーを選択することで、広範なバイインを確実に行うことができます。
ビジュアライゼーションツールを効果的に使用する
ビジュアライゼーションは、複雑なアイデアを効率的に伝える強力な方法です。ビジュアライゼーションを効果的に使用すると、作業しているデータを最初に探索して理解するのに役立ちます。グラフなどのビジュアルエイドも、モデルの出力を評価したり、予測モデルのパフォーマンスを比較したりするのに役立ちます。
予測分析ツールの使用