ビデオ: Accelerate Digital Transformation with IoT Data Using Data Analytics and AI (Cloud Next '19) 2024
ダミーチートシートの予測分析の部分
成功した予測分析プロジェクトが段階的に実行されます。
-
ビジネス目標の定義
プロジェクトは、明確に定義されたビジネス目標を使用することから始まります。このモデルは、ビジネス上の問題に取り組むことになっています。その目的を明確に述べることで、プロジェクトの範囲を定義することができ、成功を測るための正確なテストを提供します。
<! - 1 - > -
データの準備
履歴データを使用してモデルをトレーニングします。データは通常、複数の情報源に分散されており、クレンジングと準備が必要な場合があります。データに重複レコードと異常値が含まれている可能性があります。分析とビジネス目的に応じて、それらを保持するか削除するかを決定します。また、データに欠損値があり、変換が必要な場合があり、目的に合った予測能力を持つ派生属性を生成するために使用される可能性があります。全体として、データの品質はモデルの品質を示します。
-
データのサンプリング
データをトレーニングセットとテストデータセットの2つのセットに分割する必要があります。トレーニングデータセットを使用してモデルを作成します。テストデータセットを使用して、モデルの出力の精度を検証します。そうすることは絶対に重要です。それ以外の場合は、モデルに限定されたデータセットを使用してモデルを訓練し、その特定のデータセットにのみ該当するすべての特性(信号とノイズの両方)が選択されるように、モデルをオーバーフィットするリスクがあります。特定のデータセットに対して過度に適合するモデルは、他のデータセットで実行すると惨めに実行されます。テストデータセットは、モデルのパフォーマンスを正確に測定する有効な方法を保証します。 <! - 9 - > モデルの構築
データやビジネス目標は、特定のアルゴリズムやモデルに適していることがあります。他の時には、最良のアプローチはあまり明確ではありません。データを探索するときにできるだけ多くのアルゴリズムを実行します。それらの出力を比較する。全体的な結果に基づいて、最終的なモデルを選択します。時には、データのアンサンブルを同時に実行し、出力を比較して最終モデルを選択する方がよい場合もあります。 -
モデルのデプロイ
モデルを構築したら、そのメリットを得るためにモデルをデプロイする必要があります。そのプロセスは、他の部門との調整を必要とするかもしれません。展開可能なモデルの構築を目指してください。また、結果をビジネスの利害関係者に理解して説得力のある方法で提示してモデルを採用する方法を理解していることを確認してください。モデルをデプロイした後は、そのパフォーマンスを監視して改善し続ける必要があります。ほとんどのモデルは一定期間後に減衰します。新しく入手可能なデータでモデルを更新して、モデルを最新の状態に保ちます。