ビデオ: How Netflix changed entertainment -- and where it's headed | Reed Hastings 2024
テストは、収集し、文書化し、達成に役立つすべての必要なデータを収集したビジネス目標によって実行される必要があります。
バットをオフにして、ビジネス目標が達成されたかどうかをテストする方法を考案する必要があります。予測分析は将来の成果の可能性を測るものであり、そのようなテストを実行する準備が整う唯一の方法は、過去のデータをモデル化することであり、未来のデータに対しては何ができるか見る必要があります。
<!実際の未来のデータで未テストのモデルを実行する危険はないので、現実の将来のデータをシミュレートするために既存のデータを使用する必要があります。そのためには、作業中のデータをトレーニングデータセットとテストデータセットに分割する必要があります。これら2つのデータセットをランダムに選択し、両方のデータセットが測定中のすべてのデータパラメータを含んでいることを確認してください。
データをテストデータセットとトレーニングデータセットに分割すると、データセット全体のモデルをオーバートリッディングし、サンプルデータセットのみに属するすべてのノイズパターンまたは特定のフィーチャを取得することで発生するオーバーフィット問題を効果的に回避します他のデータセットには適用されません。
<! - 2 - >
トレーニングデータとテストデータセットをそれぞれ約70%と30%に分けることで、構築している予測分析モデルのパフォーマンスを正確に測定できます。モデルの予測が正確かどうかを簡単に測定できるため、テストデータに対してモデルを評価したいと考えています。