ビデオ: You Bet Your Life: Secret Word - Book / Dress / Tree 2024
データマイニングは試行錯誤によって行われるため、データマイニング担当者にとっては間違いを起こすだけです。間違いは、少なくとも特定の条件の下では、貴重なものになる可能性があります。しかし、すべてのミスが同じになるわけではありません。いくつかは、より良い回避されます。次のリストには、このような間違いが10件あります。注意深く読んで記憶に残しておけば、習得の過程でいくつかのバンプを避けることができます:
<!データ品質チェックをスキップする:-
ほとんどのデータマイナーは、予測モデルの開発が品質問題のデータを検討するよりも楽しいと考えています。しかし、データ品質の問題を検出して修正しなければ、無駄な予測に終わる可能性があります。 ポイントがありません:
-
魅力的なものを発見しました!それはいいですが、あなたが解決しようとしているビジネス上の問題にも関連していなければ、まったく関連性がありません。トラックに戻ってください。 <!
データのパターンが因果関係を証明していると考えます。 -
データセットを探索し、変数Aが増加すると変数Bも増加することに気づきます。これは、変数Aが変数Bに影響するか、変数Bが変数Aに影響を及ぼすために発生します。一方、両方があなたが考慮していない他の変数の影響を受ける可能性があります。それとも、一度の偶然の一致かもしれません。誰が言えるの? <!結論を伸ばしすぎる:
データ内で観察される関係がさまざまな状況で繰り返されるとは思わないでください。あなたのデータが涼しい環境で収集された場合は、暑い工場で同じように動作すると想定しないでください。 -
意味のない結果に賭けること: データマイニングの方法は非公式であり、通常は科学的方法や理論によってバックアップされていないため、結果は少なくともビジネス上意味をなさなくなります。あなたが提示した結果について常識的な説明がない場合、経営幹部はおそらくそれを真剣に受け止めないでしょうし、そうしてはいけません。
-
特定のモデリング方法に嫌われている: あらゆる状況に適した単一のタイプのデータマイニングモデルはありません。
-
適切なテストを行わずにモデルを生産に投入する: ホールドアウトデータでテストし、フィールドで小規模にテストするまで、ビジネスモデルを予測モデルに賭けてはいけません。
-
あなたが好きではない結果を無視する: あなたのデータを今無視すると、それはある日戻ってきて、「私はそう言った。 "
-
データマイニングを使用してすべてのデータ分析のニーズに対応します。 データマイニングには大きな価値がありますが、依然として厳しいデータ収集方法、正式な統計分析、科学的方法が求められます。
-
伝統的なデータ分析手法はもはや重要ではないと推測します。 前の項目を参照してください。
-