ダミーチートシートのデータマイニングの一部
先駆的なデータマイニング担当者Thomas Khabaza氏は、「データマイニングの第1法則」または「ビジネス目標法」は、データマイニングの9つの法則 "を発表し、新しいデータマイナーが仕事に就くときにそれらを導くことができます。このリファレンスガイドは、これらの法律のそれぞれがあなたの日常業務に及ぼす意味を示しています。
-
データマイニングの第1法則、またはビジネスゴール法: ビジネス目標はすべてのデータマイニングソリューションの起源です。
<! - 1 - >データマイナーは、特定のビジネス目標をサポートするためにデータから有用な情報を発見した人です。データマイニングは、使用するツールによって定義されていません。
-
データマイニングの第2法則、または「ビジネス知識法」: ビジネス知識は、データマイニングプロセスのすべてのステップで中心的なものです。 データマイニングを行うためには、統計学者としてファンシーである必要はありませんが、データの意味やビジネスの仕組みについて知っておく必要があります。
<! - 9 - >データマイニングの第3法則または "データ準備法":
データ準備はすべてのデータマイニングプロセスの半分以上です。 -
ほとんどすべてのデータマイナーは、分析よりもデータ準備に多くの時間を費やします。 データマイニングの第4律、または「データマイナーの無料ランチなし」:特定のアプリケーションの正しいモデルは、実験 によってのみ発見できます。
<! - 3 - >
-
データマイニングでは、モデルが試行錯誤によって選択されます。 データマイニングの第5法則: データには常にパターンがあります。
データマイナーとして、有用なパターンを探してデータを探索します。データのパターンを理解することで、将来起こることに影響を与えることができます。
-
データマイニングの6番目の法則、または「洞察の法則」: データマイニングはビジネスドメインの認識を増幅する 。
データマイニング手法を使用すると、ビジネスマイニングを使用せずに行うよりも、ビジネスをよりよく理解することができます。
-
データマイニングまたは "予測法"の第7法:予測は、一般化によって情報を局所的に増加させる。 データマイニングは、われわれが知っているものを、私たちが知らないものの予測(または見積もり)を改善するために使用するのに役立ちます。 データマイニングの第8法則、すなわち「価値法」:データマイニング結果の価値は、予測モデルの精度または安定性によって決定されない
。
-
あなたのモデルは一貫して良好な予測を生成する必要があります。それでおしまい。 データマイニングの第9律、または「変更の法則」:
すべてのパターンは変更される可能性があります。
-
今日のあなたに素晴らしい予測を与えるモデルは、明日役に立たないかもしれません。