Meta S. Brown
データマイニングは、通常のビジネスマンが有用なその情報を実用に供することができる。データマイナーは、理論や前提に惑わされません。彼らはテストによってその発見を検証します。そして、彼らは物事が変わることを理解しているので、昨日の魅力のように働いた発見が今日は成り立たない時、彼らは順応します。
<!データマイニングの9つの法則:リファレンスガイド先駆的なデータマイナーThomas Khabaza氏は、新しいデータマイナーが仕事に就くときに、彼らの「9つのデータマイニング法」を開発しました。このリファレンスガイドは、これらの法律のそれぞれがあなたの日常業務に及ぼす意味を示しています。
データマイニングの第1法則、またはビジネスゴール法:
-
ビジネス目標はすべてのデータマイニングソリューションの起源です。 <! - 2 - >
データマイナーは、特定のビジネス目標をサポートするためにデータから有用な情報を発見した人です。データマイニングは、使用するツールによって定義されていません。データマイニングの第2法則、または「ビジネス知識法」:
-
ビジネス知識は、データマイニングプロセスのすべてのステップで中心的なものです。 データマイニングを行うためには、統計学者としてファンシーである必要はありませんが、データの意味やビジネスの仕組みについて知っておく必要があります。 <! - 3 - >
データマイニングの第3法則または "データ準備法":
データ準備はすべてのデータマイニングプロセスの半分以上です。 -
ほとんどすべてのデータマイナーは、分析よりもデータ準備に多くの時間を費やします。 データマイニングの第4律、または「データマイナーの無料ランチなし」:特定のアプリケーションの正しいモデルは、実験 によってのみ発見できます。
データマイニングでは、モデルは試行錯誤によって選択されます。
-
データマイニングの第5法則: データには常にパターンがあります。
データマイナーとして、有用なパターンを探してデータを探索します。データのパターンを理解することで、将来起こることに影響を与えることができます。
-
データマイニングの6番目の法則、または「洞察の法則」: データマイニングはビジネスドメインの認識を増幅する 。
データマイニング手法を使用すると、ビジネスマイニングを使用せずに行うよりも、ビジネスをよりよく理解することができます。
-
データマイニングまたは "予測法"の第7法:予測は、一般化によって情報を局所的に増加させる。 データマイニングは、われわれが知っているものを、私たちが知らないものの予測(または見積もり)を改善するために使用するのに役立ちます。 データマイニングの第8法則、すなわち「価値法」:データマイニング結果の価値は、予測モデルの精度または安定性によって決定されない
。
-
あなたのモデルは一貫して良好な予測を生成する必要があります。それでおしまい。 データマイニングの第9律、または「変更の法則」:
すべてのパターンは変更される可能性があります。
-
今日のあなたに素晴らしい予測を与えるモデルは、明日役に立たないかもしれません。 データマイニングプロセスの段階 データマイニングのためのクロスインダストリー標準プロセス
(
-
CRISP-DM )は、主要なデータマイニングプロセスの枠組みです。オープンスタンダードです。誰でもそれを使用することができます。以下のリストは、プロセスのさまざまな段階を説明しています。
ビジネスの理解:
あなたが解決しようとしている問題、それがあなたの組織にどのような影響を及ぼしているのか、それを解決するための目標を明確に理解してください。
ビジネス目標の特定 状況の評価 データマイニングの目標の定義 プロジェクト計画の作成 データの理解:
-
それを文書化し、データ管理とデータ品質の問題を特定します。このフェーズのタスクは次のとおりです。 データの収集
-
記述
-
探索
-
品質の検証
-
データの準備:
-
-
データをモデリングに使用する準備を整えます。 データの選択
-
データのクリーニング
-
構築
-
統合
-
書式設定
-
-
モデリング: データ内のパターンを特定するために数学的手法を使用します。
-
テクニックの選択
-
テストの設計
-
ビルディングモデル
-
モデルの評価
-
評価:
-
-
発見したパターンをレビューし、ビジネスの可能性を評価します。この段階のタスクは次のとおりです。 結果の評価
-
プロセスのレビュー
-
次のステップの決定
-
展開:
-
このフェーズのタスクには、次のものが含まれます。
-
-
計画の展開(データマイニングの発見を統合するための方法) 最終結果のレポート
-
最終結果の確認
-