目次:
ビデオ: Watch for Free - Pilot - (Ep 1) 2024
データマイニングのためのクロスインダストリ標準プロセス ( CRISP-DM )は、データマイニングプロジェクトの第1段階では、データやツールにアプローチする前に、達成することを定義し、この目標を達成する理由を定義します。
ビジネス理解フェーズには次のものが含まれます。 <! - 1 - > タスク:ビジネス目標の特定
最初に行う必要があるのは、4つのタスク
(主なアクティビティ、どのようなプロジェクトでも、達成しようとしていることを正確に把握することです!それはそれほど明白ではありません。多くのデータマイナーは、データ分析に時間を費やしています。
-
あなたの経営陣が取り組んでいる問題
<! - 2 - > -
ビジネス上の目標
-
制約事項(使用することの制限、使用可能なソリューションの種類、作業を完了する必要があるときなど)
-
影響(問題と可能なソリューションがビジネスにどのように適合するか)
このタスクの成果物には3つの項目が含まれます(主な点のみに焦点を当てた簡単なレポート)。
-
背景: プロジェクトを推進するビジネス状況を説明します。この項目は、多くの場合と同様に、わずかな段落にすぎません。
<! - 3 - > -
ビジネス目標: あなたの組織がプロジェクトで達成しようとしているものを定義します。これは通常、データマイナーとして、あなたよりも広い目標ですが、独立して達成することができます。たとえば、ビジネス上の目標は、休日の広告キャンペーンの売上を前年比で10%増やすことです。
-
事業の成功基準: 結果の測定方法を定義する。明確に定義された定量的な成功基準を得るようにしてください。主観的基準(ヒント: 利得洞察 または 主観的基準を暗示する のような用語)を使用しなければならない場合、少なくともその基準が達成された。
タスク:状況の評価
ここでは、ビジネス目標に関連する問題について詳しく説明します。今度は、ビジネス目標のタスクで概説されている問題の詳細を説明しながら、事実をより深く知ることになります。
このインベントリの成果物には、5つの詳細なレポートが含まれます。
-
リソースの目録: プロジェクトで使用可能なすべてのリソースのリスト。これらには、人々(データマイナーだけでなく、ビジネス上の問題、データマネージャ、テクニカルサポートなど)、データ、ハードウェア、およびソフトウェアに関する専門知識を持つ人も含まれます。
-
要件、前提条件、および制約条件: 要件には、完了のスケジュール、法律およびセキュリティの義務、および許容される完成した作業の要件が含まれます。これは、適切なデータにアクセスできることを確認するためのポイントです。
-
リスクと偶発事象: プロジェクトの完了を遅らせる原因を特定し、それぞれについて緊急時対応計画を作成する。たとえば、オフィスのインターネットの停止が問題を引き起こす可能性がある場合は、停止が終了するまで別のオフィスで不測の事態が発生する可能性があります。
-
用語: プロジェクトに関連するビジネス用語とデータマイニング用語のリストを作成し、定義に加えて用語集に書き留めることで、プロジェクトに関わる全員がこれらの用語の共通理解
-
費用と便益: プロジェクトの費用便益分析を準備する。すべての費用と便益をドル(ユーロ、ポンド、円など)で記載してください。利益が大幅にコストを上回らない場合は、この分析とプロジェクトをやめて、再検討してください。
意思決定者は、収益を上げることを目標とするプロジェクトよりもコストを削減するプロジェクトに対して、より快適にリソースを配分すると感じることが多いため、常にコスト削減の可能性を探し出し、
タスク:データマイニングの目標の定義
ビジネス目標を達成するには、しばしばデータマイナーだけでなく、多くの人々の行動が必要です。だから、あなたは大きな絵の中にあなたの小さな部分を定義しなければなりません。たとえば、ビジネスの目標が顧客の損耗を減らすことである場合、データマイニングの目標は、複数の顧客セグメントの損害率を特定し、どの顧客が最もリスクが高いかを予測するモデルを開発することです。
データマイニングの目標:
-
モデル、レポート、プレゼンテーション、および処理済みデータセットなどのデータマイニング成果物を定義します。 データマイニング成功基準:
-
ビジネス成功基準をサポートするために必要なデータマイニング技術基準を定義します。定量的な観点から(モデル精度や既存の方法と比較した予測改善など)これらを定義してください。基準が定性的でなければならない場合は、評価を行う人を特定する。 タスク:プロジェクト計画の作成
プロジェクトが完了し、結果が提示され、レビューされるまで、データマイニング担当者が取るべきすべてのステップを指定します。
このタスクの成果物には、次の2つのレポートが含まれます。
プロジェクト計画:
-
プロジェクトの段階的な行動計画の概要を示します。各ステップの完了スケジュール、必要なリソース、入力(主題専門家によるデータや会議など)、各ステップの出力(クリーンデータ、モデル、レポートなど)をアウトラインとして展開し、依存関係(このステップが完了するまで開始できないステップ)。特定のステップを繰り返さなければならないことを明示的に述べる(例えば、モデリングと評価では、通常、複数の前後の繰り返しが必要です)。 ツールとテクニックの初期評価:
-
データマイニングの目標を達成するために必要な機能を特定し、必要なツールとリソースを評価します。欠落しているものがある場合は、プロセスの早い段階でその懸念に対処する必要があります。