目次:
- 第1法則:ビジネス目標
- データマイニングの第2法則、または「ビジネス知識法」:
- データ準備はすべてのデータマイニングプロセスの半分以上です。
- まず、モデルとは何ですか?これは、データで観測されるパターンを表す式です。少なくとも、それは荒い方法でパターンを表します。本物の数学モデルは決して完璧ではありません!これは人生の事実であり、核物理学者にとってはデータ鉱夫にとっても同様です。
- あなたはいつもパターンを見つけます。データには常にあなたに伝えるものがあります。時には、あなたがしてきたことが正しいことを確認します。それはエキサイティングなようではないかもしれませんが、少なくともそれはあなたが正しい道を歩んできたことを伝えます。他の日には、現在のビジネスプラクティスが機能しないことを示すデータがあります。それはエキサイティングであり、短期的には楽しいことではないかもしれませんが、真実を知ることは改善のための重要なステップです。
- データマイニングは即時ではありません。
- 第8法則:価値
- あなたは正しい予測を生成するモデルを探します(それを判断するには、統計理論ではなくテストを使用します)。しかし、モデルがビジネス上の意味を持っているかどうか、予期せぬ予測要因についてあなたを啓発したり、職場で使用するのが現実的かどうかなど、他の問題にもっと関心を寄せるかもしれません。
ビデオ: アノニマスの見解 Ep.15:"EUNOMIA"又は"私は如何にして心配するのを止めて社会信用システムを愛するようになったか" 2024
あらゆる職業は、指針を持ち、毎日の仕事で構造と指針を提供します。データマイニングも例外ではありません。以下は、あなたが仕事に就き、データマイナーになるときにあなたを導く9つの基本的なアイデアです。彼らは先駆的なデータマイナーであるThomas Khabazaが最初に述べた9つのデータマイニングの法則です。
第1法則:ビジネス目標
データマイニングの第1法則、またはビジネス目標法: ビジネス目標はすべてのデータマイニングソリューションの起源です。
<! - 1 - >データを探索して、ビジネスをより効果的に運営するのに役立つ情報を探します。これはすべてのビジネスデータ分析の呪文ではありませんか?もちろんそれはすべきです!しかし初心者のデータ・マイナーは、テクノロジーやその他の詳細に焦点を当てることが多く、面白いかもしれませんが、経営幹部の意思決定者のニーズや目標には合致しません。
他に何かをする前にビジネス目標を特定し、データマイニングプロセスのあらゆる段階でその目標に集中する習慣を身につけなければなりません。この法律が最初に重要である。誰もが、データマイニングは目的を持ったプロセスであることを理解する必要があります。
<!第2法則:ビジネス知識データマイニングの第2法則、または「ビジネス知識法」:
ビジネス知識はデータマイニングプロセスのすべてのステップの中心です。 データマイニングは、企業の知識、経験、洞察力を活用し、データマイニングの手法を使用してデータの意味を発見する、人々(ビジネスマン)に力を与えます。
データマイニングを行うためには、統計学者としてファンシーである必要はありませんが、データの意味やビジネスの仕組みについて知っておく必要があります。データマイニングのプロセスによって、有用な情報を発見して使用することができます。
<! - 第3法則:データ準備
データマイニングの第3法則、すなわち「データ準備法」があります。データ準備はすべてのデータマイニングプロセスの半分以上です。
伝統的な統計学者は、特定の研究課題に対処するために新しいデータを収集する機会があります。彼らは、実験の計画、調査研究アンケートの設計、または特定の研究目標を十分に狙った高品質なデータの収集に厳格なプロセスを使用する可能性があります。それでも、彼らは分析のためにデータを整理し、準備するのに多くの時間を費やしています。一方、データマイナーは、ほとんどの場合、利用可能なデータがあれば作業する必要があります。彼らは、既存のビジネスレコード、パブリックデータ、または購入可能なデータを使用します。データマイニング以外の目的で、厳密な計画や慎重なデータ収集プロセスがなくても、すべてのデータが収集される可能性があります。したがって、データ・マイナーはデータ準備に多くの時間を費やします。 第4法則:右モデル
データマイニングの第4法則、すなわち「NFL-DM」は次のとおりです。特定のアプリケーションの正しいモデルは、実験によってしか発見できません。
この法律は、NFL-DMの略称でも知られています。つまり、データマイナーには無料ランチはありません。
まず、モデルとは何ですか?これは、データで観測されるパターンを表す式です。少なくとも、それは荒い方法でパターンを表します。本物の数学モデルは決して完璧ではありません!これは人生の事実であり、核物理学者にとってはデータ鉱夫にとっても同様です。
データマイニングでは、モデルは試行錯誤によって選択されます。さまざまなモデルタイプを試してみましょう。 第5法則:パターン
データマイニングの第5法則は次のとおりです。
パターンは常にあります。
データマイナーとして、有用なパターンを探してデータを探索します。言い換えれば、データ内の変数間の有意義な関係を探します。これらの関係を理解することで、ビジネスの理解を深めることができ、将来起こることをよりよく予測できます。最も重要なのは、データのパターンを理解することで、将来起こることに影響を与えることができます。
あなたはいつもパターンを見つけます。データには常にあなたに伝えるものがあります。時には、あなたがしてきたことが正しいことを確認します。それはエキサイティングなようではないかもしれませんが、少なくともそれはあなたが正しい道を歩んできたことを伝えます。他の日には、現在のビジネスプラクティスが機能しないことを示すデータがあります。それはエキサイティングであり、短期的には楽しいことではないかもしれませんが、真実を知ることは改善のための重要なステップです。
第6法:増幅 データマイニングの第6法則、すなわち「洞察力法」があります。
データマイニングは、ビジネス領域での認識を増幅します。
データマイニング手法を使用すると、ビジネスマイニングを使わずにできるよりも、ビジネスをよりよく理解することができます。データマイニングの方法は、拡大鏡や顕微鏡のように役立ち、通常のレポートでは検出が困難または不可能な影響を発見することができます。
データマイニングは即時ではありません。
データマイニングによる発見と学習はインタラクティブなプロセスです。あなたは発見をし、それぞれから少しを見つけ出し、行動を起こすために発見したものを使用します。試したそれぞれのアクションの結果により、より多くのデータが生成され、そのデータによってさらに何かを理解することができます。それは発見のサイクルであり、探索と実験を続けている限り、サイクルは続きます。 第7法則:予測
データマイニングの第7法則、すなわち「予測法」:
予測は一般化によって情報を局所的に増加させる。
データマイニングは、あなたが知っているものを使用して、わからないことの予測(または見積もり)を向上させるのに役立ちます。データマイニングでは、データとモデリング方法を使用して、非公式の期待をデータ駆動型で一貫性があり、より正確な見積もりで置き換えます。
第8法則:価値
データマイニングの第8法則、すなわち「価値法」: データマイニング結果の価値は、予測モデルの精度または安定性によって決まらない。
データマイナーは理論を騒がせません。データマイナーとして、使用する統計モデルの背後にある理論を知ることさえできないかもしれません。データマイニングでは、それらのモデルの背後にある理論と必ずしも一致しない方法でそれらのモデルを使用することになるからです。
あなたは正しい予測を生成するモデルを探します(それを判断するには、統計理論ではなくテストを使用します)。しかし、モデルがビジネス上の意味を持っているかどうか、予期せぬ予測要因についてあなたを啓発したり、職場で使用するのが現実的かどうかなど、他の問題にもっと関心を寄せるかもしれません。
第9法則:変更 データマイニングの第9法則、または「法則」:
すべてのパターンは変更される可能性があります。
世界は常に変化しています。明日あなたに素晴らしい予測を与えるモデルは、明日役に立たないかもしれません。これは、データマイニング担当者だけでなく、すべてのデータアナリストの人生の事実です。