目次:
ビデオ: 平成30年度 市民講座 第2回 :「理解発見データマイニング -AIはなんでもしてくれるわけじゃない-」 宇野 毅明 - 国立情報学研究所 2024
データマイニングOLAPを問合せ、レポート、またはさらには、特定の質問をすることなく情報を得ることができるということです。
データマイニングは、ビジネスインテリジェンスミッションの主な2つの役割を果たします。
-
「何が起こるか教えてください」役割: データマイニングの第1の役割は予測的です。発生する可能性があります。データウェアハウスで隠された知識を使用することで、確率や将来の傾向や発生の可能性が広がり、あなたに提示されます。
<!興味深いことを教えてください: -
将来の可能性のある出来事や出来事に加えて、データマイニングは、特に知っておくべき興味深い情報、 2つの異なる製品の販売と、その関係が小売店舗の配置に応じてどのように異なるかという珍しい関係です。 これらの興味深い小物の多くは存在する可能性がありますが、クエリまたはOLAPツールを使用している場合にはどのような質問をしますか、結果をどのように解釈しますか?データマイニングは、あなたの面倒な作業の多くを行うことでどのような質問をするのかという難しい作業を支援します。
<!特定のビジネスミッションのデータマイニング
データマイニングは、これらの特定のタイプのビジネスミッションに特に適しています:
不正行為の検出
マーケティングプログラムの有効性の判断
-
大規模な顧客ベースまたは一般の人口で、マーケティングプログラムの一部としてターゲット設定する必要があります。
-
顧客維持ミッション
-
-
高度なビジネスプロセスモデリングとwhat-ifシナリオの実行
前のリストの各ビジネスミッションの背後にあるものについて考えます: -
大量のデータ
さまざまなデータの組み合わせの数
-
複雑なアルゴリズムや高度な統計手法を使用した集中的な結果セット分析
-
これらのミッションを達成するためにレポートツールまたはOLAPツールを使用していた場合、 。質問をして結果を得たり、別の質問をしたり、別の結果を得たりする必要がある場合は、前のミッションを徹底的に実行することは事実上不可能です。
-
データマイニングと人工知能
あなたが情報技術(IT)分野に少なくとも10年以上従事していたならば、前の用語のいくつかは曖昧に聞こえるかもしれません。隠された知識のロックを解除する?予測機能?ちょっと待ってください - それは人工知能です!
商用コンピューティングの初期の時代から、大量のデータを処理し、その分析に基づいて意思決定を行うことができる「思考機械」の開発に大きな関心が寄せられました。
人工知能(AI)への関心は1980年代半ばに天頂を打ちました。当時、データベースベンダーはナレッジベース管理システム(KBMS)の制作に携わっていました。他のベンダーは、ユーザーの意思決定を助言するためにフォワードチェーニングやバックワードチェーニングなどの技術を使用した
エキスパートシステムシェル、
またはAIベースのアプリケーション開発フレームワークを出しました。ニューラルネットワークは次の大きなAI開発として位置づけられました。 90年代初めに、クライアント/サーバーの移行や(もちろん)データウェアハウスなど、利用可能な機能やその他の魅力を超えるAIへの関心がなくなりました。 さて、AIが帰ってきました! データマイニングで使用される最高のAI技術は、ニューラルネットワークです。ニューラルネットは当初、人間の脳が問題を解決する方法を模倣する処理モデルとして、ニューロンと非常に並列処理を使用してパターン解決を行うと想定されていました。
データマイニングが扱うビジネスインテリジェンスの分野(ニューディールの「何か面白いことを教えてください」というミッション)にニューラルネットワークアルゴリズムを適用することは、自然な一致と思われます。
データマイニング/ニューラルネットワークゲームは確かに調べる価値がありますが、注意深くそれを行うべきです。あなたは、アルゴリズムを理解していない人の手で、おそらく失敗するだろう、面白くてエキサイティングな技術をたくさん見つけることができます。
しかし、適切な知識と教育があれば、OLAPに焦点を当てたビジネス分析のテクニカル分析のペアリングとして、この種の処理をビジネスインテリジェンスフレームワークに組み込むことに本格的に取り組むことができます。
データマイニングと統計
データマイニングのより成熟した領域は、データウェアハウスの大量のデータに対する高度な統計手法の適用です。異なるツールでは、特定の分野に合わせてさまざまな種類の統計手法を使用します。
統計的な背景がないと、データマイニングの多くが混乱することがあります。アルゴリズムをトレーニングし、より大きなデータセットで適切な結果を得るためのルールを構築するには、多くの作業を行う必要があります。しかし、あなたがこのコンセプトに慣れ親しんでいると仮定するか、助けることができる同僚がいるとすれば、より広く利用されるアルゴリズムのいくつかがあります:
分類アルゴリズム:
1つ以上の離散変数をデータセット内の属性。分類アルゴリズムを使用することで、データマイニングツールは大量のデータを見て、たとえば、「少なくとも2世代にわたる製品購入によって保持されている顧客は、次のような特徴を持つ傾向があります。少なくとも$ 75,000、彼らは自分の家を所有しています。"
回帰アルゴリズム:
-
データセットの他の属性に基づいて、損益などの1つ以上の連続変数を予測します。回帰アルゴリズムは、時間経過に伴ってデータマイニングツールに提示される履歴情報によって駆動され、よりよく 時系列の情報として知られています。セグメント化アルゴリズム:
-
類似の特性を有するアイテムのグループまたはクラスタにデータを分割する。 関連アルゴリズム: データセット内のさまざまな属性間の相関関係を検索します。この種のアルゴリズムの最も一般的なアプリケーションは、市場バスケット分析で使用できる関連ルールを作成します。たとえば、顧客が特定のソフトウェアパッケージを購入した場合、2週間以内に少なくとも2つの製品固有のアドオンパックを購入する確率は65%です。 配列分析アルゴリズム:
-
ウェブ経路フローなどのデータ中の頻繁な配列またはエピソードを要約する。 さらに多くの方法が存在する。その古い統計書を捨てて、読んで始めてください。
-