目次:
- データの隠しグループ化の可視化
- 分類モデルは、調べる新しい各データポイントに特定のクラスを割り当てる。この場合の特定のクラスは、クラスタリング作業の結果として生じるグループである可能性があります。グラフで強調表示されている出力は、ターゲットセットを定義できます。任意の新規顧客について、予測分類モデルは、新規顧客がどのグループに属するかを予測しようと試みる。
- 新しい顧客をクラスタリングまたは分類する過程で、たびに
- 多くのモデルは、
- 意思決定ツリー、ランダムフォレスト、植毛アルゴリズムなどの予測分析モデルの配列を実行したとします。これらの結果をすべて組み合わせて、すべてがサポートしている一貫した物語を提示することができます。ここで、信頼度は数学的関数を使用して計算できる数値のパーセンテージです。計算の結果は、可能性のある発生の確率をカプセル化する。
ビデオ: 重回帰分析 2024
予測分析の結果を重要な人に示すことができる必要があります。ビジュアライゼーション手法を使用して、モデルの結果をステークホルダーに報告するいくつかの方法があります。
データの隠しグループ化の可視化
データクラスタリングは、データ内の関連アイテムの隠れたグループを発見するプロセスです。ほとんどの場合、 クラスタ (グループ化)は、ソーシャルネットワークユーザー、テキスト文書、または電子メールなどの同じ種類のデータオブジェクトで構成されます。データクラスタリングモデルの結果を視覚化する1つの方法を以下に示します。グラフは、ソーシャルネットワークユーザーから収集されたデータで発見されたソーシャルコミュニティ(クラスタ)を表しています。
<! - 1 - >顧客に関するデータを表形式で収集した。クラスタリングアルゴリズムがデータに適用され、忠実な顧客、さまよっている顧客、割引顧客の3つのクラスタ(グループ)が発見されました。 X軸とY軸が元のデータから生成された2つの主成分を表すものと仮定する。主成分分析(PCA)はデータ削減手法です。
顧客を3つのグループに分類する:忠実な、放浪している、および割引。ここで、3つのグループ間の視覚的関係は、すでに、強化されたターゲットマーケティング活動が最も効果的な場合があることを示唆しています。
<!データ分類結果の視覚化分類モデルは、調べる新しい各データポイントに特定のクラスを割り当てる。この場合の特定のクラスは、クラスタリング作業の結果として生じるグループである可能性があります。グラフで強調表示されている出力は、ターゲットセットを定義できます。任意の新規顧客について、予測分類モデルは、新規顧客がどのグループに属するかを予測しようと試みる。
<! - 3 - >
クラスタリングアルゴリズムを適用し、顧客データにグループ分けを発見した後は、真実の瞬間が訪れます。ここで新しい顧客が生まれます。モデルによって、または彼女はなります。画像は、新しい顧客の情報が予測分析モデルにどのように供給されるかを示します。予測モデルは、この新規顧客がどの顧客グループに属しているかを予測します。新しい顧客A、B、Cは、分類モデルに従ってクラスターに割り当てようとしています。分類モデルを適用すると、顧客Aは忠実な顧客に属し、顧客Bは放浪者になり、顧客Cは割引にしか現れないという予測が得られた。
得意先A、B、およびCをその分類(クラスター)に割り当てる。
データの外れ値の可視化新しい顧客をクラスタリングまたは分類する過程で、たびに
外れ値 (既存の部門に適合しない特殊なケース)が発生します。 下に、あらかじめ定義されたクラスタにうまく収まらないいくつかのアウトライアーがあります。 6人の外れ値の顧客が検出され、視覚化されました。それらは、モデルが顧客の定義されたカテゴリに属しているかどうかをモデルが知ることができないほど十分に振る舞います。
外出者6人の顧客は、表示するだけで分類に反する。
決定木の可視化多くのモデルは、
決定木 を出力として使用します。これらの図は、ツリーの枝のように配置された別の行為から得られる可能性のある結果を示しています。 下の画像は、クラシファイアとして使用されるツリーの例を示しています。これは主にチケットに費やされた金額と購入日数に基づいて野球ファンを分類します。この視覚化から、新規チケット購入者がカジュアル、忠実な、バンドワゴン、大事な、または他のタイプのファンのタイプを予測できます。
各ファンの属性は、ツリー内の各レベル(出席したゲームの総数、総使用量、季節)に記載されている。ファンのクラス(c1、c2、c3、c4、c5)のいずれかに当たるツリー上の特定の「ルート」から特定の「リーフ」までのパスをたどることができます。
特定の野球ファンが属するクラスを見つける。
あなたが野球ファンの種類を決定して、顧客に送るマーケティング広告の種類を決定できるとします。チームがうまくやってプレーオフに向かうときに野球のファンやバンドワゴンのファンが新しい車を買うように説得することができると仮定したとします。マーケティング広告と割引を送信して、購入を促すことができます。さらに、特定の政治的な問題を支持して、バンドワゴンのファンが投票に賛成することができるという仮説を立てたと仮定しよう。あなたは彼らにそのサポートを求めるマーケティング広告を送ることができます。あなたが持っているファンベースのタイプがわかっている場合、デシジョンツリーを使用すると、顧客タイプの範囲としてアプローチする方法を決定するのに役立ちます。
予測を視覚化する
意思決定ツリー、ランダムフォレスト、植毛アルゴリズムなどの予測分析モデルの配列を実行したとします。これらの結果をすべて組み合わせて、すべてがサポートしている一貫した物語を提示することができます。ここで、信頼度は数学的関数を使用して計算できる数値のパーセンテージです。計算の結果は、可能性のある発生の確率をカプセル化する。
x軸上で、支持証拠は、可能性のある結果を特定するコンテンツ分析モデルで分析されたコンテンツソースを表す。ほとんどの場合、予測モデルは、さまざまなソースからのデータを使用して、可能な結果を導出するために大きなデータセットを処理していました。したがって、視覚化において最も重要なサポートエビデンスのみを表示する必要があります。
視覚化において最も重要な支持証拠のみを表示する。上記では、予測分析を適用して得られた結果の概要を、信頼スコアおよび各証拠に対する証拠と共に、起こり得る結果を示す視覚化として提示する。以下の3つのシナリオが表示されます。
Store Sに毎週少なくとも100台を出荷しないと、Item Aの在庫は需要に追いつかなくなります(信頼スコア98%)。アイテムAの生産を56%以上増やすと40%増加します。 (信頼スコア:83%)
- カリフォルニアでのマーケティングキャンペーンは、アイテムAおよびDの売上を増加させるが、アイテムKは増加させない(信頼スコア72%)。あなたの予測分析モデルに従って、起こります。それらは尤度の降順でここにリストされていることに注意してください。
- ここで最も重要な支持証拠は、いくつかのコンテンツソースからの抜粋がどのようにx軸に表示されるかで構成されています。特定のシナリオにどのように到達したのかを説明する必要がある場合は、それらを参照し、それをサポートする証拠を提示することができます。この視覚化の背後にある力は、そのシンプルさです。数か月後にデータに予測分析を適用し、いくつかの繰り返しを経て、意思決定者とのミーティングに進むことを想像してください。ビジネスに大きな影響を与える可能性のある3つのシナリオを1つのスライド視覚化で武装しています。このような視覚化は効果的な議論を生み出し、経営陣を「ああ」の瞬間に導くことができます。