ビデオ: UnderTale OST: Dummy! 10 Hours HQ 2024
データマイナーは、多くの場合、特別な機能を利用してより多くの情報を簡単なチャートにまとめます。ラベル、オーバーレイ、インタラクティブ選択は、データマイニングアプリケーションの特徴であり、生産性を高める特別な機能です。
次の図に示すように、馬力が増加すると走行距離が減少します。
<! - 1 - >マイレージは、時間の経過とともに、マイル数とモデル年の散布図が見えます。これらの2つのアイデアを1つのグラフにまとめると便利です。
ラベルには、2つ以上の変数をグラフに統合するための一般的なデータマイニング手法が含まれています。
-
ラベル: ラベルは、散布図に重ね合わせた文字列またはカテゴリ変数の値です。次の図は、自動車の年式で示された散布図を示しています。
<! - 2 - >ポイントや長いラベルが多いデータセットでは、これらのグラフを読むことができません。解決策は、データのサンプルのみを使用することです。この種のサンプリングの設定を次の図に示します。
-
オーバーレイ: オーバーレイでは、カテゴリ変数の値によってポイントの形状または色が定義されます。次の図は、マイレージ対馬力散布図のモデル年をオーバーレイする散布図の設定を示しています。
<! - 3 - >エクスポートされたオーバーレイ散布図が次の画像に表示されます。点のオーバーレイよりも色のオーバーレイを読む方が簡単です。セットアップは通常ほぼ同じです。
散布図に留意すべきもう一つのこと:複数の点が同じ場所にあるかもしれません!そうであれば、100件の事件の1件につき1点を伝えることができない場合があります。対処法は、複数のインスタンスを表示させるオプションを確認することです。ポイント・サイズまたは ジッタ (実際の位置からわずかに移動してすべてを表示させる)オプションを探します。
インタラクティブな散布図は、データ・マイナーにとって大きな節約効果をもたらします。
興味深いグループのケースがグラフで表示され、そのケースだけをさらに調査したいとします。ちょうど1つか2つのポイントを見ているなら、ホバリングで必要な情報を得るかもしれませんが、それは2つ以上のポイントに興味があるときは満足できません。
インタラクティブな散布図のデータ選択ツールを使用すると、データを選択する力が増します。次の図は同じグラフの設定を示していますが、マウスをクリックしてドラッグすることでポイントのグループが選択されています。これは単なる視覚的な特徴ではない。
選択したポイントを新しいデータセットとしてエクスポートできます。これは非常に便利で速いです!
必要なポイントが長方形の選択にうまく収まらない場合は、他にもオプションがあります。ズーム/選択領域を参照してください。長方形選択のための四角形とフリーフォーム選択のための丸みを帯びた形のボタンを見ることができます。
世界各地で販売されているタバコのニコチン含有量に関するデータを使った自由形式の選択例です。この散布図は、6つの国連地域のサンプルについて、たばこあたりのニコチンを示しています。データマイナーは伝統的なツールを非伝統的な方法で使用することがよくあります)。
地域内の点は完全な垂直線にはなりません。左および右への小さなシフト(ジッタ)は、可読性および外観のためにのみ行われます。いくつかのタバコは例外的に高いレベルのニコチンを持ち、そのようなケースを選択したいと考えています。
ドロップダウンメニューには選択オプションがあります。ポリゴン選択では、散布図上に自由形式の領域をマークすることができます。
マークを付けるには、グラフをクリックして開始点を作成し、必要な形状になるまでポイントのグループを何度も何度もクリックします。
右クリックは選択を完了したことを示します。これはグラフ上のハイライトから見ることができます。