ビデオ: RPC-313 The Wellspring | Omega-Purple | Extradimensional / Infohazard RPC 2024
あなたのインフォグラフィックのためのデータを分析することで、あなたは注意する必要があり、一部のデータポイント - の異常値 として知られている - のよう規範の外にこれまでに横たわっていました自分自身に注意を促す。最も重大なケースでは、彼らはデータを歪め、対象の誤解を招くような画像を作成することさえできます。あなたは外れ値を持っているときを認識し、それについて何をすべきかを決定する必要があります。
この表には、この考え方を示す簡単な例が含まれています。 2つのデータセットは、2週間の試験で8週間、学生の成績を表します。数値は試験の正解率です。左側のデータセット(最初の試験)には異常値は含まれていませんが、右側のデータセット(2番目の試験)にはデータセットが含まれています。 1つの異常値は太字で示されています。
<! --1 - >週 | グレード(NO外れ値) | グレード(一方の外れ値) |
---|---|---|
1、 | 90% | 90% |
2 | 88% | 88% |
3 | 90% | 90% |
4 | 85% | 50% |
5 | 86% | 86% |
6 | 87% | 87% |
7 | 85% | 85% |
8 | 84% | 84% |
平均 > 87% | 83% | <! - 2 - > |
そのような場合にデータジャーナリストは何をしていますか?いくつかのオプションがあります:
異常値を投げ捨てます。
-
あなたのグラフィックで平均値しか使用しておらず、誤解を招くおそれがある場合は、異常値を外れとして取り除いてから、その週のない平均値を図に示すように計算します。 <! --- 3 - >
この例では、外れ値を捨てることは、この生徒の平均試験スコアは用語上の成果のよりよい表現である(最初の列が示すように)87%、最大ジャンプを意味します。このオプションを使用する場合は、すべてのことを説明する脚注を追加してください:この場合、データポイントの削除。可能な限り透明にしてください。
データをそのまま表示します。
-
グラフ内の平均値だけを使用している場合でも、チャート内のすべてのデータをプロットしている場合でも、次の図に示すように、いつでも正確にデータを表示できます。 この場合、あなたの読者がそれを完全に認識できるように、外れ値を呼び出す脚注を追加する必要があります。
「ベストフィットの線」を作成します。 "
-
このオプションは、すべてのデータを示すグラフを作成する場合にのみ適用されます。 線形回帰 とも呼ばれるベストフィットの線は、データの視覚的平均です。文字通り、散らばったデータ点を最もよく表す線です。