ビデオ: 高校野球で早生まれはどの程度不利なのか??甲子園2366人&プロも調査!! 2024
大きなデータ統計を使用する場合、中心からいくつかの異なるサマリーメジャーを使用してデータセットの広がりを識別します。偏差、四分位数、四分位間範囲(IQR)。
分散は、データセットの要素と平均との平均二乗偏差である。データのサンプルでは、分散は次のように計算されます。
<!ここで、999はサンプル中の単一要素の値である。は標本平均である。
-
n はサンプルサイズである。 標準偏差は分散の平方根です。ほとんどのアプリケーションでは、分散の尺度としての分散よりも標準偏差が使いやすくなります。これは、分散が
-
999単位で測定されるのに対し、標準偏差はデータと同じ単位で測定されるためです。たとえば、価格で構成されるデータセットの分散は、 999ドルで測定され、標準偏差はドルで測定されます。標準偏差は、データセットにおける広がりの最も広く使用される尺度である。
-
<! - 2 - > 四分円は、データセットを4つの等しい部分に分割します。第1四分位数(Q 999 999)は、データを観測値の最低25パーセントに、最高75パーセント(観測値の25パーセントはQ 999 1より小さい) 75%は999,999より大きい)。第2四分位(Q 999 2 999)は、データを観測の最低50%と最高50%に分けます。第3四分位(Q 999 999)は、データを観測値の最低75%と最高値25%とに分ける。四分位範囲(IQR)は、第3四分位点と第1四分位点の差に等しい:
<! - 3 - > IQRはデータの中央の50%を表します。 データセットの四分位数は、 ボックスプロットで最もよく示されています。 2013年にExxonMobilへの日次リターンのボックスプロットを次の図に示します。
ExxonMobil株に対する日次リターンのボックスプロット。ボックスプロットでは、ExxonMobilリターンの主要統計がいくつか表示されます。 >最小のリターンは、プロットの下部に単一点としてグラフ上に表示されます(ボックスプロットは個別点として アウトライヤー を示します)。 Q 999はボックスの底部として示され、Q 999はボックス中央の実線であり、Q 999はボックス。最大のリターンは、プロットの一番上に1つの点として表示されます。