Rダミーのデータで周波数または密度を使用する方法

ビデオ: r/Rareinsults | YOU LOOK LIKE A THUMB 2025

Rの間隔でデータを分割することによって、いくらかの情報が失われます。それでも、データの最も完全な記述方法は、変数の確率密度関数（PDF）または密度を見積もることです。

この概念があなたには慣れていない場合は、心配しないでください。密度は、データの値がその値とほぼ同じになる確率に比例することを覚えておいてください。実際に、ヒストグラムの場合、密度はカウントから計算されるため、頻度を持つヒストグラムと密度を持つヒストグラムの唯一の違いは、999×999軸のスケールです。残りの部分については、まったく同じように見えます。 <！密度プロットを作成する方法 density（）関数を使用して、変数の密度関数を推定することができます。この関数自体の出力はそれほどはっきりしませんが、プロットで簡単に使用できます。たとえば、次のようにmileage変数mpgの密度を取得できます。 >> mpgdens < - 密度（cars $ mpg）

このように取得するオブジェクトは、本当に見る必要があります。しかし、そのリストは、密度をプロットすることを「密度をプロットする」と簡単にプロットします。

<！ - 2 - > >> plot（mpgdens）

プロットは端が少し粗く見えますが、重要なことはデータがどのように出てくるかを見ることです。密度オブジェクトは線としてプロットされ、データの実際の値は

軸で、密度は

軸です。

mpgdensリストオブジェクトには、とりわけ、xという要素とyという要素が含まれています。これらは、密度をプロットするための999および999の座標を表す。 Rが密度を計算すると、density（）関数はデータを小さな間隔で分割し、各間隔の中点の密度を計算します。それらの中点はxの値であり、計算された密度はyの値です。 <！ヒストグラムに濃度をプロットする方法 hist（）関数は、各区間のカウントを返します。値が一定の間隔内にある可能性は、カウントに正比例します。特定の間隔内で値が増えるほど、選択した値がその間隔内にある可能性が高くなります。ヒストグラムにカウントをプロットするのではなく、密度をプロットするだけでよいのです。 Rはあなたのためにすべての計算を行います - 唯一必要なことは、hist（）のfreq引数をFALSEに設定することです： >> hist（cars $ mpg、col = "grey"、freq = FALSE）プロットはこれまでとまったく同じになります。

y 軸の値のみが異なります。 y 軸の目盛りは、ヒストグラムに密度プロットを追加できるように設定されています。そのためには、密度オブジェクトを引数としてlines（）関数を使用します。したがって、たとえば、前のコマンドの直後に次のコードを使用して、推定密度を追加することで、前のヒストグラムをもう少し詳しく調べることができます。 >> lines（mpgdens）

これらの2つのコマンドは右側にあります。 lines（）は密度オブジェクトmpgdensのxとy要素を使って線をプロットすることを覚えておいてください。