Rの背の高いフォーマットのデータを持つ場合、格子グラフィックスを使用してデータ内のサブグループを視覚化することが簡単にできます。例えば、複数の変数を同時に解析したい場合はどうなりますか?
雇用、失業、その他の人口指標に関するデータを含む組み込みデータセットlongleyを考えてみましょう: >> str(longley) 'データ。フレーム ':16 obs。 7つの変数:$ GNP。デフレーター:num 83 88. 5 88. 2 89. 5 96.2 … $ GNP:num 234 259 258 285 329 … $失業者:num 236 232 368 335 210 … $ Armed。フォース:num 159 146 162 165 310 … $人口:108 108 109 110 111 112 … $年:int 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 … $従業員数:60名3 61. 1 60. 2 61.2データフレームの様々な変数を容易に分析する1つの方法は、最初にデータフレームをワイドフォーマットから高フォーマットに再形成することである。
<! - 1 - >
ワイドデータフレームには、各変数の列が含まれています。背の高いデータフレームにはすべて同じ情報が含まれていますが、データは、変数の名前を識別するために1つの列が予約され、2番目の列に実際のデータが格納されるように構成されています。
データフレームをワイドフォーマットから高フォーマットに容易に変更するには、reshape2パッケージのmelt()関数を使用します。覚えておいてください:
reshape2はベースRの一部ではありません。これはCRANで利用可能なアドオンパッケージです。インストール時にインストールすることができます。 packages( "reshape2")関数です。 <! - 2 - > >>ライブラリ( "reshape2")> mlongley str(mlongley) 'データ。 frame ':96 obs。 3変数:$年:int 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 … $変数:6レベルの "GNP。deflator"、…:1 1 1 1 1 1 1 1 1 … $ value:num 83 88. 5 88. 2 89. 5 96.2 … これで、背の高いデータフレームmlongleyをプロットし、新しい列の値と変数を数式の値〜Year |に使用できます。変数。 >> xyplot(value〜Year |変数、data = mlongley、+ layout = c(6,1)、+ parストリップテキスト= list(cex = 0.7)、+ scale = list(cex = 0 7)+)
追加の引数は、ストリップ。テキストとスケールは、チャートの上部にあるストリップのフォントサイズ(文字拡大率)とスケールを制御します。- <! - 1 - >
複数のグループでプロットを作成する場合は、結果のプロットが有意義であることを確認してください。例えば、GNPの単位(999国民総生産
の略)はおそらく数十億ドルです。対照的に、人口の単位はおそらく何百万という人々です。 (このトピックでは、longleyデータセットのドキュメントは明確ではありません。)
チャートジャンク
(誤解を招くようなグラフィックス)を作成したとして非難されることは望ましくありません。<! - 2 - >
