ビデオ: IBM Cloud Pak for Data - Product Walkthrough 2024
予測を行うために分析するデータセットは、UCI機械学習リポジトリにある種データセットです。このデータセットには210の観測値と7つの属性とラベルがあります。ラベルは予測される結果であり、予測モデルの精度を訓練し評価するために使用されます。
予測しようとしている結果は、7つの属性の値が与えられている場合、それが存在する種の型(属性8)です。種子タイプの3つの可能な値は1,2および3とラベル付けされ、小麦のカマ、ローザおよびカナダの品種を表す。
<!カーネルの幅カーネルの幅
-
非対称係数
-
カーネルの幅
-
カーネルの幅
-
カーネルの幅
-
カーネルの幅
-
カーネルの幅
-
>カーネル溝の長さ
-
小麦クラス
UCIリポジトリからデータセットを取得してメモリにロードするには、コンソールに次のコマンドを入力します。
<! - 2 - > >>種子< -を読んでください。あなたは次のように見ています:csv( "http:// archive。ic。edu / ml / machine -learning-databases / 00236 / seeds_dataset.txt"、header = FALSE、sep = "、as。
シード 変数をクリックして、ソース内のデータ値を表示します(右上の シード 変数をクリックしてデータフレーム変数
<! - 3 - >読み込んだデータの詳細は、summary()を使用して見つけることができます機能: >>概要(シード)V1 V2 V3最小:10. 59分:12. 41分:0.8081第1クォート:12. 27第1クォート:13.45第1クォート:0 8569中央値:14. 36中央値:14. 32中央値:0. 8734平均値:14.85平均値:14. 56平均値:0. 8710第3平均:17. 30第3平均値:15. 71第3平均値: 0.8878最大値:21.18最大値:17.25最大値:0.9183 …