R分類予測分析モデルにデータをロードする方法 - ダミー

ビデオ: IBM Cloud Pak for Data - Product Walkthrough 2025

予測を行うために分析するデータセットは、UCI機械学習リポジトリにある種データセットです。このデータセットには210の観測値と7つの属性とラベルがあります。ラベルは予測される結果であり、予測モデルの精度を訓練し評価するために使用されます。

予測しようとしている結果は、7つの属性の値が与えられている場合、それが存在する種の型（属性8）です。種子タイプの3つの可能な値は1,2および3とラベル付けされ、小麦のカマ、ローザおよびカナダの品種を表す。

<！カーネルの幅

カーネルの幅

非対称係数
カーネルの幅
カーネルの幅
カーネルの幅
カーネルの幅
カーネルの幅
>カーネル溝の長さ
小麦クラス

UCIリポジトリからデータセットを取得してメモリにロードするには、コンソールに次のコマンドを入力します。

<！ - 2 - > >>種子< -

を読んでください。

あなたは次のように見ています：csv（ "http：// archive。ic。edu / ml / machine -learning-databases / 00236 / seeds_dataset.txt"、header = FALSE、sep = "、as。

シード変数をクリックして、ソース内のデータ値を表示します（右上のシード変数をクリックしてデータフレーム変数

<！ - 3 - >

読み込んだデータの詳細は、summary（）を使用して見つけることができます機能： >>概要（シード）V1 V2 V3最小：10. 59分：12. 41分：0.8081第1クォート：12. 27第1クォート：13.45第1クォート：0 8569中央値：14. 36中央値：14. 32中央値：0. 8734平均値：14.85平均値：14. 56平均値：0. 8710第3平均：17. 30第3平均値：15. 71第3平均値： 0.8878最大値：21.18最大値：17.25最大値：0.9183 …