ビデオ: Pattern Recognition②(Simon Clippingdale,2017/12/14) 2024
予測分析では、使用するアルゴリズムのデータをロードする必要があります。 Scikitには、データセットをロードする関数がすでに作成されているため、アイリスデータセットをscikitにロードするのは、2行のコードを発行するのと同じくらい簡単です。
がく片の長さ | がく片の幅 | 花びらの長さ | 花びら幅 | ターゲットクラス/ラベル |
---|---|---|---|---|
5。 1 9 9。 1。 4 990。 2 999 Setosa(0)999。 0 999。 2 994。 7 9 7。 4 999 Versicolor(1)999。 3。 3 9。 0 9992。 Virginica(2) | - 1 - > | 新しいPython対話型シェルセッションを開きます。 | 新しいPythonセッションを使用して、メモリに残っているものはなく、作業するにはクリーンスレートが必要です。 | プロンプトに次のコードを入力し、sklearnの出力を確認します: >>>>。データセットimport load_iris >>> iris = load_iris() |
これら2つのステートメントを実行した後、インタープリタからのメッセージは表示されません。変数irisは、虹彩からのすべてのデータを含む必要があります。 CSVファイル。 | <! - 2 - > | 予測モデルを作成する前に、新しい可変虹彩とそれを使って何ができるかを少し理解することが重要です。これにより、コードの実行が簡単になり、プロセスを簡単に把握できます。あなたは虹彩の値をインタプリタに入力することによって検査することができます。 >>>> iris | 出力は、アイリスからのすべてのコンテンツになります。 csvファイルと、load_iris関数が変数にロードしたデータセットに関するその他の情報が含まれています。変数は、4つの主な特性を持つ辞書データ構造です。虹彩の重要な特性を以下に列挙する。 | <! - 9 - > |
プロパティ名 | 説明 | データ | 観測値のすべての測定値が含まれます。 | feature_name |
-
target
観測値のすべてのターゲット(ラベル)を含みます。
-
target_names
クラスの名前を含みます。
変数名の後にドットを続けてプロパティ名を入力することで、インタプリタの値を表示することができます。例としてアイリスを使用しています。このような虹彩のプロパティにアクセスするためのデータ: >>>>虹彩。 data
これは、多くのプログラミング言語でオブジェクトのプロパティにアクセスするための標準的な方法です。
SVM分類子のインスタンスを作成するには、インタプリタに次のコードを入力します。 >>>> from sklearn。 svm import LinearSVC >>> svmClassifier = LinearSVC(random_state = 111)
最初のコード行は、Linear SVCライブラリをセッションにインポートします。線形サポートベクトル分類器(SVC)は、線形分類のためのSVMの実装であり、多クラスサポートを有する。データセットは幾分直線的に分離可能で、3つのクラスを持っているため、リニアSVCを使ってどのように実行されるかを調べることをお勧めします。
2行目は、変数svmClassifierを使用してインスタンスを作成します。これは覚えておくべき重要な変数です。 random_stateパラメーターを使用すると、これらの例を再現して同じ結果を得ることができます。 random_stateパラメータを指定しなかった場合、結果はここに示されている結果と異なる場合があります。