個人財務 予測分析のためのランダムフォレストを使用した監視学習モデルの作成方法 - ダミー

予測分析のためのランダムフォレストを使用した監視学習モデルの作成方法 - ダミー

目次:

Anonim

ランダムフォレストモデルは、予測分析に使用する。そのモデルを作成するために意思決定ツリーのアンサンブル(選択)が必要です。このアイデアは、弱い学習者(トレーニングデータのランダムなサブセット)の無作為標本を取って、最も強く最良のモデルを選択するように投票させることです。ランダムフォレストモデルは、分類または回帰のいずれかに使用できます。以下の例では、ランダムなフォレストモデルを使用してアイリス種を分類しています。

-

データのロード

このコードリストは、 iris データセットをsklearnのセッションにロードします: >>>>データセットimport load_iris >>>>> iris = load_iris()

分類子のインスタンスの作成

次の2行のコードは、分類子のインスタンスを作成します。最初の行はランダムなフォレストライブラリをインポートします。 2行目は、ランダムフォレストアルゴリズムのインスタンスを作成します。

<! - 2 - > >>>> sklearnから。アンサンブルのインポートRandomForestClassifier >>>> rf = RandomForestClassifier(n_estimators = 15、

random_state = 111)

コンストラクタの

n_estimators

パラメータは、ランダムフォレストモデル。この値は、フォレスト内のツリーの数を構築するために使用されます。一般にデータセットの10〜100%ですが、使用しているデータによって異なります。ここで、値はデータの10%である15に設定されます。後で、パラメータ値を150(100%)に変更すると同じ結果が得られることがわかります。

<! - 9 - >

n _estimators は、モデルのパフォーマンスとオーバーフィットを調整するために使用されます。値が大きいほど、パフォーマンスは向上しますが、オーバーフィットのコストがかかります。値が小さいほど、オーバーフィットしない可能性は高くなりますが、パフォーマンスは低下します。また、数を増やすと精度の向上が一般的に低下し、必要な計算能力が大幅に向上する可能性があります。コンストラクタで省略された場合、パラメータのデフォルトは10です。

トレーニングデータの実行

ランダムフォレスト分類子のインスタンスを作成する前に、データセットをトレーニングセットとテストセットに分割する必要があります。次のコードは、このタスクを実行します:sklearn import cross_validation >>>> X_train、X_test、y_train、y_test = cross_validationから >>>> test_size = 0,10、random_state = 111) >>>> rf = rf。 fit(X_train、y_train) 1行目は、データセットを2つに分割するライブラリをインポートします。2行目は、データセットを2つの部分に分割し、今分割したデータセットを2組の変数に割り当てるライブラリから関数を呼び出します。

3行目は、作成したばかりのランダムフォレストクラシファイアのインスタンスを取得し、fitメソッドを呼び出してトレーニングデータセットでモデルをトレーニングします。

テストデータの実行

次のコードでは、最初の行でテストデータセットがモデルに供給され、3行目に >>>> predicted = rfという出力が表示されます。予測される(X_test) >>>>予測された配列([0,0,2,2,2,0,0,2,2,1,2,0,1,2,2]) >モデルの評価

予測からの出力を

y_test

配列と相互参照することができます。その結果、2つのテストデータポイントが誤って予測されていることがわかります。したがって、ランダムな森林モデルの精度は86.6%でした。

sklearnインポートメトリックの >>>>予測された配列([0、0、2、2、2、0、0、2、2、1、 (0,0,2,2,1,0,0,2,2,1,2,0,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23) 2、2]) >>>>メトリック。精度_スコア(y_test、予測値)

  • 0。 (True、True、True、True、False、True、True、
  • True、True、True、True、True、True) dtype = bool)

n_estimators

パラメータを150に変更すると、ランダムフォレストモデルはどのように機能しますか?この小さなデータセットでは違いがないようです。これは、同じ結果を生成します。 >>>> rf = RandomForestClassifier(n_estimators = 150、

random_state = 111) >>>> rf = rf。フィット(X_train、y_train) >>>>予測= rf。予測される(X_test) >>>>予測された配列([0,0,2,2,2,0,0,2,2,1,2,0,1,2,2]) >

予測分析のためのランダムフォレストを使用した監視学習モデルの作成方法 - ダミー

エディタの選択

キーボードからQuickBooksアクションへのショートカット - ダミー

キーボードからQuickBooksアクションへのショートカット - ダミー

QuickBooks 2012には便利なショートカットが用意されています重要な会計業務を遂行する。この表では、最も便利なQuickBooksショートカットをいくつか紹介しています。ショートカットキーまたはキーの組み合わせ結果+選択した番号または日付ファイルに表示されている値に1を加算 - 表示されている値から1を引く...

QuickBooks 2012を介して給与サービスに登録する - ダミー

QuickBooks 2012を介して給与サービスに登録する - ダミー

QuickBooks 2012 Intuit QuickBooks Payroll Servicesページから特定のオプションを選択した後、一連のWebページフォームを記入します。あなたの会社名と住所を入力し、会社の雇用者識別番号またはEINを入力し、Intuitのようにクレジットカード情報も入力します。

同時にQuickBooks 2012に領収書と請求書を記録する - ダミー

同時にQuickBooks 2012に領収書と請求書を記録する - ダミー

はQuickBooks 2012で、アイテムの領収書を記録すると同時に受け取ったアイテムの請求書を記録します。これは、明細受領伝票登録ウィンドウの上部付近に表示される請求受領チェックボックスを選択するだけで実行できます。

エディタの選択

公正なダミーを戦うことによる結婚作業

公正なダミーを戦うことによる結婚作業

いくつかのカップルは、彼らが決して論じることはないと主張する。これは、両方のパートナーが自由に相違点を表現できるような結婚では不可能です。他のカップルは頻繁に非常に大声を出す頻繁な議論を持っています。しかし、戦いの量と頻度はあまり知られていない - カップルが戦う問題でもありません。最も重要なのは...

事件後のあなたの関係の再構築 - ダミー

事件後のあなたの関係の再構築 - ダミー

不倫は離婚の主要な原因ですが、離婚するよりも事件。事件後の再建は、カップルが不倫やパターンをさまざまな形で直面することを要求します。時間は癒えますが、それだけではありません。ここではいくつか...

苦しい関係の警告サインを認識する - ダミー

苦しい関係の警告サインを認識する - ダミー

完全な関係はありません。カップルは、紛争の公正な分配を期待する必要がありますが、これらの紛争にどのように対処するかは、強さや苦痛の兆候となります。毎日の問題が時間の経過とともに克服できない問題になる可能性を見失うと、困ってしまうことがあります。ここにいくつかの警告兆候があります...

エディタの選択

セキュリティで保護されたWebサーバーをSEOフレンドリにする方法 - ダミー

セキュリティで保護されたWebサーバーをSEOフレンドリにする方法 - ダミー

Ifユーザーがクレジットカード番号や他のタイプのアカウント情報などの機密データを提供するWebサイト上のページがある場合、これらのページを安全かつSEOに適したものにすることができます。機密情報を保護するためのインターネットソリューションは、これらのWebページを安全なサーバーに置くことです。技術的には、これは...

あなたのウェブページをローカライズする方法 - ダミー

あなたのウェブページをローカライズする方法 - ダミー

ローカルでは、あなたのページにローカルな用語があることを確認することです。理想的には、「お問い合わせ」ページだけではなく、すべてのページにこれらの用語を載せてください。いくつかのウェブサイトでは、地域の検索用語をランク付けする必要がありますが、やりたいことが少しでもありません。

検索エンジンがあなたのウェブサイトを索引付けしているかどうかを調べる方法 - ダミー

検索エンジンがあなたのウェブサイトを索引付けしているかどうかを調べる方法 - ダミー

Ifあなたは検索エンジンの最適化(SEO)を心配しているので、あなたのサイトが実際に検索エンジンやディレクトリにあるかどうかを調べることが重要です。あなたのサイトは、誰かがGoogleで検索したときに現れませんか? Bingでそれを見つけることができませんか?おそらくそれは単にそこにないと思ったことはありますか?