個人財務 予測分析のためのランダムフォレストを使用した監視学習モデルの作成方法 - ダミー

予測分析のためのランダムフォレストを使用した監視学習モデルの作成方法 - ダミー

目次:

Anonim

ランダムフォレストモデルは、予測分析に使用する。そのモデルを作成するために意思決定ツリーのアンサンブル(選択)が必要です。このアイデアは、弱い学習者(トレーニングデータのランダムなサブセット)の無作為標本を取って、最も強く最良のモデルを選択するように投票させることです。ランダムフォレストモデルは、分類または回帰のいずれかに使用できます。以下の例では、ランダムなフォレストモデルを使用してアイリス種を分類しています。

-

データのロード

このコードリストは、 iris データセットをsklearnのセッションにロードします: >>>>データセットimport load_iris >>>>> iris = load_iris()

分類子のインスタンスの作成

次の2行のコードは、分類子のインスタンスを作成します。最初の行はランダムなフォレストライブラリをインポートします。 2行目は、ランダムフォレストアルゴリズムのインスタンスを作成します。

<! - 2 - > >>>> sklearnから。アンサンブルのインポートRandomForestClassifier >>>> rf = RandomForestClassifier(n_estimators = 15、

random_state = 111)

コンストラクタの

n_estimators

パラメータは、ランダムフォレストモデル。この値は、フォレスト内のツリーの数を構築するために使用されます。一般にデータセットの10〜100%ですが、使用しているデータによって異なります。ここで、値はデータの10%である15に設定されます。後で、パラメータ値を150(100%)に変更すると同じ結果が得られることがわかります。

<! - 9 - >

n _estimators は、モデルのパフォーマンスとオーバーフィットを調整するために使用されます。値が大きいほど、パフォーマンスは向上しますが、オーバーフィットのコストがかかります。値が小さいほど、オーバーフィットしない可能性は高くなりますが、パフォーマンスは低下します。また、数を増やすと精度の向上が一般的に低下し、必要な計算能力が大幅に向上する可能性があります。コンストラクタで省略された場合、パラメータのデフォルトは10です。

トレーニングデータの実行

ランダムフォレスト分類子のインスタンスを作成する前に、データセットをトレーニングセットとテストセットに分割する必要があります。次のコードは、このタスクを実行します:sklearn import cross_validation >>>> X_train、X_test、y_train、y_test = cross_validationから >>>> test_size = 0,10、random_state = 111) >>>> rf = rf。 fit(X_train、y_train) 1行目は、データセットを2つに分割するライブラリをインポートします。2行目は、データセットを2つの部分に分割し、今分割したデータセットを2組の変数に割り当てるライブラリから関数を呼び出します。

3行目は、作成したばかりのランダムフォレストクラシファイアのインスタンスを取得し、fitメソッドを呼び出してトレーニングデータセットでモデルをトレーニングします。

テストデータの実行

次のコードでは、最初の行でテストデータセットがモデルに供給され、3行目に >>>> predicted = rfという出力が表示されます。予測される(X_test) >>>>予測された配列([0,0,2,2,2,0,0,2,2,1,2,0,1,2,2]) >モデルの評価

予測からの出力を

y_test

配列と相互参照することができます。その結果、2つのテストデータポイントが誤って予測されていることがわかります。したがって、ランダムな森林モデルの精度は86.6%でした。

sklearnインポートメトリックの >>>>予測された配列([0、0、2、2、2、0、0、2、2、1、 (0,0,2,2,1,0,0,2,2,1,2,0,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23) 2、2]) >>>>メトリック。精度_スコア(y_test、予測値)

  • 0。 (True、True、True、True、False、True、True、
  • True、True、True、True、True、True) dtype = bool)

n_estimators

パラメータを150に変更すると、ランダムフォレストモデルはどのように機能しますか?この小さなデータセットでは違いがないようです。これは、同じ結果を生成します。 >>>> rf = RandomForestClassifier(n_estimators = 150、

random_state = 111) >>>> rf = rf。フィット(X_train、y_train) >>>>予測= rf。予測される(X_test) >>>>予測された配列([0,0,2,2,2,0,0,2,2,1,2,0,1,2,2]) >

予測分析のためのランダムフォレストを使用した監視学習モデルの作成方法 - ダミー

エディタの選択

ファンタジーバスケットボールドラフトの試合のダンスとダンス - ダミー

ファンタジーバスケットボールドラフトの試合のダンスとダンス - ダミー

ファンタジーバスケットボールリーグに参加するには、チームにドラフトしたい選手を考慮する前に、以下のDOとDON'Tを考慮する必要があります。クレジット:©iStockphoto。 com / IS_ImageSourceファンタジーバスケットボールのドラフトを選ぶほとんどのファンタジーバスケットボールリーグでは、コミッショナー(リーグを設定する人)がオーダーを決定します。

バスケットボールコートのラインと寸法 - ダミー

バスケットボールコートのラインと寸法 - ダミー

バスケットボールコートには対称性があります。裁判所の半分はもう片方の鏡像です。バスケットボールコート全体(図1参照)は94フィート×50フィートです。各ハーフコートには、フリースローレーンとサークル、さらにバスケットからの距離が異なる3点弧が描かれています。

ファンタジーフットボールでフリーエージェントを獲得する - ダミー

ファンタジーフットボールでフリーエージェントを獲得する - ダミー

ファンタジーフットボールシーズン中に、フリーエージェント - 所有している選手を捨てようとするリーグチームに利用可能な選手。フリーエージェントプールを使用して、負傷したプレーヤーまたはあなたの期待に沿わない人を置き換えてください。これらのヒントを使用して、フリーエージェントを見つけることができます。

エディタの選択

PowerPoint 2007でグラフィックを再描画する - ダミー

PowerPoint 2007でグラフィックを再描画する - ダミー

PowerPoint 2007でグラフィックを再描画する色。 Recoloringは、PowerPointのグラフィックに均一な色を与えます。再現されたグラフィックスは背景に役立ちます。グラフィックを選択し、グラフィックの色を変更するには、次の手順を実行します。

Mac用Office 2011のpowerPointアニメーションオプション - ダミー

Mac用Office 2011のpowerPointアニメーションオプション - ダミー

Mac用のPowerPoint 2011で作成したスライドの場合、アニメーションタブでPowerPointのアニメーションオプショングループを使用できます。各エフェクトには独自の選択肢が用意されています。アニメーションオプションは、少なくとも1つのアニメーションを適用するまで適用できません。

Office 2011 for MacのPowerPointスライドにサウンドを直接録音する - ダミー

Office 2011 for MacのPowerPointスライドにサウンドを直接録音する - ダミー

PowerPointスライドショーで使用する事前録音済みのクリップがあり、独自のオーディオを作成する必要がある場合は、次の手順でPowerPoint 2011 for Macのスライドに直接サウンドを録音できます。リボンの[ホーム]タブをクリックし、 [Media]→[Audio Audio]を選択して、...を表示します。

エディタの選択

エッジアニメートタイムラインとステージコントロールの詳細 - ダミー

エッジアニメートタイムラインとステージコントロールの詳細 - ダミー

エッジアニメイトには、タイムラインとステージ。あなたは自分の好みに合わせて調整することができます。これには、ステージを中央に配置し、ステージを拡大し、要素をフィルタし、タイムラインのスナップをオンまたはオフにする簡単な方法が含まれます。ステージとタイムラインの細かいコントロールには、次のものがあります。ステージのセンタリング:あなたが...

トリガをエッジアニメーションステージに追加する方法 - ダミー

トリガをエッジアニメーションステージに追加する方法 - ダミー

Adobe Edge Animate CCでは、ステージトリガー - 本質的に、アニメーションの再生方法を制御するコマンドです。ステージトリガーを追加するには、特定の順序でいくつかのステップを実行する必要があります。次の手順では、ステージトリガーを使用してアニメーションにループを追加する方法を示します。

エッジアニメ - ダミーの位置決めとサイジングの設定方法

エッジアニメ - ダミーの位置決めとサイジングの設定方法

Adobe Edge Animate CCには位置決めとサイジングについては、これらの機能の多くは、要素を入れ子にするときに最も効果的なので、要素パネルの仕組みを理解する必要があります。位置付けとは、ステージまたは親要素のいずれかに相対的な要素の座標を指します。