個人財務 マシンラーニングにおけるクロスバリデーションの選択を最適化する - マシン学習の仮説を有効にすることができるダミー

マシンラーニングにおけるクロスバリデーションの選択を最適化する - マシン学習の仮説を有効にすることができるダミー

ビデオ: 【機械学習】モデルの評価と選択 | 交差検証、さまざまな評価基準 2024

ビデオ: 【機械学習】モデルの評価と選択 | 交差検証、さまざまな評価基準 2024
Anonim

マシン学習仮説を有効に検証できることにより、選択したアルゴリズムをさらに最適化することができます。このアルゴリズムは、データからの信号を検出し、予測関数の過大な変動を生成せずに予測関数の実際の関数形式に適合する能力を備えているため、データの予測パフォーマンスの大部分を提供します。すべての機械学習アルゴリズムがあなたのデータに最も適しているわけではなく、あらゆる問題に対応できるアルゴリズムはありません。特定の問題に適したものを見つけることは、あなた次第です。

<!予測パフォーマンスの第2の原因は、選択されたアルゴリズムの学習能力を高めるために適切に変換され選択されたときのデータそのものです。

最終的なパフォーマンスのソースは、学習の前に決定し、データから学習しないパラメータであるアルゴリズムの

ハイパーパラメータ を微調整することによって得られます。それらの役割は、先験的仮説を定義することであり、他のパラメータは、アルゴリズムがデータと相互作用した後の事後確率を特定し、最適化プロセスを使用して、あるパラメータ値良い予測を得るうえでより効果的です。 <! - 2 - > すべての機械学習アルゴリズムがハイパーパラメータチューニングを必要とするわけではありませんが、最も複雑なものもありますが、そのようなアルゴリズムはそのままでは機能しますが、予測の正確さでハイパーパラメータがデータから学習されていない場合でも、ハイパーパラメータを決定する際に作業中のデータを考慮する必要があります。相互検証と可能性の慎重な評価に基づいて選択を行う必要があります。 <! - 3 - > 複雑な機械学習アルゴリズムは、見積もりの​​分散に最も影響を受け、多くのパラメータで表現される多くの選択肢を提示します。彼らとうんざりすると、学習しているデータに多かれ少なかれ適応します。時には過度の過パラメータのつまずきがアルゴリズムによってデータからの偽信号を検出することさえあるかもしれません。これは、ハイパーパラメータ自体を、テストセットや繰り返しの相互検証スキーマのような固定参照に基づいてあまりにも多くの操作を開始すると、検出されない分散の原因となります。 RとPythonは、入力行列を列車、テスト、および検証部品に分割するスライシング機能を提供します。特に、クロスバリデーションやブートストラップなどのより複雑なテスト手順の場合、Scikit-learnパッケージはモジュール全体を提供し、Rは特殊なパッケージを持ち、データの分割、前処理、テストの機能を提供します。このパッケージはキャレットと呼ばれます。

ハイパーパラメータが形成する可能性のある値の組み合わせによって、最適化をどこで探すのが難しいかが決まります。勾配降下について論じるときに説明したように、最適化空間は、より良いまたは悪い結果をもたらす値の組み合わせを含むことができる。あなたが良い組み合わせを見つけたとしても、それが最良の選択であるという保証はありません。 (これは、エラーを最小限にするときに極小に陥るという問題です。)この問題を解決する実際の方法として、特定のデータに適用されるアルゴリズムのハイパーパラメータを検証する最良の方法は、クロスバリデーションを行い、最良の組み合わせを選ぶことができます。グリッド検索と呼ばれるこの簡単なアプローチは、可能な値の範囲をサンプリングしてアルゴリズムに体系的に入力し、一般的な最小値が発生したときに見つけることができます。一方、グリッド検索は、計算量が多く(現代のマルチコアコンピュータでこの作業を簡単に並列実行できます)、非常に時間がかかるため、重大な欠点もあります。さらに、組織的で集中的なテストでは、データセットに存在するノイズによっていくつかの良いが偽の検証結果が発生する可能性があるため、エラーが発生する可能性が高くなります。

グリッド検索の代替手段もあります。すべてをテストする代わりに、ベイズのアプローチを使用して(Nelder-Meadメソッドのような)計算上重く数学的に複雑な非線形最適化技法によって導かれる可能性のあるハイパーパラメータ値の空間を調べることができます以前の結果の利点)、またはランダム検索を使用します。

驚くべきことに、ランダム検索は信じられないほどうまく機能し、理解しやすく、最初は盲目的な幸運に基づいているだけではありません。実際、この技術の主なポイントは、十分なランダムテストを選択すると、同様に実行する組み合わせのわずかに異なる組み合わせをテストする際にエネルギーを無駄にせずに正しいパラメータを見つけることができる可能性があるということです。

以下のグラフは、ランダム検索がうまく動作する理由を説明しています。系統的探査は有用ではあるが、すべての組み合わせをテストする傾向があり、一部のパラメータが結果に影響を与えない場合、エネルギーの浪費となる。ランダム探索は実際には組み合わせの数は少なくなりますが、各ハイパーパラメータの範囲内でより多くのテストが行​​われます。

グリッド検索とランダム検索の比較。

無作為化検索がうまくいくためには、15回から最大60回までのテストを行う必要があります。グリッド検索でより多くの実験が必要な場合は、ランダム検索に頼るのが理にかなっています。

マシンラーニングにおけるクロスバリデーションの選択を最適化する - マシン学習の仮説を有効にすることができるダミー

エディタの選択

自転車の点検チェックリスト - ダミー

自転車の点検チェックリスト - ダミー

すぐに自転車の点検をするために数分。あなたの自転車を一時的に与えることは、あなたの次の乗り心地の安全性、快適性、そして楽しさを高めることができます。乗車準備の一環として、次の手順に従ってください:車輪のクイックリリースレバーを開閉して、確認します。

必須サイクリング用具 - ダミー

必須サイクリング用具 - ダミー

あなたはバイクの乗り心地をさらに楽しくするために何百万ものものを買うことができます。自転車用に必要なアクセサリーをいくつかご紹介します。ヘルメット:ヘルメットを着用することはオーストラリアとニュージーランドの法律です。

自転車の範囲を閲覧可能 - ダミー

自転車の範囲を閲覧可能 - ダミー

あなたはサイクリングをすることに決めましたが、その重要なキットを欠いている - バイク!あなたが望む自転車のタイプを正確に知っていない限り、良いアドバイスは、あなたの時間を費やして、自転車で何をするのか、どこに乗るのかを本当に考えてみることです。

エディタの選択

アプリとプライバシー - ダミーを特定する

アプリとプライバシー - ダミーを特定する

Spotifyアプリケーションに登録すると、あなたの個人的な詳細の一部にアクセスする。たとえば、Top10アプリを使用してプレイリストを公開するには、既存のFacebookアカウントにリンクする必要があります。このプロセス中、Facebookはあなたに特定の種類の共有を許可するかどうか尋ねます。

モバイル対応携帯電話を識別する - ダミー

モバイル対応携帯電話を識別する - ダミー

SpotifyモバイルはiPhoneで最も人気がありますが、優れたAndroidバージョン(basks Androidマーケットの5つ星評価のうち5つの評価では5位に入っています)が急速に追いついています。

特集 - ダミー

特集 - ダミー

スポットメイキングは、モバイルでも、あらゆる音楽への普遍的な即時アクセスを可能にしますデバイスまたはデスクトップコンピュータ。 Facebookは人々が古い友達と再会して新しい友達を作るのを助け、Spotifyの助けを借りて青春の歌を再発見し、友人や検索を通じて新鮮な音楽を発見しました。

エディタの選択

IOSアプリケーションでオブジェクト指向設計を使用する方法 - ダミー

IOSアプリケーションでオブジェクト指向設計を使用する方法 - ダミー

IOSは、動作がオブジェクトに関連付けられているプログラムを設計するさまざまな方法です。説明するために、紅茶とスープの作り方を検討することを検討してください。しかし、即座に代わりに活動に飛び込んではいけません。探偵が犯罪現場に入るように行動してください。

IOSアプリケーションでハイレベル抽象化を使用してビデオを再生する方法 - ダミー

IOSアプリケーションでハイレベル抽象化を使用してビデオを再生する方法 - ダミー

このセクションでは、MPMoviePlayerViewControllerクラスの高レベル抽象化を使用してiOSアプリケーションでビデオを再生する方法を説明します。 - (IBAction)playVideo:(id)sender {MPMoviePlayerViewController * moviePlayer = [[MPMoviePlayerViewController alloc] initWithContentURL:movieURL];このコードは、ビデオビューコントローラ内のTTTVideoViewControllerファイルからです。 [self presentMoviePlayerViewControllerAnimated:moviePlayer];}シンプルさ自体!必要なのはURLです。

IOSアプリケーションでJavaスクリプトオブジェクト表記を使用する方法 - ダミー

IOSアプリケーションでJavaスクリプトオブジェクト表記を使用する方法 - ダミー

JavaScript Object Notation (JSON)はiOSアプリのデータを表現する上で事実上の標準になっています。 JSONを使用して、Web上でデータを転送したり、長期保存データを保存および取得するためのフォーマットとして使用することができます。 JSONは、人間が読める形式であり、マシンが理解しやすい形式です。 JSONのデータは1つにまとめることができます...