目次:
- 教師なし学習
- <!教師なし学習
- エラーは、ペナルティが追加され(コスト、時間の損失、後悔、痛みなど)、一定の行動方針が他のものよりも成功する可能性が低いことを教えるために役立ちます。強化学習の興味深い例は、コンピュータがビデオゲームを自分で演奏することを学ぶときに発生します。この場合、アプリケーションは、敵を避けながらゲーマーを迷路に抱かせるなど、特定の状況の例をアルゴリズムに提示します。アプリケーションは、アルゴリズムに必要なアクションの結果を知らせ、学習が危険なものであることを回避しながら生存を追求しようとする間に発生します。 Google DeepMindが古いAtariのビデオゲームを再生する強化学習プログラムを作成した方法を見てみることができます。ビデオを見ているとき、プログラムが最初は不器用で未熟なものであることに気づくが、それがチャンピオンになるまで、トレーニングで着実に向上する。
ビデオ: AI系スタートアップの最近のトレンドについて聞いてみました 2024
教師あり学習
- 教師なし学習
- 強化学習
- 教師あり学習
教師なし学習
は、アルゴリズムが例から学習するときに発生しますデータや関連するターゲットレスポンスは、数値や文字列ラベル(クラスやタグなど)で構成することができます。監督されたアプローチは、実際には教師の監督下で人間の学習に似ています。教師は、学生が暗記するための良い例を示し、生徒はこれらの具体例から一般的な規則を導き出します。 <! - 1 - >
目標が数値である回帰問題と、クラスやタグなどの定性的変数をターゲットとする分類問題を区別する必要があります。回帰タスクは、ボストン地区の家屋の平均価格を決定し、分類作業では、花弁の花と花弁の測定値に基づいて虹彩花の種類を区別します。教師なし学習
<!教師なし学習
は、アルゴリズムが関連するレスポンスのない単純な例から学習し、それ自身のデータパターンを決定するアルゴリズムに任せるときに発生する。このタイプのアルゴリズムは、クラスまたは新しい一連の無相関値を表す可能性がある新しいフィーチャなど、データを別のものに再構成する傾向があります。それらは、データの意味と教師付き機械学習アルゴリズムへの新しい有用なインプットを人間に提供するのに非常に有用です。<!学習の一種として、人間が特定のオブジェクトやイベントがオブジェクト間の類似度を観察するなど、同じクラスのものであることを理解するために使用する方法に似ています。マーケティング・オートメーションの形でウェブ上にある推奨システムは、このタイプの学習に基づいています。 マーケティング自動化アルゴリズムは、過去に購入したものからその提案を導き出します。これらの推奨事項は、どの顧客グループが最も類似しているのかを推定し、そのグループに基づいてユーザーの可能性の高い設定を推測することに基づいています。
強化学習強化学習
は、教師なし学習の場合のように、ラベルがない例をアルゴリズムに提示するときに発生します。しかし、アルゴリズムが提案している解決法にしたがって、正または負のフィードバックを伴う例を付けることができます。強化学習は、アルゴリズムが決定を下す必要のあるアプリケーション(教師なし学習のように説明的ではなく規範的です)につながり、その決定は結果をもたらします。人間の世界では、試行錯誤のようなものです。