新着Pick
18Picks
Pick に失敗しました

人気 Picker
強化学習(Q学習)は画期的に素晴らしいのです。しかし、解きたい問題を、Q学習で扱えるフラットな構造に落とし込むのが、現実問題では結構難しいです。それ以前に、オンラインで完結する問題に実装できる状況も限られます(なにせ失敗を繰り返しますし)。

だから、リアルなシミュレーターを用意できる問題でないと、強みが発揮しづらいです。AlphaGoやロボットピッキングはシミュレーターをうまく作れたということもできます。AI開発はどれだけビッグデータを集められるかの戦いと言われることもありますが、強化学習においてはシミュレーターのリアルさの戦いに変ってゆく予感がします。最大の主戦場は、自動運転とロボットアームでしょう。
実にわかりやすい