プレミアムを無料で体験

Fast reinforcement learning through the composition of behaviours

Deepmind

・2021/02/09

1

Picks

このまま本文を読む

本文を読む

コメント

注目のコメント

北川拓也
経営者
・2021年02月09日
AI（強化学習）を作るうえで、１．環境のモデルを作るのは大変だが、一度環境モデルがわかれば目的が変化しても対応しやすい　２．環境モデルを作らずに学習すれば早く学習できるが、目的の変化に適応できない、という問題がある。その中間となるソリューションを、複数のValue functionを作ることで解こう、というやりかた。面白い。

関連する記事

今日のニュース

マイニュースに代わり
フォローを今後利用しますか