• 特集
  • 番組
  • トピックス
  • 学び
プレミアムを無料で体験

Fast reinforcement learning through the composition of behaviours

Deepmind
1
Picks
このまま本文を読む
本文を読む

コメント


注目のコメント

  • 経営者

    AI(強化学習)を作るうえで、1.環境のモデルを作るのは大変だが、一度環境モデルがわかれば目的が変化しても対応しやすい 2.環境モデルを作らずに学習すれば早く学習できるが、目的の変化に適応できない、という問題がある。その中間となるソリューションを、複数のValue functionを作ることで解こう、というやりかた。面白い。


アプリをダウンロード

NewsPicks について

SNSアカウント


関連サービス


法人・団体向けサービス


その他


© Uzabase, Inc

マイニュースに代わり
フォローを今後利用しますか