新着Pick
22Picks
Pick に失敗しました

人気 Picker
もう少し違う言い方をしてみましょう。

お手本があってどこがどう良くて悪かったか判断できるようなものは教師あり学習。画像でいうとCNNで十分。

一方、お手本がなくてよかったか悪かったかだけがわかるとか(自動運転やゲームなどがそう)、お手本があってもどこがどれだけ悪いか定量できないものなど、専門的に言うと「ロスが返せないもの」は強化学習を使うのが一般的。