【時給5000円】今一番おいしい「AIバイト」って何だ?
コメント
注目のコメント
「AIを賢くするお手伝いをしませんか」
年明けから、不思議なバイト勧誘がくるようになりました。
時給約5000円。リモート可で、好きな時間だけ働ける。
これはなかなか美味しいバイトなのではと、「AIトレーナー」をやってみました。
ChatGPTなど生成AIのサービスは色々使っているけれど、こうしたAIがどうやって賢くなっているのか、興味があったのです。
バイトを行いつつ、他のトレーナーと話したり、AIを賢くするプロセスについて調べて行くうちに、「AIを賢くするために働く人間たち」の姿が次第に見えてきました。
何より興味深いのは、こうした「AIの下働き」バイトが日本でどんどん増えていること。東大のPhD生や三菱重工のエンジニアといった優秀な若手人材たちが、「割のいいバイト」として作業を担っています。
AIトレーナーのバイト内容に興味があるという方から、GPT-4など大規模言語モデルがどのように賢くなっているのか知りたいという方まで、この世界をちょっと覗いてみる感覚で、お読みいただけたら嬉しいです。ChatGPTは元来GPT3から派生したモデルです。
一般的に開発者はモデルにデータを入れた後、強化学習を行います。強化学習とは、モデルによる回答結果をマシンが正否を与え、モデルが自己学習する機能です。
ChatGPTは、この強化学習を人間によるフィードバックで行いました。論文ではRLHF(Reinforcement Learning from Human Feedback)と呼ばれています。
RLHFの有効性が証明されたことから、記事のような人間による訓練バイトが出てきたのでしょう。AIが登場したからできた新しい職種で、AIが世に蔓延るかぎりなくならない職種です。とはいえ、AIが究極の自己学習をして、人間からの指導さえもいらなくなる未来も十分ありえます笑AIアノテーションは途上国の低賃金労働として問題視されています。日本でもありましたが単発な仕事が多かったと思います。
大規模基盤AIモデルで複雑なタスクが解けるようになり、日本語の高学歴バイトが増えてきたのですね。円安も無関係ではないかもしれません。