【時給5000円】今一番おいしい「AIバイト」って何だ?
コメント
注目のコメント
ChatGPTは元来GPT3から派生したモデルです。
一般的に開発者はモデルにデータを入れた後、強化学習を行います。強化学習とは、モデルによる回答結果をマシンが正否を与え、モデルが自己学習する機能です。
ChatGPTは、この強化学習を人間によるフィードバックで行いました。論文ではRLHF(Reinforcement Learning from Human Feedback)と呼ばれています。
RLHFの有効性が証明されたことから、記事のような人間による訓練バイトが出てきたのでしょう。AIが登場したからできた新しい職種で、AIが世に蔓延るかぎりなくならない職種です。とはいえ、AIが究極の自己学習をして、人間からの指導さえもいらなくなる未来も十分ありえます笑AIアノテーションは途上国の低賃金労働として問題視されています。日本でもありましたが単発な仕事が多かったと思います。
大規模基盤AIモデルで複雑なタスクが解けるようになり、日本語の高学歴バイトが増えてきたのですね。円安も無関係ではないかもしれません。日本にもデータアノテーションを手掛ける企業は数多く存在しますが、顧客企業のビジネス課題を解決するのに必要なデータをアノテーションするケースがほとんどです。
ただ、日本でもLLMの品質向上に必要な教師データを作ろうという取り組みはあります。たとえば理研の関根先生が中心となって、LLMを開発する企業などとの共同研究という形で日本語のインストラクションデータ(質問とその回答のデータ)を作成するプロジェクトを進めています。
この記事で言及されているScale AIのような企業と比べると作成しているデータの規模はまだ小さいのですが、日本におけるLLM開発にとって重要な取り組みなので期待しています。
https://www.youtube.com/watch?v=a1oi1dNBUKU
https://liat-aip.sakura.ne.jp/wp/
海外企業は大規模AIモデルのためのデータをあらゆる手段で収集しています。記事中に以下の記載がありますが、
> 今や、YouTubeの文字起こしをデータ化するという権利的に「グレー」な手法がまかり通り
最近のWSJのインタビューで、テキストから動画を生成できるSoraの学習にYouTubeの動画を使ったかと聞かれたOpenAIのミラ・ムラティCTOが顔をしかめて「分からない」と言葉を濁す場面が話題になりました(以下の動画の4:23あたりから)。
https://youtu.be/mAUpxN-EIgU?si=n7WFhCqtEW5osG2I&t=263
これに対しYouTubeのニール・モーハンCEOは、OpenAIがSoraの学習にYouTube動画を使ったとすれば違反だと答えています。
https://www.itmedia.co.jp/news/articles/2404/05/news098.html
大規模AIモデル開発の熾烈な戦いは当面続きそうです。