2023/5/26

【舞台裏】サイバーが「大規模言語モデル」を生み出した必然

NewsPicks 編集部 記者
世界のテック企業がしのぎを削る「生成AI」の戦場に、サイバーエージェントも殴り込みをかける。
5月上旬、サイバーは生成AIの基盤となる日本語の大規模言語モデル(LLM)を独自開発したと発表。その翌週には一般公開に踏み切った。
ネット広告代理事業を主力とするサイバーは、大量のデータを扱う広告配信でAIの活用を進めてきた。全社員のうちエンジニアの比率も4割を超える。
1年半以上をかけたというLLMの開発は、ChatGPTが世界を席巻するよりかなり前から始まっていた。
なぜ自社でLLMを開発するに至ったのか。自らどう使いこなしていくのか。
サイバーの中で開発を担ったAI事業本部AIクリエイティブ部門で責任者を務める毛利真崇氏と、機械学習エンジニアの石上亮介氏に話を聞いた。
INDEX
  • LLMが必要だった根本理由
  • 少量の追加学習でカスタマイズ
  • OpenAIの論文が契機に
  • 「AIコピーライター」の実力
  • モデルの大規模化を阻む課題
  • 富岳のプロジェクトにも協力