NTTが大規模言語モデル「tsuzumi」、軽量&日本語に強い――商用化は24年3月予定
ケータイ Watch
120Picks
コメント
選択しているユーザー
>パラメーターサイズが6億の超軽量版と、70億の軽量版が用意される。NTT(持株)では、OpenAIの「GPT-3」の1750億パラメーターと比べ、およそ約1/300(超軽量版)および1/25(軽量版)と軽量であるとアピール。
ここ、実はChatGPT(gpt-3.5-turbo)のパラメータ数が1750億ではなく200億であることが、マイクロソフトの別論文で出てる、って情報があります。これを基準にすると、1/300, 1/25と書かれているのは、ChatGPT比較ではそれぞれ1/30, 1/3くらいだと思った方がいいかも。
参考:
https://twitter.com/Teknium1/status/1718945379612610565
注目のコメント
「自然言語処理研究から40年、満を持してデビュー!」
アピールするのはそこではないのでは?OpenAIなど他社はもっと短い期間で開発しているのだから。劇的なスピードでの進化に期待。