Picks
46フォロー
8329フォロワー
Anthropic、AIチャット「Claude 3」を3サイズで 日本語力も向上
シバタ アキラWeights & Biases カントリーマネージャー
弊社の運営するLLM日本語評価リーダーボード、Nejumi.ai でもOpenAIのモデルに次いで上位に来ていたのがClaude v2でした。多言語での性能には定評があり、韓国のSKテレコムやLG CNSなども出資しています。これまでは日本語ではGPT-3.5レベルの評価でしたが、今回の評価は英語ではGPT-4を超えた、とあって期待値が高まります。ただしモデル開発者の自己評価は概して自社モデルに贔屓目なので、弊社も評価を早く出したいところですが、AWS Bedrockではまだ最大のモデルが使えないということで、彼らの精度評価の検証にはもうすこし時間がかかりそうです。
Google、「Gemini」の人物画像生成の過剰補正問題について説明 「AIの罠を乗り越えていく」
シバタ アキラWeights & Biases カントリーマネージャー
問題発覚してすぐにサービス停止という対応の速さが気になりました。以前だったら「学習データの問題」「アルゴリズムが学習した結果」などの理由で放置されることも多かったが、AIサービスへの責任の捉え方のフェーズが変わってきた。何が人種差別的なのかは時期、対象者、用途によって変わってしまうので、画一的な対処するのが難しい。歴史的事実に対しては事実に即した生成が求められる(ことが多い)、一般的な概念の時はよりニュートラルなアウトプットが求められる(ことが多い)ので、そこから逸脱したアウトプットは明示しないと生成されない、などとするのだろうか。
NORMAL
投稿したコメント