【発見】すごく丁寧に頼めば、AIの「バイアス」はなくなる？

提携メディア

NewsPicksでは週7日毎日、世界のトレンドの背景を追う連載シリーズを開始しています。木曜日は「The Next Big Thing（次のテクノロジー）」です。

INDEX

AIモデルの「差別」を防ぐ方法

金融や健康に関する判断を行うAIモデルの設定で肝心なのが、アラインメントの問題だ。

📍編集部注：アラインメント
大規模言語モデルに価値観や目標を組み込み、有用で安全かつ信頼できるモデルにするプロセス

しかし、学習データの偏りによってモデルにバイアスが完全に入り込んでしまった場合、どうすればそのバイアスを減らせるのだろうか。

AI開発会社アンスロピックの解決策は、AIに

「どうか差別をやめてください。さもないと訴えられてしまいます」

と丁寧にお願いすることだ。

Generated by Midjourney

これは真面目な話である。

【新事実】「低脂肪牛乳」の方がヘルシー、はウソだった

プレミアム会員限定の記事です
今すぐ無料トライアルで続きを読もう。

平松伊織
PdM
・2023年12月21日
ときどき差別的なバイアスがかかった判断を下してしまうAI。
その欠点は、めちゃくちゃ丁寧にお願いしたらなくなるかもしれないという研究が発表されました。

実際にお願いし倒すことを前提にしたＡＩにできないのだろうかとも思うのですが、実用化に耐えうるかはまだわからないようです。

何にせよ、なんだか人間くさいなとと笑ってしまいました。人間の言葉遣いを学習しているので当たり前ではあるのかもしれませんが……。

お願いするくらいでどうにかなるのであれば最初からぜひ差別的な発言なくお願いしたい、と言いたいところですが、それもバイアスまみれの人間と同じく難しいのでしょうね。
佐藤元則
NCB Lab. 代表
・2023年12月21日
生成AIに間違いを教え、回答にバイアスを加えなくするようお願いすることで問題が解決するようです。さっそく使ってみよう。それはrealy?とにかくrealy。
Kato Jun
ユーザベース SPEEDAアナリスト
・2023年12月21日
様々な文章から学習をさせているのだから、人間と同様の反応をすることに驚きはない。