2023/12/21
【発見】すごく丁寧に頼めば、AIの「バイアス」はなくなる?
NewsPicksでは週7日毎日、世界のトレンドの背景を追う連載シリーズを開始しています。木曜日は「The Next Big Thing(次のテクノロジー)」です。
INDEX
- AIモデルの「差別」を防ぐ方法
- 「really」を繰り返すと効果あり
- 「お願い」を組み込めるのか
AIモデルの「差別」を防ぐ方法
金融や健康に関する判断を行うAIモデルの設定で肝心なのが、アラインメントの問題だ。
📍編集部注:アラインメント
大規模言語モデルに価値観や目標を組み込み、有用で安全かつ信頼できるモデルにするプロセス
大規模言語モデルに価値観や目標を組み込み、有用で安全かつ信頼できるモデルにするプロセス
しかし、学習データの偏りによってモデルにバイアスが完全に入り込んでしまった場合、どうすればそのバイアスを減らせるのだろうか。
AI開発会社アンスロピックの解決策は、AIに
「どうか差別をやめてください。さもないと訴えられてしまいます」
と丁寧にお願いすることだ。
これは真面目な話である。