2022/1/12

【ディープ解説】コンピュータが言葉を操る自然言語処理がすごい

NewsPicks編集部 記者
コンピュータが人間の言葉を操る「自然言語処理」をご存じだろうか。
私たちが頭と手を動かさなくても、コンピュータがメールを読んで意味を理解し、巧みな文章表現で返信してくれる──。
そんな未来に今、ぐっと近づいているらしい。
盛り上がりのきっかけは2020年、米AI企業OpenAIが手掛ける言語モデル「GPT-3」を発表したことだった。「人が書いたものと見分けがつかないほど、コンピュータが自然な文章を生成できる」と飛躍的な進化が話題を呼び、衝撃が走ったのだ。
本当に?
百聞は一見にしかず、だ。まずは実際に見てみよう。
以下の文章は、任意で与えたタイトルとサブタイトルをもとに、GPT-3が生成したニュース記事だ。
Title: United Methodists Agree to Historic Split
Subtitle: Those who oppose gay marriage will form their own denomination


Article: (GPT-3が生成)
After two days of intense debate, the United Methodist Church has agreed to a historic split - one that is expected to end in the creation of a new denomination, one that will be "theologically and socially conservative," according to The Washington Post. The majority of delegates attending the church's annual General Conference in May voted to strengthen a ban on the ordination of LGBTQ clergy and to write new rules that will "discipline" clergy who officiate at same-sex weddings. But those who opposed these measures have a new plan: They say they will form a separate denomination by 2020, calling their church the Christian Methodist denomination.
(2段落目省略)
↓(日本語訳)

タイトル: 合同メソジスト教会、歴史的な分割に合意
サブタイトル: 同性婚に反対する人たちは、自分たちの宗派を作ることになる


記事:
2日間にわたる激しい議論の末、合同メソジスト教会は歴史的な分裂に合意した。ワシントンポスト紙によると、この分裂は「神学的にも社会的にも保守的」な新しい教団を創設することになると予想されている。5月に開催された年次総会に出席した代表者の過半数は、LGBTQ聖職者の叙任禁止を強化し、同性婚を執り行った聖職者を「懲罰」するための新しいルールを設けることに票を投じた。しかし、これらの措置に反対する人々は、新たな計画を立てている。彼らは2020年までに別の教団を結成し、自分たちの教会を「キリスト教メソジスト派教団」と呼ぶという。
いかがだろうか?
日本語訳だといささかピンとこない人もいるかもしれない。だが、OpenAIの論文によると、英語ネイティブの被験者たちに「この記事は人間が書いたものか、GPT-3が書いたものか」と問うたところ、多くの人がGPT-3とは見破れなかったという。
では、この自然言語処理のテクノロジーはいかにして進化してきたのだろうか?
それが分かれば、コンピュータがメールをやりとりしてくれる未来が間近なのかどうか、ヒントが得られるかもしれない。
INDEX
  • 自然言語との格闘史
  • 何が難しいの?
  • ①ルールからデータへ
  • ②単語を「ベクトル」で表す
  • ③「文脈」の理解
  • では、どうやって?
  • GPT-3がすごかったこと
  • 小説家に編集者は要らない?