Microsoft、文章でOfficeを操作する「Semantic Interpreter」発表 テキストからパワポ生成など
コメント
選択しているユーザー
注目のコメント
Microsoftの研究者5名による研究論文、「Semantic Interpreter」=意図解釈機(?)という命名が、個人的にとても好きです。
ChatGPTあるいはGPT3.5・GPT4などのLLM(大規模言語モデル)は、"text to text"と言われるように、良くも悪くも文字を入力して、文字を出力するということに限ったシステムです。そのため、ChatGPTにOfficeの操作を指示しても、言葉で操作方法は教えてくれるものの直接操作をしてくれるわけではなく、"text to program" "text to operation"の間には大きな壁があるのが実際です。
そこでこの研究で発表されているのが、その間を埋めるための「Semantic Interpreter」というシステムで、ただ(研究とは常にそういうものですが)現状はまだ途中段階のようで、その具体的な評価については触れられていないようです(読み込んだわけではないため誤りがあればご指摘頂けますと幸いです)。
論文中にも限界として書かれていますが、その背景としては、ユーザーによる発話のパターンや内容が無限にあること、またoffice側が提示できるソリューションとしても無限に考えられるためその評価が難しいことが挙げられています。
とはいえ、LLMという技術革新によって私たちが使い慣れたofficeというツールの利便性が上がっていくことは間違いなさそうで、今後の更なる進化に思わず期待を寄せてしまいます。
(※原文となる研究論文はこちらです→https://arxiv.org/pdf/2306.03460.pdf)Office Copilotに搭載される生成AI機能の一端ですね。Office固有言語ODSLのプログラムをGPT-3.5で生成する形で実装されています。約200のタスクで有効性を評価したとのこと。
いろいろなタスクがありますが、個人的には内容を生成するより、体裁を一括で整えてくれることに期待します。ちまちまマウスで修正するのは本当に面倒ですから。
あとはPowerPointでこんな図を描きたい、というときにどこまでサポートしてくれるか。頭の中のイメージを言語化するのは大変ですが。品質の高いPowerPoint にはさまざまなルールに準拠するために細かい作業をして作っていく、前職であるコンサル業界では非常にそこにかける時間が大きかったのですがどんどん代替されていきますね。
アナリストをつけてPowerPointを作成していた部分は生成AIで間に合ってしまいそうです。