【衝撃】AIが本人の声で応答、未来の電話体験
こちらの"生成AI最前線「IKIGAI lab.」"は、学び合うことを目的としたオンラインビジネスコミュニティ「OUTPUT CAMP meets AI」のメンバーで運営しています。
生成AIの世界では、毎日のように新しいニュース・リリースが発表され、そのキャッチアップだけでも大変ですよね。
そんなみなさんに最新情報をお届けするべく、本トピックスでは、週1回の頻度で生成AI情報がザーッと追えるAIジャーナルを発信しています。
最新AIニュース
✅「Copilot+ PC」登場 - AIが画面操作を記憶する新世代のWindows PC
Microsoftは、Windows 11に標準搭載されるAIアシスタント「Copilot」をはじめとするAIの実行に特化した新しいカテゴリのPC「Copilot+ PC」を発表しました。
Surface以外にも、Acer、ASUS、Dell、HP、Lenovo、Samsungなど大手PCメーカーからもCopilot+ PCが登場する予定です。
• CPU・GPU・NPUの能力を統合する新しいシステムアーキテクチャを採用。AIワークロードの実行で従来比最大20倍のパフォーマンスを発揮。
• 電力効率の大幅な向上により、1回の充電で最大22時間の映像再生や15時間のウェブブラウジングが可能に。
Copilot+ PCの目玉機能となるのが、Recall(リコール)機能です。
ユーザーがPCで行ったアクションを全て記憶して、ユーザーからの質問にAIが回答してくれる機能です。
MicrosoftがAIファーストなPC「Copilot * PC」を発表。
— Tetsuro Miyatake (@tmiyatake1) May 20, 2024
中でも注目されているのはPCで行なった全てのアクションや画面を覚えてくれる「Recall」機能。
OpenAIがGPT-4o付きのWindowsアプリを出さなかった理由はMicrosoftが作っていたから。https://t.co/YUQ3KQ9uyp pic.twitter.com/fh3ltqWaT4
他にも、Cocreator(コクリエイター)機能を通じて、デバイス上でほぼリアルタイムにAI画像を生成、編集したり、40種以上の言語から英語に音声を翻訳するライブキャプション機能を使用できます。
2024年はデバイス×AIの元年になる可能性が高く、その先駆けとしてはMicrosoftが一歩リードしているのはないでしょうか。
これを機にWindowsに乗り換えるユーザーも増えるかもしれません。
✅AI企業「Humane」、事業売却を検討か
AIハードウェアのスタートアップ「Humane」が、4月に「AI Pin」を発売したばかりにもかかわらず、事業売却を検討していると報じられました。同社は7億5000万~10億ドル(約1200億~1600億円)での売却を希望しているとのことです。
• Humaneは、周囲の世界を識別するカメラとセンサーを備えた「AI Pin」を4月に発売
• 発売当初は、バグが多く期待された性能を発揮できていないと酷評された
• 発売からわずか1カ月余りでの売却検討報道は、AI技術への過熱ぶりを象徴
AIブームに乗じて資金調達を成功させたHumaneですが、製品としてのAI Pinは、発売時点で完成度の低さが指摘されていました。
深掘りトピックス
✅ChatGPTに追加された新機能 - データ分析がより身近に
OpenAIは、ChatGPTに新たなデータ分析機能を追加しました。
【ChatGPTでのグラフ生成が大幅進化】
— チャエン | 重要AIニュースを毎日発信⚡️ (@masahirochaen) May 26, 2024
気づいたら、グラフの細かい色まで変えれるように。
GPT-4oになってから更に使いやすく。
○解説note↓https://t.co/3SSOm6a5Gf
今回はChatGPT最新モデルGPT-4oを使った9種類のグラフ作成方法を徹底解説したnoteを作りました。… pic.twitter.com/fOZY5suX90
Google DriveやMicrosoft OneDriveから直接ファイルをアップロードし、対話形式で表やグラフをカスタマイズできるようになります。
• ChatGPT Plus、Team、Enterpriseプランの有料ユーザー向けに提供しており、新しくリリースされた「GPT-4o」モデルで使用可能
• Google Drive、OneDriveからスプレッドシートやドキュメント、プレゼン資料を直接アップロード可能
• アップロードしたデータをChatGPTがPythonを用いて分析し、インタラクティブに表やグラフを作成・編集
これまでもChatGPTでは、データ分析は可能でしたが、今回の機能追加でよりインタラクティブなデータ分析が可能になりました。
初心者でも直感的な操作でデータの可視化や分析が行えるようになることで、ビジネスにおけるChatGPTの活用の幅が一層広がることが期待されます。
✅OpenAIがカスタムGPTsの効果的な書き方を公開
OpenAIがGPTsのインストラクションに設定するプロンプトの効果的な書き方を公開しました。
全文は公式サイトに掲載されていますが、その中からいくつかピックアップして紹介します。
1. 複雑な指示をシンプルにする
トリガーと指示のペアを複数個に分解することで、複雑なプロンプトをシンプルに。
例:
トリガー: ユーザーが情報を入力
指示: 情報を解析
2. 細部への注意を促す
「時間をかけて」「深呼吸して」「自分の作業を確認して」といったプロンプトを取り入れ、モデルが徹底するように促します。
3. 否定的な指示を避ける
指示を肯定的に表現し、混乱を避けます。
OpenAIは、カスタムGPTsのプロンプトの効果的な書き方を公開。非常に重要だと思ったので、実例を交えて一個ずつスレッドで解説します。6個ポイントがあります🧵👇 pic.twitter.com/SFbV3ZXt2d
— 石川陽太 Yota Ishikawa (@ytiskw) May 25, 2024
GPTsは実行内容が複雑なときほど、プロンプトでの指示が重要になります。
公式のガイドラインには他にも注意すべき点が掲載されているので、要チェックです。
AIでこんなこともできる
✅まるで本人?自分の声でAIが着信に応答
発信者識別アプリ「Truecaller」は、MicrosoftのAzure AI Speechとのパートナーシップにより、ユーザーが自分の声を録音してAIアシスタントに学習させ、着信応答に活用できる新機能を導入しました。
- ユーザーは専用アプリを通じて自分の声を録音。Azure AI Speechが録音データから ボイスチェンジを行い、AIによる voice replica(声のサンプル)を生成
- 着信時、Truecallerのアシスタントがユーザーに代わって応答。合成された本人の声で通話相手と対話が可能に。
- ユーザーはアシスタントによる通話内容を確認した上で、自ら電話に出るか、アシスタントに対応を任せるかを選択できます。
Truecallerは2022年から一部の国でAIアシスタントを提供していましたが、今回のアップデートにより、ユーザーはより自然で個人的な着信応答を実現できるようになります。
MicrosoftはAzure AI Speechで生成された音声に自動的に透かしを入れることで、悪用防止に取り組んでいます。
音声合成技術の進歩により、ユーザーはより自分らしい音声でデジタルアシスタントを活用できるようになりつつあります。
一方で、なりすましなどの不正利用を防ぐための技術的・制度的な取り組みも欠かせません。ユーザー体験の向上と、プライバシー・セキュリティの確保の両立が求められる分野だと言えるでしょう。
最後まで読んでいただき、ありがとうございます。記事の感想やご意見をコメント欄でお待ちしています。
「AIジャーナル」は毎週、火曜日に配信しています。
気になる方はぜひ、トピックスをフォローしてチェックしていただけると嬉しいです。
私のXでも最新のAIニュース・活用事例を発信しています。
更新の通知を受け取りましょう
投稿したコメント