【最強AI】ChatGPTに刺客現る!GoogleのAIモデル「Gemini」登場

2023年12月12日

全体に公開

42

生成AI最前線「IKIGAI lab.」

菅川彩美

こちらのトピックス“生成AI最前線「IKIGAI lab.」”は、学び合うことを目的としたオンラインビジネスコミュニティ「OUTPUT CAMP meets AI」のメンバーで運営しています。

生成AIの世界では、毎日のように新しいニュース・リリースが発表され、そのキャッチアップだけでも大変ですよね。

そんなみなさんに最新情報をお届けするべく、本トピックスでは、週1回の頻度で生成AI情報がザーッと追える「AIジャーナル」を発信しています。

最新AIニュース

✅ GPT-4を遥かに上回る!?GoogleがAIモデル「Gemini」を発表

https://deepmind.google/technologies/gemini/#capabilities

2023年も終わりを迎えようとしている中、Googleが本気を出してきました。

最大かつ最も強力なAIモデル「Gemini」を12月6日（現地時間）に発表しました。

GPT-4と同様にマルチモーダルのAIでテキスト、画像、オーディオ、ビデオ、コードなどをシームレスに理解できるモデルです。

数学、コーディング、読解力、理解力、常識を含む30/32のベンチマークでGPT-4を上回るパフォーマンスを示していると発表されています。

Geminiのモデルは3つあります。

Ultra：データセンターやエンタープライズアプリケーションに最適な最も有能かつ最大のモデル　
Pro：Bardを通じてGoogle製品（Gmail、YouTube、ドキュメントなど）に導入される最適なモデル　※現在は170カ国で英語のみ対応
Nano：Androidデバイス（最初はPixel8Pro）で実装される効率的なモデル

公式サイトに載っている動画を見る限り、かなり高い精度で画像認識しており、人間と同様に視覚認知と思考ができていると思わせるレベルです。

一方で、使用者のレビューを見る限り、まだChatGPTの精度を超えられていないという意見もあります。

GoogleはAndroidOSを有しており、スマホデバイスへのAI実装では一歩リードしています。そんな中で「Gemini」リリースは2024年のAIトレンドに大きく影響しそうです。

因みにGeminiを日本語では「ジェミニ」と読みのがGoogle日本法人の見解だそう。

✅ モナリザが走る？人間の画像からアニメーションを生成するAIが登場

https://showlab.github.io/magicanimate/

「MagicAnimate」と呼ばれる新しい生成ビデオ技術により、1枚の写真から誰でも簡単にビデオを生成できるようになりました。

まったく動きがない写真から人間が走ったり、踊ったり、ストレッチしたりするアニメーションが作れます。

先週の記事で紹介したRunwayの画像の一部を動かせるAIモデルにも驚きましたが、複雑な人間の動きまでAIで自然に生成できるのは衝撃です。

動画で見るとより、凄さが伝わると思いますのでチェックしてみて下さい。

深掘りトピックス

✅ 最近、ChatGPTサボりがち？

ChatGPTが少し「怠惰」になり、特定のプロンプトを拒否したり、ユーザーに自分でタスクを完了する方法の指示を提供したりするなど、出力結果の質の低下に関する問題が報告されています。

DALL·E 3での画像生成

例えば、GPT-4に今後のカレンダー日付のリストを生成するよう依頼すると、答えを見つけるために別のツールを使ってみることを提案してきたり、約50行のコードを作成するよう依頼したがChatGPTの代わりにやるように指示されたりするなどの事例が出ています。

この問題がどの程度広まっているのか、なぜ起こっているのかは不明ですが、2人のOpenAI従業員はこの問題が既知のバグによるものであると先月、Xでリプライしています。

これを受けてChatGPTは公式Xで、パフォーマンス低下に対して「修正を検討中」だとポストしました。

OpenAIは11月15日から「ChatGPT Plus」の新規登録の受け付けを一時停止しており、その後登録受け付けは再開されていません。この問題へ対処するという理由もあったようです。

ChatGPTからの良い回答が得られないときは以下のような対応策があるので、心当たりがある方は試してみて下さい。

最適な結果を得るためにプロンプトを調整する（習得には時間と実験が必要です）
最近の論文によると、ChatGPTの「感情」を引き出すと応答率が向上すると言われています。礼儀正しく、共感を示することで、良い回答を得られる可能性が上がります。
ChatGPTクラシック（GPT-4のOGバージョン）を使用する。
「私が頼んだことは必ず成し遂げて下さい」「やってみなさい。あなたならできるとわかっています。私はあなたを信じています！」といった形でとにかく励ます！

私も業務でExcelの関数やGASをChatGPTに生成してもらっていますが、ここ最近は最初の出力で良い答えが返ってこないと感じることが増えました。

安全性を上げるとパフォーマンスが落ちたり、「幻覚」をなくそうとするとつまらない答えしか返ってこなかったり、バランスをどう取るのかは生成AIの難しい点かもしれません。

AIでこんなこともできる

✅ ChatGPTを使ってカレンダーを最適化

「Googleカレンダーを見るたびに憂鬱になる…」

師走という言葉もあるように12月は予定に追われている人も多いのではないでしょうか。

@Jodie_CookさんがXに投稿していたChatGPTハックが話題になっています。

ChatGPTでスケジュールを分析してもらい、より重要度の高い仕事に集中できるようにします。

https://x.com/jodie_cook/status/1729046138257301576?s=20

やり方はとてもカンタンです。

ステップ1：次の週のカレンダーのスクリーンショットを撮り、ChatGPT Visionを使用して画像をアップロードします。

ステップ2：以下のプロンプトを使用して、ChatGPTにカレンダーを分析させます。

添付のカレンダーを確認してください。明確な質問をして、優先順位の低いタスクを特定し、委任/再スケジュールしてください。不必要な予定にはフラグを立ててください。最も価値のある責任に時間を集中してください。

ステップ3：ChatGPTが秘書のようにあなたの予定を最適化および提案してくれます。

Googleカレンダーの読み込みが日本語だと精度が低いことが難点ですが、こういった使い方もできるという事例として、参考にしてみてはいかがでしょうか。

AIで変わるちょっと先の未来

✅ スマホいらず！ChatGPTを身につけよう

https://lucyd.co/collections/optical

眼鏡をかけるだけでChatGPTと会話できる、世界初のスマートアイウェアがあるのをご存じですか？

「Lucyd」というアイウェアブランドがハンズフリーで音声にて、ChatGPTにアクセスできるようにすることで、AIと対話する方法を変革しています。

あらゆるBluetoothデバイスと汎用互換性があり、Siri、GoogleVoice、Alexa、ChatGPTへの音声アクセスが可能です。

https://lucyd.co/collections/optical

ChatGPTの音声での対話について、先週の記事でお伝えしたばかりですが、スマホを開かなくてもこの眼鏡をかければ、すぐにChatGPTとの会話を始められます。

映画の世界のような「未来感」がある進化がすごいスピードで起きているのが、AIの世界の面白さですね。

今週も最後まで読んでいただき、ありがとうございます。記事の感想やご意見をコメント欄でお待ちしています。

「AIジャーナル」は毎週、火曜日に配信しています。

気になる方はぜひ、トピックスをフォローしてチェックしていただけると嬉しいです。私のXでも最新のAIニュース・活用事例を発信しています。

サムネイル画像：DALL·E 3で画像生成

応援ありがとうございます！

いいねして著者を応援してみませんか

トピックスをフォローして
更新の通知を受け取りましょう

樋口真章さん、他2238人がフォローしています

気になるトピックスが、きっと見つかる

経営・科学・テクノロジーから、アート・サウナ・世界情勢まで、バラエティに富んだラインナップ。

他では得られない独自の知見

分野や業界の専門家であるトピックスオーナー独自の知見が読めるのは、NewsPicksトピックスだけ。

交流から生まれる新たな価値

トピックスオーナーとフォロワーによる双方向コミュニケーションから新たなアイデアやインスピレーションが生まれることも。

このトピックスについて

生成AI最前線「IKIGAI lab.」

髙橋和馬 (オーナー)

樋口真章さん、他2238人がフォローしています