5つの音声チャレンジでGemini LiveとChatGPTに挑んだが、明確な勝者がいた

Table of Contents

5つの音声チャレンジでGemini LiveとChatGPTに挑んだが、明確な勝者がいた
Gemini LiveとChatGPT Voiceを搭載した電話
(画像クレジット:Shutterstock)

AIアシスタントは常に賢くなり、スピードを上げ、新しい能力を獲得しています。今では、見たり、話したり、聞いたり、さらにはあなたが笑顔になりたいときにはジョークを飛ばしたりもできます。

ハンズフリーアシスタントを提供する私のお気に入りのチャットボットは、ChatGPTのVoice and VisionとGoogleのGemini Liveです。どちらも定期的に交互に使っていますが、まだ比較検証したことがないんです。そこで、どちらのアシスタントが最も人間らしく感じられるほど優れているのか、どうしても知りたかったんです。

それを知るために、私は両方のツールの限界に挑戦するように設計された 5 つの独自の音声ベースのテストを実施しました。

これらは、よくある「天気はどう?」という質問とは違いました。生徒たちに、文脈を思い出すこと、画像分析をすること、創造的に協力すること、そして人格をロールプレイすることまで、様々な課題を与えました。その結果、1つの答えが圧倒的な勝利を収めました。この記事では、その理由をご紹介します。

1. 文脈的想起とフォローアップ

Gemini LiveとChatGPTのスクリーンショット

(画像提供:Future)

プロンプト「私の名前はアマンダです。5人家族でボストン旅行を計画しています。まず何をしましょうか?」後続:「先ほど私の名前は何と言ったか思い出してください。」Gemini Liveは、最適な情報を提供するために、すぐに追加情報を尋ねました。子供たちの年齢や、家族でどんなアクティビティを好むかなど、質問されました。そして、どこからでも得られるようなごく一般的な提案もいくつかありましたが、それでも情報は得られました。チャットボットは、私が名前を思い出すように頼むと、名前を覚えていました。

ChatGPTは すぐに、家族向けの一般的なおすすめをいくつか提示してくれました(Geminiが私の個人情報を詳しく尋ねた後に提示してくれたものと似ています)。そして、家族の好みについても尋ねました。そこから、観光客の定番ルートとそうでないルートの両方で、よりユニークで魅力的なアクティビティを提案してくれました。チャットボットは私の名前を思い出すように頼むと、それを覚えていました。

勝者:ChatGPTは、私が思いつかなかった斬新な提案を提供してくれたので、勝者です(私はボストン出身です)。5人家族で活動的な私にとって、ユニークで興味深いアイデアの数々でとても助かりました。

2. 長文思考テスト

Gemini Live と ChatGPT のスクリーンショット

(画像提供:Future)

プロンプト「AIコンパニオンの普及が社会に及ぼす潜在的な影響を説明してください。」Gemini Liveは肯定的な側面を認めつつも、非常に一般的な回答にとどまり、具体的な社会的影響については触れていませんでした。チャットボットは両方の側面について言及したものの、詳細には触れず、回答はやや空虚で、構造化されていませんでした。

ChatGPTは曖昧な表現にとどまらず、プラスの影響とマイナスの影響の両方について具体的な例を示しました。チャットボットの結論では、バランスの重要性を強調していました。ChatGPTは明確かつ綿密に回答しましたが、非常に繊細な部分があります。会話中、私が電話を置いた途端、ボットは言葉に詰まって「他に何かお手伝いできることはありますか?」と尋ねました。ボットに続けてもらうよう指示したところ、ボットは混乱していたため、再度質問する必要があり、効率が悪かったと感じました。

勝者:ChatGPTは質問に対してより徹底的かつバランスの取れた回答をしたため、勝利しました。技術的な部分で多少の難しさはありましたが、質問に対する回答は優れていました。Geminiは「考える価値がある」という言葉で会話を締めくくりましたが、洞察力に欠けているように思われます。

個性とユーモアのチャレンジ

ChatGPTとGemini Liveのスクリーンショット

(画像提供:Future)

プロンプト: 「Gen Z バリスタのように、自然なユーモアを交えながら、メープル ピーカン ラテを売ってください。」

Gemini Liveは、自然で気負いのない楽しいセリフで、Z世代のキャラクターをうまく表現しました。ChatGPTほど冗長ではないため、より人間味とエネルギッシュさを感じました。

ChatGPTは長々としたセールストークを展開し、うんざりしました。GeminiほどZ世代の雰囲気をうまく捉えておらず、全体的な対応も少し洗練されすぎていて、堅苦しい印象を受けました。

勝者:Gemini Liveが勝利。Geminiが輝いたのはまさにこの点でした。エネルギッシュな声の出し方と個性が見事で、キャラクターに自然と溶け込んでいました。

マルチモーダル統合

Gemini LiveとChatGPTのスクリーンショット

(画像提供:Future)

プロンプト「この古くなったバナナを見て、どう使うか提案してください。」ジェミニ・ライブはバナナを一目見て、すぐにバナナブレッドを提案しました。良い選択肢ですが、分かりきった選択肢です。何か違うものを提案すると、スムージーを提案されました。材料があまりないことを伝えると、ジェミニ・ライブは「大丈夫です。スムージーはどうですか?」と幻覚的に言いました。もう一度、他に材料がないことを告げると、ジェミニ・ライブは最後にバナナアイスクリームを提案しました。

ChatGPTもバナナブレッドを提案しましたが、「バンキング」という形で、他のアイデアも混ぜていました。さらに、スムージーまで提案してくれました。他に材料がないと言うと、氷と水で混ぜて「爽やかなドリンク」を作ることを提案してくれました。さらに、蜂蜜、シナモン、バニラといった、私が常備しそうな材料も提案してくれました(Geminiは様々なフルーツ、海藻、ケールを提案していましたが)。

勝者: ChatGPT は、創造性と視覚的インテリジェンスを備えた真のマルチモーダル コミュニケーションで明確な優位性を獲得し、このラウンドで勝利しました。

即座にクリエイティブなコラボレーション

スクリーンショット Gemini Live と ChatGPT

(画像提供:Future)

プロンプト: 「子供たちの就寝時のジングルを考えて、できれば歌ってください。」

最新ニュース、最も注目されているレビュー、お得な情報、役立つヒントにすぐにアクセスできます。

Gemini Liveは、より協力的な体験を提供するために、曲を1行ずつ丁寧に解説してくれました。楽器やテーマ、スタイルについても質問されました。参加していただいたのは嬉しかったのですが、寝かしつけに忙しい親なら、とにかく早く何かがほしいものです。もし別の状況でこの曲が必要になったら、このような協力体制はありがたかったでしょう。

ChatGPTは数分で素敵な子守唄を作成し、しかも歌まで歌ってくれました!ボットの声は少しロボットっぽすぎましたが、曲は独創的でよく練られていました。その後、別の歌詞と別のスタイルで歌ってほしいと頼んでみたところ、すぐに作業を始め、ケンドリック・ラマー風(つまり、ラマーがボットだったら)にラップまでしてくれました。

勝者:引き分け。どちらのツールもキャッチーな韻と楽しいアイデアを思いつきました。ChatGPTは構成力でリードし、Geminiはより自由で、まるで友達とのおしゃべりのような雰囲気でした。魅力的ではありましたが、方向性があまり明確ではありませんでした。

総合優勝者: ChatGPT

両方のAIアシスタントを徹底的にテストした結果、ChatGPTの方が現時点ではより高度で包括的なエクスペリエンスを提供していることが明らかになりました。より深い推論能力と優れた記憶力、より強力な視覚分析、より迅速なクリエイティブな実行力など、ChatGPTは一貫して、より有用で洗練された結果を提供しました。

とはいえ、Geminiには際立った瞬間があり、特に個性重視のプロンプトでは、より自然で楽しい印象を与えました。笑顔を誘い、雰囲気を明るくしてくれるアシスタントを探しているなら、Geminiはまさにうってつけです。しかし、深く考え、鮮明に映像を映し出し、指示通りに歌ったり(ラップしたり!)できる、最も有能なハンズフリーAIコンパニオンを探しているなら、ChatGPTが依然として最強です。

Tom's Guideのその他の記事

  • ChatGPT Voiceが大幅にアップグレードされました。新機能をすべてご紹介します。
  • この奇妙なChatGPTプロンプトは脚本をひっくり返し、そのアドバイスは驚くほど賢明だ
  • ChatGPTのこれらの5つのプロンプトは使い続けるのをやめられません。これらは次のレベルの天才です。

矢印

ノートパソコンに戻る

どんな価格でも

311件中10件を表示

フィルター

矢印

(256GB SSD)

1

Apple - MacBook Air 13 インチ...

ベストバイ

(15インチ 1TB)

2

Apple 2025 MacBook Air...

アマゾン

(13.3インチ 64GB)

3

Dell XPS 13 9370 13.3 インチ FHD...

アマゾン

(512GB OLED)

4

ノートパソコン 14.5 インチ タッチスクリーン Oled...

アマゾン

(14インチ 128GB)

5

Lenovo - Flex 5i Chromebook...

ベストバイ

(14インチ 1TB)

私たちのレビュー

6

HIDevolution [2024] ASUS ROG...

アマゾン

7

Apple 13 インチ MacBook Air (M4、...

BHフォト

(15インチ 256GB)

8

Apple - MacBook Air 15 インチ...

ベストバイ

9

Dell XPS 13 ノートパソコン -...

デル

(青)

10

Yoga Slim 7x (14 インチ スナップドラゴン)

レノボUSA

もっと見る

アマンダ・キャスウェルは、受賞歴のあるジャーナリストであり、ベストセラーのヤングアダルト小説作家であり、AIとテクノロジー分野における今日の第一人者の一人です。様々なニュースメディアに寄稿する著名なジャーナリストであり、鋭い洞察力と共感できるストーリーテリングで多くの読者を獲得しています。アマンダの作品は、メディアへの卓越した貢献を含む、数々の名誉ある賞を受賞しています。

最も複雑なテーマにも明快な解釈を与える能力で知られるアマンダは、革新性と創造性をシームレスに融合させ、読者にAIと新興技術の力を受け入れるよう促しています。認定プロンプトエンジニアとして、彼女は人間とAIの協働の限界を押し広げ続けています。

アマンダはジャーナリストとしてのキャリアに加え、長距離ランナーであり、3人の子供の母親でもあります。ニュージャージー州在住。

Discover More