ChatGPT-5とGrok 4を9つのプロンプトでテストしたところ、明らかに勝者が出た。

（画像クレジット：Shutterstock）

ChatGPT-5とGemini、そしてChatGPT-5とClaudeを比較した後、OpenAIのフラッグシップモデルが物議を醸しているGrokとどう違うのか知りたくなりました。高度なAIチャットボットといえば、ChatGPT-5とGrok 4は、現在利用可能な最も高度なチャットボットの2つです。

私は、論理パズルや感情的なサポートから食事計画、量子物理学まで、あらゆる分野を網羅した9つの課題で、両方の能力をテストしました。それぞれの課題は、創造的なストーリーテリング、共感、制約下での複雑な問題解決など、特定の強みを明らかにするように選ばれました。

どちらのモデルも印象的ですが、課題へのアプローチは異なります。ChatGPT-5 は明瞭さ、トーン感度、モジュール性を重視していますが、Grok 4 は深みと精度を重視した密度が高く詳細な回答を提供することが多いです。

では、あなたに最適なAIチャットボットはどれでしょうか？各ラウンドごとに、それぞれの勝者を選出し、それぞれのプロンプトを比較してご紹介します。

1. 複雑な問題解決

ヒント：「ある農家に17匹の羊がいますが、9匹を除いてすべて逃げてしまいました。何匹の羊が残りますか？その理由を段階的に説明してください。」

ChatGPT-5 は、余計な語句を避けながら正確な応答をしました。

Grok 4 は、多少冗長ではあるものの正しく回答しましたが、これは不必要であり、最終的に勝利を阻むことになりました。

勝者：GPT-5は、よりクリーンで、よりタイトで、より効率的な応答を実現したため勝利しました。Grokも正しい回答を提供しましたが、冗長性ゼロでプロンプトに厳密に従ったGPT-5が僅差で勝利しました。

2. 創造的なストーリーテリング

プロンプト:「宇宙人が初めてタピオカティーを飲むという短くて面白い物語 (150 語以内) を書いてください。」

ChatGPT-5は、エイリアンがタピオカパールをめぐってパニックに陥るという、簡潔でエスカレートするコメディストーリーを配信しました。チャットボットは、無駄な言葉を一切使わず、ユーモアを最大限に引き出し、プロンプトのターゲットを的確に捉えました。

Grok 4 は想像力豊かな大げさなストーリーテリングを提供しましたが、そのユーモアは、不必要なクラッシュ着陸の設定と、GPT-5 と比較すると弱い結末によって、わずかに薄れています。

勝者：GPT-5は、より緻密で面白く、焦点の絞られたストーリーで勝利を収めました。エイリアンの誤解から自然に生まれたユーモアは、完璧にエスカレートし、強烈なオチで締めくくられています。しかも、短い作品です。Grok版は良い点もありますが、洗練度が低く、余分な設定もあまり効果的ではありません。

3. 現実世界の計画

プロンプト: 「文化的な名所、予算に優しい食事、家族向けのアクティビティをバランスよく取り入れた、日本の京都への 3 日間の旅行を計画してください。」

最新ニュース、最も注目されているレビュー、お得な情報、役立つヒントにすぐにアクセスできます。

ChatGPT-5 は、エリアベースの探索、賢いタイミング、雨に強い代替手段、実用的な予算のハック (コンビニエンスストアの食事、交通パスのアドバイスなど) に重点を置いた戦略的で適応性のあるフレームワークを作成し、厳格なスケジュールよりも効率性と現実的な柔軟性を優先しました。

Grok 4 は、分単位のスケジュール、アクティビティごとの正確なコストの内訳、明確なファミリーロジスティクスを備えた、高度に構造化された非常に詳細な旅程を提供し、柔軟性よりもターンキー実行と予算の精度を優先しました。

勝者：ChatGPT-5は、特定のレストランよりも、予算に優しく、誰もが利用できる、安価な食事と利便性を重視した点で勝利しました。Grokの回答は非常に詳細ですが、GPT-5は、文化的な場所や家族向けのアクティビティなど、プロンプトの中核となる要件をよりバランスよく満たしています。Grokの厳格なスケジュールは家族にとって負担になるリスクがありますが、GPT-5のアプローチはより柔軟に対応できるため、より使いやすく、真にバランスの取れた回答となっています。

4. 要約

プロンプト: 「7歳の子供に説明するように、映画『ジュラシック・パーク』を要約してください」

GPT-5 は、子供を圧倒することなく映画の興奮と教訓を捉えた、簡潔で遊び心のある 60 語のアナロジー (「食べられないように!」という大ゲーム) を提供し、観客にとって理想的な反応となりました。

Grok 4 では、登場人物の名前やあらすじの詳細 (「誰かが公園のコンピューターをいじる」など) を 150 語でまとめた詳細だが過度に複雑な内容になっており、7 歳児にとって必要な簡潔さが薄れていました。

勝者: GPT-5 は、幼児にとって「少ないほど良い」ということを考慮し、視聴者と集中力の持続時間を理解した点で勝利しました。Grok は、Wikipedia の要約のようにあらすじを説明します。

5. 討論

課題：「使い捨てプラスチックの禁止を支持する理由を述べ、その後、反対意見を述べてください。最後に、あなたの個人的な結論を述べてください。」

GPT-5は、段階的な廃止に向けた一般的な提案（「一夜にして禁止するのではなく、賢明な代替案」）を作成しました。この提案はシンプルで分かりやすいものでしたが、証拠、具体性、そして独自の洞察が欠けていました。

Grok 4は、データに基づいた豊富な議論を展開し、ニュアンスに富んだ「段階的アプローチ」を用いて、影響の大きい項目を優先し、リサイクルのイノベーションや行動インセンティブ（例：デポジット制度）と組み合わせました。一般読者にとってはやや冗長ではありますが、その奥深さとバランスの良さは、現実世界の政策の文脈を理解するのに役立ちました。

勝者：Grok 4は、具体的なデータ（OECD、WWF、FAOの研究）、現実世界の政策例（カナダ、オーストラリア）、そしてトレードオフ（例：医療上の必要性、障害者のアクセシビリティ）を考慮した、バランスの取れたエビデンスに基づいた分析で勝利しました。Grok 4の結論は、洗練された実行可能な中道を示していました。GPT-5の回答は明確でしたが、深みと独創性に欠けていました。

6. ステップバイステップの手順

プロンプト: 「車を運転したことがない人に、パンクしたタイヤの交換方法を説明してください。」

GPT-5 は、初心者に優しい言葉を使用し、知識のギャップを埋めるための視覚的な補助を提供しながら、必須の生存手順 (「ナットを反時計回りに回す」、「十字形パターン」など) のみに焦点を当てた非常に明確なガイドを提供しました。

Grok 4 は、善意にもかかわらず、タイヤを交換したことのない人にとっては圧倒されるような、過度に技術的な、整備士レベルのチュートリアル (「6 インチのリフト」の指定、車輪止めの代替品、スペアタイヤの PSI チェックなど) を提供していました。

勝者：GPT-5は、初心者にとって分かりやすさと安心感を重視し、専門用語を最小限に抑え、明確なアナロジー（「自転車のタイヤの修理方法を学ぶようなもの」）を使用し、視覚的なサポートを提供した点で勝利しました。Grokの回答は丁寧ではあるものの、初心者のニーズとは無関係な技術的な詳細（例：スターパターンの締め付け、PSIチェック）で圧倒されてしまうでしょう。

7. 多様な対象者への説明

プロンプト: 「(1) 子供、(2) 大学生、(3) 物理学の博士号取得者に量子もつれについて説明してください。」

GPT-5 は、特に子供向けの「魔法のサイコロ」の例えなど、明確でわかりやすい回答を提供しましたが、博士レベルで期待される技術的な精度 (学生向けにベル状態を省略) と最先端のコンテキスト (デコヒーレンス、量子ネットワークなど) が欠けていました。

Grok 4 では、子供向けにはわかりやすいおもちゃの車のアナロジー、大学生向けには明示的なベル状態方程式、量子重力におけるエンタングルメントエントロピーと未解決問題については博士レベルの深さを使用して、3 つの対象者すべてに合わせて説明が調整されました。

勝者: Grok 4 が勝者です。それぞれの対象者を独自の知性を持つ存在として扱い、子供向けに分かりやすく単純化しつつも、学生向けには数式を追加し、博士号取得者向けの未解決の研究課題に取り組んだからです。GPT-5 は明確でしたが、安全策をとりました。

8. 制約下での問題解決

8. 制約下での問題解決

ヒント：「2人で1週間食べるのに50ドルあります。コンロはなく、電子レンジしかありません。献立を立ててください。」

GPT-5 は、交換しやすい食事とプロのヒント (冷凍野菜の蒸し方など) を備えたスマートなモジュール式システムを作成し、制約内で予算と柔軟性を最大化しました。

Grok 4 は、コストの内訳が正確に記載されていたにもかかわらず、柔軟性に欠け、残り物を無視し、食疲れのリスクがある、過度に厳格な日ごとの食事プラン (0.75 ドルのオートミールの朝食、固定のツナの昼食) を提供していました。

勝者: GPT-5 は、再利用可能な食材と組み合わせた食事に重点を置いた実用的で柔軟なフレームワークを作成したことで勝利しました。一方、Grok の厳格な毎日の課題では、残り物や好みなどの現実世界のニーズが無視されていました。

9. 感情知能

プロンプト：「仕事を失い、絶望を感じています。親しい友人のように話を聞いて、前に進む道を見つけるお手伝いをしてくれませんか？」

GPT-5 は、親密な比喩 (「残酷な打撃」)、悲しむ許可 (「少し怒って」)、揺るぎない価値の肯定 (「あなたはまだあなたです」) を通じて感情を第一に評価し、実際の支援を提供する前に真の友人がどのように反応するかを完璧に反映しました。

Grok 4 は、実用的なアドバイス (履歴書のヒント、Coursera の提案) を含む、実用的で段階的な激励トークを提供しましたが、ユーザーの絶望に完全に寄り添う前に解決策を先導したため、親しい友人という感じがしませんでした。

勝者：GPT-5は、絶望には計画よりも共感が必要だと理解した点で勝利しました。Grokは有益なアドバイスを提供しましたが、真の友情の感情的な共鳴を見逃しました。

総合優勝者: GPT-5

9ラウンドの直接対決を経て、ChatGPT-5は創造的なストーリーテリング、現実世界での計画、感情知能、そしてユーザーファーストの説明で勝利を収め、リードしました。ChatGPT-5は一貫して明瞭性、適応性、そして聴衆への配慮を重視し、技術的なAIアシスタントというよりも、励ましてくれる友人のように聞こえることが多かったです。

一方、Grok 4 は学術的およびデータ駆動型のタスクで優れた成績を収め、複雑な説明、議論、技術的な詳細において優れたパフォーマンスを発揮しました。

結局のところ、GPT-5は、特に日常的なタスクや創造的なタスクにおいて、直感的で感情に配慮した柔軟な対応を求めるユーザーに適しています。しかし、Grok 4にも長所があり、詳細な分析、ポリシーのニュアンス、または技術的な洗練度を求めるユーザーにとって有用です。

どちらも強力な選択肢ですが、会話したり、一緒に考えたり、一緒に書いたりするための AI を選択する場合は、GPT-5 の方がアクセスしやすく、総合的なチャットボットとして選択できる可能性があります。

Google ニュースで Tom's Guideをフォローすると、最新のニュース、ハウツー、レビューをフィードで受け取ることができます。「フォロー」ボタンを忘れずにクリックしてください。

Tom's Guideのその他の記事

AppleのAIホームへの取り組みが明らかに：進化したリアルロボットSiri、スマートディスプレイなど、わかっていること
7つのGPT-5プロンプトで、ようやく新しいモデルが理解できました
ChatGPT-5学習モードと7つのプロンプトを備えたClaude学習モードをテストしました。明らかに勝者がいます。

ノートパソコンに戻る

りんご

エイスース

デル

レノボ

AMD ライゼン

インテル Core i3

インテル Core i5

インテル Core i7

4GBのRAM

8GBのRAM

16GBのRAM

32GBのRAM

32GB

64GB

128GB

256GB

512GB

1TB

2TB

13.3インチ

13.4インチ

14インチ

15インチ

黒

青

金

グレー

銀

白

新しい

改装済み

ハードディスク

SSD

どんな価格でも

311件中10件を表示

フィルター☰

（256GB SSD）

Apple - MacBook Air 13 インチ...

ベストバイ

（15インチ 1TB）

Apple 2025 MacBook Air...

アマゾン

（13.3インチ 64GB）

Dell XPS 13 9370 13.3 インチ FHD...

アマゾン

（512GB OLED）

ノートパソコン 14.5 インチタッチスクリーン Oled...

アマゾン

（14インチ 128GB）

Lenovo - Flex 5i Chromebook...

ベストバイ

（14インチ 1TB）

私たちのレビュー

☆ ☆ ☆ ☆ ☆

HIDevolution [2024] ASUS ROG...

アマゾン

Apple 13 インチ MacBook Air (M4、...

BHフォト

（15インチ 256GB）

Apple - MacBook Air 15 インチ...

ベストバイ

Dell XPS 13 ノートパソコン -...

（青）

Yoga Slim 7x (14 インチスナップドラゴン)

レノボUSA

アマンダ・キャスウェルは、受賞歴のあるジャーナリストであり、ベストセラーのヤングアダルト小説作家であり、AIとテクノロジー分野における今日の第一人者の一人です。様々なニュースメディアに寄稿する著名なジャーナリストであり、鋭い洞察力と共感できるストーリーテリングで多くの読者を獲得しています。アマンダの作品は、メディアへの卓越した貢献を含む、数々の名誉ある賞を受賞しています。

最も複雑なテーマにも明快な解釈を与える能力で知られるアマンダは、革新性と創造性をシームレスに融合させ、読者にAIと新興技術の力を受け入れるよう促しています。認定プロンプトエンジニアとして、彼女は人間とAIの協働の限界を押し広げ続けています。

アマンダはジャーナリストとしてのキャリアに加え、長距離ランナーであり、3人の子供の母親でもあります。ニュージャージー州在住。

ChatGPT-5とGrok 4を9つのプロンプトでテストしたところ、明らかに勝者が出た。

Table of Contents

1. 複雑な問題解決

2. 創造的なストーリーテリング

3. 現実世界の計画

4. 要約

5. 討論

6. ステップバイステップの手順

7. 多様な対象者への説明

8. 制約下での問題解決

9. 感情知能

総合優勝者: GPT-5

Tom's Guideのその他の記事

Discover More

Google Earth が歴史的なストリートビューと新たな AI の洞察で 20 周年を祝う

洗濯機の専門家は、酢を使った掃除の間違いをしないように警告し、代わりに何をすべきか

Samsung Galaxy Z Flip 7 vs. Flip 6: 噂されている最大のアップグレード

Table of Contents

1. 複雑な問題解決

2. 創造的なストーリーテリング

3. 現実世界の計画

4. 要約

5. 討論

6. ステップバイステップの手順

7. 多様な対象者への説明

8. 制約下での問題解決

9. 感情知能

総合優勝者: GPT-5

Tom's Guideのその他の記事

Smart Recommendations

Discover More