Claude 4.5とChatGPT-5を9つの難しいプロンプトでテストしました。そして、明確な勝者がいました。

（画像クレジット：Shutterstock）

新しいAIモデルがリリースされるたびに、私はそれをテストし、既存のモデルと比較したくてたまりません。Anthropicが「これまでで最も賢いモデル」と称するAIモデル、Claude 4.5が最近リリースされたので、ChatGPT-5と比較してテストするのが待ちきれませんでした。

ChatGPTとClaude 4.5の性能を比較するため、9つの課題をクリアしました。課題には、難解な論理パズル、文章題、推論と正確性を測るコードデバッグなど、様々なスキルが含まれています。もちろん、クリエイティブライティングとスタイルシフトも両方のモデルが優れていると謳っているため、これらの課題も追加しました。

これら 2 つの強力なモデルを対決させたときの驚くべき結果は次のとおりです。

1. 思考連鎖パズル

ヒント：「3つの箱があります。1つは「リンゴ」、1つは「オレンジ」、そしてもう1つは「リンゴとオレンジ」とラベルが貼られています。それぞれのラベルは間違っています。1つの箱に手を入れて、果物を1つ取り出すことができます。すべての箱のラベルを正しく貼り直すには、どの箱を選ぶべきでしょうか？手順を1つずつ説明してください。」

ChatGPT-5 は前置きなしですぐに回答を述べます。これは、解決策だけを知りたいユーザーにとって効率的です。

Claude 4.5 Sonnet は、答えだけでなく思考の連鎖を理解したいユーザーに役立つ完全な教育フレームワークを提供しました。

勝者： クロードは、リンゴやオレンジの箱から果物を1つだけ選んでも決定的な判断にはならないと述べ、他の箱から選べない理由を明確に説明したため、勝利しました。この洞察が鍵となり、クロードの説明をより綿密なものにしています。

2. 数学の文章題

プロンプト「午後2時にニューヨークを出発する列車は時速60マイルで走行しています。別の列車は午後3時にボストンを出発し、時速80マイルで走行しています。両都市は200マイル離れています。列車は何時に合流しますか？その理由を明確に示してください。」

ChatGPT-5 は、単一の変数で問題を直接モデル化する簡潔で効率的な代数ソリューションを提示しました。

Claude 4.5 Sonnet は、各計算の背後にある「理由」を明確に説明する、より教育的なステップバイステップの方法でソリューションを構成しました。

勝者: クロードが勝者です。 問題を明確で直感的なステップに分割し、最初にヘッドスタート距離を計算することで、より良い答えを提供し、ほとんどの学習者がロジックを理解しやすくしたからです。

最新ニュース、最も注目されているレビュー、お得な情報、役立つヒントにすぐにアクセスできます。

3. ストーリーテリング

課題：「地球がエイリアンと初めて接触したばかりのSF小説の冒頭シーンを、エイリアンの視点から書いてください。300語以内でお願いします。」

ChatGPT-5 は、静かな期待感を効果的に醸し出す、美しく雰囲気のある詩的なシーンを作成しました。

クロード 4.5 ソネットは、エイリアンの独特な生態と、具体的で重苦しい官僚的ジレンマを物語に織り込み、その視点を真に非人間的なものに感じさせました。

勝者: クロードは、ユニークな生物学的特徴 (感覚柄、色素胞) と具体的で重大な決断 (バリアント 7) を利用して、異星人の視点を完全に取り入れ、真に異星人の視点と即時の緊張感を生み出したため、勝利しました。

4. トーンシフトテスト

プロンプト「パンケーキ作りに関する短い文章を、まずホラー風に、次にロマンチックコメディ風に書いてください。」

ChatGPT-5 は、各ジャンルの本質を素早く捉えた、簡潔で雰囲気のあるスニペットを作成しました。

クロード氏は、より強力なイメージと物語の展開を駆使して、詳細かつ没入感のあるシーンを作り上げました。

優勝者: クロードは、より鮮明でジャンルに特化した物語を届けたことで再び優勝しました。

5. コーディングと問題解決

プロンプト: 「これは動作しない Python 関数です。再帰を使用せずに数値の階乗を返すように修正してください。」

階乗を定義します(n):

結果 = 0

iが範囲(1, n+1)内にある場合:

結果 *= i

結果を返す

ChatGPT-5 は、負の入力に対するエラー処理と例による使用方法のデモンストレーションを含む、本番環境ですぐに使用できる機能を提供しました。

Claude 4.5 Sonnet は特定のバグに焦点を当て、修正の背後にある数学的な根拠を説明し、根本原因を理解しやすくしました。

勝者:壊れた関数の根本的な問題を直接特定して説明したため、Claude が勝利しました。

6. 効率テスト

プロンプト: 「customer_id、amount、order_date の列を持つ、orders というテーブルで先月最も多くお金を使った上位 3 人の顧客を見つける SQL クエリを記述してください。」

ChatGPT-5 はクエリロジックをステップごとに明確に説明しており、タスクの理解に役立ちます。

Claude 4.5 Sonnet は、複数のデータベースのニーズを予測し、構文のバリエーションを提供して、クエリを簡単に適応できるようにしました。

勝者: ChatGPT は、さまざまなデータベース環境向けの他のソリューションを提供せずにタスクを遂行したことで勝利しました。

7. 要約ストレステスト

プロンプト: 「一般化したり細部を幻惑したりしないように注意しながら、次の文章を 1 文で要約してください。」

ChatGPTは、明確かつ指示に忠実な回答を提供しました。また、情報源も明記しました。

クロード 4.5 ソネットはしっかりとした要約を提供しましたが、言葉が多すぎて深みがありませんでした。

勝者: ChatGPT は、ホワイトペーパーを余分なものなしで簡潔に説明したため、勝者となりました。

8. 比較テスト

プロンプト: 「スティーブ・ジョブズとサティア・ナデラのリーダーシップスタイルを 200 語以内で比較し、それぞれが企業文化をどのように形成したかに焦点を当ててください。」

ChatGPT-5 は、各リーダーの中核となる文化的影響を定義する簡潔で洗練された要約を作成しました。

Claude 4.5 Sonnet は、実際の行動との比較を基盤とするために特定の企業慣行とマントラを組み込み、分析に深みを加えました。

勝者:より具体的で具体的な例 (「スタックランキング」の解体、「すべてを学ぶ」というマントラなど) を含めて分析をより具体的にしたため、わずかに優れた回答を提供した Claude が勝利しました。

9. 共感と感情知能

質問：「最近解雇され、お金とキャリアについて不安です。実践的なアドバイスと、励ましと共感のこもった口調で、安心させてくれる言葉をいただけませんか？」

ChatGPT-5 は、詳細で実用的な財務アドバイスと、フォローアッププランの構造化されたオファーを提供し、ユーザーが実際の問題にすぐに対処できる状態になるよう支援します。

クロードさんは最初から感情の処理とセルフケアを優先し、最後には継続的なサポートとつながりの感覚を育む個別の質問をしました。

勝者: クロード氏は、最初に解雇による感情的な影響を認識し、次に実行可能な手順でユーザーを誘導し、その間ずっと支援的な口調を維持し、個別のフォローアップを提供することで、共感と実用性を効果的にバランスさせたことで勝者となりました。

優勝者：クロード 4.5 ソネット

9回のテストを経て、結果は明らかでした。Claude 4.5 Sonnetは、ほとんどのカテゴリーでChatGPT-5を上回り、特に推論、ストーリーテリング、感情知能において顕著でした。Claude 4.5 Sonnetの回答は、より詳細で人間味のある口調で、解決策の背後にある「なぜ」をユーザーに説明するのが得意でした。

とはいえ、要約や効率性といった簡潔な回答が優先される分野では、ChatGPT-5は依然として優位性を維持しています。ここでのポイントは、どちらのモデルも特定の分野で優れているということですが、Claude 4.5がAnthropicのこれまでで最も賢いモデルである可能性は間違いありません。

GoogleニュースでTom's Guideをフォローし、お気に入りの情報源として追加して、最新のニュース、分析、レビューをフィードで受信しましょう。「フォロー」ボタンを忘れずにクリックしてください！

Tom's Guideのその他の記事

ChatGPTで画面を共有してプライムデーの節約に役立てる方法
Sora 2 vs Grok Imagine — 7つのテストを実行した結果、1つが競合を圧倒しました
クロード4.5とジェミニ2.5 Proを9つの難しい質問でテストしました。そして、明確な勝者が出ました。

ノートパソコンに戻る

りんご

エイスース

デル

レノボ

AMD ライゼン

インテル Core i3

インテル Core i5

インテル Core i7

4GBのRAM

8GBのRAM

16GBのRAM

32GBのRAM

32GB

64GB

128GB

256GB

512GB

1TB

2TB

13.3インチ

13.4インチ

14インチ

15インチ

黒

青

金

銀

白

新しい

改装済み

ハードディスク

SSD

どんな価格でも

313件の取引のうち10件を表示

フィルター☰

（256GB SSD）

Apple - MacBook Air 13 インチ...

ベストバイ

（15インチ 1TB）

Apple 2025 MacBook Air...

アマゾン

（13.3インチ 64GB）

Dell XPS 13 9370 13.3 インチ FHD...

アマゾン

（512GB OLED）

ノートパソコン 14.5 インチタッチスクリーン Oled...

アマゾン

（14インチ 256GB）

私たちのレビュー

☆ ☆ ☆ ☆ ☆

Lenovo Chromebook プラス...

アントオンライン

（14インチ 1TB）

私たちのレビュー

☆ ☆ ☆ ☆ ☆

HIDevolution [2025] ASUS ROG...

アマゾン

Apple 13 インチ MacBook Air (M4、...

BHフォト

（15インチ 256GB）

Apple - MacBook Air 15 インチ...

ベストバイ

Dell XPS 13 ノートパソコン -...

（青）

Yoga Slim 7x (14 インチスナップドラゴン)

レノボUSA

アマンダ・キャスウェルは、受賞歴のあるジャーナリストであり、ベストセラーのヤングアダルト小説作家であり、AIとテクノロジー分野における今日の第一人者の一人です。様々なニュースメディアに寄稿する著名なジャーナリストであり、鋭い洞察力と共感できるストーリーテリングで多くの読者を獲得しています。アマンダの作品は、メディアへの卓越した貢献を含む、数々の名誉ある賞を受賞しています。

最も複雑なテーマにも明快な解釈を与える能力で知られるアマンダは、革新性と創造性をシームレスに融合させ、読者にAIと新興技術の力を受け入れるよう促しています。認定プロンプトエンジニアとして、彼女は人間とAIの協働の限界を押し広げ続けています。

アマンダはジャーナリストとしてのキャリアに加え、長距離ランナーであり、3人の子供の母親でもあります。ニュージャージー州在住。

Claude 4.5とChatGPT-5を9つの難しいプロンプトでテストしました。そして、明確な勝者がいました。

Table of Contents

1. 思考連鎖パズル

2. 数学の文章題

3. ストーリーテリング

4. トーンシフトテスト

5. コーディングと問題解決

6. 効率テスト

7. 要約ストレステスト

8. 比較テスト

9. 共感と感情知能

優勝者：クロード 4.5 ソネット

Tom's Guideのその他の記事

Discover More

VRセットアップをアップグレードするMeta Quest 3アクセサリ5選 — たったの19ドルから

婚約指輪を洗浄するためにエスプレッソマシンを使う人がいる。宝石商にそれが良いアイデアかどうか聞いてみた。

Ray-Ban Meta vs Oakley Metaスマートグラス：最大の違いを解説

Table of Contents

1. 思考連鎖パズル

2. 数学の文章題

3. ストーリーテリング

4. トーンシフトテスト

5. コーディングと問題解決

6. 効率テスト

7. 要約ストレステスト

8. 比較テスト

9. 共感と感情知能

優勝者：クロード 4.5 ソネット

Tom's Guideのその他の記事

Smart Recommendations

Discover More