ChatGPT Visionをテストしてみた — 処理できなかったタスクが1つある

Table of Contents

ChatGPT Visionをテストしてみた — 処理できなかったタスクが1つある
携帯電話にChatGPTとOpenAIのロゴ
(画像クレジット:Shutterstock)

視覚AIモデルは、スマートフォンから世界と関わる方法を変えつつあります。テキストのリアルタイム翻訳から植物(あるいは不気味な生き物)の識別、数学の問題の解答など、これらのツールは「見て」反応することで、生活をより便利にしてくれます。

ChatGPT Visionは、OpenAIのマルチモーダルアップグレードで、テキストと同じように画像とインタラクションできます。ChatGPTアプリ内またはブラウザから直接写真をアップロードすると、チャットボットが画像を分析し、説明し、画像に関する疑問点を丁寧に解説します。

同様に、Google レンズはAndroidアプリやGoogleアプリに直接統合されており、テキストの翻訳、商品やランドマークの識別、さらにはショッピングのサポートにも役立ちます。認識速度が速いことで知られており、スマートフォンから直接情報を得たい人にとって頼りになるツールとなっています。

どちらも同じ目的を果たしますが、すべての視覚モデルが同じように作られているわけではありません。どちらが実際に優れているかを知るために、ChatGPT VisionとGoogle Lensを7つの日常的なシナリオで比較してみました。結果はきっと驚くでしょう。

1. 翻訳

ChatGPT VisionとGoogle Lensのスクリーンショット

(画像提供:Future)

最初の課題として、電動自転車の取扱説明書に記載されているスペイン語の指示を写真に撮りました。そして、各モデルに翻訳してもらいました。

ChatGPT Vision はユーザーマニュアルの翻訳をうまく行いました。ただし、翻訳に時間がかかり、手順も多くなりました。

Google Lensが目の前でユーザーマニュアルを翻訳してくれました。何も言わなくても、モデルが言葉を「見て」、簡単な切り替え操作で翻訳してくれます。

勝者:簡単かつ高速な翻訳でGoogle レンズが勝利しました。

2. 手書きの数学の問題を解く

ChatGPT VisionとGoogle Lensのスクリーンショット

(画像提供:Future)

難しい代数の問題をメモ用紙に書き留め、その手書きの問題を写真に撮りました。そこから、生徒一人ひとりに段階的に解いてもらいました。

ChatGPT Vision は、複雑な代数問題を理解しやすくし、最終的に最終的な答えに到達するために、問題を複数のステップに分解しました。

Google Lensは数学の問題を一目見て、数秒で解いてくれました。しかし、計算過程は表示できたものの、ChatGPTほど詳細な情報を提供できず、最終的には段階的に説明することなく結論にたどり着いてしまいました。

勝者: ChatGPT Vision が、問題をより適切に分析し、より教育的で徹底的な回答を提供したことにより勝利しました。

3. 特定して提案する

ChatGPT VisionとGoogle Lensのスクリーンショット

(画像提供:Future)

私は庭の低木にカメラを向け、AI モデルにそれがどんな種類の低木か、どのように手入れするかを尋ねました。

ChatGPT Vision は低木を特定し、その手入れ方法や、適切に成長している兆候を探す方法も説明しました。

Google Lens は私の庭の低木を識別しましたが、ChatGPT ほどその手入れ方法については応答しませんでした。

勝者: ChatGPT Vision は、より徹底的かつ個人的な正確な対応により勝利しました。

ChatGPT VisionとGoogle Lensのスクリーンショット

(画像提供:Future)

これは、キルト作家の母が布切れしか残っていない時に、布を探すのを手伝うためにいつもやっていることです。ChatGPT VisionとGoogle Lensの両方が、この作業に役立っています。

最新ニュース、最も注目されているレビュー、お得な情報、役立つヒントにすぐにアクセスできます。

ChatGPT Vision は、生地の名前や製造元を見つけるのに役立つことはできないと直接伝えました。

Google レンズは生地を表示するだけでなく、生地の名前とオンラインで購入できる場所も教えてくれました。

勝者:この場合、Google Lens が最高のショッピング アシスタントとして勝利します。

健康/救急スタイル(非医療)サポート

ChatGPT VisionとGoogle Lensのスクリーンショット

(画像提供:Future)

今回は画像は伏せますが、私自身、ささくれができやすく、救急外来や皮膚科にも通った経験があるので、対処法は自信を持って言えます。今回は、両方のチャットボットにささくれの画像をシェアしました。

ChatGPT Visionは私の指を見てすぐに何が起こっているのかを理解し、エプソムソルトのような鎮静剤も提案してくれました。まさに私の皮膚科医が勧めてくれたものです。

Google レンズは画像を認識し、様々な可能性を提示しましたが、どれも実際の問題ではありませんでした。他のGoogle レンズユーザーの画像に基づいて画像の説明をし、一般的な補足説明以上のものはありませんでした。

勝者:ChatGPT Visionは、私の問題を素早く特定し、即座に解決策を提供してくれたので、勝利しました。ChatGPTは実際の医師の代わりにはなりませんが、ChatGPT-5 Visionは、いざという時にとても役立ちました。特に、子供のかかりつけの小児科医と電話で話す際に、詳細情報を伝えるのにとても役立ちました。

日常的なトラブルシューティング

ChatGPT VisionとGoogle Lensのスクリーンショット

(画像提供:Future)

これは、ChatGPT VisionとGoogle Lensの両方を私が普段から使っているもう一つの方法です。車のダッシュボードで警告灯が点灯した時によく写真を撮って、「これはどういう意味?次に何をすればいいの?」と自問します。そこで、10年ほど前に所有していた車の写真をまだ撮っていたので、アップロードしました。

ChatGPT Visionは、その画像をダッシュ​​ボード上の「故障表示ランプ」だと認識しました。そして、それが何を意味するのか、そしてまず何をすべきかまで教えてくれました。

Google レンズはより一般的なヘルプを提供し、車のユーザーマニュアルへのリンクも含まれていました。

勝者:ChatGPT Visionは、ユーザーマニュアルで自分で解決策を探すのではなく、よりパーソナライズされた回答を提供してくれたため、私の問題を理解するのに役立ちました。また、ダッシュボードのライトが点灯するたびに、問題が軽微である可能性が高いことを示してくれたので、これは常に役立つ情報です(軽微な問題か重大な問題かは関係ありません)。

創造性

ChatGPT VisionとGoogle Lensのスクリーンショット

(画像提供:Future)

うちの子が作った作品をいくつかアップロードしました。ミクストメディアアートです。それぞれのモデルに作品の詳しい説明をお願いしました。

ChatGPT Vision はアートワークがどのようなものかを正確に教えてくれましたが、それ以上の詳細については説明しませんでした。

Google レンズは、私の子どもの作品のほぼすべての要素を詳細に表示し、類似した作品もいくつか表示しました。

勝者: Google レンズは、説明の詳細さと、インスピレーションを得るためのより多くのアートワークを表示することで創造性をさらに刺激する点で、期待以上の成果をあげたため、勝者となりました。

持ち帰り

7つの非常に異なるプロンプトで両ツールをテストした結果、ChatGPT Visionが明らかに勝者となりました。しかし、すべてのカテゴリーで優位に立ったわけではありません。Google Lensはスピード、ショッピング、クリエイティブな探索において優れており、ChatGPT Visionは深み、コンテキスト、そしてパーソナライズされたヘルプにおいて際立っています。

どちらが「ベスト」かは、最終的にあなたが何を最も必要としているかによって決まります。即座の回答か、それとも思慮深い分析か。私のおすすめは、両方のAIビジョンアプリを手元に置いておくことです。そうすれば、迅速な修正、翻訳、そしてより深い理解が可能になります。私は、もう一度確認したいときにいつも両方使っています。

GoogleニュースでTom's Guideをフォローし、お気に入りの情報源として追加して、最新のニュース、分析、レビューをフィードで受信しましょう。「フォロー」ボタンを忘れずにクリックしてください!

Tom's Guideのその他の記事

  • AI主導の就職市場で将来を見据えたキャリアを築くために、私は5つのChatGPTプロンプトを活用しています。これが効果的な理由です。
  • Gemini が App Store で ChatGPT を追い抜いた — Google が「これはまだ始まりに過ぎない」と言っている理由
  • ChatGPTのキーボードショートカット4つで文章の書き方が変わります

矢印

ノートパソコンに戻る

どんな価格でも

315件の取引のうち10件を表示

フィルター

矢印

(256GB SSD)

1

Apple - MacBook Air 13 インチ...

ベストバイ

(15インチ 1TB)

2

Apple 2025 MacBook Air...

Amazon

(13.3インチ 64GB)

3

Dell XPS 13 9370 13.3" FHD...

Amazon

(512GB OLED)

4

Laptop 14.5" Touchscreen Oled...

Amazon

(14インチ 256GB)

私たちのレビュー

5

Lenovo Chromebook Plus...

antonline

(14インチ 1TB)

私たちのレビュー

6

HIDevolution [2025] ASUS ROG...

Amazon

7

Apple 13" MacBook Air (M4,...

BHPhoto

(15インチ 256GB)

8

Apple - MacBook Air 15-inch...

Best Buy

9

Dell XPS 13 Laptop - w/...

Dell

(青)

10

Yoga Slim 7x (14″ Snapdragon)

Lenovo USA

もっと見る

アマンダ・キャスウェルは、受賞歴のあるジャーナリストであり、ベストセラーのヤングアダルト小説作家であり、AIとテクノロジー分野における今日の第一人者の一人です。様々なニュースメディアに寄稿する著名なジャーナリストであり、鋭い洞察力と共感できるストーリーテリングで多くの読者を獲得しています。アマンダの作品は、メディアへの卓越した貢献を含む、数々の名誉ある賞を受賞しています。

最も複雑なテーマにも明快な解釈を与える能力で知られるアマンダは、革新性と創造性をシームレスに融合させ、読者にAIと新興技術の力を受け入れるよう促しています。認定プロンプトエンジニアとして、彼女は人間とAIの協働の限界を押し広げ続けています。

アマンダはジャーナリストとしてのキャリアに加え、長距離ランナーであり、3人の子供の母親でもあります。ニュージャージー州在住。

Discover More