NightCafeを使って5つの最高のAI画像ジェネレーターをテストしました。これがトップの座を獲得しました。

Table of Contents

NightCafeを使って5つの最高のAI画像ジェネレーターをテストしました。これがトップの座を獲得しました。

AI生成のクリップでバリスタが女性にコーヒーを渡す

(画像クレジット:NightCafe/Future/Ryan Morrison)

AI画像生成ツールの分野では競争が激しく、Ideogram、Midjourney、OpenAIといった企業が自社製品の使用を促そうと躍起になっています。だからこそ私はNightCafeのファンで、数年前から愛用しています。DALL-E 3、Flux、Google Imagen、Ideogramなど、主要なモデルがすべて1か所に揃っています。

長年にわたり多くのAI画像を作成してきましたが、それぞれのモデルがそれぞれ異なる特徴を持っています。例えば、Fluxは様々なバージョンで優れた汎用モデルです。Imagen 4はリアリティに優れており、IdeogramはGPT-4o以外ではどのモデルよりもテキスト処理が優れています。

NightCafeを使えば、複数のモデルで同じプロンプトを試したり、Google Imagenを使って例えば駅のリアルな画像を作成し、それをイデオグラムプロジェクトのスターター画像として使ってキャプションやスタイリッシュなロゴを重ねたりできます。また、複数のモデルで同じプロンプトを試してみて、どれが好みかを確認することもできます。

NightCafeは、Kling、Runway Gen-4、Luma Dream Machine、Wan 2.1など、主要なビデオモデルのほとんどを提供しています。今回のテストでは、画像モデルに焦点を当てています。

お気に入りのモデルを選ぶ

これらすべてのモデルを手元に置いておくことは、それぞれのモデルを試して、自分の美的感覚に最も合ったものを見つけるのに最適な方法です。そして、それぞれのモデルはあなたが思っている以上に異なっています。

FluxやImagenのような「主力」モデルに加えて、FluxとStable Diffusionを微調整したコミュニティモデルも存在します。ここでは、OpenAI GPT1、Recraft v3、Google Imagen 4、Ideogram 3、Flux Kontextといったコアモデルに焦点を当てました。

各モデルに試していただきたいプロンプトを思いつきました。ある程度のフォトリアリズムが求められ、複雑なシーンを描き、繊細なテキストも必要です。

最新ニュース、最も注目されているレビュー、お得な情報、役立つヒントにすぐにアクセスできます。

The prompt: “A small independent coffee van parked on a quiet cobblestone street in Paris during early autumn, captured in candid 35mm street photography style with natural light and shallow depth of field. Golden morning sunlight reflects off the damp stones after a light rain. The van is a matte forest green Citroën Type H, with a hand-painted chalkboard sign leaning against it that reads “Café du Matin” in elegant cursive. A barista in a denim apron hands a coffee to a smiling elderly woman in a beige trench coat holding a small umbrella. Fallen leaves gather near the tyres, and gentle steam rises from takeaway cups on the wooden counter.”

1. Google 画像 4

バリスタがコーヒーを提供する

(画像クレジット:NightCafe/Future/Ryan Morrison)

GoogleのImagen 4は、Geminiアプリで画像を作成する際に使用するモデルです。また、Googleスライドで画像を作成する際にも使用されるモデルです。

これはこのテストの最初の画像です。煙が立ち上る様子を捉えているものの、少し強調しすぎています。視覚的に魅力的なシーンを作り出し、シーン内の2人の人物の要件も満たしています。正しい車両は写っていますが、文字は見えません。

2. フラックスコンテキストマックス

バリスタがコーヒーを提供する

(画像クレジット:NightCafe/Future/Ryan Morrison)

Black Forest Labs Fluxモデルは、最も汎用性が高く、オープンソースです。Kontextバリアントの登場により、自然言語をより深く理解する画像モデルが利用可能になりました。これは、OpenAIのGPT-4oにおけるネイティブ画像生成に少し似ており、特にテキストや複雑なシーンをレンダリングする際に、より正確な結果をもたらすことを意味します。

Flux Kontext は「Cafe Matin」を完璧に捉えており、女性の描写も正確で、Imagen よりもフランスらしさを感じさせますが、写真としてはそれほど正確ではないと思います。

3. OpenAI GPT 画像-1

バリスタ

(画像クレジット:NightCafe/Future/Ryan Morrison)

GPT Image-1は、2018年のオリジナルGPT-1モデルと混同しないでください。OpenAIが開発したマルチモーダルモデルで、レンダリング精度の向上を目的として設計されており、Adobe、Figma、Canva、NightCafeなどで使用されています。Kontextと同様に、自然言語プロンプトの理解度が優れています。

このモデルの欠点は、9:16や16:9の画像が作成できないことです。正方形の画像しか作成できません。トラックと名前は捉えましたが、シーン全体の出来はあまり良くないと思います。また、2つ目の傘がランダムに生成され、手の配置が不自然です。

4. 表意文字 v4

バリスタ

(画像クレジット:NightCafe/Future/Ryan Morrison)

Ideogramは、リリース以来、私のお気に入りのAI画像モデルの一つです。常に読みやすいテキストを生成できるだけでなく、他のモデルよりもスタイルの柔軟性に優れています。Ideogramのウェブサイトには、デザイン性に優れたキャンバスと、アップスケーラーが組み込まれています。

結果は完璧とは言えませんが、バリスタの傾きがおかしくなっています。しかし、照明はよりリアルになり、トラックが道路ではなく歩道に停まっていることで、シーンもよりリアルになりました。また、よりモダンな雰囲気になり、テキストも読みやすく、デザインも優れています。

5. リクラフト v3

Recraft v3 バリスタイメージ

(画像クレジット:NightCafe/Future/Ryan Morrison)

Recraftはどちらかというとデザインモデルで、レンダリングされたテキストとイラストの両方に最適ですが、だからといって素晴らしい画像を作成できないわけではありません。市場に登場した際には、他のモデルを凌駕し、リーダーボードのトップに躍り出ました。

出来栄えにはそれほど感心しませんでした。確かに、シーンに与えられた空間のおかげで、視覚的に最も印象的であることは確かです。しかし、煙が強調されすぎているし、バリスタはどこにいるのでしょうか? また、テキストを主眼としたモデルなのに、看板の文字が全くありません。

私のお気に入り: Flux Kontext Max

バリスタ

(画像クレジット:NightCafe/Future/Ryan Morrison)

Flux には視覚的にいくつか問題がありましたが、最も一貫性があり、看板の文字も読みやすいという点が優れていました。もしこれを商用利用、つまりストック画像として使用するなら、Google Imagen 4 を選びますが、純粋に視覚的な観点から言えば Flux が勝者です。

Flux Kontext では、適応も容易です。トラックの色を変えたり、おばあさんをビジネスマンに置き換えたりするセカンダリプロンプトを作成できます。これは Gemini では可能ですが、Imagen ではできません。Gemini 2 以降のネイティブ画像生成機能を使用する必要があります。

Kontextを使って画像に変更を加えたい場合、たとえそれが元々Kontext画像でなかったとしても、NightCafeで画像をクリックし、「編集プロンプト」を選択するだけです。約2.5クレジットで、簡単な説明文を入力するだけで編集できます。

NightCafeについての最終的な感想

このテストでは、各モデルの中で最も高価なバージョンを使用しました。各画像の処理に最も時間がかかるバージョンです。これにより、最も公平な比較が可能になりました。驚いたのは、各モデルが同じ説明文をどれほど異なる方法で解釈するかということです。しかし、説明文を理解する能力が各モデルともに大幅に向上したことは、驚くべきことではありません。

NightCafeの一番の魅力は、AIコンテンツがワンストップで利用できることです。主要な画像や動画モデルを利用できるだけでなく、コンテンツ作成を中心とした様々なゲーム、アクティビティ、グループなど、大規模なコミュニティも提供しています。さらに、アプリ内で作成した画像は、編集、補正、顔の修正、拡大、拡大などが可能です。

Tom's Guideのその他の記事

  • ChatGPTの就職活動ハックは誰も語らないが、実は効果がある
  • これらの7つのChatGPTプロンプトは私の考え方を変えました。今では毎週使っています。
  • ChatGPTの隠れた5つのトリック - 多くの人が使っていないけど、実はゲームチェンジャーになる

矢印

ノートパソコンに戻る

どんな価格でも

219件の取引のうち10件を表示

フィルター

矢印

(256GB SSD)

1

Apple - MacBook Air 13 インチ...

ベストバイ

(15インチ 1TB)

2

Apple 2025 MacBook Air...

アマゾン

(13.3インチ 256GB)

私たちのレビュー

3

デル XPS XPS9350-4007SLV...

アマゾン

(512GB OLED)

4

ノートパソコン 14.5 インチ タッチスクリーン Oled...

アマゾン

(14インチ 128GB)

5

Lenovo - Flex 5i Chromebook...

ベストバイ

(14インチ 1TB)

私たちのレビュー

6

HIDevolution [2024] ASUS ROG...

アマゾン

7

Apple 13 インチ MacBook Air (M4、...

BHフォト

(15インチ 256GB)

8

Apple - MacBook Air 15 インチ...

ベストバイ

9

Dell XPS 13 ノートパソコン -...

デル

(青)

10

Yoga Slim 7x (14 インチ スナップドラゴン)

レノボUSA

もっと見る

テクノロジージャーナリズム界の重鎮であるライアン・モリソンは、20年以上にわたる輝かしい実績を誇りますが、AIとテクノロジーに関する洞察に満ちた記事で自らの見解を代弁することを好んでおり、自己顕示欲に走るようなことは好みません。トムズ・ガイドの元AI編集者であるモリソンは、懐疑心と熱意を織り交ぜながら、AIの複雑さを解き明かし、差し迫ったロボットによる支配など忘れさせてしまうほどの洞察力を発揮します。
自身の経歴を渋々執筆している時(あまりにも嫌いなため、AIに外注しています)は、天文学と物理学を学ぶことで知識を深め、科学的根拠に基づいた文章を執筆しています。

Discover More