中国のAIスタートアップHailuoのMiniMax 02は、物理特性と視覚的なリアリズムにおいてGoogleのVeo 3に匹敵する数少ないモデルの一つです。シンプルなプロンプトから複雑なプロンプトまで、驚くほどリアルな現実世界のシーンを再現することができ、前世代機から大幅にアップグレードされています。
Veo 3のようなオーディオ機能は搭載されていませんが、画像やテキストから動画を作成でき、文字の一貫性機能を使用して動画全体の一貫性を保つことができます。動画生成時間は6秒または10秒、解像度は720pまたは1080pから選択できます。
最新世代のAI動画モデルをテストするために、私はあるコンセプトを思いつきました。それは、もはや存在しない野生生物についてのドキュメンタリーです。ドードー、サーベルタイガー、ケナガマンモスといった絶滅種を題材に、現代の生物と結びつけるというものです。
物語の創造
ネイチャーコールズ ミニマックス 02 - YouTube
最初の課題は物語を考えることでした。絶滅の危機から、もし現代まで生き延びていたらどうなるかまでを描きます。特に巧妙な話ではなく、意味不明なシーンもありますが、見栄えは良いです。その後、物語をプロンプト、つまりシンプルなアイデアにまとめました。
ストーリーを練るのにGrok 4を頼りました。思いついたアイデアを伝え、1~2分のドキュメンタリーを作るための一連の動画の構成を手伝ってもらいました。AIを使ってAIを誘導するのは実用的な解決策です。AIは文章の構造を作り、カメラの種類や動きといったキーワードを単純な文章に追加してくれます。
Grok 4は特に便利で、すぐにオンラインに接続し、MiniMax 02のプロンプトガイドを見つけ、ベストプラクティスに基づいて応答をカスタマイズしました。16個のプロンプトが生成され、それぞれ6秒間の動画が作成されました。
プロンプトの作成
プロジェクトのコンセプトは、「絶滅種の行動と環境をまるでフィルムに記録したかのように記録し、進化と絶滅の原因について議論する。マンモスが現代にいたらどうなっていたかといった『もしも』のシナリオも盛り込み、想像力を掻き立てる」というものでした。
最新ニュース、最も注目されているレビュー、お得な情報、役立つヒントにすぐにアクセスできます。
次に、ストーリーを伝えるために必要な具体的なシーンを練り上げ、MiniMaxの強みを活かせるプロンプトを作成しました。例えば、MiniMax 02は、毛皮の動きや衝突といったリアルな物理表現、カメラコントロール、テクスチャのディテール表現に最適です。
例えば、私は「絶滅の夜明け」というシーンで幕を開けることにしました。その目的は、先史時代の地球をドラマチックに概観し、舞台を設定することです。最初のプロンプトは、「ドードーやサーベルタイガーといった多様な絶滅動物が平和に草を食む、緑豊かな先史時代の谷のパノラマビュー。かすかな風の物理法則が葉や毛皮を揺らし、広角の周回カメラが引き戻されて接近する小惑星の影が浮かび上がる。温かみのあるゴールデンアワーの照明を使った、映画のような壮大なスタイル。1080p/24fps、6秒。」です。
ご覧のとおり、さまざまな絶滅動物、より広いシーン、そしてもちろん照明、カメラの種類やスタイルがリストされています。
ビデオの生成
合計16個のプロンプトが完成したら、HailuoのMiniMaxを使い、モデルメニューから02を選択し、テキストから動画への変換が選択されていることを確認しました。より一貫した制御が必要な場合は、Midjourneyなどで画像を生成してから画像から動画への変換を使用することもできます。
私はスタンダードアカウントしか持っていないので、1080p、6秒に設定しています。機種ごとに利用可能な最高解像度を選択すると、後でトリミングしたりズームモーションを追加したりするなど、編集作業が柔軟になります。
動画を繰り返し再生する必要は2回だけでしたが、そこまでこだわりはしませんでした。1つはサーベルタイガーとケナガマンモスの戦いを描くように指示したのですが、普通のトラが映し出されてからサーベルタイガーに変わってしまいました。もう1つはエンドボードのテキストをダブルクォーテーションで囲むのを忘れてしまいました。こうすることで正確なレンダリングが可能になります。
すべてをまとめる
ミニドキュメンタリーを構成する16本のビデオが完成したら、それぞれのビデオのサウンドエフェクトの作成に取り掛かりました。Grok 4を使って、ビデオプロンプトをElevenLabs SFXジェネレーター用のSFXプロンプトに変換しました。
その後、Suno に依頼して、インストゥルメンタルの壮大なサウンドトラックを作成し、ElevenLabs に戻って、ビデオの内容に基づいて書いたスクリプトに音声を付けました。
最後に、すべてをCapCutに取り込み、動画の重要なシーンに合うサウンドを選択しました。そして、ナレーションと音楽トラックを追加しました。
最後に
AI動画ツールを使ったコンテンツ制作は、かつてないほど容易になりました。MiniMaxのようなAI動画ツールは、見た目だけでなく、照明や物理演算の扱いにおいても、ますますリアルになっています。
ほんの数個のプロンプトから、ドキュメンタリー全体を制作できます。かつては良いビデオ1本に対して、悪いビデオを何十本も制作する必要があったかもしれませんが、今ではプロンプトが良ければ、ほぼ1本で済むため、コストとスピードの両方が削減されます。
Hailuo MiniMax 02 は、Google Veo 3 以外のほぼすべての世代で一貫して物理と照明の精度を実現している唯一のモデルですが、はるかに安価です。
Tom's Guideのその他の記事
- 私はChatGPTのテストを生業としています。この「3ワードルール」を使って、より賢い回答を得ましょう。
- Character.AIは本当にクレイジーで、使えば使うほど奇妙になります。使い始める方法は次のとおりです。
- ChatGPTを毎日使っています。これが私にとって欠かせない9つの新しいプロンプトです。