Veo 3.1はGoogle DeepMindの最新動画生成モデルで、Google I/Oで初めて発表されました。GoogleはFlow(AIフィルムメイキングツール)、Gemini API(開発者向け)、Vertex AI(エンタープライズ統合)の3つのプラットフォームで展開しています。Google自身のAPIでは、Standard $0.40/秒、Fast $0.15/秒で無料枠はありません。当プラットフォームでは同じモデルが約$0.06〜0.25/秒で利用でき、無料クレジットも付いています。
映画グレードの映像品質。
VeoとΟotherモデルとの差は、照明と素材表現に最も明確に現れます。リアルなボケを伴う適切な被写界深度、蝋細工のように見えない肌のテクスチャ、正しい物理法則で垂れて流れる布地。出力は「ストックフッテージテスト」を定期的にパスします。
クロスディメンションのスタイル融合。
Veo 3.1の最もユニークな機能の一つ:完全に異なるアートスタイルのキャラクターを一つの一貫したシーンに融合できます。フォトリアリスティックな人物と対話するアニメキャラクター、実写環境を歩くピクセルアートキャラクター。
最初/最後のフレーム補間。
Veoに「開始」画像と「終了」画像を与えると、その間のトランジションを自動生成します。モデルが動き、カメラの動き、照明の変化を補完して滑らかな自然なシーケンスを作成します。
2つのモード、大きく異なるコスト。
Veo Fastは8秒クリップあたり50クレジットで約30秒で生成し、反復作業に最適です。Veo Qualityは1〜2分かかり200クレジットですが、明らかに豊かなディテールを生み出します。ほとんどのユーザーはFastでプロンプトを調整し、最終出力にはQualityに切り替えます。
自動サウンドエフェクト(台詞なし)。
Sora 2と同様に、Veoは同期された環境音を生成します。足音、環境音、ASMRテクスチャなど。自然のシーンや雰囲気のあるシーンで特に優れています。Sora 2とは異なり、Veoは台詞やキャラクターの音声を生成しません。