何を作りたいですか?
動画の説明
設定
Veo 3.1 のプレビュー版。30秒でアイデアを確認でき、気に入ったら高品質版に切り替えて本番を作成。
良い結果を得るコツ
具体的に描写する
「猫」だけでなく「日当たりの良い窓辺でうたた寝するオレンジ色の猫」と書きましょう
動きを記述する
動きを指定:ゆっくりパン、静かに振り向く、カメラズームインなど
スタイルを指定する
「シネマティック」「アニメ」「フォトリアル」などのキーワードで画風を制御
テキストから動画 — 活用シーン
商品広告からストーリーボードまで — 書けるものならAIが動画にします。
商品・ブランド広告
商品説明をプロ品質の広告動画に変換。シーン・照明・アングル・雰囲気を入力するだけ — 撮影チーム不要。
Luxury watch rotating on dark marble, golden rim lighting, macro detail, premium product photography
YouTube イントロ・Bロール
目を引くイントロとBロール素材をテキストから生成。必要なショットを説明するだけ — ストック素材のサブスク不要。
Aerial flyover of futuristic city at sunrise, golden clouds, cinematic wide angle, smooth dolly forward
SNSショート動画
TikTok・リール・Shorts向けのスクロールストップ動画を作成。1行のフックを書いて数秒で生成 — デイリーコンテンツに最適。
Close-up coffee pour into glass cup, creamy swirl, satisfying ASMR style, warm tones
教育・解説動画
抽象的なコンセプトをわかりやすい映像に。コンセプトを説明すればAIがビジュアル化 — モーショングラフィックスのスキル不要。
3D visualization of DNA double helix rotating, molecular structure glowing, dark background, scientific documentary style
ミュージックビデオ・歌詞映像
歌詞やムードの説明を雰囲気のあるビジュアルに変換。AIがシネマティックなクリップを生成し、楽曲に合わせてシンク可能。
Neon-lit rain falling on empty city street at night, lone figure in silhouette, cyberpunk aesthetic, slow motion
ショートドラマ・絵コンテ
脚本からシーンを事前にビジュアル化。各ショットをテキストプロンプトにして絵コンテを生成、高コストの撮影前にイテレーション。
Medium shot, detective examining evidence on desk under dim lamp, film noir, moody shadows, slight push-in
動画プロンプト公式ライブラリ
動画プロンプト ≠ 画像プロンプト。動き・カメラ・時間変化が重要。この6つの公式でプロ品質の動画を。
ナラティブショット
[被写体] + [動作/モーション] + [場面] + [カメラワーク] + [雰囲気/照明]
プロンプト例
赤いコートの女性が雨の狭い路地を歩く、カメラが背後から追随、ネオンサインが濡れた石畳に反射、シネマティックなムーディー照明
カメラ追随 + 歩行モーション + 雨 = 3層の動きの重ね合わせ。動画プロンプトと静止画の説明の本質的な違いがここにある。
ムードループ
[環境] + [微細なモーション] + [時間の手がかり] + [雰囲気] + [音のヒント]
プロンプト例
居心地の良いカフェの店内、コーヒーカップから立ち上る湯気、カーテン越しに変化する午後の光、lo-fiな暖かみのある色調、静かなアンビエント感
微細な連続モーション(湯気、光の変化)がシームレスなループを生成 — 背景動画、音楽ビジュアル、SNSヘッダーに最適。
アクションクローズアップ
[クローズアップ] + [被写体] + [ドラマチックな動作] + [速度] + [視覚効果]
プロンプト例
超クローズアップ、新鮮なイチゴが牛乳に落ちる、スローモーションのスプラッシュ、乳白色の水滴が空中に浮遊、プロのフード撮影照明
スローモーション + スプラッシュ + 浮遊する水滴 = SNSフィードで手を止めさせる満足感のある動画。速度コントロールが動画のバイラルの鍵。
ダイナミックカメラ
[カメラタイプ] + [移動方向] + [被写体の出現] + [環境] + [シネマティックスタイル]
プロンプト例
海面から始まるドローンショット、垂直に上昇して熱帯の島全体を明らかに、ターコイズブルーのラグーン、ゴールデンアワー、息をのむ空撮映像
カメラがストーリーテラー:垂直の出現演出はキャラクターなしでも物語の緊張感を生む。カメラワークだけで動画全体を支えられる。
キャラクターパフォーマンス
[キャラクター説明] + [感情の変化] + [ジェスチャー/動作] + [場面] + [アートスタイル]
プロンプト例
三つ編みの少女、驚きの表情が満面の笑みに変わる、手のひらで蛍を受け止める、夕暮れの魔法の森、スタジオジブリ風アニメスタイル
感情の変化(驚き → 笑顔)が5秒の動画に起承転結を与える。感情変化がなければ、キャラクター動画はただの動く写真。
シーントランジション
[シーンA] + [トランジションのきっかけ] + [シーンB] + [視覚的連続性] + [全体のトーン]
プロンプト例
壁に掛かった山の風景画にカメラがプッシュイン、絵が動き出し、カメラが画面を通り抜けて実際の山のシーンへ、シームレスなトランジション、ドリーミーなファンタジー
シーントランジションは静止画では不可能 — 映画ならではの表現。この公式はAIの2つの視覚状態間モーフィング能力を活用。
よくあるプロンプトの間違いと修正方法
よくある間違いを避けて、AI動画の品質を倍増させましょう。
曖昧すぎる — モーションの記述がない
猫
茶トラ猫が日当たりの良い窓辺で伸びをしてあくびをする、暖かい午後の光、クローズアップ、穏やかなスローモーション
動きの言葉(伸び、あくび)がないと、AIは静止画のような動画を生成する。何がどう動くかを必ず記述すること。
1クリップにアクションを詰め込みすぎ
男性が入ってきて、座って、スマホを取り、話し始め、立ち上がって出て行く
カフェのテーブルに座った男性が、穏やかな笑顔でコーヒーカップを手に取る、暖かい朝の光、ミディアムショット
5〜10秒の動画は1〜2アクションが限界。複数のアクションは不自然で支離滅裂な動きになる。1クリップ1アクションが鉄則。
カメラワークの指定がない
海に沈む美しい夕日
海に沈む美しい夕日、ドローンがゆっくり引いて海岸線を映し出す、ゴールデンアワー、シネマティックな広角
カメラワーク(トラッキング、パン、ズーム、空撮、ドリー)がスライドショーではなくシネマティックな動画に仕上げる鍵。
スタイルや雰囲気のキーワードがない
夜の街
サイバーパンクな夜の東京、濡れた路面にネオンの反射、ブレードランナー風の美学、群衆の中をゆっくりドリー、ムーディーなブルーとピンクのトーン
スタイルキーワード(シネマティック、サイバーパンク、アニメ、ドキュメンタリー)+ 雰囲気(ムーディー、ドリーミー、エピック)が出力の視覚言語全体を決定する。
見た目だけ書いて動きを書いていない
高い木と日差しのある森
高い木々の樹冠越しに差し込む日光、光の筋の中を漂う塵の粒子、カメラがゆっくり上にティルト、静寂で幻想的
動画は時間の中の動きが本質。「塵が漂う」+「カメラがティルト」で、静的な森の描写が生きた呼吸するシーンに変わる。
プロンプトタイプ別おすすめモデル
テキストの書き方がモデル選択を決める。短い説明、詳細スクリプト、スタイルキーワード — それぞれに最適解があります。
Sora 2
簡潔なプロンプトの解釈に優れる。指定しなかったディテールを想像力で補完 — アイデアはあるが台本がないときに最適。
"猫がテーブルからカップを落とす、ドラマチックなスローモーション"
Veo 3.1 Quality
複数のビジュアル要素を含む長く複雑な記述を処理。ナラティブテキスト中のカメラ・照明・雰囲気の指示に最も忠実。
"ゴールデンアワーの海辺の町をドローン空撮、カメラがゆっくり降下して桟橋で網を修繕する漁師を映し出す、暖かい逆光、ドキュメンタリー風"
Wan 2.6
アートスタイルのキーワードを動画に変換する能力が最高。サイバーパンク、水彩、ジブリ、フィルムノワール — 抽象的な美学を他モデルより忠実に再現。
"魔法の森、生物発光するキノコ、スタジオジブリ風アートスタイル、穏やかな蛍、ドリーミーな雰囲気"
Runway Gen-4
最安・最速 — 10クレジット、30秒以内。プロンプトのアイデアをテストしてから、最終版にプレミアムモデルを使う流れに最適。
"雪の中を歩く人物、ワイドアングル" → テスト → 調整 → 最終版はVeoに切替
台本から動画へ — ワークフロー
アイデアから完成動画までの流れ。
短いスクリプトを書く
長い説明を4-6秒ごとのシーンに分割。各シーンに1つのアクションを。
"A woman in a red dress walks through a rainy Tokyo street at night, neon reflections on wet pavement"
スタイルとモデルを選択
テストにはRunway Gen-4(10クレジット、30秒)を使用。最終版にはVeo 3.1 Quality(200クレジット)に切替。
Cinematic → Veo 3.1 · Anime → Wan 2.6 · Fast Draft → Runway Gen-4
生成してイテレーション
各シーンのクリップを生成。プロンプトを微調整して動き・タイミング・雰囲気を改善。
ドラフト:Runway 10cr → 最終版:Veo Quality 200cr
テキストから動画 — 手法の比較
従来の撮影 vs 単一モデルツール vs マルチモデルプラットフォーム — テキストから動画を生成するのに最適な方法は?
| 機能 | 従来の撮影 | 単一モデル | Vimod AI |
|---|---|---|---|
| カメラ・撮影チーム・機材が不要 | |||
| 複数のAIモデルから選択可能 | |||
| プロンプトに最適なモデルを自動選択 | |||
| テキスト入力のみで生成 | |||
| HD / 4K出力品質 | |||
| 1動画あたり3分以内で完成 | |||
| 1動画あたり$1未満 | |||
| 多彩なスタイル(シネマティック、アニメ、リアル…) |