オリジナルのSoraが動画生成分野のGPT-1であるとするなら、Sora 2はそのGPT-3.5モーメントです。リリース後わずか数日で米国App Storeの無料チャートで1位を獲得しました。これは単なる品質向上ではなく、「動画生成ツール」から世界シミュレーターへの転換です。
実際に機能する物理演算。
以前のモデルは「楽観的」でした。バスケットボール選手がシュートを外しても、ボールは魔法のようにゴールに入っていました。Sora 2はごまかしません。外れたシュートはリアルにバックボードで跳ね返ります。キャラクターが転んで自然に立ち直ります。オリンピックレベルの体操シーケンスも処理できます。
ディレクターレベルのマルチショット制御。
Sora 2はショット間の物語の継続性をサポートしています。キャラクターの外見、位置、環境の照明が複数の生成クリップにわたって持続します。孤立したクリップだけでなく、一貫したマルチシーンのストーリーを作成できます。
エンドツーエンドの音声・動画生成。
Sora 2は動画を作るだけでなく、同じパスで同期された台詞、効果音、環境音も生成します。別途音声処理は不要です。
Cameo — AI シーンに自分を登場させる。
OpenAIのCameo機能を使うと、本人確認と完全なコンソールの下で、自分の顔と声をSora生成シーンに挿入できます。Cameoは当プラットフォームを含むサードパーティでは利用できません。
トレードオフは?アクセスとコストです。OpenAIはSora 2をChatGPT Plus($20/月)の後ろに置き、厳格な使用制限を設けています。当プラットフォームでは、招待コードなし、透かしなし、1動画あたり約$0.30で同じSora 2モデルを利用できます。