如果说初代 Sora 是视频生成领域的 GPT-1,那 Sora 2 就是迈进了 GPT-3.5 时刻。它在上线几天内就登顶美区 App Store 免费榜——速度甚至超过了 ChatGPT 本身。这不只是画质提升——而是从"视频生成工具"向"世界模拟器"的飞跃。
真正有效的物理模拟。
之前的模型过于"乐观"——它们会通过扭曲现实来强行完成指令。如果篮球运动员投篮不中,球会神奇地飞进篮筐。Sora 2 不会作弊。投篮失败,球会从篮板上正常弹回。角色会绊倒、踉跄、然后像真人一样恢复。它甚至能处理奥运级别的体操动作——这是之前模型完全做不到的。模型中的"错误"现在看起来像是人的失误,而非物理定律的崩坏。
导演级多镜头控制。
Sora 2 支持跨镜头叙事连续性——角色外观、位置、环境光照在多个生成片段中保持一致。这意味着你可以创建连贯的多场景故事,而不只是孤立的片段。把它想象成一个记住了前一条拍摄所有细节的虚拟导演。
端到端音视频联合生成。
Sora 2 不仅创建视频——还在同一次生成中输出同步对白、音效和环境音。雨打路面、人群欢呼、角色说出他们的台词。不需要单独的音频步骤。Veo 3.1 也有自动音频,但 Sora 2 的对白生成和场景匹配准确度在叙事内容上领先一步。
Cameo——把自己放入 AI 场景。
OpenAI 的 Cameo 功能让你把自己的面孔和声音放入 Sora 生成的场景中,带有身份验证和完整的授权控制。虽然 Cameo 需要在 OpenAI 平台直接使用,但它标志着个性化 AI 视频的发展方向。
代价是什么?访问和成本。OpenAI 把 Sora 2 限制在 ChatGPT Plus 订阅($20/月)和严格的使用次数之后。在我们平台,你可以使用同样的 Sora 2 模型——不需要邀请码、不带水印、每条视频约 $0.30,而不是消耗月付订阅额度。