Google 推出 Veo 2 视频生成模型，与 OpenAI 的 Sora 竞争

Google 发布了最新版本的视频生成模型 Veo 2，声称其能生成更逼真的视频，直接与 OpenAI 的 Sora 竞争。同时，Google 还更新了图像生成模型 Imagen 3，以生成更丰富、更详细的照片。

Veo 2 具有“更好地理解现实世界物理以及人类运动和表达的细微差别”的能力。它可在 Google Labs 的 VideoFX 平台上使用，但目前仅对等待名单上的用户开放。用户需要通过 Google 表单注册，并等待 Google 在其选择的时间临时授予访问权限。

Google 在一篇博客文章中表示：“Veo 2 还理解电影摄影的语言：要求它提供一种类型、指定一个镜头、建议电影效果，Veo 2 将以高达 4K 的分辨率提供。”使用 Veo 2 生成的视频将包含 Google 的元数据水印 SynthID，以识别这些视频是由 AI 生成的。

尽管 Google 承认 Veo 2 可能仍然会出现幻觉，例如多出手指等，但它承诺新模型产生的幻觉更少。

Veo 2 将与 OpenAI 最近发布的 Sora 视频生成模型竞争，以吸引电影制作人和内容创作者。Sora 在向付费用户开放之前已经进行了一段时间的预览。

令人印象深刻的是，Google 表示，在其内部测试中，衡量“总体偏好”（即观众更喜欢哪些视频）和“提示遵守”（视频与人类创作者给出的指令匹配程度）时，人类评估者更喜欢 Veo 而不是 Sora 和其他竞争对手的 AI 模型。

今年 5 月，在 Google I/O 开发者大会上，Google 与演员兼音乐家唐纳德·格洛弗（Donald Glover，又名 Childish Gambino）合作制作了一段视频，宣布推出 Veo。

AI 视频生成仍需努力

AI 视频生成一直是生成式 AI 领域的一个领域，大型模型开发人员，如 Google 和 OpenAI，经常与相对较小的公司竞争并追赶。

AI 视频生成的先驱之一 RunwayML 最近为其 Gen-3 Alpha Turbo 模型推出了高级控制。Pika Labs 发布了 Pika 2.0，使用户能够更好地控制并将自己的角色添加到视频中。Luma AI 宣布与 AWS 合作，将其模型引入 Bedrock 供企业使用。Luma 还扩展了其 Dream Machine 生成模型。

然而，AI 视频生成仍然需要说服创作者和观众。在 Sora 备受期待的发布后，当它继续生成违反物理和解剖学的人物时，人们仍然对其能力持怀疑态度。用户认为它的结果不一致。

最近的游戏大奖预告片也显示了人们对他们认为的“AI 垃圾”的不信任。

然而，一些电影制作人已经开始接受 AI 视频生成器提供的可能性。著名导演詹姆斯·卡梅隆（James Cameron）加入了 Stability AI 的董事会，而演员安迪·瑟金斯（Andy Serkis）则宣布他正在建立一家以 AI 为重点的制作公司。

Google 表示，它看到了许多用户的兴趣。该公司表示，YouTube 创作者一直在使用 VideoFX 为 YouTube Shorts 制作背景，以节省时间。

Imagen 3 的更新

Google 还更新了其图像模型 Imagen 3，该模型最近通过其 Gemini 聊天机器人在网络上提供，以更逼真并提供更明亮的图像。

Imagen 3 现在可以更准确地呈现更多艺术风格，“从真实感摄影到印象派，从抽象到动漫”。Google 表示，该模型还将更忠实地遵循提示。

人们可以通过 ImageFX 访问 Imagen 3。