$("body").append("")

Google 推出 Veo 2 视频生成模型,与 OpenAI 的 Sora 竞争

97次阅读
没有评论

Google 推出 Veo 2 视频生成模型,与 OpenAI 的 Sora 竞争
Google 发布了最新版本的视频生成模型 Veo 2,声称其能生成更逼真的视频,直接与 OpenAI 的 Sora 竞争。同时,Google 还更新了图像生成模型 Imagen 3,以生成更丰富、更详细的照片。

Veo 2 具有“更好地理解现实世界物理以及人类运动和表达的细微差别”的能力。它可在 Google Labs 的 VideoFX 平台上使用,但目前仅对等待名单上的用户开放。用户需要通过 Google 表单注册,并等待 Google 在其选择的时间临时授予访问权限。

Google 在一篇博客文章中表示:“Veo 2 还理解电影摄影的语言:要求它提供一种类型、指定一个镜头、建议电影效果,Veo 2 将以高达 4K 的分辨率提供。”使用 Veo 2 生成的视频将包含 Google 的元数据水印 SynthID,以识别这些视频是由 AI 生成的。

尽管 Google 承认 Veo 2 可能仍然会出现幻觉,例如多出手指等,但它承诺新模型产生的幻觉更少。

Veo 2 将与 OpenAI 最近发布的 Sora 视频生成模型竞争,以吸引电影制作人和内容创作者。Sora 在向付费用户开放之前已经进行了一段时间的预览。

令人印象深刻的是,Google 表示,在其内部测试中,衡量“总体偏好”(即观众更喜欢哪些视频)和“提示遵守”(视频与人类创作者给出的指令匹配程度)时,人类评估者更喜欢 Veo 而不是 Sora 和其他竞争对手的 AI 模型。

今年 5 月,在 Google I/O 开发者大会上,Google 与演员兼音乐家唐纳德·格洛弗(Donald Glover,又名 Childish Gambino)合作制作了一段视频,宣布推出 Veo。

AI 视频生成仍需努力

AI 视频生成一直是生成式 AI 领域的一个领域,大型模型开发人员,如 Google 和 OpenAI,经常与相对较小的公司竞争并追赶。

AI 视频生成的先驱之一 RunwayML 最近为其 Gen-3 Alpha Turbo 模型推出了高级控制。Pika Labs 发布了 Pika 2.0,使用户能够更好地控制并将自己的角色添加到视频中。Luma AI 宣布与 AWS 合作,将其模型引入 Bedrock 供企业使用。Luma 还扩展了其 Dream Machine 生成模型。

然而,AI 视频生成仍然需要说服创作者和观众。在 Sora 备受期待的发布后,当它继续生成违反物理和解剖学的人物时,人们仍然对其能力持怀疑态度。用户认为它的结果不一致。

最近的游戏大奖预告片也显示了人们对他们认为的“AI 垃圾”的不信任。

然而,一些电影制作人已经开始接受 AI 视频生成器提供的可能性。著名导演詹姆斯·卡梅隆(James Cameron)加入了 Stability AI 的董事会,而演员安迪·瑟金斯(Andy Serkis)则宣布他正在建立一家以 AI 为重点的制作公司。

Google 表示,它看到了许多用户的兴趣。该公司表示,YouTube 创作者一直在使用 VideoFX 为 YouTube Shorts 制作背景,以节省时间。

Imagen 3 的更新

Google 还更新了其图像模型 Imagen 3,该模型最近通过其 Gemini 聊天机器人在网络上提供,以更逼真并提供更明亮的图像。

Imagen 3 现在可以更准确地呈现更多艺术风格,“从真实感摄影到印象派,从抽象到动漫”。Google 表示,该模型还将更忠实地遵循提示。

人们可以通过 ImageFX 访问 Imagen 3。

正文完