概要:前 Snap AI 首席推出 Higgsfield,挑战 OpenAI 的 Sora 视频生成器。新推出的 Higgsfield AI 旨在为更多定制、个性化的视频应用提供服务,吸引了创作者们的目光。尽管面临着与版权问题和滥用的挑战,但该平台通过移动端优先和社交导向的营销策略,以及对视频编辑功能的改进和训练更强大的生成模型的计划,有望在社交媒体市场脱颖而出。
一项颠覆性的技术正在迅速改变着视频创作的格局。在前不久,OpenAI 推出了一款名为 Sora 的生成式 AI 模型,能够将场景描述转化为原创视频,无需摄像机或拍摄团队的参与。然而,Sora 迄今为止受到了严格的限制,似乎主要面向着像好莱坞导演这样的资金雄厚的创意人士,而不是业余爱好者或小型营销人员。
在这个技术风起云涌的时刻,前 Snap 公司的生成 AI 部门负责人 Alex Mashrabov 察觉到了一个机会。于是,他推出了 Higgsfield AI 「https://higgsfield.ai/」,这是一个由人工智能驱动的视频创作和编辑平台,旨在为更具定制性、个性化的应用场景提供服务。
Higgsfield 的首个应用程序 Diffuse,采用了定制的文本到视频模型,可以从头开始生成视频,或者使用自拍照生成以该人物为主角的视频片段。
“我们的目标受众是各种类型的创作者”,Mashrabov 在接受 TechCrunch 采访时表示,“从想要与朋友一起创造有趣内容的普通用户,到想尝试新的内容格式的社交内容创作者,再到希望其品牌脱颖而出的社交媒体营销人员。”
Mashrabov 曾通过他的前创业公司 AI Factory 来到 Snap,Snap 在 2020 年以 1.66 亿美元的价格收购了该公司。在 Snap 的任职期间,Mashrabov 帮助打造了一些产品,如 Snapchat 的 AR 效果和滤镜,包括 Cameos,以及备受争议的 MyAI 聊天机器人。
Higgsfield 是 Mashrabov 与 AI 研究员 Yerzat Dulat 几个月前联合推出的产品,该产品提供了一组经过策划的预生成视频片段,一个用于上传参考媒体(即图像和视频)的工具,以及一个允许用户描述人物、动作和场景的提示编辑器。使用 Diffuse,用户可以直接将自己插入到由 AI 生成的场景中,或者让他们的数字化形象模仿其他视频中捕捉到的动作,比如舞蹈动作等。
“我们的模型支持高度逼真的动作和表情”,Mashrabov 表示,“我们正在为消费者打造‘世界模型’,这将使我们能够以极高的控制水平构建一流的视频生成和编辑。”
Higgsfield 并不是唯一一家与 OpenAI 正面竞争的生成式视频初创公司。Runway 是最早进入市场的公司之一,其工具不断完善。还有 Haiper,由两位 DeepMind 的前员工支持,获得了超过 1300 万美元的风险资金。
Mashrabov 认为,Diffuse 将因其面向移动端和社交导向的营销策略而脱颖而出。
“通过优先考虑 iOS 和 Android 应用程序,而不是桌面工作流程,我们使创作者能够随时随地创建引人注目的社交媒体内容”,Mashrabov 表示,“事实上,通过移动端的建设,我们能够从一开始就优先考虑易用性和消费者友好的功能。”
Higgsfield 还在节流运行。Mashrabov 表示,支撑该平台的生成模型是由一个由 16 人组成的团队在不到九个月的时间内开发的,并且是在一个包含 32 个 GPU 的集群上进行训练的(32 个 GPU 可能听起来很多,但考虑到 OpenAI 使用了数万个,实际上并不算多)。到目前为止,Higgsfield 只筹集了 800 万美元的资金,其中大部分是来自 Menlo Ventures 领投的最近一轮种子融资。
为了领先于竞争对手,Higgsfield 计划将种子资金投入到构建一款改进的视频编辑器中,该编辑器将允许用户修改视频中的角色和物体,并且训练更强大的视频生成模型,专门用于社交媒体的使用案例。事实上,Mashrabov 将社交媒体和社交媒体营销视为 Higgsfield 的主要盈利领域。
虽然 Diffuse 目前是免费使用的,但 Mashrabov 设想未来,营销人员可能会为高级功能或大量或大规模广告付费一定费用或订阅费用。
在同一波动态下,Higgsfield 也可能会使盗取创作者内容变得更加容易。例如,只需上传某人编舞的视频,就可以生成一个自己表演相同编舞的视频。