Shutterstock 正在通过一种新颖的“研究许可证”方法重塑 AI 公司获取训练数据的方式,首先与 AI 创意技术公司 Lightricks 合作。今天宣布的合作伙伴关系允许 Lightricks 使用 Shutterstock 广泛的高清和 4K 视频库来训练其开源视频生成模型 LTXV。新的许可模式解决了 AI 开发中的一个关键挑战:获取高质量训练数据的高成本。它使公司能够在承诺更昂贵的商业许可证之前,先以较小的研究许可证进行测试和实验。
为初创公司提供更易获得的道德 AI 开发
Shutterstock 的全球数据许可和 AI 负责人 Daniel Mandell 在接受 VentureBeat 独家采访时表示:“许多公司和模型训练师采取了未经授权的数据抓取路线,而不是进行必要的投资来达到开发商业可行模型所需的质量和信任水平。然而,我们认为财务投资不应该成为那些希望以道德方式进入这个领域的人的障碍。”这种两阶段方法可能会改变初创公司进行 AI 开发的方式。Lightricks 的全球公关经理 Craig Andrews 将其描述为“对于希望探索生成式 AI 创新应用而无需承担传统许可高昂前期成本的小型、更敏捷的开发人员来说,这是一个转折点。”
在 AI 时代的法律保护和公平补偿
这一时机意义重大,正值对 AI 训练数据实践的法律审查日益严格之际。几家主要的 AI 公司面临着关于涉嫌未经授权使用版权材料进行模型训练的诉讼。Shutterstock 的方法提供了一种合法的替代方案,同时确保内容创作者获得补偿。Andrews 解释说:“我们正在为道德 AI 开发设定标准,同时确保创作者因其工作获得公平补偿。这种方法不仅在创意生态系统中建立信任,而且还为负责任的 AI 创新建立了可持续的框架。”
收入分享:创作者和 AI 公司的双赢
Shutterstock 实施了收入分享模式,贡献者可获得数据许可交易收入的 20%。贡献者还可以选择不让其内容用于 AI 训练,尽管 Mandell 指出只有约 1%的人选择这样做。Lightricks 计划使用许可的视频数据来增强其上个月发布的开源视频生成模型 LTXV。该模型已经获得了显著的吸引力,根据 Andrews 的说法,“在 GitHub 和 Hugging Face 上有数千次下载”。一个值得注意的用例是实时视频生成,用于交互式电子商务。该合作伙伴关系旨在解决 AI 视频生成中的技术挑战,特别是在较长视频中的运动一致性。Andrews 说:“AI 视频生成中最大的技术障碍之一是在不牺牲质量的情况下,在较长的视频片段中实现一致的运动和结构。Shutterstock 的高质量视频库提供了一个广泛的数据集,帮助我们解决这个挑战。”对于 Shutterstock 来说,这种合作伙伴关系代表了其商业模式的战略转变。该公司已经与包括 Nvidia、Meta 和 OpenAI 在内的主要 AI 公司建立了合作伙伴关系。Mandell 强调,研究许可证模式可以使小型组织和研究机构更容易获得高质量的训练数据。
为道德 AI 开发设定新的行业标准
该合作还反映了 AI 开发中日益增长的透明度和道德考虑趋势。Lightricks 将 LTXV 开源以促进合作和创新,而 Shutterstock 的许可方法确保了内容创作者的适当补偿。Mandell 总结道:“这里的重要信息是,无论公司规模或资金如何,都不再有借口抓取未经许可的内容用于培训目的。有更好的方法进入这个不断发展的市场。”这种合作伙伴关系可能会为 AI 公司获取训练数据设定新的标准,随着对 AI 训练数据来源的担忧继续增加,可能会影响行业实践。这种模式的成功与否可能决定其他内容提供商是否会效仿 Shutterstock,为 AI 开发创建更灵活、更易于访问的许可选项。