$("body").append("")

ElevenLabs获得8000万美元融资,成为“独角兽”;AI语音合成引发行业变革

396次阅读
没有评论

ElevenLabs获得8000万美元融资,成为“独角兽”;AI语音合成引发行业变革

随着语音克隆技术的崛起,创业公司ElevenLabs宣布完成8000万美元B轮融资,成为“独角兽”。这家公司的语音合成工具由人工智能驱动,已引起了多位知名投资者的兴趣,包括Andreessen Horowitz、前GitHub首席执行官Nat Friedman和企业家Daniel Gross。

这轮融资由Sequoia Capital、Smash Capital、SV Angel、BroadLight Capital和Credo Ventures等公司共同领投,将ElevenLabs的总融资额提高到1.01亿美元,估值超过10亿美元(较去年6月的1亿美元有了显著增长)。ElevenLabs首席执行官Mati Staniszewski表示,新资金将用于产品开发、扩大公司基础设施和团队规模、进行人工智能研究以及“增强安全措施,确保AI技术的负责任和道德发展”。

ElevenLabs成立于2022年,由前谷歌机器学习工程师Piotr Dabkowski和前Palantir战略部署专家Mati Staniszewski共同创办。该公司大约一年前推出了公测版。Staniszewski表示,他和在波兰长大的Dabkowski之所以创建语音克隆工具,是因为他们受到了翻译不佳的美国电影的启发。他们认为,人工智能可以做得更好。

ElevenLabs获得8000万美元融资,成为“独角兽”;AI语音合成引发行业变革

如今,ElevenLabs以其基于浏览器的语音生成应用而闻名,该应用可以通过可调整的开关生成具有语调、情感、节奏等关键语音特征的逼真声音。免费用户可以输入文本,然后听到由多种默认语音之一朗读的录音。付费用户可以上传语音样本,使用ElevenLabs的语音克隆工具创作新样式。

ElevenLabs越来越多地投资于其语音生成技术的版本,旨在创建有声读物、为电影和电视节目配音,以及为游戏和市场活动生成角色语音。

去年,该公司推出了一款“语音对话”工具,试图在自动消除背景噪音的同时保留说话者的声音、韵律和语调,以及在电影和电视节目中翻译和同步语音与源材料。未来几周的计划中,ElevenLabs将推出一个新的配音工作室工作流程,提供生成和编辑文稿和翻译的工具,以及一个订阅式移动应用程序,使用ElevenLabs的语音朗读网页和文本。

尽管ElevenLabs的创新赢得了Paradox Interactive等公司的青睐,但公司也面临一些负面的关注。

曾被以充满阴谋论内容而闻名的论坛4chan使用ElevenLabs的工具分享了模仿名人(如女演员Emma Watson)的令人讨厌的消息。一位记者成功使用ElevenLabs恶意克隆声音,生成包含威胁暴力、种族主义和恐同言论的样本。在Vox,记者Joseph Cox记录了生成一个克隆声音足以愚弄银行身份验证系统的过程。

作为回应,ElevenLabs试图清除反复违反其禁止滥用的服务条款的用户,并推出了一个工具,用于检测由其平台创建的语音。Staniszewski表示,今年ElevenLabs计划改进检测工具,以标记其他语音生成AI模型的音频,并与未透露的“分发平台”合作,在第三方平台上提供该工具。

此外,ElevenLabs还面临声优的批评,声称该公司未经他们的同意使用他们的声音样本,这些样本可能被用来宣传他们不支持的内容,传播错误和虚假信息。在一篇Vice的文章中,受害者叙述了ElevenLabs如何在针对他们的骚扰活动中被用来分享演员的私人信息,比如家庭地址,使用克隆声音。

然后有个不可忽视的问题:ElevenLabs等平台对声优行业构成的存在威胁。

Motherboard撰文称,声优越来越被要求放弃他们的声音权利,以便客户可以使用人工智能生成合成版本,而这些版本最终可能取代他们——有时甚至没有相应的补偿。担心的是,声优工作——尤其是便宜的、初级水平的工作——最终将被AI生成的声音取代,而声优将无可奈何。

一些平台正试图取得平衡。本月早些时候,ElevenLabs的竞争对手Replica Studios与SAG-AFTRA签署了一项协议,创建和许可媒体艺术家工会成员的数字复制品。在一份新闻稿中,两个组织表示,该安排建立了“公平”和“道德”的条款和条件,以确保表演者的同意,并就在新作品中使用数字语音替身的条款进行谈判。

然而,即便如此,这也没有让一些声优满意——其中包括SAG-AFTRA的会员。

ElevenLabs的解决方案是创建一个声音市场。目前处于α测试阶段,计划在未来几周更广泛地推出,该市场允许用户创建、验证和分享声音。当他人使用某个声音时,原始创作者将获得补偿,Staniszewski表示。

他补充说:“用户始终对其声音的可用性和补偿条件保持控制。该市场旨在是AI进步与已建立的行业实践相协调的一步,同时为ElevenLabs的平台带来多样化的声音。”

然而,声优可能对ElevenLabs目前并未以现金形式支付创作者的方式产生异议。目前的设置是创作者获得ElevenLabs高级服务的积分(有些人可能会觉得讽刺)。

或许在未来,ElevenLabs将试图在合成语音领域的激烈竞争中击败Papercup、Deepdub、Acapela、Respeecher和Voice.ai等初创公司,以及亚马逊、微软和谷歌等大型科技公司。无论如何,作为目前资金最充裕的合成语音初创公司之一,ElevenLabs计划在这个迅速增长的市场中留下并制造一些波澜。

正文完