$("body").append("")

Snap创新:文本转语音赋予情感

808次阅读
没有评论

Snap创新:文本转语音赋予情感

Snap创新:文本转语音赋予情感
摘要: Snap寻求对“基于情感的文本转语音”系统进行专利,该系统使用人工智能从文本中提取情感,并将这些输入用于改善文本转语音系统的输出。这一系统通过机器学习计算文本中的情感水平,然后将这些情感数据用于混合和组合不同情感,从而生成更真实的语音输出。然而,要通过文本表达情感并从头开始创造类似人类的语音仍然面临许多困难。虽然每个人表达情感的方式不同,并且文化差异也存在,但这一创新有望在广告领域为Snap提供更深入的用户理解,进而改善其业绩。

突破情感难题: Snap近日寻求通过AI技术为文本转语音增添一些情感元素。目前,文本转语音技术已不再新颖,但要通过这些技术传达情感并从头创造类似人类的语音却仍具有挑战性。Snap的系统使用机器学习计算文本中的情感水平,然后根据这些情感数据决定如何混合和组合不同情感以生成适当的语音输出。例如,如果机器学习模型判断句子中的某些单词是中性的,而另一些单词是愉快的,那么它会在中性和愉快之间找到平衡点。

文本转情感语音的挑战: 尽管情感理解对于AI来说是一个极具挑战性的障碍,但Snap试图通过将文本逐字逐句分解,从中提取情感,并将其转化为配音,从而解决这个问题。然而,存在一些障碍。首先,每个人表达情感的方式都不同,很多人都难以在文本中准确地传达情感。另一个障碍是不同文化之间的沟通差异。AI难以准确地理解全球沟通中微小的差异,这几乎可以称为“科幻”,因为每个文化背景都有其独特性。

用户参与的方向: 为了解决这些障碍,Snap的专利中指出,系统可以从用户那里获得一些指导。在某些情况下,用户可以选择希望在他们的文本转语音中表达的情感,而不是由社交不擅长的机器学习模型来决定。此外,情感的理解不仅仅在文本转语音领域有用,无论是从文本还是音频中理解情感都可以成为广告领域中的一个有利指标。

潜在商机: 在广告领域,理解用户情感可以成为一个有利的指标。对于Snap来说,这项技术有望帮助其更好地理解用户,从而改善其业绩。考虑到Snap上季度的营收进一步下降,任何可以帮助其更好地理解用户的技术都有可能对公司有所益处。

结论: Snap的“基于情感的文本转语音”系统在解决AI难以理解情感的难题上取得了创新性突破。尽管存在许多挑战,如文化差异和个体表达方式的多样性,但这一技术为文本转语音赋予了更多情感元素,有望在广告领域为Snap带来商机,同时也为AI技术的发展开辟了新的方向。这篇文章来自ChatGPT3.5。
Snap创新:文本转语音赋予情感

https://www.thedailyupside.com/snaps-patent-makes-text-to-speech-emotional/?utm_campaign=Artificial%2BIntelligence%2BWeekly&utm_medium=web&utm_source=Artificial_Intelligence_Weekly_347

正文完