$("body").append("")

稳定AI发布更快更强大的图像生成模型Stable Cascade

377次阅读
没有评论

概要:Stable Cascade的问世标志着AI图像生成领域的新里程碑。这一更快、更强大的模型为研究人员和开发者提供了更多的选择,并将进一步推动AI技术的发展。然而,随之而来的法律诉讼和道德考量也凸显了AI发展中的一些挑战。


稳定AI发布更快更强大的图像生成模型Stable Cascade

随着稳定AI发布其最新的图像生成模型Stable Cascade,人工智能领域再次迎来了一次重要的技术进步。该模型不仅声称更为强大,而且速度更快,这意味着它将成为许多已经使用Stable Diffusion作为基础的文本到图像AI模型的首选。

Stable Cascade拥有一系列新特性,例如能够修改已经创建的图像或尝试增加现有图像的分辨率。它还提供了补洞和补边功能,这些功能在几个竞争对手的AI图像生成器中也有所体现。这使得模型能够填补图像中的特定部分,这在Adobe Photoshop中被称为生成填充。它还可以通过使用名为Canny Edge的功能仅利用现有图片的轮廓来创建新照片。

作为开源模型,Stable Cascade可供研究人员在GitHub上使用,但不得用于商业用途。这一新模型的问世为AI图像生成领域带来了更多的选择,而谷歌和苹果也在发布他们自己的图像生成模型。

与Stable Diffusion只在单一语言模型上运行不同,Stable Cascade使用了三个不同的基于Würstchen架构的大型语言模型。在幕后,该过程从C阶段开始,将文本提示压缩为潜在的、紧凑的代码片段。这些代码片段随后被转发到A和B阶段,这两个阶段共同工作来解码和满足请求。

将请求分解为较小的组件不仅可以减少内存需求(以及对稀缺GPU的大量培训时间),而且可以增强系统的效率,在提示准确度和视觉吸引力方面取得卓越的结果。这将图像生成的时间显著减少到仅需10秒。相比之下,当前的SDXL模型大约需要22秒才能创建一幅图像。
稳定AI发布更快更强大的图像生成模型Stable Cascade

稳定扩散技术是由稳定AI开创的,但它也面临着一些挑战,包括在英国被Getty Images起诉,指控其未经许可在受版权保护的数据上训练其AI模型。一些人还指出,用于稳定扩散的训练数据中包含数千张儿童虐待图片。

稳定AI发布更快更强大的图像生成模型Stable Cascade

尽管稳定Cascade的推出标志着AI图像生成领域的进一步发展,但随之而来的法律纠纷和道德考量提醒我们,在AI技术快速发展的同时,我们也需要思考和解决相关的伦理和法律问题。

正文完