稳定AI发布更快更强大的图像生成模型Stable Cascade

561次阅读

概要：Stable Cascade的问世标志着AI图像生成领域的新里程碑。这一更快、更强大的模型为研究人员和开发者提供了更多的选择，并将进一步推动AI技术的发展。然而，随之而来的法律诉讼和道德考量也凸显了AI发展中的一些挑战。

随着稳定AI发布其最新的图像生成模型Stable Cascade，人工智能领域再次迎来了一次重要的技术进步。该模型不仅声称更为强大，而且速度更快，这意味着它将成为许多已经使用Stable Diffusion作为基础的文本到图像AI模型的首选。

Stable Cascade拥有一系列新特性，例如能够修改已经创建的图像或尝试增加现有图像的分辨率。它还提供了补洞和补边功能，这些功能在几个竞争对手的AI图像生成器中也有所体现。这使得模型能够填补图像中的特定部分，这在Adobe Photoshop中被称为生成填充。它还可以通过使用名为Canny Edge的功能仅利用现有图片的轮廓来创建新照片。

作为开源模型，Stable Cascade可供研究人员在GitHub上使用，但不得用于商业用途。这一新模型的问世为AI图像生成领域带来了更多的选择，而谷歌和苹果也在发布他们自己的图像生成模型。

与Stable Diffusion只在单一语言模型上运行不同，Stable Cascade使用了三个不同的基于Würstchen架构的大型语言模型。在幕后，该过程从C阶段开始，将文本提示压缩为潜在的、紧凑的代码片段。这些代码片段随后被转发到A和B阶段，这两个阶段共同工作来解码和满足请求。

将请求分解为较小的组件不仅可以减少内存需求（以及对稀缺GPU的大量培训时间），而且可以增强系统的效率，在提示准确度和视觉吸引力方面取得卓越的结果。这将图像生成的时间显著减少到仅需10秒。相比之下，当前的SDXL模型大约需要22秒才能创建一幅图像。
稳定AI发布更快更强大的图像生成模型Stable Cascade

稳定扩散技术是由稳定AI开创的，但它也面临着一些挑战，包括在英国被Getty Images起诉，指控其未经许可在受版权保护的数据上训练其AI模型。一些人还指出，用于稳定扩散的训练数据中包含数千张儿童虐待图片。

稳定AI发布更快更强大的图像生成模型Stable Cascade

尽管稳定Cascade的推出标志着AI图像生成领域的进一步发展，但随之而来的法律纠纷和道德考量提醒我们，在AI技术快速发展的同时，我们也需要思考和解决相关的伦理和法律问题。

正文完