苹果研究人员推出“Keyframer”：利用LLMs实现静态图像动画化

概要：苹果研究人员推出了一款名为“Keyframer”的新AI工具，利用大型语言模型（LLMs）通过自然语言提示来为静态图像添加动画效果。这一创新应用代表着人工智能与创意过程整合的巨大飞跃，也预示着苹果产品新一代，如iPad Pro和Vision Pro可能的发展方向。该工具通过用户反馈提升动画设计过程，为非专业人士提供了将故事通过动画呈现的能力，并展示了人工智能作为创意过程中合作力量的潜力。

在苹果公司的最新研究中，一项名为“Keyframer”的新AI工具被揭晓，它利用大型语言模型（LLMs）通过自然语言提示来为静态图像添加动画效果。

这一创新应用的详细内容发布在arxiv.org上的一篇新研究论文中，它代表了人工智能与创意过程整合的巨大飞跃，也可能预示着苹果产品新一代，如iPad Pro和Vision Pro的发展方向。

这篇题为“Keyframer：利用大型语言模型进行动画设计”的研究论文，探索了将LLMs应用于动画行业的未知领域，提出了诸如如何有效描述自然语言中的运动等独特挑战。

想象一下：你是一名有着想法要探索的动画师。你手头有静态图像和一个想要讲述的故事，但是想到要花费数小时俯身在iPad上将生命注入你的创作中，这实在是令人筋疲力尽。这时“Keyframer”登场了。只需几句话，这些图像就可以在屏幕上跳动起来，仿佛它们读懂了你的心意。或者更确切地说，仿佛是苹果的大型语言模型（LLMs）读懂了。

“Keyframer”是由一个大型语言模型驱动的（在研究中，他们使用了GPT-4），它可以从静态SVG图像和提示生成CSS动画代码。研究人员解释说：“大型语言模型有潜力影响广泛的创意领域，但将LLMs应用于动画尚未被充分探索，并提出了诸如用户如何有效地描述自然语言中的运动等新领域挑战。”

为了创建动画，用户只需上传一个SVG图像，输入文本提示，如“使云朵慢慢向左飘移”，然后“Keyframer”将生成使动画发生的代码。用户可以通过直接编辑CSS代码或添加新的自然语言提示来细化动画。

根据论文，“Keyframer通过提示和直接编辑生成的输出的组合来支持动画的探索和细化。”这种以用户为中心的方法是通过与多位专业动画设计师和工程师的几次访谈得出的，他们提供了对研究工具的反馈，其中强调了迭代设计和创造力。

“我认为这比我做过的许多事情要快得多……我认为以前做这样的事情只需要几个小时就能完成，”论文中一位被采访的研究参与者说道。

研究人员发现，大多数用户采取了迭代的“分解”方法来提示设计，逐个添加新的提示来逐步使各个元素动起来。这使他们能够根据AI的输出逐渐调整他们的目标。

“Keyframer使用户能够通过顺序提示逐步完善其设计，而不是不得不一次考虑他们的整个设计，”研究人员在论文中解释道。直接代码编辑功能也使创意控制更加精细。

虽然AI动画工具有潜力使设计民主化，但研究人员承认了围绕失去创意控制和满意度的担忧。但通过结合提示和编辑，Keyframer旨在提供易于使用的原型设计工具，同时保持用户代理权。

“通过这项工作，我们希望激发未来结合了LLMs强大生成能力来加速设计原型制作的动画设计工具，以及结合了动态编辑器的动画设计工具，从而使创作者能够保持创意控制，”研究人员总结道。

“Keyframer”在创意行业中的广泛影响

“Keyframer”承诺改变动画行业的格局，使其更加容易接近广泛的创作者。Keyframer向非专业人士提供了通过动画将故事呈现出来的能力，这一任务曾经需要相当的技术技能和资源。这标志着AI在创意过程中作为合作力量的角色增长，并暗示了技术在各个领域如何被应用的转变。

Keyframer的影响不仅仅局限于技术

上的进步，更是对文化变革的预期，其中人工智能成为人类创意体验中更直观和重要的一部分。这不仅仅是技术上的一次飞跃，更是对我们与数字世界互动方式重新想象的潜在催化剂。苹果推出Keyframer可能预示着一个新时代的来临，其中创作者与创造物之间的边界变得日益模糊，受到人工智能无形之手的引导。