$("body").append("")

未来的 AI 将是多模型的,而非单一模型统治

44次阅读
没有评论

未来的 AI 将是多模型的,而非单一模型统治
每周甚至每天,世界上都会诞生一个新的先进 AI 模型。到 2025 年,新模型发布的速度令人眼花缭乱,甚至让人疲惫不堪。过山车的曲线继续呈指数级增长,疲劳和惊奇成为我们不变的伙伴。每次发布都强调为什么这个特定的模型比其他所有模型都好,随着我们努力跟上,无数的基准和条形图充斥着我们的信息源。

自 2020 年以来,每年发布的大型基础模型数量呈爆炸式增长[Charlie Giattino, Edouard Mathieu, Veronika Samborska 和 Max Roser (2023) – “Artificial Intelligence” Published online at OurWorldinData.org.]。

18 个月前,绝大多数开发者和企业都在使用单一的 AI 模型。而今天,情况正好相反。很少有大规模的企业将自己局限于单一模型的能力。公司担心供应商锁定,特别是对于一项迅速成为长期企业战略和短期底线收入核心部分的技术。对于团队来说,把所有的赌注都押在一个单一的大型语言模型(LLM)上越来越危险。

尽管如此分散,但许多模型提供商仍然支持 AI 将是一个赢家通吃的市场的观点。他们声称,训练一流模型所需的专业知识和计算能力是稀缺的、可防御的和自我强化的。从他们的角度来看,构建 AI 模型的炒作泡沫最终将破裂,留下一个单一的、巨大的通用人工智能(AGI)模型,用于任何事情。独家拥有这样一个模型将意味着成为世界上最强大的公司。这个奖项的规模引发了一场 GPU 的军备竞赛,每隔几个月,训练参数的数量就会增加一个新的零。

我们认为这种观点是错误的。未来的 AI 不会是单一模型统治宇宙,无论是明年还是未来十年。相反,AI 的未来将是多模型的。

语言模型是模糊的商品

《牛津经济学词典》将商品定义为“大规模买卖的标准化商品,其单位可以互换”。语言模型在两个重要方面是商品:

- 模型本身在更广泛的任务集上变得更可互换;

- 生产这些模型所需的研究专业知识变得更加分布和可访问,前沿实验室几乎没有超过彼此,开源社区的独立研究人员紧随其后。

但尽管语言模型正在商品化,但它们的商品化并不均匀。对于任何模型,从 GPT-4 一直到 Mistral Small,都有一个很大的核心能力,非常适合处理。同时,当我们走向边缘和极端情况时,我们看到了越来越大的差异,一些模型提供商明确专注于代码生成、推理、检索增强生成(RAG)或数学。这导致了无休止的苦恼、reddit 搜索、评估和微调,以找到适合每个工作的正确模型。

AI 模型在核心能力上商品化,在边缘上专业化。Credit: Not Diamond

因此,虽然语言模型是商品,但更准确地说,它们是模糊的商品。对于许多用例,AI 模型将几乎可以互换,价格和延迟等指标将决定使用哪个模型。但在能力的边缘,情况将相反:模型将继续专业化,变得越来越不同。例如,Deepseek-V2.5 在 C#编码方面比 GPT-4o 更强,尽管它的大小只有一小部分,而且便宜 50 倍。

这两种动态——商品化和专业化——都推翻了单一模型最适合处理每个可能用例的论点。相反,它们指向了一个逐渐分散的 AI 格局。

多模态编排和路由

语言模型的市场动态有一个恰当的类比:人类大脑。我们大脑的结构在 10 万年里没有改变,大脑的相似之处远远多于不同之处。在我们地球上的大部分时间里,大多数人学习相同的东西,具有相似的能力。

但后来发生了变化。我们发展了用语言交流的能力——首先是口语,然后是书面语。通信协议促进了网络,随着人类开始相互联网,我们也开始越来越专业化。我们摆脱了需要在所有领域都是通才、成为自给自足的岛屿的负担。矛盾的是,专业化的集体财富也意味着今天的普通人比我们的任何祖先都是更强的通才。

在足够宽的输入空间上,宇宙总是倾向于专业化。这在从分子化学到生物学,再到人类社会的所有方面都是如此。如果有足够的多样性,分布式系统总是比单体系统更具计算效率。我们相信 AI 也是如此。我们越能利用多个模型的优势,而不是仅仅依赖一个模型,这些模型就越能专业化,扩大能力的前沿。

多模型系统可以实现更大的专业化、能力和效率。Source: Not Diamond

利用不同模型优势的一个越来越重要的模式是路由——动态地将查询发送到最适合的模型,同时在不降低质量的情况下利用更便宜、更快的模型。路由使我们能够利用专业化的所有好处——更高的准确性、更低的成本和延迟——而不放弃任何通用性的稳健性。

路由的强大功能可以在一个简单的演示中看到:世界上大多数顶级模型本身就是路由器:它们是使用混合专家架构构建的,该架构将每个下一个令牌生成路由到几十个专家子模型。如果 LLM 确实呈指数级增长为模糊商品,那么路由必须成为每个 AI 堆栈的重要组成部分。

有一种观点认为,LLM 将在达到人类智能时达到平台期——当我们完全饱和能力时,我们将围绕一个单一的通用模型凝聚,就像我们围绕 AWS 或 iPhone 凝聚一样。这些平台(或其竞争对手)在过去几年中都没有将其能力提高 10 倍——所以我们不妨在他们的生态系统中感到舒适。然而,我们相信 AI 不会停留在人类水平的智能上;它将远远超过我们甚至可能想象的任何限制。当它这样做时,它将变得越来越分散和专业化,就像任何其他自然系统一样。

我们怎么强调 AI 模型碎片化是一件非常好的事情都不为过。碎片化的市场是高效的市场:它们赋予买家权力,最大限度地提高创新,最小化成本。并且,在我们可以利用较小的、更专业的模型网络而不是将所有内容都通过单个巨型模型的内部发送的程度上,我们朝着更安全、更可解释和更可操纵的 AI 未来迈进。

最伟大的发明没有所有者。本·富兰克林的继承人不拥有电力。图灵的遗产不拥有所有的计算机。AI 无疑是人类最伟大的发明之一;我们相信它的未来将是——也应该是——多模型的。

Zack Kass 是 OpenAI 的前市场负责人。

Tomás Hernando Kofman 是 Not Diamond 的联合创始人兼首席执行官。

正文完