Nvidia 推动代理 AI 发展，发布新服务和模型

Nvidia 推动代理 AI 发展，发布新服务和模型

Nvidia 继续推动代理 AI 的发展，宣布了几项新的服务和模型，以促进 AI 代理的创建和部署。

Nvidia 推出 Nemotron 模型家族

今天，Nvidia 推出了 Nemotron，这是一个基于 Meta 的 Llama 并使用该公司的技术和数据集进行训练的模型家族。该公司还宣布了新的 AI 编排蓝图，以指导 AI 代理。这些最新发布使 Nvidia，一家以推动生成 AI 革命的硬件而闻名的公司，站在了代理 AI 发展的前沿。

Nemotron 有三种尺寸：Nano、Super 和 Ultra。它也有两种类型：用于语言任务的 Llama Nemotron 和用于物理 AI 项目的 Cosmos Nemotron 视觉模型。Llama Nemotron Nano 有 4B 参数，Super 有 49B 参数，Ultra 有 253B 参数。

据该公司称，这三种模型都最适合代理任务，包括“指令跟随、聊天、函数调用、编码和数学”。

Nvidia 的 Omniverse 和模拟技术副总裁 Rev Lebaredian 在与记者的简报中表示，这三种尺寸针对不同的 Nvidia 计算资源进行了优化。Nano 适用于 PC 和边缘设备上的成本效益高的低延迟应用，Super 适用于单个 GPU 上的高精度和高吞吐量，Ultra 适用于数据中心规模的最高精度。

“AI 代理是将为我们工作并与我们合作的数字劳动力，因此 Nemotron 模型家族是为代理 AI 而设计的，”Lebaredian 说。

Nemotron 模型可作为托管 API 在 Hugging Face 和 Nvidia 的网站上使用。Nvidia 表示，企业可以通过其 AI Enterprise 软件平台访问这些模型。

Nvidia 对基础模型并不陌生

去年，Nvidia 悄悄发布了一个版本的 Nemotron，Llama-3.1-Nemotron-70B-Instruct，其性能优于 OpenAI 和 Anthropic 的类似模型。它还推出了 NVLM 1.0，这是一个多模态语言模型家族。

对代理的更多支持

随着企业开始探索如何在其工作流程中部署代理系统，AI 代理在 2024 年成为一个大趋势。许多人认为，这一势头将在今年继续。

Salesforce、ServiceNow、AWS 和 Microsoft 等公司都将代理称为企业中下一代生成 AI 的浪潮。AWS 在 Bedrock 中添加了多代理编排，而 Salesforce 发布了其 Agentforce 2.0，为其客户带来了更多代理。

然而，代理工作流程仍然需要其他基础设施才能高效工作。其中一个基础设施围绕着编排，或管理跨越不同系统的多个代理。

编排蓝图

Nvidia 还通过其指导代理完成特定任务的蓝图进入了新兴的 AI 编排领域。

该公司与几家编排公司合作，包括 LangChain、LlamaIndex、CrewAI、Daily 和 Weights and Biases，在 Nvidia AI Enterprise 上构建蓝图。每个编排框架都与 Nvidia 合作开发了自己的蓝图。例如，CrewAI 创建了一个代码文档蓝图，以确保代码库易于导航。LangChain 在其结构化报告生成蓝图中添加了 Nvidia NIM 微服务，以帮助代理以不同格式返回互联网搜索结果。

“使多个代理顺利协同工作或编排是部署代理 AI 的关键，”Lebaredian 说。“这些领先的 AI 编排公司正在将每个 Nvidia 代理构建块、NIM、Nemo 和蓝图与他们的开源代理编排平台集成。”

Nvidia 的新 PDF 到播客蓝图旨在与 Google 的 NotebookLM 竞争，将 PDF 中的信息转换为音频。另一个新蓝图将帮助构建代理来搜索和总结视频。

Lebaredian 说，蓝图旨在帮助开发人员快速部署 AI 代理。为此，Nvidia 推出了 Nvidia Launchables，这是一个让开发人员一键测试、原型和运行蓝图的平台。

随着企业努力应对多代理生产，编排可能成为 2025 年更大的故事之一。