$("body").append("")

Nvidia 推动代理 AI 发展,发布新服务和模型

11次阅读
没有评论

Nvidia 推动代理 AI 发展,发布新服务和模型
Nvidia 推动代理 AI 发展,发布新服务和模型

Nvidia 继续推动代理 AI 的发展,宣布了几项新的服务和模型,以促进 AI 代理的创建和部署。

Nvidia 推出 Nemotron 模型家族

今天,Nvidia 推出了 Nemotron,这是一个基于 Meta 的 Llama 并使用该公司的技术和数据集进行训练的模型家族。该公司还宣布了新的 AI 编排蓝图,以指导 AI 代理。这些最新发布使 Nvidia,一家以推动生成 AI 革命的硬件而闻名的公司,站在了代理 AI 发展的前沿。

Nemotron 有三种尺寸:Nano、Super 和 Ultra。它也有两种类型:用于语言任务的 Llama Nemotron 和用于物理 AI 项目的 Cosmos Nemotron 视觉模型。Llama Nemotron Nano 有 4B 参数,Super 有 49B 参数,Ultra 有 253B 参数。

据该公司称,这三种模型都最适合代理任务,包括“指令跟随、聊天、函数调用、编码和数学”。

Nvidia 的 Omniverse 和模拟技术副总裁 Rev Lebaredian 在与记者的简报中表示,这三种尺寸针对不同的 Nvidia 计算资源进行了优化。Nano 适用于 PC 和边缘设备上的成本效益高的低延迟应用,Super 适用于单个 GPU 上的高精度和高吞吐量,Ultra 适用于数据中心规模的最高精度。

“AI 代理是将为我们工作并与我们合作的数字劳动力,因此 Nemotron 模型家族是为代理 AI 而设计的,”Lebaredian 说。

Nemotron 模型可作为托管 API 在 Hugging Face 和 Nvidia 的网站上使用。Nvidia 表示,企业可以通过其 AI Enterprise 软件平台访问这些模型。

Nvidia 对基础模型并不陌生

去年,Nvidia 悄悄发布了一个版本的 Nemotron,Llama-3.1-Nemotron-70B-Instruct,其性能优于 OpenAI 和 Anthropic 的类似模型。它还推出了 NVLM 1.0,这是一个多模态语言模型家族。

对代理的更多支持

随着企业开始探索如何在其工作流程中部署代理系统,AI 代理在 2024 年成为一个大趋势。许多人认为,这一势头将在今年继续。

Salesforce、ServiceNow、AWS 和 Microsoft 等公司都将代理称为企业中下一代生成 AI 的浪潮。AWS 在 Bedrock 中添加了多代理编排,而 Salesforce 发布了其 Agentforce 2.0,为其客户带来了更多代理。

然而,代理工作流程仍然需要其他基础设施才能高效工作。其中一个基础设施围绕着编排,或管理跨越不同系统的多个代理。

编排蓝图

Nvidia 还通过其指导代理完成特定任务的蓝图进入了新兴的 AI 编排领域。

该公司与几家编排公司合作,包括 LangChain、LlamaIndex、CrewAI、Daily 和 Weights and Biases,在 Nvidia AI Enterprise 上构建蓝图。每个编排框架都与 Nvidia 合作开发了自己的蓝图。例如,CrewAI 创建了一个代码文档蓝图,以确保代码库易于导航。LangChain 在其结构化报告生成蓝图中添加了 Nvidia NIM 微服务,以帮助代理以不同格式返回互联网搜索结果。

“使多个代理顺利协同工作或编排是部署代理 AI 的关键,”Lebaredian 说。“这些领先的 AI 编排公司正在将每个 Nvidia 代理构建块、NIM、Nemo 和蓝图与他们的开源代理编排平台集成。”

Nvidia 的新 PDF 到播客蓝图旨在与 Google 的 NotebookLM 竞争,将 PDF 中的信息转换为音频。另一个新蓝图将帮助构建代理来搜索和总结视频。

Lebaredian 说,蓝图旨在帮助开发人员快速部署 AI 代理。为此,Nvidia 推出了 Nvidia Launchables,这是一个让开发人员一键测试、原型和运行蓝图的平台。

随着企业努力应对多代理生产,编排可能成为 2025 年更大的故事之一。

正文完