|

财经

英伟达发布Nemotron系列大语言模型 欲推动代理式AI加速崛起

来源:21世纪经济报道

2025-01-07 12:53:05

(原标题:英伟达发布Nemotron系列大语言模型 欲推动代理式AI加速崛起)

21世纪经济报道记者白杨 北京报道

在今日召开的CES 2025大会上,英伟达创始人兼CEO黄仁勋发布了全新的 Llama Nemotron系列大语言模型。

黄仁勋表示,人工智能正在进入一个新时代——代理式人工智能(agentic AI),专业的AI代理可以帮助人们解决复杂问题并自动执行重复性任务。

他进一步表示,借助定制的 AI 代理,各行各业的企业都可以实现前所未有的生产力。然而,这些先进的 AI 代理需要一套针对代理 AI 功能和能力进行优化的多个生成式 AI 模型系统。这种复杂性意味着对强大、高效的企业级模型的需求从未如此强烈。

英伟达此次推出的Llama Nemotron模型,有Nano、Super和Ultra三个不同版本。其中,Nano是最具成本效益、低延迟的模型,适合在PC和边缘设备上部署。

Super是一种高精度模型,在平衡计算效率的同时具有更高的准确性;而Ultra是最高精度模型,专为要求最高性能的数据中心规模应用而设计。

黄仁勋称,这些模型基于Llama 构建,可帮助开发人员在一系列应用程序中创建和部署AI代理,包括客户支持、欺诈检测以及产品供应链和库存管理优化。

在性能上,Llama Nemotron模型经过精简和训练,采用了英伟达的最新技术和高质量数据集。它们在指令跟踪、聊天、函数调用、编码和数学方面表现出色,同时进行了大小优化,可在英伟达广泛的加速计算资源上运行。

据黄仁勋介绍,Llama Nemotron模型系列将以可下载模型和NVIDIA NIM微服务的形式提供,可轻松部署在云端、数据中心、PC 和工作站上。

企业还可以使用 NVIDIA NeMo 微服务针对其特定用例和领域定制模型,以简化数据管理、加速模型定制和评估。同时,借助NVIDIA NeMo Retriever,开发人员可以集成检索增强生成功能,将模型连接到他们的企业数据。

证券之星资讯

2025-01-07

首页 股票 财经 基金 导航