向更快的AI进发,英伟达到哪一步了?


来源: 互联网

“加速计算与生成式AI两大变革相交汇,计算机行业正面临转折点。”处于

“加速计算与生成式AI两大变革相交汇,计算机行业正面临转折点。”处于加速计算与AI的交汇点,黄仁勋指出,“英伟达采用全栈的方法,在改进硬件的同时也改进软件,将硬件和软件设计结合在一起才能真正使堆栈工作,才能使AI运行得更快。”


(相关资料图)

北京时间8月8日晚,英伟达创始人兼首席执行官黄仁勋在SIGGRAPH发表了一年一度的主题演讲。SIGGRAPH是由ACM SIGGRAPH(计算机协会计算机图形图像特别兴趣小组)举办的计算机图形学的年度顶级会议,黄仁勋曾在此舞台上宣布了一代又一代图像技术的升级,对于英伟达自身和整个计算机图形领域来说,SIGGRAPH都是意义非凡的盛会。

今年的演讲中,黄仁勋介绍了英伟达的最新技术突破:超级芯片GH200 Grace Hopper再次升级,用了最新的存储技术HBM3e;软件方面,英伟达则推出了OpenUSD、云上API等重磅技术,在与Adobe、苹果、Pixar、Autodesk等公司的紧密合作中不断推动人工智能和生成式AI走向下一个浪潮尖峰。

英伟达再一次向业界证明,他们在AI的布局绝不仅限于硬件,而是软硬件结合的全栈式布局,只有这样才能推动业界向更快的AI进发。

新一代GH200——全球首款搭载HBM3e的处理器

5月,英伟达在Computex最新发布了GH200系统,这是一款用于数据中心、被认为是当今全球性能最强的处理器产品,它可以训练AIGC超大规模大模型,利用英伟达的NVLink连接技术,实现了256块Grace CPU和H100 GPU的无缝连接。

SIGGRAPH演讲中,黄仁勋宣布GH200 Grace Hopper在2个月内已经完成了初次升级,存储技术升级至HBM3e。该平台采用双配置——提供的内存容量和带宽比当前产品分别增加了 3.5 倍和 3 倍——包括一个拥有 144 个 Arm Neoverse 内核、8 petaflops的AI性能和 282GB HBM3e 内存技术的单个服务器。

黄仁勋表示:“为了满足生成式AI不断激增的需求,数据中心需要能够满足特定需求的加速计算平台。全新GH200 Grace Hopper超级芯片平台以出色的内存技术和带宽,提高了吞吐量,在不影响性能的情况下可连接多GPU以整合性能,并且具有可以轻松部署到整个数据中心的服务器设计。”

为了推动该技术的广泛应用,采用HBM3e的新一代Grace Hopper超级芯片平台与COMPUTEX上发布的NVIDIA MGX服务器规格完全兼容。借助MGX,任何系统制造商都可以快速、经济地将Grace Hopper添加到100多款服务器机型中。

据介绍,HBM3e版本的GH200预计会在2024年二季度交付。HBM世代差异主要以速度区分,其中传输速度8Gbps的HBM3e是当前最快的一代新技术,比上一代HBM3提升50%。

放眼未来,生成式AI正呈现出无比广阔的前景,而GH200 Grace Hopper将带来更多的可能性,为处理大语言模型、推荐系统、矢量数据库等复杂的生成式 AI 工作负载,提供多种配置选择。

Omniverse 重大升级——支持生成式AI与OpenUSD

英伟达近几年大力推动的Omniverse平台也发布了重要更新,通过OpenUSD框架和生成式AI来优化并强化其3D工作流程。

作为OpenUSD原生软件平台,Omniverse可进行跨3D工具和应用的连接、描述及模拟,此次平台更新主要升级了Omniverse Kit(用于开发原生OpenUSD应用和扩展程序的引擎),以及NVIDIA Omniverse Audio2Face基础应用和空间计算功能,将加快虚拟世界和高级工作流的创建速度,推动工业数字化进程。

这些平台更新在Omniverse基础应用中得到了展现,Omniverse基础应用是完全可定制的参考应用,创作者、企业和开发者可以对其进行复制、扩展或改进。升级的应用包括:

Omniverse USD Composer:让3D用户能够组装基于OpenUSD的大型场景;Omniverse Audio2Face:提供对只需通过音频文件即可创建逼真面部动画和手势的生成式AI应用编程接口的访问,现在还添加了多语种支持和全新女性基础模型。

此外,英伟达还发布了一系列面向开发者和企业的框架、资源和服务,以此加速通用场景描述(即OpenUSD)的采用。

为了帮助开发人员更为无缝地实现和部署OpenUSD工作流和应用程序,英伟达还宣布构建全新的Omniverse Cloud API。

例如,ChatUSD是一个供开发人员使用的大型语言模型(LLM) copilot工具,可以回答USD知识问题或生成Python-USD代码脚本。OpenUSD支持的全新Omniverse连接器现已推出,为工业企业打破复杂生产流水线中的数据孤岛带来了更多可能性。

据了解,Cesium、Convai、Move AI、SideFX Houdini和Wonder Dynamics 现已通过 OpenUSD 接入Omniverse。

随着工业企业竞相推动工作流数字化,提升对OpenUSD赋能、互联、可互操作的3D软件生态的需求越来越多。Omniverse的更新可让开发者通过OpenUSD,利用生成式AI来强化自身工具,并让企业能够构建更大、更复杂的模拟应用。

据了解,多家客户正在使用Omniverse来完成从模拟机器人到训练AI模型和改进动画等各种任务,包括波士顿动力人工智能研究所、沃尔沃汽车等。

此外,英伟达正在与全球各地的系统制造商协作,为数百万设计师、建筑师和工程师提供针对 Omniverse 优化配置的RTX工作站。这些新系统最多可搭载四颗NVIDIA RTX 6000 Ada Generation GPU,并搭配 NVIDIA Omniverse Enterprise 软件,可加速OpenUSD世界的构建、生成式AI赋能的协同设计以及其他工业数字化应用。

黄仁勋表示:“正如HTML点燃了2D互联网的重大计算革命,OpenUSD也将开启协作式 3D 和工业数字化的时代。英伟达通过开发NVIDIA Omniverse 和生成式AI,正在全力推动 OpenUSD的发展和应用。”

通过Omniverse与新的技术组合ChatUSD、RunUSD 等云应用编程接口(API)以及全新NVIDIA OpenUSD开发者计划,英伟达正在大力推进OpenUSD的发展,实现软件工具与数据类型之间的互通,更便捷地构建数字世界。

英伟达发布的四款全新的Omniverse Cloud API,也将进一步帮助开发者无缝实施和部署 OpenUSD流程与应用,这些更新包括:

ChatUSD:一款面向开发人员的大型语言模型 (LLM) copilot工具,可以回答USD知识问题或生成 Python-USD 代码脚本。ChatUSD 借助NVIDIA提供的USD功能和Python-USD代码片段进行微调。

RunUSD:通过检查上传文件与OpenUSD版本的兼容性,将OpenUSD文件转换为完全路径跟踪渲染的图像,并使用Omniverse Cloud生成渲染。目前,NVIDIA OpenUSD开发者计划中的开发人员可以使用该API的演示。

DeepSearch:其为LLM代理,可在海量无标记资产数据库中进行快速语义搜索。

USD-GDN Publisher:一键式服务,可助力企业和软件制造商从USD Composer等基于 Omniverse的应用向Omniverse Cloud GDN发布基于OpenUSD的高保真体验,并实时传输到网络浏览器和移动设备。

大幅提升台式工作站性能

英伟达还发布了性能强大的全新NVIDIA RTX工作站,专为生成式AI和数字化时代的开发与内容创作打造。BOXX、戴尔、惠普、联想等公司所提供的系统,配备有NVIDIA RTX 6000 Ada GPU、NVIDIA AI Enterprise和NVIDIA Omniverse Enterprise软件。

此外,NVIDIA发布了三款全新台式工作站Ada架构GPU——NVIDIA RTX 5000、RTX 4500和RTX 4000,为全球专业人士带来最新的AI、图形和实时渲染技术。

面对一些非常具有挑战的工作负载,例如需要使用全栈计算方案的生成式AI和数字化应用时,英伟达最新RTX工作站,可以助力专业人士在台式机上运行这些应用,在新到来的生成式AI时代构建出庞大的数字化世界。

写在最后

我们正处于一个全新的计算时代,生成式AI能够理解的信息不仅限于文本和数字,而是多模态的信息,因此,这场计算革命注定将触及各行各业。我们看到,英伟达正通过全栈的解决方案,提升GPU的处理能力、网络的连接能力……让GPU更好地扩展、数据更高效地传输、AI算法更好地运行,为生成式AI的全面来临做好准备。

[责任编辑:]

网罗天下