向更快的AI进发，英伟达到哪一步了？

2023-08-10 11:43:41
来源：互联网

“加速计算与生成式AI两大变革相交汇，计算机行业正面临转折点。”处于

“加速计算与生成式AI两大变革相交汇，计算机行业正面临转折点。”处于加速计算与AI的交汇点，黄仁勋指出，“英伟达采用全栈的方法，在改进硬件的同时也改进软件，将硬件和软件设计结合在一起才能真正使堆栈工作，才能使AI运行得更快。”

(相关资料图)

北京时间8月8日晚，英伟达创始人兼首席执行官黄仁勋在SIGGRAPH发表了一年一度的主题演讲。SIGGRAPH是由ACM SIGGRAPH（计算机协会计算机图形图像特别兴趣小组）举办的计算机图形学的年度顶级会议，黄仁勋曾在此舞台上宣布了一代又一代图像技术的升级，对于英伟达自身和整个计算机图形领域来说，SIGGRAPH都是意义非凡的盛会。

今年的演讲中，黄仁勋介绍了英伟达的最新技术突破：超级芯片GH200 Grace Hopper再次升级，用了最新的存储技术HBM3e；软件方面，英伟达则推出了OpenUSD、云上API等重磅技术，在与Adobe、苹果、Pixar、Autodesk等公司的紧密合作中不断推动人工智能和生成式AI走向下一个浪潮尖峰。

英伟达再一次向业界证明，他们在AI的布局绝不仅限于硬件，而是软硬件结合的全栈式布局，只有这样才能推动业界向更快的AI进发。

新一代GH200——全球首款搭载HBM3e的处理器

5月，英伟达在Computex最新发布了GH200系统，这是一款用于数据中心、被认为是当今全球性能最强的处理器产品，它可以训练AIGC超大规模大模型，利用英伟达的NVLink连接技术，实现了256块Grace CPU和H100 GPU的无缝连接。

SIGGRAPH演讲中，黄仁勋宣布GH200 Grace Hopper在2个月内已经完成了初次升级，存储技术升级至HBM3e。该平台采用双配置——提供的内存容量和带宽比当前产品分别增加了 3.5 倍和 3 倍——包括一个拥有 144 个 Arm Neoverse 内核、8 petaflops的AI性能和 282GB HBM3e 内存技术的单个服务器。

黄仁勋表示：“为了满足生成式AI不断激增的需求，数据中心需要能够满足特定需求的加速计算平台。全新GH200 Grace Hopper超级芯片平台以出色的内存技术和带宽，提高了吞吐量，在不影响性能的情况下可连接多GPU以整合性能，并且具有可以轻松部署到整个数据中心的服务器设计。”

为了推动该技术的广泛应用，采用HBM3e的新一代Grace Hopper超级芯片平台与COMPUTEX上发布的NVIDIA MGX服务器规格完全兼容。借助MGX，任何系统制造商都可以快速、经济地将Grace Hopper添加到100多款服务器机型中。

据介绍，HBM3e版本的GH200预计会在2024年二季度交付。HBM世代差异主要以速度区分，其中传输速度8Gbps的HBM3e是当前最快的一代新技术，比上一代HBM3提升50%。

放眼未来，生成式AI正呈现出无比广阔的前景，而GH200 Grace Hopper将带来更多的可能性，为处理大语言模型、推荐系统、矢量数据库等复杂的生成式 AI 工作负载，提供多种配置选择。

Omniverse 重大升级——支持生成式AI与OpenUSD

英伟达近几年大力推动的Omniverse平台也发布了重要更新，通过OpenUSD框架和生成式AI来优化并强化其3D工作流程。

作为OpenUSD原生软件平台，Omniverse可进行跨3D工具和应用的连接、描述及模拟，此次平台更新主要升级了Omniverse Kit（用于开发原生OpenUSD应用和扩展程序的引擎），以及NVIDIA Omniverse Audio2Face基础应用和空间计算功能，将加快虚拟世界和高级工作流的创建速度，推动工业数字化进程。

这些平台更新在Omniverse基础应用中得到了展现，Omniverse基础应用是完全可定制的参考应用，创作者、企业和开发者可以对其进行复制、扩展或改进。升级的应用包括：

Omniverse USD Composer：让3D用户能够组装基于OpenUSD的大型场景；Omniverse Audio2Face：提供对只需通过音频文件即可创建逼真面部动画和手势的生成式AI应用编程接口的访问，现在还添加了多语种支持和全新女性基础模型。

此外，英伟达还发布了一系列面向开发者和企业的框架、资源和服务，以此加速通用场景描述（即OpenUSD）的采用。

为了帮助开发人员更为无缝地实现和部署OpenUSD工作流和应用程序，英伟达还宣布构建全新的Omniverse Cloud API。

例如，ChatUSD是一个供开发人员使用的大型语言模型（LLM) copilot工具，可以回答USD知识问题或生成Python-USD代码脚本。OpenUSD支持的全新Omniverse连接器现已推出，为工业企业打破复杂生产流水线中的数据孤岛带来了更多可能性。

据了解，Cesium、Convai、Move AI、SideFX Houdini和Wonder Dynamics 现已通过 OpenUSD 接入Omniverse。

随着工业企业竞相推动工作流数字化，提升对OpenUSD赋能、互联、可互操作的3D软件生态的需求越来越多。Omniverse的更新可让开发者通过OpenUSD，利用生成式AI来强化自身工具，并让企业能够构建更大、更复杂的模拟应用。

据了解，多家客户正在使用Omniverse来完成从模拟机器人到训练AI模型和改进动画等各种任务，包括波士顿动力人工智能研究所、沃尔沃汽车等。

此外，英伟达正在与全球各地的系统制造商协作，为数百万设计师、建筑师和工程师提供针对 Omniverse 优化配置的RTX工作站。这些新系统最多可搭载四颗NVIDIA RTX 6000 Ada Generation GPU，并搭配 NVIDIA Omniverse Enterprise 软件，可加速OpenUSD世界的构建、生成式AI赋能的协同设计以及其他工业数字化应用。

黄仁勋表示：“正如HTML点燃了2D互联网的重大计算革命，OpenUSD也将开启协作式 3D 和工业数字化的时代。英伟达通过开发NVIDIA Omniverse 和生成式AI，正在全力推动 OpenUSD的发展和应用。”

通过Omniverse与新的技术组合ChatUSD、RunUSD 等云应用编程接口（API）以及全新NVIDIA OpenUSD开发者计划，英伟达正在大力推进OpenUSD的发展，实现软件工具与数据类型之间的互通，更便捷地构建数字世界。

英伟达发布的四款全新的Omniverse Cloud API，也将进一步帮助开发者无缝实施和部署 OpenUSD流程与应用，这些更新包括：

ChatUSD：一款面向开发人员的大型语言模型 (LLM) copilot工具，可以回答USD知识问题或生成 Python-USD 代码脚本。ChatUSD 借助NVIDIA提供的USD功能和Python-USD代码片段进行微调。

RunUSD：通过检查上传文件与OpenUSD版本的兼容性，将OpenUSD文件转换为完全路径跟踪渲染的图像，并使用Omniverse Cloud生成渲染。目前，NVIDIA OpenUSD开发者计划中的开发人员可以使用该API的演示。

DeepSearch：其为LLM代理，可在海量无标记资产数据库中进行快速语义搜索。

USD-GDN Publisher：一键式服务，可助力企业和软件制造商从USD Composer等基于 Omniverse的应用向Omniverse Cloud GDN发布基于OpenUSD的高保真体验，并实时传输到网络浏览器和移动设备。

大幅提升台式工作站性能

英伟达还发布了性能强大的全新NVIDIA RTX工作站，专为生成式AI和数字化时代的开发与内容创作打造。BOXX、戴尔、惠普、联想等公司所提供的系统，配备有NVIDIA RTX 6000 Ada GPU、NVIDIA AI Enterprise和NVIDIA Omniverse Enterprise软件。

此外，NVIDIA发布了三款全新台式工作站Ada架构GPU——NVIDIA RTX 5000、RTX 4500和RTX 4000，为全球专业人士带来最新的AI、图形和实时渲染技术。

面对一些非常具有挑战的工作负载，例如需要使用全栈计算方案的生成式AI和数字化应用时，英伟达最新RTX工作站，可以助力专业人士在台式机上运行这些应用，在新到来的生成式AI时代构建出庞大的数字化世界。