英伟达 2025 年计算机展革命:将数据中心转变为人工智能工厂

英伟达™(NVIDIA®)首席执行官黄仁勋身着标志性的皮夹克在2025年台北国际电脑展(Computex 2025)上登台,发布了新硬件和全新的计算模式。这家半导体巨头已果断转型为一家人工智能基础设施公司,为黄仁勋所说的 "智能基础设施"--继电力和互联网之后的第三次重大基础设施革命--奠定了基础。

这次主题演讲不仅仅是一次产品发布,而是詹森为英伟达重塑计算格局描绘的蓝图。他所揭示的技术飞跃、战略支点和市场策略很可能会让本届电脑展成为我们多年来的参考。观看完整的 2025 年英伟达国际电脑展主题演讲.

英伟达™(NVIDIA®)的战略演变:从图形卡到基础架构提供商

英伟达公司的转型故事令人震撼。1993 年,詹森看到了 "3 亿美元的芯片机会"--一个巨大的市场。时至今日,他已经掌控着一个价值万亿美元的人工智能基础设施巨头。这种爆炸式增长并非偶然--英伟达一路上多次从根本上重塑了自己。

在主题演讲中,詹森强调了成就今天英伟达的转折点:

  1. 2006:CUDA 的出现颠覆了并行计算。突然之间,从未考虑过使用 GPU 进行通用计算的开发人员开始构建在传统 CPU 上无法实现的应用程序。

  2. 2016:DGX1 成为英伟达首个不折不扣的人工智能系统。在现在看来几乎是阴森恐怖的预示中,Jensen 向 OpenAI 捐赠了第一台设备,实际上为他们提供了计算基础,最终导致了我们当前的人工智能革命。

  3. 2019:收购 Mellanox,使英伟达能够将数据中心重新概念化为统一的计算单元

这一转变最终成就了英伟达目前作为 "重要基础设施公司 "的地位--黄仁勋强调了这一地位,并着重介绍了其前所未有的五年期公开路线图,该路线图可为人工智能部署提供全球基础设施规划。

重新定义性能指标:代币经济

英伟达™(NVIDIA®)在衡量计算产出的方式上发生了根本性的转变。与FLOPs或每秒运算量等传统指标相比,黄仁勋将人工智能数据中心定位为生产 "代币"(计算智能的单位)的工厂:

"公司开始讨论上个季度生产了多少代币,上个月生产了多少代币。很快,我们将像每家工厂一样,讨论我们每小时生产多少代币。"

这种重构将计算投资与业务产出直接联系起来,使人工智能基础设施与传统工业框架相一致。这一模式将英伟达定位为新经济模式的中心,在这一模式中,计算效率直接转化为业务能力。

Blackwell 架构升级:GB300 规格和性能指标

GB200 系统

Blackwell 架构的 GB300 更新体现了 NVIDIA 坚持不懈的性能改进周期。GB300计划于2025年第三季度推出,其性能包括

  • 推理性能比 GB200 提升 1.5 倍

  • HBM 内存容量提升 1.5 倍

  • 网络带宽提高 2 倍

  • 全液冷设计

  • 向后兼容现有机箱和系统

每个 GB300 节点可提供约 40 petaflops 的性能,实际上取代了整个 Sierra 超级计算机(约 2018 年),后者需要 18,000 个 Volta GPU。六年内性能提升了 4000 倍,远远超过了传统的摩尔定律扩展,证明了 NVIDIA 通过架构、软件和互连创新实现性能加速的多层面方法。

MVLink:重新定义互连技术

MVLink 代表了自 NVLink 推出以来 GPU 互连技术最重大的进步。该系统可在整个机架上实现计算资源的完全分解,将 72 个 GPU(144 个 GPU 芯片)转化为一个庞大的计算单元。

其技术规格令人咋舌:

  • 单个 MVLink 交换机:7.2 TB/s 带宽

  • MVLink spine:130 TB/s 全对全带宽

  • 物理实施:5,000 根长度精确匹配的同轴电缆(总长约 2 英里)

  • 功率密度:每个机架 120 千瓦(需要液体冷却)

Huang指出,整个互联网的峰值流量约为每秒900太比特(112.5 TB/s),这使得单个MVLink脊柱在峰值容量时能够处理的流量超过全球互联网的流量。

MVLink Fusion:创建开放式人工智能基础设施生态系统

MVLink Fusion 可能是英伟达(NVIDIA)多年来最具创新性的生态系统。英伟达并没有强迫合作伙伴全部使用英伟达的硬件,而是开放架构,让公司可以构建半定制的人工智能系统,但这些系统仍与英伟达的生态系统紧密相连。

这种方法出奇地灵活:

  1. 定制 ASIC 集成:有自己的专用加速器吗?没问题。合作伙伴可以通过 MVLink chiplets 将他们的定制芯片连接到英伟达的生态系统。这就好比英伟达在说:"打造你想要的任何专用硬件,只要确保它能与我们的产品对话即可"。

  2. 定制 CPU 集成:CPU 供应商也不会被排除在外。他们可以直接实施MVLink的芯片到芯片接口,在其处理器和Blackwell GPU(或即将推出的Ruben架构)之间建立一条直接的高速公路。MVLink 对于投资于特定 CPU 架构的公司来说意义重大。

宣布的合作伙伴遍及半导体行业:

  • 硅实施合作伙伴:LCHIP、Astera Labs、Marll、联发科

  • CPU 供应商:富士通、高通

  • EDA 供应商:Cadence、Synopsis

无论客户采用何种硬件组合,NVIDIA®(英伟达™)都能通过这种战略定位来获取价值,这也反映了黄晓明的坦率言论:"没有什么能比你们购买 NVIDIA 的所有产品更让我高兴了。我希望你们知道这一点。但是,如果你从 NVIDIA 购买一些东西,也会给我带来极大的快乐"。

企业人工智能部署:RTX Pro Enterprise 和 Omniverse Server

RTX Pro Enterprise 和 Omniverse 服务器代表了英伟达最重要的企业级计算产品,专门用于将人工智能功能集成到传统 IT 环境中:

  • 完全兼容 x86 架构

  • 支持传统管理程序(VMware、Red Hat、Nanix)

  • 集成 Kubernetes,实现熟悉的工作负载协调

  • Blackwell RTX Pro 6000s GPU(每台服务器 8 个)

  • 提供 800 Gb/s 带宽的 CX8 网络芯片

  • 与 Hopper H100 相比,性能提升 1.7 倍

  • Deepseek R1 等优化机型的 4 倍性能

该系统为人工智能推理建立了一个新的性能包络线,以吞吐量(每秒令牌数)和响应度(每秒每个用户的令牌数)双轴框架来衡量,这也是 Huang 所描述的 "推理时间扩展 "或 "思考型人工智能 "时代的关键指标。

人工智能数据平台:重塑非结构化数据的存储方式

英伟达™(NVIDIA®)的人工智能数据平台为企业存储引入了一种根本不同的方法:

"人类查询 SQL 等结构化数据库...但人工智能想要查询非结构化数据。它们需要语义。它们需要意义。因此,我们必须创建一种新型的存储平台。"

主要组成部分包括

  • 英伟达 AIQ(或 IQ):语义查询层

  • GPU 加速存储节点取代以 CPU 为中心的传统架构

  • 训练后的人工智能模型具有透明的训练数据来源

  • 与现有解决方案相比,查询速度提高 15 倍,查询结果提高 50

实施这一架构的存储行业合作伙伴包括戴尔、日立、IBM、NetApp 和 Vast,从而创建了一个全面的企业人工智能数据管理生态系统。

人工智能操作和机器人技术:智能企业的软件框架

主题演讲介绍了两个重要的软件框架:

  1. 人工智能运营(AIOps):在企业环境中管理人工智能代理的综合堆栈,包括数据整理、模型微调、评估、防护和安全。合作伙伴包括 Crowdstrike、Data IQ、Data Robots、Elastic、Newonix、Red Hat 和 Trend Micro。

  2. 艾萨克-格鲁特平台 N1.5:一个开源的机器人开发生态系统,包括

    • 牛顿物理引擎(与谷歌 DeepMind 和迪士尼研究院共同开发)

    • Jetson Thor 机器人处理器

    • 英伟达 Isaac 操作系统

    • 生成合成轨迹数据的格鲁特梦想蓝图

机器人技术倡议解决了一个关键挑战:"要实现机器人技术,就需要人工智能。但要教授人工智能,你需要人工智能"。这种递归优化模式利用生成式人工智能,将有限的人类演示数据扩展为全面的机器人训练集。

台湾在人工智能制造革命中的战略地位

主题演讲的大部分内容都强调了台湾在生产和实施人工智能技术方面的关键作用:

  • 台湾制造公司(台积电、富士康、纬创、和硕、台达电子、广达、Wiiwin、技嘉)正在部署 NVIDIA Omniverse,以实现数字孪生。

  • 台积电利用 CUDA 上的人工智能工具优化晶圆厂布局和管道系统

  • 制造业合作伙伴利用数字双胞胎进行虚拟规划和预测性维护,并将其作为训练机器人系统的 "机器人健身房"。

  • 富士康、台积电、台湾政府和英伟达正在建造台湾首台大型人工智能超级计算机。

黄仁勋还宣布了 "NVIDIA 星座 "计划,即在台北建立一个新的总部设施,从而进一步巩固了英伟达对该地区的承诺。

技术分析:这对企业人工智能战略意味着什么

这些公告共同代表了对企业计算的全面重新构想,具有若干战略意义:

  1. 计算规模要求:推理人工智能 "和代理系统对推理时间性能的要求将大大高于最初部署的大型语言模型,这就需要对大规模扩展和横向扩展能力进行架构规划。

  2. 企业 AI 的分解:MVLink Fusion 生态系统可在构建异构 AI 系统方面实现前所未有的灵活性,在通过互连技术保持 NVIDIA 在生态系统中的地位的同时,有可能加速专用 AI 加速器的采用。

  3. 从数据中心转向人工智能工厂:我们需要彻底重新思考如何衡量基础设施投资的价值。原始计算能力或存储容量说明一切的时代已经一去不复返了。现在的关键是代币产量--你的系统每秒、每瓦特、每美元能产生多少单位的人工智能产出?詹森说公司很快就会报告它们的代币产量,比如制造指标,这并不是开玩笑。向人工智能工厂的转变将从根本上改写我们如何部署人工智能基础设施并证明其合理性的经济学。

  4. 数字双胞胎集成:台湾各大制造商都在构建 Omniverse 数字孪生系统,这一事实告诉我们,我们需要知道的一切--这不再只是一个很酷的技术演示。数字孪生已经成为致力于优化的公司必不可少的基础设施。尤其引人入胜的是,这如何形成了一个反馈循环:公司建立数字双胞胎来优化物理流程,然后使用相同的环境来训练人工智能和机器人,进一步改善物理世界。这是一个不断加速的持续改进循环。

  5. 机器人劳动力规划:代理人工智能和实体机器人技术的融合表明,企业应制定综合的数字和实体自动化战略,这对劳动力规划和设施设计具有重大影响。

  6. 软件定义的基础设施:尽管发布了硬件产品,但英伟达对库和软件框架的持续重视进一步表明,人工智能领域的竞争优势将来自软件优化,就像原始硬件能力一样。

引领人工智能工厂转型

将传统数据中心转变为人工智能工厂,需要在硬件部署、软件优化和架构设计之间架起桥梁的专业知识。在 Introl,我们一直在实施这些先进的 GPU 基础设施解决方案为企业实施这些先进的 GPU 基础架构解决方案。我们的团队在英伟达生态系统(从复杂的MVLink部署到Omniverse数字孪生实施)方面拥有深厚的经验,能够帮助企业驾驭这种模式转变,而不会出现通常与尖端基础设施相关的陡峭学习曲线。无论是扩展人工智能推理能力,还是建立首个人工智能工厂车间,与专家合作都能在这一快速发展的环境中大大加快实现价值的速度。准备好**了吗? 立即拨打电话。

总结:计算机的第三个时代已经到来

Computex 不仅仅是英伟达(NVIDIA)展示更快的芯片。詹森所展示的,已经超越了我们习以为常的 "比去年提高 20%"的宣传。他从根本上重构了计算机的用途。几十年来,我们一直在制造计算数字和移动数据的机器。现在,英伟达正在打造以制造智能为主要输出的系统。这就好比把文件柜比作大脑。当然,两者都是存储信息,但一个是静静地摆放在那里,而另一个则在创造新的想法。这种转变听起来像是语义学上的,直到你意识到它改变了我们构建、部署和衡量计算系统的一切方式。

"在我们共事的所有时间里,这还是第一次,我们不仅在创造下一代 IT,而且我们还做了好几次,从 PC 到互联网到云再到移动云。我们已经做了好几次了。但这一次,我们不仅要创造下一代 IT,还要创造一个全新的行业。"

这一转变是继个人计算革命和互联网/云时代之后的第三次重大计算模式转变。整合了这些人工智能基础设施能力的组织将有可能在各行各业建立起不可逾越的竞争优势。

如今,计算智能工厂正在建设之中。问题已不再是人工智能是否会改变商业,而是在计算智能变得像电力一样成为企业运营基础的世界里,贵组织是否正在建设保持竞争力的基础设施。

参考资料和其他资源

  1. 英伟达官方 Blackwell 架构概述: https://www.nvidia.com/en-us/data-center/technologies/blackwell-architecture/

  2. 英伟达™ MVLink 技术文档: https://developer.nvidia.com/mvlink

  3. NVIDIA Omniverse 平台: https://www.nvidia.com/en-us/omniverse/

  4. Isaac 机器人平台: https://developer.nvidia.com/isaac-ros

  5. 英伟达人工智能企业: https://www.nvidia.com/en-us/data-center/products/ai-enterprise/

  6. 英伟达 Computex 2025 官方新闻资料: https://nvidianews.nvidia.com/news/computex-2025

  7. 英伟达™(NVIDIA®)CUDA-X 库概览: https://developer.nvidia.com/gpu-accelerated-libraries

  8. 英伟达 DGX 系统: https://www.nvidia.com/en-us/data-center/dgx-systems/

上一页
上一页

降低人工智能时代的停机成本

下一页
下一页

数字拆除的艺术:精确而有目的地停用高性能计算中心