Chinaunix首页 | 论坛 | 博客
  • 博客访问: 462
  • 博文数量: 19
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 201
  • 用 户 组: 普通用户
  • 注册时间: 2025-03-05 10:20
文章分类
文章存档

2025年(18)

我的朋友
最近访客

分类: IT业界

2025-03-19 18:18:42

北京时间 3 月 19 日凌晨,英伟达 GTC 大会在美国加州圣何塞 SAP 中心举行。

黄仁勋穿着标志性皮衣站上“ AI 界超级碗” GTC 2025 的舞台,带来了英伟达的{BANNED}{BANNED}最佳佳新技术。两小时的演讲时间,浓缩了从芯片革命到机器人进化的{BANNED}{BANNED}最佳佳新成果。而背后隐藏的,是一场关于算力、成本与生态的暗战。


AI 的四波浪潮:从生成文字到操控物理世界


黄仁勋一开场便抛出了震撼观点:AI 正经历从“生成内容”到“操控物理世界”的跃迁。



黄仁勋提出人工智能演进的四个阶段:

  • 感知 AI(Perception AI):10 年前启动,专注于语音识别等基础任务;
  • 生成式 AI(Generative AI):过去 5 年的重点,实现文本、图像、视频等内容生成;
  • 代理式 AI(Agentic AI):AI 具备自主推理与决策能力(如多步骤问题解决);
  • 物理 AI(Physical AI):未来方向,AI 操控物理世界(如机器人、自动驾驶)

按照这个趋势,我们目前正迈向代理式AI阶段,未来,将是机器人和自动驾驶等更高级的智能体登场的时代。

然而,代理式 AI 的计算需求要比传统模型高 100 倍。黄仁勋指出,人工智能行业在计算方面面临“巨大挑战”,他解释说,这是因为推理模型在推理过程中的众多步骤中都需要 tokens。

因此,计算需求仍然存在巨大空间。


新一代 AI 芯片:Blackwell Ultra

英伟达的杀手锏依然是芯片。去年 6 月,黄仁勋首次透露英伟达芯片架构将“一年一更”:计划 2025 年推出 Blackwell Ultra 架构,随后推出 Rubin 架构,此次则补上了路线图。

随后发布的 Blackwell Ultra,拥有 5 纳米工艺、288GB HBM3e 显存、每秒处理 1000 个推理标记(token)——性能达到前代 H100 的 10 倍。采用 Blackwell Ultra 架构的芯片包括 GB300 NVL72 等。

拥有 72 颗 GB300 的 Blackwell Ultra NVL72 平台将于 2025 年下半年推出,算力高达原本 GB200 NVL72 的 1.5 倍。

而更强的 Rubin Ultra NVL576 将于 2027 年下半年推出。Rubin Ultra NVL576 将搭载 HBM4e 内存,算力是 GB300 NVL72 的14倍,内存速度则是8倍。


考虑到散热问题,英伟达彻底抛弃传统风冷,全面转向液冷技术。新一代机柜的液冷管线密度是前代的4倍,甚至被网友戏称为“水管工的春天”。

这种暴力堆料的背后,是 AI 推理需求爆炸的残酷现实:代理式AI的单次推理需生成 8000 多个标记,算力消耗比传统模型高 100 倍。

而黄仁勋也直言:“未来五年,数据中心投资将超 1 万亿美元,这不是选择题,而是生存战。”


黄仁勋:“买得越多,省得越多”

随着架构迭代,黄仁勋表示, AI工厂的算力成本将得到相应降低。

他抛出一组反直觉的数据:推理成本每降低一半,市场需求将激增十倍。核心在于软硬协同优化。

随后发布的新一代 Dynamo 操作系统能动态分配 GPU 算力,让同样硬件下的推理吞吐量提升30倍。黄仁勋指出,“它本质上是 AI 工厂的操作系统。”它以启动上次工业革命的{BANNED}中国{BANNED}中国第一台仪器命名,暗示这项技术将在新一轮AI革命中扮演关键角色。

通过 Dynamo,可以让 DeepSeek 等推理模型,在相同架构和使用相同数量 GPU 的条件下,将性能提升30倍。


而 CUDA 生态新增的数学规划工具 CuOpt,可以将将物流调度等复杂问题的求解速度提升千倍。


生态合纵:从6G网络到量子计算的“科技朋友圈”


英伟达的野心不止于硬件。黄仁勋现场官宣了多项跨界合作:


黄仁勋宣布,英伟达将扩大与通用汽车的合作,与通用汽车共建全栈AI系统,从数字孪生工厂到车载安全架构 HALOS(含700万行安全代码),试图将造车效率提升一个量级。



与此同时,在 6G 通信方面,英伟达将联合思科、T-Mobile 研发 AI 原生 6G 网络,用硅光子技术将光模块功耗降低 90%,为万物互联铺路。英伟达还在周二宣布,将在波士顿建立一个研究中心,为推进量子计算提供尖端技术。


英伟达用 AI 串联起来的从数据生成、处理到落地的全链条,正在构建一个“自我喂养”的科技生态。

此次 GTC 2025,我们或许能深刻地感受到:AI 正在经历类似电力的普及历程——从实验室的稀奇玩意,变成驱动万物的基础能源。这场算力狂欢,或许将改写每个行业的生存法则。


大家有什么看法呢?欢迎在评论区留言讨论哦~

阅读(27) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~