Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1003
  • 博文数量: 40
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 411
  • 用 户 组: 普通用户
  • 注册时间: 2025-03-05 10:20
文章分类
文章存档

2025年(35)

我的朋友
最近访客

分类: IT业界

2025-04-10 16:29:04

 

2025年4月9日深夜,在谷歌云Next大会上,代号Ironwood的第七代TPU芯片正式亮相,拉开了算力革命新的序幕。

 

Ironwood拥有4614TFlops的峰值、192GB内存与7.2Tbps带宽,算力直逼英伟达B200。与前几代相比,性能是2017年第二代TPU的3600倍,2023年第五代TPU的10倍。

 

谷歌称,Ironwood是谷歌迄今为止最强大、最节能的TPU,专为支持思考、推理类模型的大规模应用而设计。

 

这款性能超强的AI推理芯片,带来的不止硬件升级。谷歌正用一颗专为深度思考而生的芯片,打造满足推理时代更大计算需求的软硬协同生态。

 

“我们正在见证AI从‘响应式’向‘主动式’的范式迁移。”谷歌机器学习副总裁Amin Vahdat在演讲中反复强调这一观点。Gemini 2.5等新一代模型已能主动拆解问题、调用工具、协同推理。这种会思考的AI,需要芯片像人脑般高效处理逻辑推演与多任务并行——而这正是Ironwood的设计哲学。

 

软硬协同的细节方面,Ironwood的芯片间互连(ICI)网络将双向带宽提升至1.2Tbps,让9216颗芯片组成的超级集群,以42.5 ExaFLOPS的总算力碾压目前世界上最大超算El Capitan。

 

同时,Ironwood还Pathways软件栈配合:当Gemini模型拆解出推理链条时,系统能自动将子任务分配给不同芯片组,实现高效的分布式计算。

Ironwood的4614TFlops略超B200的4500TFlops,内存带宽(7.2Tbps)虽稍逊于B200的8Tbps,但拥有每瓦29.3TFlops的能效比。

 

值得一提的是,黄仁勋特地为谷歌云Next大会录制了一段视频,表示双方将在加密计算服务方面开展合作。

 

但谷歌的最新发布,无疑加剧了AI芯片领域的竞争和英伟达的压力,很多网友直呼“英伟达的地位受到威胁了”。

 

算力——智能时代的“氧气”

回望AI芯片发展史,从CPU到GPU,从训练芯片到推理专用,每一次架构革新都在重塑行业规则。Ironwood的登场,或许预示着算力竞争进入场景定制化时代

可以预见的是,随着谷歌与英伟达等芯片巨头的竞争加剧,算力的较量早已超越单纯的硬件参数之争。它揭示了一个清晰的真相:算力,正在成为智能时代的“氧气”。

 

而未来的算力产业,可能走向三极分化:

一方面,通用芯片时代渐行渐远,针对推理、训练、边缘计算等场景的专用架构将会重塑产业链,如同Ironwood对深度思考模型的定向优化。

另一边,据斯坦福《AI指数2025》,随着AI耗电量逼近全球总发电量的10%,每瓦性能将成为比绝对算力更关键的指标。

 

最后,开源生态的强势崛起将加速技术平权,从而推动AI普惠赋能千行百业。相应地,广大中小企业对于算力的需求将持续增加,AI算力民主化也将成为算力产业的未来趋势,这将推动算力租赁等领域的发展。未来,算力可能会变得像水电一样便捷、高效。

 

阅读(7) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~