
英伟达周一在圣何塞举行的GTC 2026大会上发布了Groq 3语言处理器,
这是该公司与人工智能推理初创公司Groq于去年圣诞前夕达成的价值200亿美元的授权和人才合作协议的首款成果。
这款基于SRAM的推理加速器将作为专用解码阶段协处理器集成到Vera Rubin平台中,
英伟达计划于2026年第三季度出货,该产品由三星采用4nm工艺制造。
这是该公司首款基于非GPU芯片的机架级产品,其上市已经取代了英伟达自主研发的芯片,使其退出了产品路线图。
Groq 3 LPX机架的核心是LP30芯片,
每个芯片集成512MB片上SRAM,
可提供150TB/s的内存带宽。
这一数字远超每颗Rubin GPU上288GB HBM4显存的22TB/s带宽。
一个完整的LPX机架包含256个LPU,总共拥有128GB SRAM和40PB/s的总带宽。
英伟达声称,LPX与Vera Rubin NVL72搭配使用,
在目标价格为每百万个代币45美元的情况下,
其每兆瓦功耗的吞吐量是单独使用Blackwell NVL72的35倍(针对万亿参数模型)。
扫一扫,关注我们最新消息