在GTC 2026主题演讲上,一款名为英伟达Groq 3 LPU的全新芯片正式亮相。
北京时间周二凌晨,英伟达正式推出Vera Rubin平台,包括Groq 3 LPU(简称LPU)在内,共计搭载了七款芯片,分别为Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU和Spectrum-6以太网交换机。
据悉,英伟达将构建包含256个LPU的Groq 3 LPX机架,提供128GB(每个LPU集成500MB的SRAM)的SRAM和40 PB/s的推理加速带宽,并通过每个机架640 TB/s的专用扩展接口将这些芯片连接起来。这款机架将与Vera Rubin NVL72、Vera CPU等另外四款机架一同构成完整的AI超级计算机平台Vera Rubin。
元股证券:ygzq.hk英伟达表示,Groq 3 LPX 是Vera Rubin的推理加速器,旨在满足智能体系统对低延迟和大上下文的需求。Vera Rubin和LPX通过协同设计的架构,将Rubin GPU和LPU的卓越性能完美结合,使其呈现极低延迟与超大吞吐量的特点。

黄仁勋介绍称,LPX与Vera Rubin平台结合后,推理吞吐量/功耗比将能提升35倍。LPU芯片将由三星代工,预计机架将于今年下半年开始出货。
就在昨日,分析师郭明錤发文称,在英伟达投资Groq之后,LPU的出货量预测已大幅上调。预计2026至2027年的总出货量将达到400万至500万颗。新架构机柜预计于今年第四季度开始量产,2026年与2027年机柜出货量分别约为300至500个,以及15000至20000个。
在他看来,LPU需求增长快速增长主要来自外部因素。一方面,LPU与英伟达生态系(如CUDA)高度整合,大幅降低应用开发与部署门槛。另一方面,如今业内超低延迟推理需求快速增加,包括AI智能体(AI Agents)以及正在兴起的即时处理(Real-Time)、终端用户(Consumer-Facing)与物理AI(Physical-AI)等类型应用。
值得一提的是,黄仁勋在主题演讲上也强调,AI已完成从感知智能到生成智能,再到物理智能和智能体智能的关键跃迁。
财通证券指出,大模型在推理过程中会存在延迟,延迟与用户体验感紧密挂钩,大模型推理过程中的延迟主要在Decode阶段,核心瓶颈在于内存带宽。LPU具备更快的内存带宽,可缩短大模型推理过程中的延迟。同时,基于LPU的大模型不仅具有更快的推理速度,还可以提供更具性价比的价格,可进一步提高用户体验感。
元股证券该机构表示,目前Tokens的消耗量大幅增长,带动推理芯片市场规模的高增长。LPU有望在推理芯片市场中逐步渗透,具有高成长性的市场空间。看好LPU的高成长性及LPU以机柜出货时带来的PCB机会,建议关注:智微智能(参股元川微)、星宸科技(多轮增资元川微)、沪电股份(英伟达PCB供应商)、胜宏科技(英伟达PCB供应商)、深南电路。


波段型投资者群体在处于指数虚高而个股分化的阶段阶段中如何使用近期,在全球多国证券市场的以事件驱动为主的震荡期中,围绕“股
2026-02-20
聚焦北向资金市场配资推荐的产品设计风险收益平衡视角近期,在亚洲股市的趋势与震荡交替的过渡期中,围绕“配资推荐”的话题再度
2026-01-16
投资者报告:年度周期偏好热点题材轮动的交易者使用配资佬专业配近期,在境内外股市的存量博弈格局中,围绕“配资佬专业配资”的
2026-02-05
首次尝试杠杆工具的体验用户在离岸金融市场运用手机股票配资的账近期,在国际科技股市场的指数中枢上下反复试探阶段中,围绕“手
2026-01-28
风控专栏:配资专属服务平台在存量博弈主导的拉锯行情里的投资行近期,在主要资本流向区域的题材轮动加速期中,围绕“配资专属服
2026-01-08