
高通技术公司(NASDAQ:QCOM)今日在投资者日活动上宣布发布全新数据中心解决方案,涵盖高通飞龙™ C1000 CPU、高通 ® 高带宽计算(HBC)技术、高通飞龙™ AI300 推理加速器、连接产品及定制芯片解决方案。所有产品均旨在实现最大化每瓦特性能与 Token 吞吐能力,同时降低客户总体拥有成本。全新平台进一步强化了高通技术公司在构建面向 AI 优化的全栈数据中心基础设施领域的布局,覆盖面向智能体与数据中心级别的 CPU、AI 推理加速器、高带宽光电互联及规模化高性能定制芯片解决方案。此前高通已推出高通飞龙 AI200 与 AI250,高通飞龙 AI300 将正式纳入这一数据中心解决方案产品组合,AI 加速器技术路线图以年度为迭代周期。
高通公司总裁兼 CEO 安蒙表示:“智能体 AI 正在推动数据中心 AI 推理需求的大幅增长。随着智能体 AI 成为主流工作负载,基础设施必须在更低功耗、更低成本的前提下实现更高性能。这正契合高通的技术优势,我们已为这一转变做好充分准备。依托高通飞龙,我们将高性能低功耗计算能力引入数据中心市场,并与多家领先客户签订多年、多代合作协议。”
面向超大规模云服务商打造的推理优先平台
高通技术公司依托数十年在系统级芯片、低功耗设计、高性能处理和领先 IP 方面的深厚技术积累,以及超过 400 亿组件的工程经验,构建分布式机架级 AI 基础设施,专为超大规模场景下的智能体密集型数据中心级 AI 推理负载而设计。这些创新将显著优化词元(Token)经济性、同时降低时延、简化集成,并支持规模化部署,从而进一步降低总体拥有成本。面对智能体 AI 带来的 Token 需求的大幅增长,高通技术公司的解决方案将持续优化每瓦特下 Token 吞吐量,成为降低总体拥有成本(TCO)的关键驱动因素。
高通技术公司执行副总裁兼数据中心业务总经理 Tony Pialis 表示:“企业的当前需求早已超越单一硬件组件,如何在分布式、始终在线的基础设施上,实现多类型算力的规划,正变得至关重要。借助高通飞龙,我们将计算、AI、内存与连接整合到一个统一的机架级平台中,专为日益复杂的智能体驱动工作负载设计,并解决了内存带宽和功耗的关键瓶颈。得益于高通技术公司在高性能、低功耗规模化计算方面的数十年技术积累,我们能够为数据中心领域带来行业内少有企业能够比肩的能力。”
从芯片到机架:分布式、机架级 AI 推理平台
高通飞龙 C1000 CPU

专为数据中心打造的 CPU,能够为智能体、通用型和 AI 管理节点工作负载提供领先的性能表现和资源利用效率,同时具备同档产品中最佳的能效和总体拥有成本。
Qualcomm Oryon™ CPU 核心采用定制化设计,针对核心性能和 5GHz 以上的频率进行优化,能够为规模化部署的智能体工作负载提供卓越性能。
采用超过 250 核的核心设计,提供卓越的吞吐能力和扩展性,同时保持出色的单核性能。
根据规格参数预估,每瓦特性能较现有服务器 CPU 竞品的基准数据提升超过 2 倍
整套架构经过专门规划设计,面向关键数据中心业务场景提供最佳吞吐性能、响应速度和基础设施利用率;同时降低资本支出与运营成本,从而在规模化部署环境下,实现行业领先的单位 TCO 性能表现。
采用多芯粒互联架构,并结合先进的封装工艺实现模块化集成,支持性能和 IO 扩展,适配数据中心领域从通用处理到 AI CPU 的需求。
支持速率高达 2TB/s 的领先 PCIe 7.0 连接和 CXL 连接技术,可支持下一代加速器、高速网络和存储,以及分布式内存架构。
内存子系统采用行业领先的低功耗内存技术,带来超高带宽、大容量、低时延和卓越的能效表现。
基于 CPU 的推理任务可选配搭载 HBC 扩展。
搭载先进的 RAS(可靠性、可用性、可维护性)特性,支持 ECC 纠错、故障隔离与错误恢复,保障大规模部署下的稳定可靠运行。
同时支持风冷与液冷散热方案,可适配各类数据中心部署环境,机架与服务器均符合 OCP ORv3 标准。
CPU 产品组合包括:智能体 CPU,面向高吞吐智能体调度规划、低时延交互式 AI 用例;通用 CPU,针对自有业务负载实现最优单位 TCO 性能,面向第三方弹性业务提供最优单位虚拟 CPU 性能;AI CPU,专为最大化生成式 AI 计算场景中的 XPU 利用率而设计。
预计于 2028 年实现商用。
高通高带宽计算(HBC)技术
采用创新的专用近存计算架构,通过 3D 堆叠硅基解决方案将计算与超高速带宽内存相融合,解决 AI 计算中的数据搬运瓶颈。
高通 HBC 技术具备多代际演进的技术路线图,相较高带宽内存(HBM),可实现更快速、更高效、扩展性更强的处理能力,在降低总体拥有成本的同时实现更高能效。
搭载第一代 HBC 技术的 AI250,单卡可实现业界领先的 133TB/s 带宽速率,与采用 LPDDR5X 的 AI200 相比,有效内存带宽提升 18 倍;搭载第二代 HBC 技术的 AI300 进一步实现阶梯式性能跃升,有效内存带宽较 AI200 提升 54 倍。
与竞品已公布的板卡级标准化产品参数相比,HBC 技术支持的每瓦特带宽相比 HBM 技术提升 6 倍。
与竞品已公布的机架级标准化产品参数相比,HBC 技术支持的每瓦特存储容量为静态随机存取存储器(SRAM)技术的 200 倍。
HBC 技术旨在支持 AI 智能体实现高效规模化扩展,满足对持续推理、内存带宽和实时响应的需求。
我们与供应链的战略合作关系以及独特的实现路径,解决了近存计算带来的复杂性问题,这得益于高通领先的 3D 堆叠、系统级设计、LPDDR 控制器以及能效设计技术专长。
搭载第一代 HBC 技术的 AI250 预计将于 2027 年年中实现商用出样。
高通飞龙 AI300(加速卡 / 机架级产品)

高通飞龙 AI300 支持风冷与直液冷散热,是继 AI200、AI250 之后推出的第三代机架级 AI 推理平台。
AI300 集成突破性的第二代高通 HBC 技术以实现计算加速,支持集成内存和更高的有效内存带宽,面向分布式推理部署设计(AI250 搭载第一代 HBC 技术)。
AI300 支持行业领先的内存容量与有效带宽,为大语言模型和多模态大模型(LLM、LMM)推理及智能体 AI 工作负载提供高吞吐量、低时延性能。
与现有的基于 GPU 的架构相比,在单卡每瓦特内存带宽方面,AI300 的每瓦特性能预计可实现 4 至 8 倍的提升。
可支持通过 UALink (超加速器链路) 与 ESUN (以太网纵向扩展网络) 进行纵向扩展;支持基于铜缆与光缆的横向扩展。
预计将于 2028 年商用出样。
定制芯片
面向下一代 AI 与云数据中心基础设施,规模化提供客户定制芯片。
面向智能体 AI 及其他专用工作负载,提供定制化专属芯片。
具备跨芯片、系统和软件的端到端协同设计能力,满足客户差异化的性能、功耗与集成需求。
先进封装与模块化架构设计,旨在提升性能、能效与可扩展性。
业经验证的 IP 和高效设计流程,可助力加速产品上市周期,降低执行风险。
基于生态系统与供应链合作伙伴关系,支持从设计到大规模量产的全流程交付。
连接技术
面向下一代 AI 数据中心的广泛连接技术组合,涵盖 Die-to-Die 芯片互联、铜缆连接、光互联及园区级长距互联。
支持 800G 和 1.6T 高带宽连接、可适配光模块、有源光缆(AOC)、有源电缆(AEC)应用场景,覆盖数据中心内部链路至最远 20 公里的园区级部署。
集成高通技术公司的串行解串器(SerDes)、四电平脉冲幅度调制(PAM4)、轻量化相干数字信号处理器(DSP)、信号完整性与遥测技术,支撑可扩展、高性能 AI 基础设施。
解决数据传输瓶颈。随着分布式、解耦式、带宽密集型基础设施的发展,这一瓶颈是制约 AI 数据中心性能的核心痛点。
全生态合作布局
除全新的高通飞龙数据中心产品组合外,高通技术公司今日宣布与 Meta 达成多年、多代合作协议。
高通技术公司与 Meta 今日宣布达成战略合作协议,高通技术公司将成为 Meta 数据中心多代 CPU 的供应商。Meta 下一代服务器集群计划搭载高通技术公司的数据中心 CPU—— 高通飞龙™ C1000,彰显了在大规模横向扩展部署场景中,高性能、高能效计算的重要性日益提升。
此外,全球超 35 家科技与 AI 生态领军企业也分享了对高通技术公司数据中心愿景和商用解决方案的支持,包括爱德万测试、Arista、Astera、Cirrascale、仁宝电脑、Confidential Core AI、Core42、台达、Fibercop、富士康、技嘉科技、HUMAIN、英业达、IONOS、联想、Master Works、Microchip Technology、美光、南亚科技、NEC、NeuReality、广达电脑、和硕联合科技、三星 SDS、Saptiva AI、SK 海力士美国、Supermicro、泰瑞达、TeraHop、联华电子、VAST Data、Viettel IDC、VNPT 集团和纬创。点击此处查看生态合作伙伴引言。
高通技术公司致力于推进面向数据中心的多代产品技术路线图,并以年度为迭代周期持续演进,聚焦提升 AI 推理性能、优化能效、降低总体拥有成本(TCO)。欲了解更多信息,欢迎访问高通网站。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。