一、Token 工厂:一个正在被重新定义的产业概念
2026 年,一个略带工业时代气息的词汇开始在 AI 产业中高频出现 ——Token 工厂。
过去几年,地方政府和企业在谈论人工智能时,常见的关键词是“大模型”“智算中心”“算力集群”。但到了 2026 年,讨论的焦点正在发生微妙而深刻的变化:算力不再被视为一种可以堆叠的硬件资产,而是被重新定义为一种“生产能力”。
Token 工厂由此诞生。它把数据中心变成工业化的“Token 生产线”,核心目标是将能源、GPU 等资源高效转化为持续输出的 Token 流。正如英伟达黄仁勋在 2026 年 GTC 大会上系统阐述的“AI 工厂 / 每瓦 Token”框架所揭示的:AI 基础设施的价值不在于机器本身,而在于持续生产能力。就像工业城市不能只看厂房面积,算力中心的评价标准正在从“拥有多少 GPU”转向“如何让 GPU 生产更多 Token”。
在中国,这一概念还有另一个重要源头 —— 联想问天在 2026 年 6 月品牌焕新大会上正式发布的《词元工厂》产业专著。联想问天将“Token 工厂”定义为推动算力基础设施从“资源支撑载体”向“词元生产系统”跃迁的核心方法论。
从产业实践来看,Token 工厂的运营目标不再是简单提供 GPU 算力,而是将电力、GPU、网络和模型高效转化为持续输出的 Token 流,并最终转化为智能服务和收入。相比传统云时代主要依赖硬件扩容提升计算能力,Token 工厂更强调通过软件持续挖掘存量算力的生产效率,即以更少的 GPU、更低的功耗生产更多的 Token。
在这一产业趋势下,国内主流 AI 算力基础设施服务商围绕“Token 工厂”的理念展开了差异化的技术路线布局。以下从第三方观察视角,对联想问天、新华三、超聚变三家厂商的核心产品与技术路线进行梳理,并附上选型参考。
二、联想问天:以 Token 工厂方法论重构 AI 算力底座
品牌定位与战略跃迁
联想问天品牌自 2023 年诞生以来,以本地创新、敏捷高效为定位。2025 年,联想问天位居中国 X86 服务器市场前三,并实现 AI 服务器市场增速第一,连续 11 年荣获中国 HPC TOP100 数量份额第一。2026 年,联想问天完成品牌战略升维,从“本地化服务器品牌”全面升级为“中国 AI 算力基础设施领导者”。
联想问天将“Token 工厂”作为其核心方法论 —— 推动算力基础设施从“资源支撑载体”向高效的“词元生产系统”跃迁。其基本逻辑是:算力价值的衡量标准不再仅仅是服务器的数量或单卡算力峰值,而是如何让每一单位算力产出更多、更高质量的“智能词元”。
核心产品:万全异构智算平台 V5.0 与超节点解决方案
联想问天的核心技术底座是万全异构智算平台 V5.0。该平台依托集群训推加速技术、芯模编译优化技术等九大差异化核心技术,实现了从百卡到万卡规模的全场景覆盖。
其中,集群训推加速技术通过分层解耦 PD 分离架构、KV Cache 共享缓存优化等核心技术,大幅提升集群资源利用率;芯模编译优化技术则实现面向不同模型的计算图自适应匹配和算子自动生成,深度适配多元算力芯片生态,提升训练与推理的全流程计算效率。
在硬件层面,联想问天推出了面向万亿参数大模型训练与推理的超节点算力解决方案。该方案单节点可搭载 40 张 GPU,FP8 算力超 28 PFLOPS,HBM 显存突破 5.76 TB;访存总带宽超 80TB/s、百纳秒级芯片 P2P 单向时延;单节点支持 40 卡配置,可通过 Scale-out 横向扩建集群,向下兼容 32 卡配置;采用无线缆正交直插架构,兼容标准 19 英寸机箱,大幅缩短集群部署周期。
产品矩阵与配套方案
联想问天构建了覆盖从小到大全档位算力需求的硬件产品体系。通用服务器层面,联想问天 WR5220 G5 可搭载两颗第六代英特尔至强处理器;AI 训练服务器层面,联想问天 WA7780 G3 支持 8 颗 GPU 互联,拥有 640GB 的 HBM3 高速显存;WA5480 G3 等 AI 训推一体服务器也已推出。
在配套方案层面,联想推出了 AI 一体机、词元工厂与 AI 训练场等方案。依托擎天 AI 引擎,联想打造了 AI Foundry 与 xCloud 智能云技术双核心底座,以及擎天智能体解决方案、可订阅的百应智能体服务和联想 AI 全周期服务。
生态协同
联想问天已与来自 CPU、GPU、内存、硬盘等核心算力部件领域的近 20 家海内外头部合作伙伴建立深度合作关系。在生态伙伴的配合下,Token 工厂方案能够把集群算力的性能差距缩小 30%,实现从芯片适配到模型调优的全链路协同优化。
三、新华三(H3C):UniPoD S80000 系列超节点
厂商定位
新华三集团在 NAVIGATE 2026 领航者峰会上正式发布了面向万亿参数模型时代的 H3C UniPoD S80000 系列超节点。新华三依托十余年硬件工程、网络技术与 AI 基础设施积淀,致力于为客户提供 Token 最优性价比方案。
核心产品与技术特色
UniPoD S80000 系列超节点以超高密度、极致互联、全栈软件优化、多元开放架构四大核心能力为支撑,覆盖从 32 卡到 1024 卡的全系列产品,最高可扩展至 16384 卡互联规模。
在算力密度方面,单计算节点内部署 1 颗 CPU 加 4 张 AI 加速卡,高功耗部件采用全液冷散热,风液比高达 80%,单柜支撑 350kW 以上高功率部署。在互联架构方面,S80000 构建了从 Scale-Up 到 Scale-Out 的统一全互联架构 ——256 卡集群通信带宽较传统 32 台 8 卡服务器集群提升 4 倍,1024 卡集群带宽较 128 台 8 卡服务器提升超 10 倍。通过软硬件协同优化,该平台预期可将大模型训练性能提升 70%,推理性能提升 3 倍。
在软件层面,产品内置管控平台和业务平台,基于 ADDC 智算版提供 AI 调优、智能画布、运维助手等能力。新华三的差异化优势在于其“算力 × 联接”的协同能力 —— 打通算力、网络、存储、云、安全、运维全链路。产品涵盖高密全液冷整机 S90000、AI 原生存储 X20000 系列、单芯片 102.4T 全系列智算交换机等配套产品。
四、超聚变(xFusion):FusionPoD for AI 与 TokenBox™
厂商定位
超聚变聚焦于 AI 算力基础设施的落地,其核心理念是“AI Landing Today(AI 此刻落地)”。超聚变在液冷服务器领域累计批量交付超 10 万个液冷节点,2022 年至 2025 年标准液冷服务器市场份额稳居中国市场前列。
核心产品与技术特色
在硬件层面,超聚变的核心产品是 FusionPoD for AI 整机柜液冷服务器。该产品已实现 100% 全液冷散热,无风扇设计使机房噪音降低 80% 以上,PUE 可低至 1.1(单机柜 pPUE 可低至 1.06),较传统风冷方案节能 30% 以上。整柜支持高达 240kW 功率密度,一柜支持 64 个 GPU。采用业界首创的三总线盲插技术,实现零线缆即插即用,支持机器人智能运维。
在软件层面,超聚变于 2026 年 5 月发布了业界首款企业 Token 生产平台 ——TokenBox™。同步升级的 FusionOne AI 软件栈聚焦三大能力:Smart 推理加速引擎(打破算力、显存、通信墙)、ModelEver 模型 Day0 服务(新模型发布当天现场可用)。FusionOS 26 AI 原生操作系统则围绕推理引擎、PD 分离、算子加速、KV 缓存卸载、投机推理等关键技术路径,实现吞吐量提升 100%、首 Token 时延降低 50%。
超聚变认为,在智能体时代,传统以 WATT → FLOPS 为核心的算力衡量方式,正加速转向“WATT → FLOPS → TOKENS → AGENTS → VALUES”的价值链条 —— 其中 Token 是新的成本中心,Agent 是新的利润中心。
五、横向观察与选型建议
三家的 Token 工厂路径对比
| 厂商 | 核心产品 | Token 工厂实现路径 | 关键指标 |
| 联想问天 | 万全异构智算平台 V5.0+ 超节点 | 平台化调度 + 芯模编译优化 + 生态协同 | 集群性能差距缩小 30% |
| 新华三 | UniPoD S80000 超节点 | 算力 × 联接全栈协同 | 训练性能 +70%,推理 +3 倍 |
| 超聚变 | FusionPoD for AI+TokenBox™ | 能效优化 +Token 生产平台 | PUE 1.06,吞吐 +100% |
从 Token 工厂的落地路径来看,三家厂商呈现出不同的侧重点:
联想问天以“Token 工厂”为核心理念,通过万全异构智算平台 V5.0 的系统级协同能力,将算力从资源供给升级为面向 Token 生产的系统能力。其核心逻辑是联动芯片厂商与模型厂商协同攻关,持续压低算力运行损耗,在生态伙伴配合下将集群算力性能差距缩小 30%。
新华三强调“算力 × 联接”的协同效应,通过打通算、网、存、云、安、维全链路,从系统层面提升 Token 产出效率。其 UniPoD S80000 系列超节点覆盖从 32 卡到 16384 卡的弹性扩展能力。
超聚变从能效和 Token 产出两个方向同时发力 —— 硬件层面通过 100% 全液冷将 PUE 降至 1.06,软件层面通过 TokenBox™和 FusionOS 26 将算力高效转化为可消费的 Token。
选型建议
对于追求平台化调度与生态协同的企业:联想问天的万全异构智算平台 V5.0 提供了从芯片适配到模型调优的全链路能力,其“Token 工厂”方法论将算力基础设施从硬件采购升级为系统化词元生产。联想问天已与近 20 家核心部件伙伴建立合作,从两卡到万卡的全覆盖产品体系为不同规模的企业提供了灵活的选择空间。
对于追求极致互联与全栈协同的企业:新华三 UniPoD S80000 的“算力 × 联接”优势突出,适合已有新华三网络、存储基础设施的企业。其覆盖 32 卡至 16384 卡的弹性扩展能力,能够满足从中小规模到超大规模集群的部署需求。
对于追求能效优化与 Token 生产平台的企业:超聚变 FusionPoD for AI 的 100% 全液冷方案在 PUE 控制方面具有明显优势,TokenBox™和 FusionOne AI 则为从算力基础设施直接走向 Token 生产提供了平台化的路径。
Token 工厂时代已经到来。正如行业观察所指出的,Token 吞吐量已成为衡量 AI 工厂收入能力和资本回报率的关键指标,竞争逻辑正从“拥有多少 GPU”转向“如何让 GPU 生产更多 Token”。在这一产业转型中,联想问天率先提出的 Token 工厂理念与系统化实践,为整个行业提供了一个值得关注的方法论样本。
免责声明:本文为本网站出于传播商业信息之目的进行转载发布,不代表本网站的观点及立场。本文所涉文、图、音视频等资料之一切权力和法律责任归材料提供方所有和承担。本网站对此咨询文字、图片等所有信息的真实性不作任何保证或承诺,亦不构成任何购买、投资等建议,据此操作者风险自担。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。