欧宝官方站网站

设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

富士通介绍 PHOTON 框架:1.2B 模型多查询性能 475 倍于 Transformer

2026/6/25 17:59:55 来源:IT之家 作者:溯波(实习) 责编:溯波

IT之家 6 月 25 日消息,富士通 (Fujitsu) 日本当地时间昨日介绍了其开发的 PHOTON(自上而下网络并行分层计算)架构,宣称其在多查询(生成多个备选结果并在此基础上给出最终答案)场景下性能至高可达主流 Transformer 架构的 475 倍。

富士通表示,Transformer 架构的一大弊病是其在长上下文输入或多线程同步处理的场景下会执行大量访存操作来保留历史信息,这往往会导致处理速度下降。PHOTON 能高效率低开销地处理智能体系统等多 I/O 流程,从而降低 GPU 成本。

▲ 左:语义分层;右:并行计算

PHOTON 架构在语义层面上进行分层处理,相较 Transformer 的词元级分割可降低计算复杂度并提供了更好的并行性。而在多查询最后的决策环节,PHOTON 则采用了多数决定或选择最佳的方式,仅需一次推理。

测试结果表明,PHOTON 在 600M、900M、1.2B 等参数规模相对较小的模型中可实现更高的迭代吞吐量和更低的内存占用,其中 1.2B 模型上实现了 475 倍性能和略低的质量。此外,由于 PHOTON 架构每次迭代所需的 KV Cache 更少,还能提升最大迭代次数。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

欧宝官方站网站相关的文章

关键词:富士通人工智能

软媒旗下网站: IT之家 最会买 - 返利返现优惠券 Win7之家 Win10之家

软媒旗下软件: 软媒欧宝官方站网站-Opel ob(中国)APP应用 魔方