首页 > 新闻资讯 > 新闻详情

AI推理专题研讨会成功举办,共研智能体时代存算协同新路径

2026-05-12

当前,人工智能产业正处于从基础模型研发向规模化应用落地的关键转折。随着大模型在对话问答、工具调用、多智能体协作等场景的快速渗透,推理环节在AI全链条中的战略地位持续上升。在此背景下,AI算力供需体系正面临一场由计算范式变革驱动的深层调整。

为研判技术方向、凝聚产业共识。2026年5月9日,中国信息通信研究院在雄安新区组织召开AI推理工作组专题研讨会。

640 (9).png

本次会议由中国信通院云大所数据中心部副主任王月主持,华为、浪潮信息、中科曙光、智元芯(芯途异构)、东方算芯、清微智能、算苗科技、大普微电子、得一微电子等企业代表受邀参加,围绕智能体推理场景下的算力体系特征、存算协同技术路径与标准布局等话题展开深度研讨。

640 (10).png

王月

中国信通院云大所数据中心部副主任

智能体推理正驱动AI算力体系范式变革

当前大模型产业正经历从训练驱动向推理驱动的结构性转变,智能体应用的快速普及使推理负载的算力需求特征发生显著变化。中国信息通信研究院工程师何适指出,智能体推理已演变为涵盖状态数据管理、多次迭代、多模态协同、工具链调用等特征的全新计算负载。AI基础设施的优化重心需要从单纯的算力密度提升扩展至算力、存力、网络与资源调度的系统级协同。

640 (11).png

何适

中国信息通信研究院工程师

多条技术路径并行

探索智能体推理时代存算协同新模式

智能体记忆数据管理:破局推理瓶颈,加速行业智能体落地

针对长序列上下文存储受限、历史推理状态难以复用等技术挑战,华为存储训推加速领域专家汪子凡展示了统一推理记忆数据管理的技术思路。通过前缀缓存复用、KV Cache稀疏化压缩、跨位置KV拼接复用等技术有效降低重复计算开销,助力长序列推理效率与系统扩展性提升。同时在存算分离架构优化方面做出技术分享,为大规模推理集群部署提供新的架构建设思路。

640 (12).png

汪子凡

华为存储训推加速领域专家

AI原生存储架构:重塑智能体数据底座,打通高性能数据供给

AI Agent应用的快速普及正推动存储从数据底座升级为服务智能算力的高性能平台。浪潮信息存储产品部总监王少磊分享了面向Agent Memory的AI原生并行存储架构,通过全链路用户状态处理、原生KV接口、存算直联等技术实现更低时延与更高带宽的数据供给,并搭配多租户隔离与全链路审计等机制为企业级智能体部署提供安全保障。

640 (13).png

王少磊

浪潮信息存储产品部总监

3D堆叠封装:突破内存-功耗双瓶颈,探索自主可控创新路线

模型规模与上下文长度持续增长,内存带宽与容量以及数据搬运开销正成为影响推理性能与能耗的关键因素。算苗科技首席AI科学家楼建光分享了基于3D混合键合先进封装技术的存算融合架构,通过计算核心与存储单位的超高密度垂直互连提升片内带宽、降低数据搬运开销,实现推理算力突破,为我国推理算力发展提供差异化技术思路。

640 (14).png

楼建光

算苗科技首席AI科学家

AI推理存储生态:推进接口标准化,深度释放SSD更大价值

随着智能体推理中上下文长度的快速增长,海量KV Cache的持久化管理成为基础设施优化的重要方向。深圳大普微电子首席架构师李根在会上围绕高性能SSD在低时延、高IOPS、大容量和多形态部署方面的能力分析其推理场景中的潜在价值。结合AI数据平台、高端全闪文件存储、智能数据分层与自适应I/O调度等方向构建,分享统一开放的AI推理存储生态理念。

640 (15).png

李根

深圳大普微电子首席架构师

AI Memory扩展:突破显存物理限制,降低大模型部署门槛

当前大模型推理与微调对显存容量的需求快速增长,大模型应用创新门槛显著升高。得一微电子技术副总监张淏楠分享通过存储主控技术实现GPU高带宽内存与闪存的高频数据交换,将闪存从冷数据存储扩展为温/热数据内存,有效突破GPU物理显存容量限制,推动大模型推理与微调向边缘场景延伸,对促进AI基础设施的普惠化发展具有积极意义。

640 (16).png

张淏楠

得一微电子技术副总监

标准预研:

凝聚共识,推进智能体算力体系标准化

研讨会期间,中国信息通信研究院工程师苏浩对工作组当前开展的标准推进工作进行介绍。与会成员代表就智能体推理算力协同技术要求与智能体推理能力要求及测试方法两方向开展标准预研讨论。在推理算力协同方面,探讨了不同类型智能体任务与计算、存储、网络资源之间的映射关系,旨在为资源配置、集群规划和成本测算提供统一的参照框架。在推理能力要求与测试方法方面,初步形成涵盖任务完成质量、系统稳定性、资源利用效率等多个维度的评测体系设计。

640 (17).png

苏浩

中国信息通信研究院工程师

与会成员代表就构建科学合理标准体系、推动技术进步达成共识。指出建立科学合理的算力协同体系与测试方法,对于帮助供需建立可量化的信任基础、引导产业有序发展具有重要意义。

640 (18).png

640 (19).png

面向下一步工作,中国信息通信研究院将继续依托算力产业发展方阵平台,联合成员单位深化智能体推理技术体系研究,推动标准研制工作,促进产学研协同攻关,为我国人工智能基础设施的技术创新与生态培育提供支撑。

联系人

何老师 15910953232 heshi@caict.ac.cn

苏老师 13021269299 suhao@caict.ac.cn

王老师 18601152291 wangyue2@caict.ac.cn

640 (20).png

640 (21).png

640 (22).png

关注我们
联系我们
中国信通院云大所 数据中心团队
<< 上一篇
算力聚势 网筑生态|算力产业发展方阵算网融合工作组会议顺利召开
下一篇 >>
智算聚势·Token引航 | 算力产业发展方阵大模型算力工作组会议顺利召开
返回顶部