热搜:
中国版范海辛?国外博主向玩家科普“钟馗是谁”“高烧难退”的动力煤,拐点或悄然逼近?刘昊然为欧阳娜娜庆生:你的生日我从未缺席 两人是什么关系

快捷

logo

综合

(电子发烧友网报道 文/章鹰)8月12日,破解在2025金融AI推理应用落地与发展论坛上,赖A理黑华为公司副总裁、科技开源数据存储产品线总裁周越峰宣布,线月华为此次和银联联合创新,正式推出AI推理创新技术UCM(推理记忆数据管理其器)和管理系统的破解算法,这项突破性成果降低对HBM技术的赖A理黑依赖,提升国内AI大模型的科技开源推理能力。


该技术是线月一款以KV Cache为中心的推理加速套件,UCM集成了多类型缓存加速算法工具,正式实现推理过程中KV Cache记忆数据的破解分级管理,从而扩大推理上下文窗口,赖A理黑提升推理效率。科技开源“银联的线月实际案例和大量测试显示,UCM显著降低首Token的正式时延,最高降低90%,系统吞吐率最大提升22倍,上下文的推理窗口可以扩展10倍以上,这是对于AI推理系统一个巨大的进步。” 周越峰指出。

华为UCM技术已率先应用在中国银联“客户之声”、“营销策划”和“办公助手”三大业务场景,开展智慧金融AI推理加速应用试点,并且已经取得成果。华为表示,计划于2025年9月正式开源UCM,将在魔擎社区首发,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

AI大模型推理给存储带来哪些挑战?UCM的创新之处如何解读?本文结合中国信通院人工智能研究平台与工程化部主任曹峰、华为数据存储产品线AI存储首席架构师李国杰的观点,进行详细分析。

AI大模型推理给存储带来三重挑战

“ChatGPT的访问量呈现线性增长,最新访问量达到4亿,受益于中国AI大模型DeepSeek爆发,日均调用量也在快速上升,2025年1月开始,中国AI推理的需求增长20倍,未来三年算力需求爆发。IDC表示,2024年算力需求60%是训练,40%是推理,到2027年中国用于推理的算力需求——工作负载将达到72.6%。” 中国信通院人工智能研究平台与工程化部主任曹峰分析说。

当下,AI大模型推理应用落地中,遇到推不动、推得慢和推得贵的三大挑战。首先,长文本越来越多,输入超过模型上下文窗口的内容,推理窗口小就推不动;其次,由于中美在AI基础设施的差距,中国互联网大模型首Token时延普遍慢于美国头部厂商的首Token时延,时延长度为后者的两倍;推得贵,美国大模型的推理吞吐率为中国大模型推理吞吐率的10倍。

华为公司副总裁、数据存储产品线总裁周越峰指出,AI时代,模型训练、推理效率与体验的量纲都以Token数为表征,Token经济已经到来。

在AI基础设施投资,中国和美国有差距,为了保障流畅的推理体验,企业要加大算力投入,但是如何改善AI推理的效率和体验,在推理效率与成本之间找到最佳平衡点?华为推出UCM,以KV Cache和记忆管理为中心提供全场景化系列化推理加速能力。

UCM两大关键能力和创新算法,破解HBM受困难题

HBM是解决"数据搬运"的关键技术。当HBM不足时,用户使用AI推理的体验会明显下降,导致出现任务卡顿、响应慢等问题。华为此次技术突破有望缓解这一瓶颈。

华为重磅推出UCM推理记忆数据管理器,包括对接不同引擎与算力的推理引擎插件(Connector)、支持多级KV Cache管理及加速算法的功能库(Accelerator)、高性能KV Cache存取适配器(Adapter)三大组件,通过推理框架、算力、存储三层协同,实现AI推理“更优体验、更低成本”。

UCM的创新之处,在于可以根据记忆热度在HBM、DRAM、SSD等存储介质中实现按需流动,同时融合多种稀疏注意力算法实现存算深度协同,使长序列场景下TPS(每秒处理token数)提升2至22倍,从而降低每个Token的推理成本。

“实时数据放在HBM当中,短期记忆数据放在DRAM中,其他数据就放在共享存储SSD中,极大提高系统的效率和AI推理能力。针对AI推理平衡成本和效能的挑战,华为推出UCM统一的记忆数据管理器,在两个层面以系统化的方案来解决问题。” 华为数据存储产品线AI存储首席架构师李国杰表示。

一、在底层的框架和机制上提供了多级缓存空间,构建智能管理以及智能流动的基础框架能力。在此基础之上,华为构筑了一系列创新的推理的加速算法和加速特性,包括自适应的全局Prefix Cache,降低首Token时延与单位Token成本。

二、采用动态的Training稀疏加速算法,倍数级提升长序列吞吐和体验。还有后缀检索、预测加速算法、PD检索加速和Agent原生记忆加速。

UCM将超长序列Cache分层卸载至外置专业存储,通过算法创新突破模型和资源限制,实现推理上下文窗口的10倍级扩展,满足长文本处理需求。

中国银联执行副总裁涂晓军分享说,华为与中国银联的联合创新技术试点中,在中国银联的“客户之声”业务场景下,借助UCM技术及工程化手段,大模型推理速度提升125倍,仅需10秒就可以精准识别客户高频问题,促进服务质量提升。

众所周知,目前,AI大模型训练对内存带宽需求呈指数级增长,传统DDR内存已无法满足需求。HBM(高带宽内存)是一种专用内存技术,用于 AI 处理器GPU和 HPC 系统,这些系统中带宽和能效比原始容量更为重要。HBM3 每堆栈可提供高达 819 GB/s 的传输速度,对于支持大型语言模型 (LLM)、神经网络训练和推理工作负载至关重要。

但是去年12月以来美国将HBM2E列入对中国的禁售清单,国产厂商HBM的突破还在推进中,华为推出UCM的重大意义,在于加速推进国产AI推理生态,其核心价值是推进更快的推理响应和更长的推理序列,以及更优化的成本。

中国信通院人工智能研究平台与工程化部主任曹峰认为,国产化AI推理生态建设应该加速,KV Cache已经成为架构优化的焦点,以KV Cache为核心的推理方案迭出,背后依赖的高性能存储、先进调度策略的重要性愈发显现。

李国杰还强调指出,AI是一个快速发展的行业,每6个月就会迎来新一轮的技术革新,UCM不仅定位于当下,解决AI推理问题,未来发展UCM将从KV Cache分层管理走向Agentic AI原生记忆管理和应用加速。

本文由电子发烧友原创,转载请注明以上来源。微信号zy1052625525。需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱zhangying@huaqiu.com。

相关阅读

王牌地位稳固 招行摩羯智投规模超50亿

2025-08-27
随着国务院于7月20日发布《新一代人工智能发展规划》,要求到2030年中国人工智能产业竞争力达到国际领先水平,人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元,标志着人工智能正式上升为

三星全球首发Micro RGB 为高端显示技术树立标杆

2025-08-27
Micro RGB 以小于 100 微米的微型 LED,实现了卓越的色彩准确度,重塑超高端显示行业标准。近日,三星电子正式发布其全球首款Micro RGB,突破性地将微米级RGB LED背光技术应用于

河南技师奖励补贴申报启动!优秀人才最高可领1500元

2025-08-27
河南技师奖励补贴申报启动!优秀人才最高可领1500元发布时间:2017-12-17 11:31 来源:豫都网 我要投稿[摘要]省会优秀技能人才又有机会领取工会组织发放的职业技能提升“红包”!昨日,记者

厦门海沧港开启散货国际中转新业务模式

2025-08-27
东南网8月27日讯 福建日报记者 郑璜 通讯员 叶佳增) 近日,一艘运载着248件4756.79吨冷轧卷钢的散货轮缓缓驶离厦门通达码头,前往土耳其伊兹米特港,这标志着海沧港海运货物“国际中

《无人深空》“信标”免费更新正式上线

2025-08-27
聚落系统焕然一新,支持多聚落管理,画质全面升级科幻探索游戏《无人深空》(No Man’s Sky)正式带来免费更新“信标”(BEACON)。此次更新围绕聚落玩法进行了大幅改造,新增支持多聚落管理的功能

致匠心·平安木门:传承工匠精神,尊重匠人价值

2025-08-27
前言在家具领域,大众的尊重和认可,才是现代手艺人需要的鼓励。每一位匠人都有极强的自尊心,对于他们来说,工作能否被他人认可,直接关乎个人的荣辱。正因如此,他们对自己的工作极度认真,对制作的每一件家具都力

泉州市直宣传系统启动六中全会精神“先”讲行动

2025-08-27
深入学习贯彻十九届六中全会精神学在前讲在先 全会精神入人心泉州市直宣传系统启动六中全会精神“先”讲行动为迅速掀起党的十九届六中全会精神学习宣传贯彻热潮,市委宣传部坚持走在前、当

洛阳中学男生学"蜘蛛侠"取钥匙 从高楼坠落摔伤

2025-08-27
洛阳中学男生学"蜘蛛侠"取钥匙 从高楼坠落摔伤发布时间:2017-12-17 10:09 来源:豫都网 我要投稿[摘要]洛阳名中学男生学“蜘蛛侠”取钥匙 从高楼坠落摔伤 11月25日,大河报·大河客户

弄虚作假、冒黑烟……重型货车等尾气污染问题突出

2025-08-27
2022年2月14日,安徽芜湖,交警和环保部门工作人员一起,检测一辆大货车尾气排放达标情况。陈效宝/视觉中国2024年前三季度,长三角地区PM2.5平均浓度为32微克/立方米,同比上升6.7%;秋冬季

中粮酒业旗下产品荣获2025春季FIWA大奖赛多项荣誉

2025-08-27
2月12日,2025春季 FIWA、FIWA Bio & FISA法国国际葡萄酒、有机葡萄酒及烈酒大奖赛中国区获奖酒款正式公布。在本次大奖赛上,中粮酒业旗下长城葡萄酒获得12枚大金奖、7

mbr一体化污水处理设备

2025-08-27
mbr一体化污水处理设备 标签: 添加时间:2023-01-11 浏览次数:2013 一、工作原理MBR一体化污水

《异形:地球》中文正式预告 混血机器人对抗异形

2025-08-27
异形剧集《异形:地球》中文正式预告公开,该剧集由诺亚·霍利(《冰血暴》《大群》)执导兼编剧,基于《异形》系列电影。该剧被视为1979年电影《异形》的前传,故事时间线设定在该电影事件发生的两年前。主演阵

今日起停复牌个股一览 沪深股市实时行情(8月8日)

2025-08-27
证券时报股市大数据新媒体“数据宝”统计,沪深两市共有1只个股今日起开始停牌,其中沪市1只,今日起复牌的个股有7只,其中沪市4只,深市3只。详情如下表所示。(数据宝)今日起停牌个

宇曼家居十里河总店开业!全新高定品牌本庭易墅揭幕

2025-08-27
10月29日下午,宇曼家居十里河总店正式开业,全新高定品牌同期揭牌。宇曼家居总店的落地,是以全新升级的家居定制体验馆,应对市场同质化现状与不断变化的行业期待。新店不仅是产品的全新升级,更是对宇曼家居品

亞馬遜、Google雙雙裁員 今年科技大裁員仍會持續嗎?|天下雜誌

2025-08-27
經過了2023年科技業的大裁員風潮,今年的科技業裁員風潮仍然會持續嗎?新年伊始,包括亞馬遜和Google都傳出裁員的消息。該如何解讀?您的閱讀篇數已達上限立刻訂閱全閱讀,即可享全站不限篇數閱讀

实木家具选购注意事项~你都知道吗?

2025-08-27
判断家具是否真的为实木制成,或标明哪里是实木,哪里是人造板。窥实木的奥秘:木纹和疤结。这是业内人士透露的鉴别是否整块实木的方法。如一个柜门,外表看上去是一种花纹,那么相应着这个花纹变化的位置,在柜门的

防水涂料三重奏 促进行业健康持续发展

2025-08-27
近年来,质量问题在防水行业频繁上演着,虽然防水行业一直以来都以“小行业”自居,但实际上,防水产品的好坏却与人们的日常生活息息相关。为此,我们应当将目光投向国外,学习先进的技术、

凯力风牌乘龙国六11吨防役消毒洒水车产品说明专汽家园

2025-08-27
凯力风牌乘龙国六11吨防役消毒洒水车颜值同行业最高;配置同行业最高;价格同行业最低;价格欢迎来电咨询。凯力风牌乘龙国六11吨防役消毒洒水车整车外形尺寸8000,8100X2550,2500X3300,

嵌入式开发的核心选择

2025-08-27
RK系列核心板是基于瑞芯微(Rockchip)处理器的高集成度嵌入式模块,广泛应用于智能终端、工业控制、物联网和人工智能等领域。凭借出色的性能、低功耗和丰富的接口,RK核心板成为众多开发者及企业的首选

厦门市思明区各所学校多形式开启开学第一课

2025-08-27
东南网9月2日讯本网记者 林歆刚)9月2日,厦门很多师生回到校园迎接新学期开学第一天。记者从厦门市思明区教育局了解到,各所学校开启了开学第一课,各校师生通过开学典礼、升旗仪式、诵读表演等形式迎接新学期
小编推荐
猜你喜欢
如果觉得快捷不错,还请把快捷分享到你的微信好友、朋友圈、微博等,万分叩谢
「**」无微不至网为你提供,,,,等 http://m.butkkmaudience.xyz/
点我复制链接

俺也是有底线滴

© 2023 无微不至网 版权所有
为你提供,,,,等 http://m.butkkmaudience.xyz/