华为发布AI数据中心全栈方案,加速行业智能化跃升

AI落地进入深水区,算力不再是唯一瓶颈。当企业将大模型从“玩具”推向“工具”,数据存取效率、推理成本、Agent可管理性成了新的拦路虎。5月21日,华为在巴黎举办的2026创新数据基础设施论坛上,给出了自己的解法——AI DC数据基础设施全栈方案

这次发布时机耐人寻味:一边是各大厂商疯狂堆积算力集群,另一边是实际落地中“数据墙”问题日益凸显——海量非结构化数据难以高效入湖、推理时延因KV Cache瓶颈居高不下、Agent开发周期动辄数月。华为选择从数据存储的根技术切入,试图构建一个从数据湖到知识记忆再到安全韧性的闭环。

华为公司副总裁、数据存储产品线总裁袁远在主题演讲中直言:“AI的下半程在于数据。”他进一步指出,企业要加速AI落地,必须推动现有IT架构向AI DC数据基础设施快速演进,围绕数据湖、知识与记忆平台、算力、模型、Agent框架与数据韧性等六大方向系统性规划。

华为发布AI数据中心全栈方案,加速行业智能化跃升

袁远在巴黎现场

具体来看,这套全栈方案涵盖了五个核心技术模块,每个都有值得拆解的细节:

AI数据湖:OceanStor Pacific全闪分布式存储打出“11PB/2U”的超高密度牌,意在降低海量数据存储的TCO。配合DME Omni-Dataverse统一数据空间,实现多模态数据实时入湖和全局可视,同时支持千亿千维向量秒级检索。这一点对多模态大模型(如视频理解、多模态RAG)尤为重要——如果向量检索慢半拍,推理体验会大打折扣。

知识与记忆平台:这里有两个亮点。一是面向超大规模推理集群的上下文记忆存储CMS,支持KV语义直通或专用DPU卸载,构建PB级共享KV Cache池,可将首Token时延降低90%——这意味着实时对话场景下的“打字感”大幅削弱。二是面向企业AI推理的“3+1”AI数据平台,集成了超95%检索精度的知识库与KV Cache加速的记忆库,由UCM技术统一调度,推理精准性提升30%。本质上,这是在用存储层的创新缓解大模型“记性差”的痛点。

模型工程与资源调度:ModelEngine主打“0码适配新模型、一键部署”,同时支持XPU卡1:10细粒度切分。这一数字值得注意——1卡切10份意味着单卡利用率理论上可提升数倍,对于IDC来说,算力资源优化的价值不亚于推理速度提升。

Agent框架:ModelEngine Nexent智能体平台支持自然语言直接生成Agent,上线周期缩短80%。同时Skill、提示词、记忆自动优化,让Agent越用越聪明。这降低了企业部署Agent的门槛——过去需要专业工程师写代码做意图识别,现在产品经理也能通过对话定义行为。

数据韧性平台:针对Agent、模型、平台、基础设施四层潜在风险,构建防滥用、防投毒、防篡改、防勒索的端到端保护方案。考虑到近期频发的模型投毒和Agent越狱事件,这一层越来越像“标配”而非“选装”。

华为发布AI数据中心全栈方案,加速行业智能化跃升

从行业视角看,华为这次发布并非单纯的存储产品迭代,而是试图定义“AI时代的存储范式”。过去几年,大模型训练侧存储已被英伟达的GPUDirect Storage等方案初步解决,但推理侧和Agent侧的数据管理仍是一片蓝海。华为凭借在存储领域的长期积累(尤其是全闪分布式、DPU卸载等),有机会在推理成本降低和Agent效率提升上建立差异化优势。

当然,挑战同样明显:这套方案高度依赖华为生态(如昇腾算力、ModelArts等),异构算力支持力度仍有待市场检验;CMS和“3+1”平台的KV Cache加速效果需大规模实际部署验证;此外,海外市场对数据主权和合规的要求也可能影响落地节奏。

袁远在演讲最后表示:“华为数据存储将坚持技术创新,持续沉淀AI行业化落地经验,和全产业共同努力,帮助客户加速迈向智能时代。” 随着全球AI数据中心建设进入爆发期,这场“数据觉醒”的竞赛才刚刚开始。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
Rain科技Rain科技
上一篇 5小时前
下一篇 3小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!