在万众瞩目的华为开发者大会HDC2025上,华为云计算业务迎来了一座重要的里程碑。华为常务董事兼云计算业务CEO张平安先生,正式向全球开发者发布了备受期待的盘古大模型5.5版本。本次发布的重点在于对自然语言理解(NLP)、计算机视觉(CV)、预测、多模态以及科学计算这五大关键领域的全面升级,旨在为各行各业的应用场景注入更强大的AI动力。
张平安特别强调,盘古大模型5.5是基于华为自主研发的昇腾云全栈软硬件平台进行深度优化的结果。这一成果不仅证明了昇腾架构在全球大模型竞争中的实力,更预示着华为有能力打造世界一流水平的大模型。考虑到当前国际形势下,拥有自主可控的大模型技术对于国家信息安全和产业升级具有战略意义,盘古大模型5.5的发布无疑具有深远的意义。
在自然语言理解方面,盘古大模型5.5引入了全新一代的718B深度思考模型。该模型采用了由256个专家系统组成的MoE (Mixture of Experts) 混合专家架构,在知识推理、工具调用以及数学处理等方面展现出强大的性能。通过通算掩盖、全局动态均衡以及分组混合专家MoGE等一系列创新算法,盘古大模型实现了与昇腾平台的深度融合,显著提升了训练效率和单卡推理性能,达到行业领先水平。此外,模型亲和的词表设计、三明治架构以及EP-Group负载均衡loss等技术,进一步提高了模型的竞争力,使其在各项评测指标上能够与国际顶尖模型相媲美。
为了提升用户体验,盘古大模型5.5进行了全面的升级。例如,引入了自适应快慢思考合一技术,允许模型根据问题的复杂程度智能地切换思考模式,在简单问题上快速响应,在复杂问题上深入分析,从而将整体推理效率提升了8倍。盘古深度研究工具DeepDiver,则利用长链难题合成与渐进式奖励等关键技术,在网页搜索、常识性问答等应用场景中表现出色,能够在短时间内生成复杂问答和专业的报告,极大提高了工作效率。这种自适应的思考模式和强大的报告生成能力,无疑将极大地赋能各行各业的专业人士。
除了NLP领域,张平安还在会上介绍了盘古大模型在计算机视觉(CV)、预测、多模态以及科学计算等其他基础模型上的技术进展。他指出,盘古大模型不仅在技术上取得了突破,更重要的是,在农业、工业、科研等多个领域实现了丰富的创新应用和落地实践。这些实际应用案例证明了盘古大模型能够为行业难题提供切实可行的解决方案,并成为推动行业AI发展的核心力量。随着人工智能技术的不断发展,我们有理由相信,盘古大模型将在未来继续发挥更大的作用,为中国的数字化转型做出更大的贡献。