在备受瞩目的华为开发者大会HDC 2025上,华为云计算领域迎来了一次重要的技术跃升。华为常务董事兼云计算CEO张平安先生正式发布了盘古大模型5.5版本。此次更新覆盖了自然语言理解(NLP)、计算机视觉(CV)、预测、多模态以及科学计算五大关键领域,为各行各业注入了新的发展动力和技术价值。
盘古大模型5.5的发布,标志着华为在人工智能基础大模型领域取得了显著的进展。张平安先生在大会上特别强调,盘古大模型5.5是完全基于华为昇腾云强大的全栈软硬件协同环境训练而成。这一成就不仅凸显了华为在软硬件一体化方面的领先优势,也进一步巩固了昇腾架构在全球大模型训练与推理领域的领先地位。基于昇腾的训练,意味着模型能够更高效率,更低能耗地完成学习与迭代。
具体而言,在自然语言处理(NLP)方面,盘古大模型5.5引入了创新性的718B深度思考模型。据介绍,这是一个采用MoE(混合专家)架构,由高达256位专家参与训练的大型模型。该模型在知识推理、工具调用和数学计算等多个方面都展现出卓越的性能提升,达到了行业领先水平。 通过通算掩盖、全局动态均衡以及分组混合专家MoGE等一系列创新算法的加持,盘古大模型5.5在昇腾平台上实现了高效的训练和推理,其MFU(模型浮点利用率)训练和单卡推理吞吐量均达到了业界领先水平。这意味着在同等硬件条件下,盘古5.5能够更快、更高效地处理NLP任务。
为了进一步提升用户体验,盘古大模型5.5在高效长序列处理、低幻觉现象控制、快慢思考融合以及Agent(智能代理)技术等方面进行了全面升级。其中,自适应快慢思考合一技术尤为值得关注。这项技术通过构建难度感知的数据集和两阶段渐进式训练流程,使模型能够根据问题的复杂程度灵活切换思考模式,实现简单问题快速响应,复杂问题深入思考。这种智能调整不仅提高了模型的整体推理效率,据称提升了高达8倍,也使其在实际应用中更具灵活性和适应性。
盘古深度研究工具DeepDiver也表现抢眼。通过长链难题合成和渐进式奖励等关键技术的应用,DeepDiver在网页搜索和常识性问答等应用场景中展现出极高的效率。官方数据显示,DeepDiver能够在短短5分钟内完成超过10条的复杂问答,并生成字数过万的专业调研报告,从而显著提高工作效率。这对于信息搜集、分析和报告撰写等工作而言,无疑是一项强大的辅助工具。
除了NLP领域的突破,张平安先生还详细介绍了盘古大模型在计算机视觉(CV)、预测、多模态和科学计算等基础模型方面的技术升级。这些升级不仅显著提升了模型的性能和准确性,还在农业、工业、科研等多个领域催生了丰富的创新应用和落地实践。 盘古大模型正逐渐成为行业AI领域的领头羊,为解决各行业的实际问题提供强有力的技术支持。例如,在农业领域,盘古大模型可以应用于精准农业,根据作物生长情况和环境数据,提供智能化的种植建议;在工业领域,它可以用于故障诊断和预测性维护,减少设备停机时间,提高生产效率。 随着技术的不断发展和应用场景的持续拓展,盘古大模型有望在更多领域发挥更大的价值。