2024年8月19日,北京人工智能生态大会在中关村国家自主创新示范区会议中心颐和厅成功举行。会上,智谱AI CEO 张鹏发表了主题演讲,分享了昇腾对智谱自主创新大模型的助力,并介绍了正在打造的基于昇腾的第四代代码模型CodeGeeX4和多模态模型CogVLM2-video。

智谱CEO 张鹏
与此同时,华为昇腾计算业务副总裁刘鑫也介绍了昇腾原生进展,并展示了昇腾在人工智能领域取得的最新成果。

华为昇腾计算业务副总裁 刘鑫
昇腾赋能智谱大模型
智谱AI作为国内领先的人工智能企业,一直致力于打造自主创新的大模型。此次大会,智谱AI重点介绍了其基于昇腾平台开发的两款全新大模型:CodeGeeX4和CogVLM2-video。
1. 代码生成大模型CodeGeeX4
CodeGeeX4是智谱AI第四代代码生成大模型,也是业界首个基于昇腾AI与昇思AI框架训练的代码生成大模型。CodeGeeX4-ALL-9B版本仅用百亿级参数便实现了超越业界主流产品的精度水平。在NaturalCodebench等测试基准上,CodeGeeX4在性能上甚至超越了更大的模型。
CodeGeeX4以强大的功能和性能优势,成为代码生成领域的“六边形战士”:它能够实现编程开发全流程覆盖,包括需求设计、前端开发、后端开发、数据处理等场景;支持代码补全和生成、代码问答、代码解释器、工具调用、联网搜索、项目级代码问答等功能;拥有高达128K的长序列,支持20+自然语言和300+编程语言;最重要的是,它可以在本地私有化部署,保障企业代码安全。


2. 多模态大模型CogVLM2-video
CogVLM2-video是智谱AI推出的多模态大模型,它能够实现视频生成文本的能力,支持2K序列长度、224×224分辨率的视频理解以及中英文回答等功能。在多个视频问答任务上,CogVLM2-video达到了SOTA模型的性能,并在多个主流性能测试数据集上表现出色,彰显了其强大的竞争力。



基于昇腾与昇思的新版本CodeGeeX4
CodeGeeX4的研发充分利用了昇腾平台的优势。在训练过程中,CodeGeeX4调用昇腾原生的融合算子,并利用昇思MindSpore AI框架提供的多维混合分布式并行能力,通过对流水交织并行、tensor模型并行的优化,实现了“计算、网络、存储”协同优化,对比同等规模参数的模型,训练效率提升了20%,加速了模型的迭代创新。
此外,CodeGeeX4还采用了MindSpore 2.3版本原创的多级编译技术,开启O1编译选项增加了自动算子融合优化,以接近动态图的启动时间获得了图模式下接近理论值的内存复用率,进而降低重计算比例,相对动态图获得了15%的性能收益。
智谱AI表示,未来将与昇腾AI持续合作,打造更多领先的自主创新大模型,加速中国人工智能产业发展,助力中国千行百业的智能化转型,共同迈向智能新世界。
