加速原生创新 智谱携手昇腾、昇思打造自主创新原生模型

2024年8月19日,北京人工智能生态大会在中关村国家自主创新示范区会议中心颐和厅成功举行。会上,智谱AI CEO 张鹏发表了主题演讲,分享了昇腾对智谱自主创新大模型的助力,并介绍了正在打造的基于昇腾的第四代代码模型CodeGeeX4和多模态模型CogVLM2-video。

加速原生创新 智谱携手昇腾、昇思打造自主创新原生模型

智谱CEO 张鹏

与此同时,华为昇腾计算业务副总裁刘鑫也介绍了昇腾原生进展,并展示了昇腾在人工智能领域取得的最新成果。

加速原生创新 智谱携手昇腾、昇思打造自主创新原生模型

华为昇腾计算业务副总裁 刘鑫

昇腾赋能智谱大模型

智谱AI作为国内领先的人工智能企业,一直致力于打造自主创新的大模型。此次大会,智谱AI重点介绍了其基于昇腾平台开发的两款全新大模型:CodeGeeX4和CogVLM2-video。

1. 代码生成大模型CodeGeeX4

CodeGeeX4是智谱AI第四代代码生成大模型,也是业界首个基于昇腾AI与昇思AI框架训练的代码生成大模型。CodeGeeX4-ALL-9B版本仅用百亿级参数便实现了超越业界主流产品的精度水平。在NaturalCodebench等测试基准上,CodeGeeX4在性能上甚至超越了更大的模型。

CodeGeeX4以强大的功能和性能优势,成为代码生成领域的“六边形战士”:它能够实现编程开发全流程覆盖,包括需求设计、前端开发、后端开发、数据处理等场景;支持代码补全和生成、代码问答、代码解释器、工具调用、联网搜索、项目级代码问答等功能;拥有高达128K的长序列,支持20+自然语言和300+编程语言;最重要的是,它可以在本地私有化部署,保障企业代码安全。

加速原生创新 智谱携手昇腾、昇思打造自主创新原生模型
加速原生创新 智谱携手昇腾、昇思打造自主创新原生模型

2. 多模态大模型CogVLM2-video

CogVLM2-video是智谱AI推出的多模态大模型,它能够实现视频生成文本的能力,支持2K序列长度、224×224分辨率的视频理解以及中英文回答等功能。在多个视频问答任务上,CogVLM2-video达到了SOTA模型的性能,并在多个主流性能测试数据集上表现出色,彰显了其强大的竞争力。

加速原生创新 智谱携手昇腾、昇思打造自主创新原生模型
加速原生创新 智谱携手昇腾、昇思打造自主创新原生模型
加速原生创新 智谱携手昇腾、昇思打造自主创新原生模型

基于昇腾与昇思的新版本CodeGeeX4

CodeGeeX4的研发充分利用了昇腾平台的优势。在训练过程中,CodeGeeX4调用昇腾原生的融合算子,并利用昇思MindSpore AI框架提供的多维混合分布式并行能力,通过对流水交织并行、tensor模型并行的优化,实现了“计算、网络、存储”协同优化,对比同等规模参数的模型,训练效率提升了20%,加速了模型的迭代创新。

此外,CodeGeeX4还采用了MindSpore 2.3版本原创的多级编译技术,开启O1编译选项增加了自动算子融合优化,以接近动态图的启动时间获得了图模式下接近理论值的内存复用率,进而降低重计算比例,相对动态图获得了15%的性能收益。

智谱AI表示,未来将与昇腾AI持续合作,打造更多领先的自主创新大模型,加速中国人工智能产业发展,助力中国千行百业的智能化转型,共同迈向智能新世界。

加速原生创新 智谱携手昇腾、昇思打造自主创新原生模型
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
AI快讯网编辑-青青AI快讯网编辑-青青
上一篇 2024年 8月 21日 下午3:54
下一篇 2024年 8月 21日 下午4:57

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!