近年来,中国在人工智能领域取得了长足的进步,尤其是在大模型技术方面,已经涌现出一批达到国际领先水平的成果。与此同时,国内AI芯片企业也积极行动,加速与国产大模型的适配工作,力图构建完整的智能计算产业生态。这种合作关系至关重要,它将决定中国AI产业能否真正实现自主可控和可持续发展。
中国信息通信研究院(信通院)作为国家级技术验证平台,在这一进程中扮演着关键角色。通过“人工智能芯片测试评估公共服务平台”,信通院建立了AI芯片与大模型协同适配的标准化体系,为产业链上下游的深度合作搭建桥梁。该平台开展的适配验证工作,旨在解决AI芯片与大模型之间可能存在的兼容性、性能优化等问题,从而推动双方的协同发展。
值得关注的是,摩尔线程自主研发的训推一体计算卡MTT S4000,近日成功通过了信通院的《AI芯片和大模型适配能力通过性评测软硬件环境及测试细则》推理场景验证。与杭州深度求索人工智能基础技术研究有限公司研发的DeepSeek-R1 671B大模型的适配结果显示,MTT S4000不仅运行稳定,完全满足DeepSeek-R1 671B大模型的推理需求,还获得了相应的检测证书。这一成果标志着国产GPU在支持国产大模型方面取得了重要突破。
MTT S4000是基于摩尔线程的全功能GPU架构设计的,专为大模型应用场景量身打造的通用计算卡。它支持FP64、FP32、TF32、FP16、BF16和INT8等多种计算精度,配备48GB的高性能显存,能够灵活地处理各种复杂计算任务。此外,MTT S4000还支持摩尔线程自研的MTLink1.0技术,可以实现多卡互联和大规模集群部署,为千亿参数大模型的训练、微调和推理提供强大的算力支撑。除了人工智能领域,MTT S4000还具备先进的图形渲染、视频编解码和超高清8K HDR显示能力,能够满足科学计算、多媒体处理等多种复合场景的需求。
摩尔线程之所以能够迅速完成与DeepSeek R1-671B大模型的适配验证,关键在于其完善的MUSA生态软件栈和高效的开发实践。 vLLM_MUSA推理框架、MUTLASS、Triton-MUSA等技术的应用,不仅展现了MUSA软件栈的高效适配能力,也使得MTT S4000的整体性能达到了行业主流水平。这充分证明了摩尔线程在国产GPU技术创新和生态建设方面的实力。
为了进一步降低大模型的应用门槛,摩尔线程还推出了搭载MTT S4000的MCCX DeepSeek大模型一体机。该产品融合了国产全功能GPU、深度优化的高性能推理引擎和软件栈,全面支持从蒸馏版到671B参数全量版的DeepSeek模型部署需求。MCCX DeepSeek大模型一体机可以灵活适配广泛的行业、场景和应用,并通过摩尔线程的自主技术链,实现开箱即用、安全可控的一站式大模型服务。对于希望快速部署和应用大模型的政企客户来说,这无疑是一个极具吸引力的选择,可以大大简化部署流程,降低使用成本。