Rain科技4月30日消息,近日,阿里巴巴发布并开源了新一代通义千问模型Qwen3。该模型以相对较小的参数量(仅为DeepSeek-R1的三分之一),实现了性能上的全面超越,包括压过DeepSeek-R1和OpenAI-o1等全球顶尖模型,成为目前全球最强大的开源模型,引发了业界的广泛关注。
Qwen3发布当天,摩尔线程随即宣布,已率先完成了Qwen3全系列模型在其全功能GPU上的高效支持。这表明国产GPU在人工智能大模型领域的适配能力正在迅速提升。
摩尔线程方面表示,这一成果充分验证了其自主研发的MUSA架构以及全功能GPU的技术成熟度和可靠性。此次对Qwen3全系列模型的支持,无疑是对MUSA架构的一次重要检验,也为国产GPU在AI领域的应用奠定了坚实的基础。
目前,主流的推理引擎都已经可以在摩尔线程的MUSA平台上运行Qwen3系列模型。这意味着开发者可以更加便捷地利用摩尔线程的硬件资源来部署和运行Qwen3模型。
摩尔线程进一步指出,MUSA平台能够作为vLLM、Ollama、GPU Stack等各类主流开源推理引擎的后端,为Qwen3系列模型的高效运行提供强大动力。通过优化软件堆栈,摩尔线程旨在释放其GPU的全部潜力,从而提升Qwen3的推理速度和效率。
例如,QWen3-235B-A22B,作为Qwen3系列中参数量最大的模型,已经可以在基于vLLM-MUSA引擎的摩尔线程全功能GPU上稳定运行。 这标志着国产GPU在支撑超大规模模型方面取得了重要进展。
据了解,此次开源的Qwen3模型包括两款MoE(Mixture of Experts)模型:Qwen3-235B-A22B和Qwen3-30B-A3B;同时还包括六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。多样化的模型选择,旨在满足不同应用场景下的需求。
客观来讲,摩尔线程对Qwen3全系列模型的支持,不仅展示了国产GPU的进步,也体现了国内AI生态的协同发展。 随着国产硬件的不断完善和优化,相信未来将在人工智能领域发挥更大的作用。 当然,国产GPU在软件生态、性能优化等方面仍有提升空间,需要持续投入研发,才能真正与国际领先水平看齐。