国产大模型“闪电”仅用2000张GPU追平GPT-4

近日,国内AI大模型公司零一万物发布了其最新的预训练旗舰模型Yi-Lightning(“闪电”),在国际权威榜单LMSYS上取得了显著成绩,排名世界第六,位居中国第一,超越了OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet等国际领先模型。

国产大模型“闪电”仅用2000张GPU追平GPT-4

这一突破标志着中国大模型技术在全球竞争中取得了重要进展,零一万物也因此跻身全球前列,紧随OpenAI和Google之后。Yi-Lightning的优势不仅体现在其性能的提升上,更在于其显著优化的推理速度和成本。相比公司此前发布的Yi-Large模型,Yi-Lightning的首包时间缩短了一半,最高生成速度提升近四成,而每百万token的推理成本仅需0.99元,接近行业最低。

Yi-Lightning在LMSYS Chatbot Arena总榜上的表现同样出色,在中文分榜上与世界第二名并列,并在多轮对话、数学能力、代码能力等多个分榜上取得世界前列的成绩,超越了xAI的Grok-2-08-13和智谱的GLM-4-Plus等国内外优秀模型。

零一万物能够在短时间内取得如此显著的成果,与其在芯片、推理、基础架构和算法等多个维度的深厚积累密不可分。 这使得他们能够有效地实施“模基共建”战略,持续优化模型性能并降低推理成本。其中,Yi-Lightning采用混合专家模型架构(MoE),并结合混合注意力机制(Hybrid Attention)和动态Top-P路由机制等技术创新,实现了性能与效率的平衡以及对不同任务的智能适配,从而实现了“极速推理”。

Yi-Lightning的应用也已拓展到多个领域。例如,零一万物最新推出的AI 2.0数字人产品已接入Yi-Lightning,并在零售和电商领域展现出强大的实时互动和话术生成能力。据悉,某酒旅企业在接入该数字人直播后,GMV增长了170%,为其商业落地提供了可观的案例。

国产大模型“闪电”仅用2000张GPU追平GPT-4

零一万物的成功,为中国大模型行业发展提供了宝贵的经验:坚持“模型+AI Infra+应用”三位一体的全栈式布局,以国际领先的基座模型为基础,积极开发企业级解决方案,从而构建健康的行业生态。目前,Yi-Lightning已上线Yi大模型开放平台(https://platform.lingyiwanwu.com/),每百万token仅需0.99元,旨在推动大模型技术的普及和应用。

面对算力限制的挑战,零一万物的实践证明,通过技术创新和全栈式布局,中国大模型企业完全有可能在全球竞争中脱颖而出,创造新的生产力。未来,随着大模型技术的持续发展,其应用场景也将更加广泛。零一万物将继续秉持其“模基共建”战略,积极探索大模型的应用潜力。

国产大模型“闪电”仅用2000张GPU追平GPT-4

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
AI快讯网编辑-青青AI快讯网编辑-青青
上一篇 2024年 10月 18日 下午3:04
下一篇 2024年 10月 18日 下午4:38

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!