Rain科技 4 月 7 日消息,近期大模型领域热度不减,尤其是随着类 Claude 应用市场的爆发,大部分用户和开发者关注的核心成本仍集中在 Token 词元费用上。这一趋势也促使国产大模型厂商异军突起,其中 MiniMax 2.7 凭借其高性价比,长期占据调用量前列。
MiniMax 2.7 大模型发布已有一段时间,但此前一直没有开源的具体消息。如今,官方终于在 Huggingface 社区透露了详细计划,并向开源开发者表达了歉意,坦言低估了开源所需的工作量。目前团队还在执行一些基础设施的适配工作,预计本周末正式发布 MiniMax 2.7 开源版本。
MiniMax 2.7 的开源不仅对开发者群体具有里程碑式的意义,普通用户也能从中直接受益。开源之后,其他平台将能够部署 MiniMax 2.7,这将有助于提高该模型的可用程度,同时也能通过市场竞争降低价格,让用户在体验类 Claude 服务时拥有更便宜的 Token 费用选择。
此前,在 Anthropic 宣布限制第三方接入之后,MiniMax 方面曾明确表态,不赞同这种封闭做法,认为这会扼杀生态创新。MiniMax 强调,其 Token 计划从一开始就设计为支持跨第三方平台使用,致力于构建更开放的开发者生态。
MiniMax 2.7 大模型于 3 月 18 日发布,距离春节前夕发布 MiniMax 2.5 仅过了一个月多一点,迭代速度非常快。据悉,这是稀宇科技第一个由模型深度参与迭代自身版本的案例,标志着 AI 研发流程的进一步自动化。
其提升主要集中在三个方面,官方介绍如下:
1. M2.7 在真实的软件工程中有优异的表现,包括端到端的完整项目交付,分析日志排查 Bug、代码安全,机器学习等。在基准测试 SWE-Pro 中,M2.7 得分 56.22%,几乎接近 Opus 最好的水平。
这一能力同样延伸到了端到端的完整项目交付场景(VIBE-Pro 55.6%)以及对复杂工程系统的深层理解 Terminal Bench 2(57.0%)。
M2.7 具备与复杂环境交互的能力,在 40 个复杂技能(大于 2000 Token)的测试案例上,仍能保持 97% 的技能遵循率。
在类 Claude 应用的使用中,M2.7 相比于 M2.5 也有了显著的提升,在相关评测中接近最新的 Sonnet 4.6 水平。
3. M2.7 具备优秀的身份保持能力和情商,除了生产力使用外,给互动娱乐场景的创新也准备了空间。
客观分析:MiniMax 此次加速开源 2.7 版本,显然是希望在国产大模型竞争加剧的背景下,通过开放生态换取更大的市场份额。相较于闭源模型,开源策略能够迅速吸引开发者社区进行二次开发和微调,从而形成围绕模型的护城河。此外,随着 Token 成本的降低,中小型企业接入高性能大模型的门槛将进一步下降,有望催生出更多垂直领域的应用场景。对于用户而言,多一个开源的高性能模型选项,意味着在隐私部署和成本控制上拥有了更多的主动权。


