最近,一款由巴西里约热内卢市政府IT部门开发的开源大模型Rio 3.5 397B,在AI社区掀起了一阵不小的波澜。这款模型一度宣称在多项基准测试中达到SOTA(当前最优),跻身全球大模型第一梯队,迅速成为热议焦点。
不过,仔细推敲其技术路线,我们有必要先厘清一个背景:当前开源大模型领域竞争激烈,不少团队通过微调、蒸馏甚至权重混合来快速追赶性能。这种“站在巨人肩膀上”的做法本身无可厚非,但如果缺乏透明度和归属声明,就容易引发争议。Rio 3.5的横空出世,恰好撞上了这一敏感地带。
核心权重暴露数学真相
然而,这匹黑马发布不到24小时就遭遇了反转。AI Agent开源项目联盟Nex-AGI发布声明,直指Rio 3.5实际上是一个“套壳合成模型”。
Nex团队对Rio 3.5的权重进行了深入的数学分析和比较,揭示了模型背后的真实技术配方。结果显示,该模型约60%的核心组件来自Nex团队此前开源的Nex N2 Pro,而剩余40%则来自阿里云开源的大模型Qwen 3.5。
这里需要补充一个客观视角:权重混合在学术界并非新鲜事,甚至有些研究证明它能在特定场景下提升模型鲁棒性。但问题在于,Rio 3.5的论文和发布材料中并未明确披露这一构成,导致外界误以为它是从零开始训练的原创模型。这种信息不对称,在强调开放透明的大模型社区中,无疑会引发信任危机。
系统提示词泄露天机
为确认上述结论,Nex团队提供了两种相互独立的验证方法。研究人员移除了Rio硬编码的系统提示词后,部署的模型有高达79%的概率会自称是“来自Nex-AGI的Nex”,甚至一字不差地复述Nex团队编造的背景故事。
此外,统计分析也完全暴露了真相。Rio模型在网络全部60层及各个组件上均呈现精确的0.6和0.4混合比例,统计偏差高达数千标准差——这在典型的微调模型中几乎不可能出现。
从技术角度看,这种“统计指纹”其实揭示了一个更深层的问题:目前的权重混合检测手段已经非常成熟,依赖简单的线性插值或层级替换几乎无法逃脱数学验证。对于想要走捷径的团队而言,这无疑是一记警钟。
Nex团队表示,对方使用他们的开源底座打造出顶级性能,反过来证明了自身技术的强大。同时,他们强调,开源社区欢迎对技术的合理使用,但署名和致谢是道德底线,不容逾越。
客观来说,这一事件也给整个行业敲响了警钟:开源模型生态的繁荣需要基于信任与规则,而任何试图模糊技术起源的行为,最终都可能反噬自身。未来,类似Rio 3.5的案例或许会推动社区建立更严格的模型溯源标准——比如强制公开训练数据来源、权重贡献比等元信息。毕竟,在AI高速迭代的今天,技术可以复用,但信用必须重建。