巴西AI黑马Rio 3.5翻车:被指抄袭拼凑两款国产大模型

最近,一款由巴西里约热内卢市政府IT部门开发的开源大模型Rio 3.5 397B,在AI社区掀起了一阵不小的波澜。这款模型一度宣称在多项基准测试中达到SOTA(当前最优),跻身全球大模型第一梯队,迅速成为热议焦点。

不过,仔细推敲其技术路线,我们有必要先厘清一个背景:当前开源大模型领域竞争激烈,不少团队通过微调、蒸馏甚至权重混合来快速追赶性能。这种“站在巨人肩膀上”的做法本身无可厚非,但如果缺乏透明度和归属声明,就容易引发争议。Rio 3.5的横空出世,恰好撞上了这一敏感地带。

核心权重暴露数学真相

然而,这匹黑马发布不到24小时就遭遇了反转。AI Agent开源项目联盟Nex-AGI发布声明,直指Rio 3.5实际上是一个“套壳合成模型”。

Nex团队对Rio 3.5的权重进行了深入的数学分析和比较,揭示了模型背后的真实技术配方。结果显示,该模型约60%的核心组件来自Nex团队此前开源的Nex N2 Pro,而剩余40%则来自阿里云开源的大模型Qwen 3.5。

这里需要补充一个客观视角:权重混合在学术界并非新鲜事,甚至有些研究证明它能在特定场景下提升模型鲁棒性。但问题在于,Rio 3.5的论文和发布材料中并未明确披露这一构成,导致外界误以为它是从零开始训练的原创模型。这种信息不对称,在强调开放透明的大模型社区中,无疑会引发信任危机。

系统提示词泄露天机

为确认上述结论,Nex团队提供了两种相互独立的验证方法。研究人员移除了Rio硬编码的系统提示词后,部署的模型有高达79%的概率会自称是“来自Nex-AGI的Nex”,甚至一字不差地复述Nex团队编造的背景故事。

此外,统计分析也完全暴露了真相。Rio模型在网络全部60层及各个组件上均呈现精确的0.6和0.4混合比例,统计偏差高达数千标准差——这在典型的微调模型中几乎不可能出现。

从技术角度看,这种“统计指纹”其实揭示了一个更深层的问题:目前的权重混合检测手段已经非常成熟,依赖简单的线性插值或层级替换几乎无法逃脱数学验证。对于想要走捷径的团队而言,这无疑是一记警钟。

Nex团队表示,对方使用他们的开源底座打造出顶级性能,反过来证明了自身技术的强大。同时,他们强调,开源社区欢迎对技术的合理使用,但署名和致谢是道德底线,不容逾越。

客观来说,这一事件也给整个行业敲响了警钟:开源模型生态的繁荣需要基于信任与规则,而任何试图模糊技术起源的行为,最终都可能反噬自身。未来,类似Rio 3.5的案例或许会推动社区建立更严格的模型溯源标准——比如强制公开训练数据来源、权重贡献比等元信息。毕竟,在AI高速迭代的今天,技术可以复用,但信用必须重建。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
AI快讯网编辑-青青AI快讯网编辑-青青
上一篇 11小时前
下一篇 11小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!