李飞飞团队用不到50美元训练出媲美DeepSeek R1的AI推理模型

AI快讯网2月6日消息,据报道,李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。据钛媒体App了解,s1是从谷歌Gemini 2.0 Flash Thinking Experimental模型中提炼出精华的1000条数据,然后以Qwen2.5-32B-Instruct开源模型为底座,得出来新的s1的模型。值得注意的是,s1的训练仅用了16个Nvidia H100 GPU,耗时不到30分钟,租用计算资源的成本约为20美元。研究人员还发现,在推理过程中添加“等待”一词,有助于模型获得更准确的答案。目前,s1模型及其训练数据和代码已在GitHub上开源。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!