策略蒸馏
-
智行机器实验室博客发布策略蒸馏新成果:Qwen启发下的显著成效
在人工智能的浪潮中,模型大小与能力之间的权衡始终是核心议题。大型模型固然强大,但其高昂的训练和部署成本限制了其广泛应用。近期,一家名为Thinking Machines Lab(T…
-
Thinking Machines 推出的新策略蒸馏技术,让 LLM 后训练效率大幅提升,开启高效学习新时代
在这个AI进化日新月异的时代,模型训练的效率和性能始终是大家关注的焦点。近日,一个名为THINKING MACHINES的研究团队推出了一项让业界眼前一亮的新技术——“在线策略蒸馏…