Thinking Machines首款产品Tinker助开发者轻松搞定大模型后训练难题

在AI模型微调的浪潮中，基础设施层面的繁复往往是阻碍研究人员和开发者前进的巨大藩篱。如今，一支由前OpenAI首席技术官米拉·穆拉蒂（Mira Murati）领衔的初创公司——Thinking Machines，正试图打破这一僵局。他们近日正式推出了首款AI工具Tinker，一个专为语言模型开发者量身打造的API，其核心目标是极大地简化模型微调的流程。

Tinker的出现，意味着研究人员可以将更多宝贵的精力投入到算法的创新和数据的深度优化上，而无需再深陷于底层基础设施的复杂管理泥潭。这意味着，曾经那些需要耗费大量时间和资源的繁琐配置，如今有望被Tinker高效地封装和自动化。这种对效率的极致追求，恰恰呼应了当前AI领域加速迭代和产出前沿成果的时代主题。

该工具支持包括Qwen-235B-A22B在内的众多前沿大模型，并在模型微调技术上采用了业界瞩目的LoRA（低秩适应）技术。LoRA的精妙之处在于其能够实现计算资源的有效共享。此前，Thinking Machines在公开博客中就曾详细阐述过LoRA如何在多任务训练场景下实现显著的成本优化。通过复用同一计算池，LoRA技术能够大幅度降低跨任务训练过程中的硬件开销，这对于预算有限的研究实验室和初创团队来说，无疑是一大利好。

为了进一步降低技术门槛，Thinking Machines团队还同步开源了Tinker Cookbook库。这个代码库的功能远不止于此，它还收录了来自伊利诺伊大学香槟分校团队的创新成果——Search-R1工具。Search-R1通过“边推理边搜索”的机制，能够有效提升模型在复杂决策场景下的能力。开发者可以借鉴库中提供的现代实现模板，快速上手并构建高度定制化的训练流程，这极大地缩短了新想法从概念走向实践的时间线。

Tinker在学术界的实际应用案例，已经充分证明了其卓越的性能和广泛的适用性。普林斯顿大学的Goedel团队利用Tinker开发了一个数学定理证明器。令人惊叹的是，他们仅用了全参数微调模型20%的数据量，就达到了同等的性能水平，并在MiniF2F基准测试中取得了高达90.4%的惊人准确率。斯坦福大学Rotskoff化学小组则借助Tinker，通过强化学习将LLaMA 70B模型在化学公式转换任务上的准确率从原先的15%大幅提升至50%。而加州大学伯克利分校的SkyRL团队，更是利用Tinker强大的异步训练框架，成功实现了复杂的多智能体协作强化学习实验。

参与Tinker早期测试的Anyscale公司CEO罗伯特·西西哈拉（Robert Nishihara）对此评价极高，他认为Tinker在有效抽象化分布式训练的复杂细节的同时，依然为用户保留了对数据和算法的完全控制权。伯克利大学博士生泰勒·格里格斯（Tyler Griggs）则特别强调了Tinker带来的灵活性：“传统的强化学习微调服务常常限制了训练逻辑的修改，而Tinker则让研究者能够完全专注于核心的环境建模和算法设计，自由度极大。”

目前，Tinker工具正处于内部测试阶段，但已经开放了等待名单申请通道。Thinking Machines承诺，在初期阶段将为用户提供免费服务，后续则会根据使用量推出灵活的定价模式。米拉·穆拉蒂表示，推出Tinker的核心愿景在于打破当前前沿AI研究领域日益显现的封闭化趋势。“当学术界与产业界的差距持续扩大时，”她说道，“我们需要让更多有志于创新的开发者和研究者，能够轻松地获得调整和驾驭尖端模型的能力。”Tinker的出现，无疑为AI研究的民主化添上了一笔浓墨重彩。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Thinking Machines首款产品Tinker助开发者轻松搞定大模型后训练难题

相关推荐

发表回复