看不见的大模型，看得见的生产力

在全球大模型领域，智源研究院是一家独树一帜的存在。作为一家没有依托大型科技公司的非企业研究机构，智源在国内率先系统布局了大模型技术研发、开源生态建设、人才培养和企业培育，成为了国内大模型领域的先驱者和引领者。新任院长王仲远，既拥有企业从业经验，也拥有研究机构背景，他对科技赋能产业的体会尤为深刻。“过去每次科技平权都能催生重大产业机会”，他相信，大模型将带来新的科技平权浪潮。

智源的“先见之明”

早在2019年，智源研究院就开始布局大模型领域，并在2020年组建了悟道攻关团队，正式启动大模型研发。2021年3月，智源发布了悟道1.0大模型，并在同年6月推出参数量高达1.75万亿的悟道2.0，创下了当时“世界最大”大模型的纪录，参数量是当时OpenAI最先进的大模型GPT-3的10倍。这种魄力和先见之明，源于智源对人工智能大模型时代到来的准确判断，甚至“大模型”这个中文词汇也是由智源研究院率先提出的。

智源研究院理事长黄铁军对大模型的定义是：参数规模达到百亿以上、具备涌现性和通用性。所谓涌现性，是指模型能够在训练过程中产生超出预期的新能力；通用性则体现在模型能够处理多种不同的任务，而不局限于特定问题或领域。悟道系列模型已升级至3.0版本，涵盖语言、视觉、多模态等基础大模型，并全面开源。2023年，智源与Google、微软、Facebook（现Meta）等科技巨头一道，被斯坦福大学列为世界大模型研究的代表性机构。

智源研究院创始理事长张宏江曾说：“历史上多数研究成果的出现是偶然事件，没人能规划出来，所有努力都是为了提升概率——汇聚优秀的研究人员，为他们提供能够碰撞思想、发现问题、寻找协作伙伴的社区环境。” 这句话解释了智源研究院为什么能在科技浪潮中“后发先至”的原因。智源为学者们提供了一个充满活力、自由开放的交流环境，正是这种环境孕育了大模型研究的突破性进展。

智源研究院的“系统工程”

智源研究院的成立背景，离不开北京市对科技体制改革的决心。2018年初，北京市出台了《北京市支持建设世界一流新型研发机构实施办法》，力求打破传统的科研管理模式，推动科技体制的飞跃式改革。同年12月，智源研究院在科技部和北京市委市政府的支持下正式成立。

智源研究院打破了传统科研机构的束缚，以一种全新的模式开展研究工作，实现了高校和企业的优势互补。智源研究院汇集了来自清华、北大、Facebook人工智能实验室、百度等不同机构和企业的优秀学者，打破了地域和部门之间的壁垒，专注于解决重大科学问题，进行前瞻布局。更重要的是，智源研究院不再以论文或产品作为最终评价指标，而是以创新性系统作为评价标准，鼓励科研人员进行更长远、更具挑战性的研究项目。

王仲远院长强调：“高校模式已经运行了几十年，较难有组织、有规模、跨团队地做系统性研发。企业投入研发，也更倾向于研发与业务强相关的技术。智源会做3—5年甚至更长时间才能看到成果的研究项目。”

智源研究院的信心还源于国家对人工智能的重视。2024年3月，中共中央政治局常委、国务院总理李强在北京调研时明确表示：人工智能是发展新质生产力的重要引擎。这将为智源研究院的发展提供更广阔的空间和更强有力的支持。王仲远表示：“过去每次科技平权都能够催生重大产业机会，大模型可以带来新的科技平权。”

在大模型时代，人工智能技术将迎来新一轮的突破，大模型将成为“智力”的载体，像水、电、网一样，成为一种公共服务，通过云计算向大量企业或个人提供AI服务。智源研究院院长王仲远认为：“这是一个系统工程，需要集中投入资源、集中人力，不能很多人在做但各做一摊，而是要形成一个技术体系。”

智源研究院正在构建一个完整的技术体系，包括大模型全家桶、大模型操作系统、数据集、训练框架、算子库等。智源研究院的愿景目标是成为人工智能技术领域的先锋，引领和预判人工智能的发展方向，比产业走得更超前。在王仲远看来，未来大模型技术的发展将朝着两个方向前进：一个是与产品结合，推动应用，发挥商业化价值；另一个是继续进行最顶尖的大模型的迭代和优化。智源研究院将专注于后者，不断提升大模型的技术能力，为产业发展提供强有力的支撑。

智源研究院正在探索多模态大模型的研发，希望将不同模态的信息，比如文字、图像、视频、语音，从一开始就放在一个模型里进行训练，这将赋予模型更强大的理解和推理能力。未来，大模型与硬件结合，将实现具身智能，能够进入物理世界服务人类。

智源研究院作为一家非企业研究机构，其工作重点在于核心技术突破，而非具体的场景应用。智源研究院通过开源的方式，为产业界提供技术支持，将自身的科研成果转化为产业发展的动力。智源研究院的理念是“人工智能不等同于大模型，它只是人工智能的一个流派。” 智源研究院在发展大模型的同时，也积极探索其他人工智能技术，比如类脑研究、数字心脏等，为人工智能的未来发展提供了无限可能。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

看不见的大模型，看得见的生产力

相关推荐

发表回复