在全球大模型领域,智源研究院是一家独树一帜的存在。作为一家没有依托大型科技公司的非企业研究机构,智源在国内率先系统布局了大模型技术研发、开源生态建设、人才培养和企业培育,成为了国内大模型领域的先驱者和引领者。新任院长王仲远,既拥有企业从业经验,也拥有研究机构背景,他对科技赋能产业的体会尤为深刻。“过去每次科技平权都能催生重大产业机会”,他相信,大模型将带来新的科技平权浪潮。
智源的“先见之明”
早在2019年,智源研究院就开始布局大模型领域,并在2020年组建了悟道攻关团队,正式启动大模型研发。2021年3月,智源发布了悟道1.0大模型,并在同年6月推出参数量高达1.75万亿的悟道2.0,创下了当时“世界最大”大模型的纪录,参数量是当时OpenAI最先进的大模型GPT-3的10倍。这种魄力和先见之明,源于智源对人工智能大模型时代到来的准确判断,甚至“大模型”这个中文词汇也是由智源研究院率先提出的。
智源研究院理事长黄铁军对大模型的定义是:参数规模达到百亿以上、具备涌现性和通用性。所谓涌现性,是指模型能够在训练过程中产生超出预期的新能力;通用性则体现在模型能够处理多种不同的任务,而不局限于特定问题或领域。悟道系列模型已升级至3.0版本,涵盖语言、视觉、多模态等基础大模型,并全面开源。2023年,智源与Google、微软、Facebook(现Meta)等科技巨头一道,被斯坦福大学列为世界大模型研究的代表性机构。
智源研究院创始理事长张宏江曾说:“历史上多数研究成果的出现是偶然事件,没人能规划出来,所有努力都是为了提升概率——汇聚优秀的研究人员,为他们提供能够碰撞思想、发现问题、寻找协作伙伴的社区环境。” 这句话解释了智源研究院为什么能在科技浪潮中“后发先至”的原因。智源为学者们提供了一个充满活力、自由开放的交流环境,正是这种环境孕育了大模型研究的突破性进展。
智源研究院的“系统工程”
智源研究院的成立背景,离不开北京市对科技体制改革的决心。2018年初,北京市出台了《北京市支持建设世界一流新型研发机构实施办法》,力求打破传统的科研管理模式,推动科技体制的飞跃式改革。同年12月,智源研究院在科技部和北京市委市政府的支持下正式成立。
智源研究院打破了传统科研机构的束缚,以一种全新的模式开展研究工作,实现了高校和企业的优势互补。智源研究院汇集了来自清华、北大、Facebook人工智能实验室、百度等不同机构和企业的优秀学者,打破了地域和部门之间的壁垒,专注于解决重大科学问题,进行前瞻布局。更重要的是,智源研究院不再以论文或产品作为最终评价指标,而是以创新性系统作为评价标准,鼓励科研人员进行更长远、更具挑战性的研究项目。
王仲远院长强调:“高校模式已经运行了几十年,较难有组织、有规模、跨团队地做系统性研发。企业投入研发,也更倾向于研发与业务强相关的技术。智源会做3—5年甚至更长时间才能看到成果的研究项目。”
智源研究院的信心还源于国家对人工智能的重视。2024年3月,中共中央政治局常委、国务院总理李强在北京调研时明确表示:人工智能是发展新质生产力的重要引擎。这将为智源研究院的发展提供更广阔的空间和更强有力的支持。王仲远表示:“过去每次科技平权都能够催生重大产业机会,大模型可以带来新的科技平权。”
在大模型时代,人工智能技术将迎来新一轮的突破,大模型将成为“智力”的载体,像水、电、网一样,成为一种公共服务,通过云计算向大量企业或个人提供AI服务。智源研究院院长王仲远认为:“这是一个系统工程,需要集中投入资源、集中人力,不能很多人在做但各做一摊,而是要形成一个技术体系。”
智源研究院正在构建一个完整的技术体系,包括大模型全家桶、大模型操作系统、数据集、训练框架、算子库等。智源研究院的愿景目标是成为人工智能技术领域的先锋,引领和预判人工智能的发展方向,比产业走得更超前。在王仲远看来,未来大模型技术的发展将朝着两个方向前进:一个是与产品结合,推动应用,发挥商业化价值;另一个是继续进行最顶尖的大模型的迭代和优化。智源研究院将专注于后者,不断提升大模型的技术能力,为产业发展提供强有力的支撑。
智源研究院正在探索多模态大模型的研发,希望将不同模态的信息,比如文字、图像、视频、语音,从一开始就放在一个模型里进行训练,这将赋予模型更强大的理解和推理能力。未来,大模型与硬件结合,将实现具身智能,能够进入物理世界服务人类。
智源研究院作为一家非企业研究机构,其工作重点在于核心技术突破,而非具体的场景应用。智源研究院通过开源的方式,为产业界提供技术支持,将自身的科研成果转化为产业发展的动力。智源研究院的理念是“人工智能不等同于大模型,它只是人工智能的一个流派。” 智源研究院在发展大模型的同时,也积极探索其他人工智能技术,比如类脑研究、数字心脏等,为人工智能的未来发展提供了无限可能。