2024年6月14日,北京智源大会在京举行。百度首席技术官王海峰受邀出席并发表主旨演讲,对人工智能技术的发展趋势进行了最新判断。他认为,大模型为通用人工智能带来了曙光,这一判断可以从两个角度进行解读:一是人工智能技术的通用性,二是其能力的全面性。
人工智能是模拟、延伸和扩展人类智能的科学技术。王海峰指出,大模型的出现为通用人工智能带来了曙光。这种解读可以从两个方面理解:
人工智能技术经过几十年的发展,已经从早期的依靠人工撰写规则,演进到后来的统计机器学习阶段,在这一阶段,人工智能可以自动从数据中学习。然而,解决不同场景的问题仍然需要不同的算法。直到深度学习时代的到来,算法的通用性才得到了显著提升。深度神经网络的统一架构和技术能够解决各种问题。而在大模型时代,模型也变得更加通用和统一,除了算法的通用性之外,模型本身也具备了通用性。
在技术的通用性方面,大模型在解决不同任务、语言、模态、场景的通用性方面都取得了显著的进步。以自然语言处理为例,过去需要分别处理分词、句法分析、语义匹配、机器翻译、问答、对话等多个子方向,现在一个大语言模型就可以解决绝大多数任务。在语言方面,大模型可以处理单语言问题,也可以跨语言处理,不仅学习了人类的自然语言,也学习了人工定义的形式语言,为从思考到执行之间架起了桥梁。同时,大模型还可以实现多模态的统一建模,广泛赋能各行各业的应用等等。总体上,人工智能技术的通用性正在不断增强。
在能力的全面性方面,理解、生成、逻辑、记忆是人工智能的四项基础能力。其他各种典型的人工智能能力,无论是创作、解题、代码,还是规划、决策等等,基本上都是这四项基础能力的综合运用。这四项能力越强,人工智能越接近通用人工智能的水平。
文心大模型技术解读
文心一言是百度自主研发的新一代知识增强大语言模型。它基于更强大的平台、更优质的数据和更好的算法进行训练,从万亿数据和千亿知识中融合学习,突破了知识内化和外用技术,具备知识增强、检索增强和对话增强的核心技术。在基础模型训练、数据构建与优化、对齐技术创新、提示优化、智能体机制等方面进一步取得了突破。
智能体是在基础模型上,进一步进行思考增强训练,包括思考过程的有监督精调、行为决策的偏好学习、结果反思的增强学习,进而得到思考模型。智能体的思考模型可以调用工具来完成任务。代码智能体首先通过思考模型理解用户需求,经过思考,把完成任务的指令和相关信息整合成提示,输入给代码解释器;然后,代码解释器根据提示,把自然语言表达的用户需求翻译成代码并执行,相当于“用模型写代码让复杂的任务变简单”。
公开资料显示,百度自2010年开始全面布局人工智能,并于2019年3月推出了文心大模型1.0,此后持续进行迭代升级,在去年10月发布了文心大模型4.0。文心大模型的持续快速进化得益于百度在芯片、框架、模型和应用上的全栈布局,特别是飞桨深度学习平台和文心的联合优化。文心大模型的周均训练有效率达到98.8%,相比于一年前文心一言发布时,训练效率提升到当时的5.1倍,推理效率提升了105倍。
人工智能进入工业大生产
对于人工智能技术的进一步发展,王海峰强调,规模定律在未来几年仍将有效;大语言模型目前能力很强,并正在快速进步,未来依然有很大的提升空间;多模态大模型将越来越好用;智能体技术将越来越成熟。人工智能技术正在加速进步,产业进入爆发期。
王海峰认为,纵观人类经历的前三次工业革命,其核心驱动力量——机械技术、电气技术和信息技术,都具有很强的通用性,能够应用于各个行业。当它们呈现出标准化、自动化和模块化的工业大生产特征时,核心技术便进入工业大生产阶段。人工智能基于深度学习及大模型工程平台,包括算法、数据、模型、工具等,也已经具备了非常强的通用性,并且具备了标准化、模块化和自动化的特征。因此,深度学习及大模型工程平台推动人工智能进入了工业大生产阶段,通用人工智能的到来将会加速。