智源大会：AI春晚，上演Scaling Law、多模态与价格战

6月14日至15日， “2024北京智源大会” 在北京举行。OpenAI Sora负责人Aditya Ramesh（阿迪提亚·拉梅什）进行了技术分享，零一万物CEO、创新工场董事长李开复与中国工程院院士张亚勤进行了炉边对话，国内大模型创业公司“四小龙”罕见同台。

智源研究院是在国家科学技术部和北京市委市政府的指导下，由北京市科委和海淀区政府于2018年11月成立的新型研发机构。2023年，原院长黄铁军从张宏江理事长手上接过理事长的“接力棒”，新任院长由王仲远出任，后者曾是快手技术副总裁。一年一度的智源大会被行业称为“AI春晚”。

会上，科技部战略规划司副司长康相武表示，当前，人工智能正处在群体性技术变革的起点，正迈向多智能融合的新阶段，将成为第四次工业革命的标配，引发社会发展深远变革。人工智能的大规模跨界应用也将带来多重安全风险挑战。如何预期共存且在确保安全可控前提下更好造福人类社会，成为全球人类共同面对的重大议题。

过去一年，国产大模型发展迅速，迭代速度惊人。在本次大会上，智源研究院院长王仲远分享了这一年来的技术发展变化。他指出，2023年时，行业普遍认为国内大模型还在追赶GPT 3.5。然而，仅仅一年时间，国产大模型的平均水平已经超过GPT3.5，无限逼近GPT-4。甚至在中文语境下的某些能力上，国内大模型已经超越GPT4。但是，GPT4本身也在不断迭代，例如最新发布的GPT4o在整体性能、效果，甚至效率方面都取得了显著提升，因此国产大模型仍处于追赶阶段。

在大会现场，王仲远还披露了智源研究院在语言、多模态、具身、生物计算大模型等方面的最新进展，包括与中国电信人工智能研究院（TeleAI）联合研发的全球首个低碳单体稠密万亿语言模型Tele-FLM-1T，以及针对大模型幻觉等问题自主研发的通用语义向量模型BGE（BAAI General Embedding）系列。为了实现多模态、统一、端到端的下一代大模型，智源研究院还推出了Emu3原生多模态世界模型。

王仲远表示，国产大模型已经达到了可用水平，但距离真正好用还有差距。随着GPT4的出现，大模型可以进入到具体场景内进行快速迭代，但这将面临更大的技术突破难度，包括算力资源、核心算法、系统工程等方面，例如如何实现万卡以上的GPU芯片互联仍然是一个挑战。

Scaling Law（规模法则）是此次大会嘉宾多次提到的关键因素，被认为是大模型发展的重要推动力。李开复认为，AI 2.0是有史以来最伟大的科技革命和平台革命，大模型Scaling Law的重要性在这一时代得以凸显。人类能够通过增加计算量和数据来不断提升大模型的智慧，这条已经被多方验证的路径仍在推进中，尚未达到天花板。

月之暗面CEO杨植麟认为，大模型是第一性原理，需要不断提升模型的规模，但最大的挑战是数据并非无限量可得。智谱AI CEO张鹏从实用主义角度表示，Scaling Law仍在起作用，并持续前进。至于它能否帮助大模型达到顶峰，目前行业还没有找到一个确切的答案。百川智能CEO王小川从AGI的终点来看，实现AGI除了规模，还需要有范式的改变，例如当前大模型通过数据驱动学习进行压缩，但目前的Scaling Law无法实现AGI。面壁智能CEO李大海表示，Scaling Law是一个经验公式，是行业对大模型这样一个复杂系统观察后的经验总结。随着训练过程中的实验越来越多、认知越来越清晰，会有更细颗粒度的认知，例如模型训练中的训练方法对Scaling Law、对智能的影响非常显著。

王仲远表示，国产大模型已经具备支撑应用的能力，他个人预测未来两三年将出现大量大模型应用。他认为B端应用十分明确，几乎涵盖了所有行业。至于C端，行业普遍期待看到爆款级应用，但类似移动互联网时代，新技术或技术革命的出现都需要一定的时间周期，需要天时地利人和，需要技术能力的积累。

王仲远认为，大模型落地C端产品需要模型足够低价好用，同时解决用户的真实痛点。因此，对C端爆款应用需要保持一定耐心，目前即使在大洋彼岸，也尚未出现C端的爆款应用。

对于AGI时代的到来，王仲远认为未来的技术演进路线可能是这样的：过去几年，绝大部分科研和产业的关注度都集中在大语言模型的突破上，目前大语言模型依然是单语言模型。但除了文本数据外，还存在大量图像、视频、音频等多模态数据。当多模态大模型能够理解和感知、决策这个世界时，它就有可能进入到物理世界。如果进入到宏观世界与硬件结合，这就是具身大模型的发展方向；如果进入到微观世界去理解和生成生命分子，这就是AI For Science。

OpenAI Sora团队负责人Aditya Ramesh在与纽约大学助理教授谢赛宁的对话环节中表示，对于构建更加智能的具有推理能力的系统来说，语言模态确实十分重要。但从某种意义上来说，将语言信息以某种通用接口融入视觉信号中或许可以实现模拟任何事物的能力。随着模型规模的增大，其对于语言的依赖也会降低。

近期，海内外多模态领域更新频繁，包括AI初创公司Luma AI发布视频生成模型Dream Machine，短视频公司快手推出Kling大模型。对于行业现状，Aditya Ramesh表示，团队目前最关心的是视频生成模型的安全性及其对社会的影响，希望人们不要用Sora发布错误信息，也希望模型的行为符合人类的期望。他表示很高兴看到有其他实验室和公司从事视频生成模型的研发，更多人尝试使用不同的方法对于激发艺术和扩散模型领域的创新很重要。目前，Sora团队从合作伙伴那里收到的最重要的功能需求是“提高可控性”和“减少随机性”。

AI安全是此次智源大会的另一个重要议题。杨植麟同样认为AI安全非常重要，虽然不一定是当前最急迫的，但需要提前进行准备。因为随着模型的进展，Scaling Law的发展是每N个月算力乘以10倍，智能会得到提升。他认为AI安全包括模型本身因用户而产生的恶意意图，以及在模型底层注入AI“宪法”框定模型的行为。

李大海认为，现阶段安全主要聚焦在基础安全与内容安全两个方向上。现在的大模型本质上是只读的，权重是固定的，推理不会影响权重。未来当用户将模型部署到机器人等终端上，模型能够去动态更新自己的权重后，安全问题将变得更加重要。

对于近期的价格战问题，王小川表示，降价让更多个人与企业入场，同时令很多企业开始清醒，不再参与做大模型，而是“退”回来成为大模型的用户，减少资源浪费。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

智源大会：AI春晚，上演Scaling Law、多模态与价格战

相关推荐

发表回复