在2024 T-EDGE创新大会暨钛媒体财经年会上,DeepAI首席执行官Kevin Baragona分享了他对当下大模型行业发展现状的独到见解。过去一年,大模型领域可谓风起云涌,其发展速度与带来的影响都令人瞩目。
李开复等业内专家指出,过去一年大模型的推理成本下降了约10倍(例如从GPT-4、Turbo、4o到o1),推理速度显著提升。然而,这一飞速发展也面临挑战。随着算力的提升,大模型的Scaling Law(扩展定律)开始失效,全球数据总量的限制成为制约大模型进一步发展的瓶颈。

针对这一行业困境,Baragona提出了DeepAI的解决方案。作为美国领先的生成式AI供应商,DeepAI提供文生图、文生视频、音乐创作以及开发者API等一系列工具,赋能个人创作者和企业高效利用AI技术。
Baragona回顾了AI的发展历程,从过去被视为笑柄的“令人羞愧”的技术,到如今蓬勃发展的“黄金时代”。他认为,计算成本的大幅下降是推动AI快速发展的主要动力。大规模的算力投入和数据积累,是提升AI性能的关键。然而,这一模式也暴露出问题:大语言模型的进步开始放缓。
Baragona认为,大语言模型发展放缓的根本原因在于现实世界数据的有限性,可用于训练的数据资源几近枯竭。他指出,DeepAI的应对策略是回归模型架构本身的优化,特别是推理架构的优化。此方法虽然初期会增加模型的推理时间、数据训练和测试时间,但能够大幅降低对数据量的需求。通过逐步优化推理模型的各个步骤,最终可以实现推理速度的提升和AI性能的增强。Baragona预测,在新的架构下,算力成本将持续降低,而AI性能却可能取得突破性的进展。
DeepAI在图像和视频生成领域取得了显著突破。Baragona分享了DeepAI早期图像生成效果不佳的经历,如今,其生成图像已达到令人惊叹的清晰度和真实感,甚至能创作出现实中不存在的奇幻场景,展现了强大的泛化能力。

Baragona也坦言,AI发展并非一蹴而就。深度学习技术曾经历漫长的“寒冬”,饱受质疑。然而,GPT-3等模型的出现改变了这一切,深度学习技术获得广泛认可,推动了AI的快速发展。他指出,英伟达在AI领域的成功,得益于其以较低成本提供高效矩阵乘法运算能力,这体现了算力成本降低的重要性。

AI技术的快速发展也引发了社会担忧,关于AI安全性和监管的讨论日益增多。各国和企业之间的竞争加剧,也导致AI研究和开发变得更加保密。然而,Baragona认为,AI的核心技术框架并非神秘,关键在于有效整合海量计算资源和庞大的数据集,这如同一种“炼金术”,能够显著提升AI模型的性能。

关于大语言模型是否进入平台期的问题,Baragona认为,虽然发展速度放缓,但并未完全停滞。数据资源的匮乏是主要瓶颈,但他并不认为研发全新模型架构是解决问题的关键。他认为,只要数据量足够丰富,计算资源充足,不同架构的性能差异不会太大。真正重要的,是重新审视对AI模型的期望和定位,将重点放在提升模型的推理能力上,使其能够灵活应用知识解决实际问题。
