近日,一场以大模型技术与应用创新为主题的论坛在北京圆满落幕。本次论坛汇聚了中关村科金等行业巨头,以及来自国内外顶尖的AI科学家和行业专家,共同探讨了大模型技术发展的未来方向和挑战。

中关村科金总裁喻友平在论坛上发布了得助大模型平台2.0。该平台是中关村科金“三级引擎战略”的核心组成部分,旨在为企业提供从算力调度到应用落地的全流程支持。喻友平介绍,得助大模型平台2.0已与众多行业伙伴合作,构建了超过200个应用场景,涵盖智能营销、智能客服、智能运营和知识管理等领域。平台核心功能包括算力统一调度、一站式模型训练和推理服务、快速应用构建以及高效的RAG技术,可显著提升资源利用率、部署效率和应用构建速度,并确保识别准确率高达98%以上。他还分享了平台在实际应用中的成功案例,例如助力某家装平台提升营销转化率,以及与多地公安机关合作开发的大模型接警助手,有效缩短了反诈接警时间。这些案例体现了得助大模型平台2.0的实际应用价值和市场竞争力。
清华大学计算机系教授、中国工程院院士郑纬民从国产计算系统的角度,分析了当前大模型发展面临的技术瓶颈。他指出,构建国产万卡系统和解决异构卡及异地卡联合训练效果不佳的问题是当前的两大挑战。他强调,优秀的系统软件对充分发挥底层硬件算力至关重要,中国需要自主研发核心软件来突破这些技术瓶颈,才能更好地支持大模型的快速发展。

ChatGPT核心研发科学家、前OpenAI研究员肯尼斯·斯坦利则从模型架构和算法层面分享了对未来AI发展的预测。他认为,随着Scaling Law效应的减弱,简单的规模扩展策略将难以持续提升模型性能,AI领域需要探索新的架构和理念来突破瓶颈。他特别指出,当前大模型出现的“幻觉”并非创造力,而是一个需要解决的技术问题。斯坦利还分享了OpenAI和中关村科金在减少大模型“幻觉”方面的实践经验,为业界提供了宝贵的参考。

中国信通院人工智能研究所平台与工程化部主任曹峰则重点探讨了AI Agent技术的应用和发展。他指出,优化Agent的工作流是提升大模型应用性能的关键。通过实例分析,他说明了合理设计工作流能够在模型能力达到上限时,进一步提升任务准确性和输出质量。此外,他还探讨了大模型与小模型结合应用的前景,并提出了解决Agent泛化性和鲁棒性等技术瓶颈的方案,为大模型应用的优化提供了新的思路。

论坛总结指出,虽然大模型技术已取得显著进展,但仍面临诸多挑战。未来,只有持续创新和优化架构,才能推动AI技术取得更大突破,更好地服务于社会经济发展。