人工智能的过弯点:三驾马车全面调整姿态

近日,英伟达 CEO 黄仁勋和 Meta 创始人马克·扎克伯格进行了一场名为“炉边谈话”的深度交流。

作为人工智能领域的领军人物,黄仁勋凭借其强大的 AI 芯片,牢牢占据着算力领域的主导地位,而扎克伯格则通过开源大模型 Llama 3.1 的推出,成为开源领域的领头羊。这场对话,为未来 AI 发展趋势提供了不同的视角。

人工智能的“过弯点”,三驾马车已经全面调整了姿态

黄仁勋和扎克伯格的对话,为我们勾勒了 AI 技术未来发展的大致蓝图:从开源的 AI 算法,到先进的人形机器人,再到即将普及的智能眼镜,AI 技术的发展充满机遇和挑战。未来,AI 手机、AIPC、AI 汽车、智能眼镜、服务器等各类产品都将实现智能化升级,而复杂模型、海量数据和计算都将高度依赖于 AI 算力的支持。

AI 算力正在从专用计算扩展到所有的计算场景,逐步形成“一切计算皆 AI”的格局。算力厂商的动作也体现了市场对算力发展的高度需求。一方面,CPU、GPU、NPU 等各种类型的处理器都被用于 AI 计算;另一方面,浪潮信息等厂商正在通用服务器上,致力于提供兼具高性能与低成本的 AI 算力解决方案。

例如,浪潮信息基于其 2U4 路旗舰通用服务器 NF8260G7,创新地采用了领先的张量并行、NF4 模型量化等技术,实现了仅依靠 4 颗 CPU 即可运行千亿参数“源 2.0”大模型,成为了通用 AI 算力领域的新标杆。

当前市场上,算力的地位正在迅速崛起。与人工智能发展的三驾马车——算力、算法、数据相呼应,三者终于达到了地位相当的状态,走向“并驾齐驱”。

在 AI 技术发展早期,中国凭借庞大的互联网用户群体和丰富的在线数据资源,侧重于数据的发展。而美国在计算机科学、数学、统计学等基础学科方面拥有悠久的研究传统,更聚焦于算法的研发。相对而言,算力在早期并没有得到足够的重视。

如今,随着三驾马车并驾齐驱,大众对人工智能发展思路也愈发清晰:AI 产业的爆发是算法、算力与数据三者协同发展的结果。这意味着 AI 产业已经进入了一个全新的阶段。

人工智能产业已经来到了“过弯点”。大模型技术的加速迭代,带来了千亿级大模型的持续涌现与精进。相关的 AI 应用以前所未有的速度和规模渗透到各行各业,并融入日常的生活和工作中。

人工智能产业正在从初步探索迈向广泛应用的“过弯点”。在这个过程中,AI 的三驾马车也到了全面协同发展的关键时刻,才能为场景应用的跨越式升级提供必要的技术支持。

以银行的防欺诈系统为例,早期的系统是基于大数据构建的,通过经验预设规则和统计模型来判断和检测可疑交易。现在,基于更高性能的通用算力,整合大数据系统和金融防诈的 AI 模型,银行防欺诈系统实现了功能升级,不仅具备更高的准确性和更低的误报率,而且还能够根据新的数据进行自我学习和调整,快速适应新的欺诈模式。

算法、算力和数据三者协同,构成当前 AI 应用的基本范式。一个成功的 AI 项目往往需要在这三个方面都做出适当的投入和优化。

算法相当于 AI 的大脑,负责处理信息、学习知识、做出决策。数据是算法的基础,如果没有足够的数据,即使是再先进的算法也无法发挥出应有的效果。而无论是算法的运行还是数据的处理,都离不开算力的支持。特别是在涉及到大量的数据处理、复杂的模型训练以及实时的推理需求等场景中,AI 对算力的要求非常高,并且随着场景的规模化普及,还需进一步兼顾经济性。

目前,针对 AI 产业的三驾马车,算法、算力和数据层面的升级依旧在同步进行,三者之间的协同在 AI 行业发展的驱动下达到了新高度。AI 产业的加速发展需要三驾马车的步伐更加一致。

是时候全面调整三驾马车的状态了。

人工智能的广泛应用必然要建立在三驾马车协同发展的基础上。在接下来的时间内,针对人工智能产业的升级就需要解决一个关键问题,即如何保持三驾马车并驾齐驱的稳定状态。

**一、技术“并驾”:一马当先并非最佳,三马同行最为稳定。**

算力、算法、数据三者相辅相成,单一的技术领先无法带来 AI 产业的全面爆发,必须要另外两项迅速补齐,才能对应解决相关的技术问题。

例如,当前,千亿级参数甚至万亿级参数的大模型加速发展,带来了更强大的信息处理和决策能力,为智能涌现提供了基础。但是,算法层面的突破必然要有算力、数据层面的升级,才能发挥出应用的效果。简单来说,如果没有足够的算力带动千亿级大模型的训练、推理等需求,那么再强大的模型也没有“用武之地”。

要加速人工智能的发展,支撑千行百业最广泛的通用场景,千亿级大模型必须要和大数据、数据库、云等场景相融合,实现高效运行。但这一目标对计算、内存、通信等硬件资源需求量非常大。为了满足更多用户的 AI 算力需求,算力厂商不得不考虑如何有针对性地去克服现有的算力瓶颈。以承载千亿参数大模型推理的 NF8260G7 AI 通用服务器为例,浪潮信息在这方面就做出了专业的设计。

针对千亿级大模型推理过程中的低时延以及所需的巨大内存需求,NF8260G7 服务器配置了 4 颗具有 AMX 的 AI 加速功能的英特尔至强处理器,内存方面,NF8260G7 配置 32 根 32G DDR5 4800MHZ 的内存,内存带宽实测值分别为 995GB/s(读带宽)、423GB/s(写带宽)、437GB/s(读写带宽),为满足千亿大模型低延时和多处理器的并发推理计算打下基础。同时,浪潮信息还对 CPU 之间、CPU 与内存之间的高速互联信号走线路径和阻抗连续性做了优化,从而更好地支撑大规模并发计算。

人工智能的“过弯点”,三驾马车已经全面调整了姿态

这样的设计与升级,旨在面向算法,进行算力的优化,为接下来千亿级大模型的规模化应用提供了一个非常关键的支撑。

**二、系统“齐驱”:三马拉车,重在系统性优化。**

随着 AI 技术的发展,算力、算法、数据的系统性越来越强。很多科技巨头都在竞相发力寻找“模型水平高、算力门槛低”的人工智能方案。AI 相关的解决方案不再是单一技术的应用,而是综合多个领域的突破实现整体系统性的升级。

举个例子,谷歌的 EfficientNet 模型通过优化网络架构,在 ImageNet 数据集上的精度相比传统模型提升了约 6%,而所需计算量减少了 70%。可见,当前大模型厂商在推动算力升级的过程中,也会考虑到软件层面的创新,提高算力和算法之间的适配运行能力。

为了能让通用服务器更好的运行千亿级大模型,浪潮信息除了对服务器本身进行创新升级外,也对千亿级大模型的参数规模做了优化。基于源 2.0 的算法研发积累,浪潮信息将 1026 亿参数的源 2.0 大模型卷积算子进行张量切分,为通用服务器进行高效的张量并行计算提供了可能,最终提高了推理计算效率。

人工智能的“过弯点”,三驾马车已经全面调整了姿态

基于 CPU 服务器的并行计算

同时,在这个过程中,浪潮信息还采用了 NF4 量化技术,对模型进行“瘦身”,提高了推理的解码效率等等。

人工智能的“过弯点”,三驾马车已经全面调整了姿态

NF4 量化技术

当算力、算法走向协同,系统性优化的结果,是建立在两者协同的基础之上,最终目的在于为 AI 产业的落地提供一个稳定、强大的技术底座。未来,AI 产业的全面爆发就需要以更系统的理念去驱动三驾马车的发展。

**三、应用“加速”:产业落地需要“三驾马车”的综合最优解。**

AI 不再是实验室的产物,而是市场竞争的商品。不管是千亿级大模型的涌现,或是算力解决方案的升级,其根本的目标都是推动 AI 应用的加速落地,走向大众,带来实际性的经济效益。因此,在技术层面之外,行业还需要考虑经济层面的问题。

对比来看,尽管以英伟达 GPU 芯片为核心的 AI 服务器在处理机器学习、深度学习等高性能计算任务方面表现卓越,但是浪潮信息等算力厂商依旧致力于研发和升级以 CPU 为核心的通用服务器,这是为什么?

根本原因就在于 CPU 在通用计算、能效比以及成本效益方面仍然不可替代。特别是关系成本效益的经济性问题,本来就是当前限制诸多场景应用规模化落地发展的关键因素。因为 AI 专用基础设施的成本居高不下,普通的企业很难承受。而浪潮信息则是提供了一个更低成本、同时兼顾高性能的经济性选择,恰恰正是市场需要的。

基于通用服务器 NF8260G7 的软硬件协同创新,浪潮信息成功实现了千亿级大模型在通用服务器的推理部署,同时还提供了性能更强,成本更经济的选择,让 AI 大模型应用可以与云、大数据、数据库等应用能够实现更紧密的融合,助力产业高质量发展。这样的综合最优解,才是产业实现规模化爆发最需要的条件。

结语

AI 三驾马车的系统性已经成型,更强大的算力可以支持更复杂的算法模型,从而更好地处理大规模数据。同时,高质量的数据集有助于提升算法的效果,反过来又需要更强大的算力来处理。而算法的进步也可以减少对算力的需求,通过更高效的模型设计降低计算成本。

这种系统性的形成,将极大推动人工智能产业的发展,也为现阶段 AI 厂商们的产品升级、技术迭代、服务进阶提供了一个关键的大方向。但同时,也意味着新的挑战,即如何去整合算力、算法和数据三者之间的技术与资源,成就新的突破。

    免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
    (0)
    AI快讯网编辑-青青AI快讯网编辑-青青
    上一篇 2024年 8月 12日 上午9:41
    下一篇 2024年 8月 12日 上午10:13

    相关推荐

    发表回复

    您的邮箱地址不会被公开。 必填项已用 * 标注

    欢迎来到AI快讯网,开启AI资讯新时代!