人工智能的蓬勃发展正驱动着企业数智化转型进入规模化、倍增创新的阶段。AI技术的快速演进和应用场景的不断拓展,催生了大量AI创新应用,并迅速惠及各行各业。
然而,AI的火热也带来了对智能算力的巨大需求。《中国算力发展指数白皮书(2023年)》显示,当前算力规模中,通用算力占比74%,智能算力占比25%,同比增长60%,成为算力快速增长的主要驱动力。预计未来几年,智能算力的需求将增长数百倍。

这给算力基础设施带来了新的挑战:企业需要根据自身业务场景和计算任务选择合适的算力方案,并提升数据中心的整体能效。此外,戴尔科技“创新催化剂”研究显示,35%的受访企业认为缺乏专业人士指导,45%的企业急需AI部署、实施、培训和扩展方面的专业服务,以提高效率和运营水平。这表明,企业在AI部署和数智化转型过程中,面临的挑战不仅体现在技术“硬实力”上,更包括数字化人才和专业服务支持等“软实力”。
基于此,戴尔科技积极推动算力基础设施产品和解决方案的技术创新,打造“AI First端到端全栈AI平台解决方案”,帮助企业充分释放现代化数据中心的AI潜力。近期,戴尔科技在中国市场正式发布全新AI加速服务器PowerEdge XE9680,配备8个NVIDIA SXM5 500W GPU及NVLink完全互联,专为高性能AI工作负载而设计,为AI时代大模型训练和推理提供高效稳定的基础设施。
戴尔科技还提供AI数据中心服务部署保障与绿色节能方案,为中国企业数智化转型提供技术支撑,加速AI落地应用,其价值深远。
AI First全栈解决方案就绪
IDC《2024 AIGC应用层十大趋势白皮书》预测,到2024年,全球将涌现超过5亿个新的智能化应用,这将是过去40年应用总数的总和。这表明企业和产业的智能化规模化创新,本质上是AI应用的扩张,而这需要强大的AI算力和基础设施作为支撑。

戴尔科技集团信息基础架构解决方案事业部AI企业技术架构师、全球CTO大使吴跃表示,戴尔科技秉承“AI First”战略,从“AI赋能戴尔产品、戴尔产品组合赋能AI、用AI优化企业运营、构建开放的AI生态”四个维度,帮助企业加速AI创新,发现商业机会,保持竞争优势。
在AI基础架构优化方面,戴尔科技围绕“算、网、存、管”提供整体参考架构,打造端到端全栈AI平台解决方案,构建高效能AI平台:
01 “算”: 戴尔科技提供多元化的AI加速计算选型支持,例如新一代PowerEdge服务器,针对GPU计算进行设计和优化,提供GPU分布式训练、GPU池化以及边缘AI计算解决方案,支持AI端到端训练、微调、推理以及传统AI模型的训练和推理。此外,戴尔科技还提供高性能CPU计算服务器,支持集群管理、登录和数据治理。

02 “网”: 面对日益增长的数据量,戴尔科技提供端到端400GbE AI计算网络解决方案,帮助企业构建新一代网络基础架构,加速AI转型。
03 “存”: 戴尔科技推出专为AI打造的PowerScale全闪存节点,这是全球首个通过NVIDIA SuperPOD验证的AI以太网存储平台, 通过高速的NVIDIA Spectrum以太网技术加速数据访问,并支持智能横向扩展以最大化性能。

04 “管”: 戴尔科技提供AI智算平台软件解决方案,包括AI框架与系统管理软件以及专业服务,加速AI工程化和场景化落地,简化AI基础设施平台管理与资源调配。

戴尔科技的端到端全栈AI平台解决方案,能够有效满足AI应用多样化和市场规模扩张带来的算力需求,加速AI在各行业的落地,并推动企业和行业的数智化变革。
AI加速服务器“焕新上市”
AI 1.0时代,AI基础设施主要采用垂直一体化方案,针对性强但通用性和兼容性较低。AI 2.0时代,除了高性能、安全和可管理性,还出现了多元异构加速融合的趋势,即最大化融合不同架构的芯片平台、算法模型和数据集,以提升AI基础设施算力效率。
戴尔科技面向AI 2.0时代,发布了全新AI计算平台PowerEdge XE9680,这是一款8路GPU服务器,为AI、深度学习、训练和推理等工作负载提供极致性能。

戴尔科技集团大中华区服务器解决方案产品高级经理秦建丰介绍了PowerEdge XE9680的四大优势:
▶高性能:针对极致AI计算性能需求设计,在6U空间内搭载8块NVIDIA高速GPU,并通过NVLink互联,GPU与高速网卡实现1:1配比。在MLPerf Inference V3.1推理基准测试中,PowerEdge XE9680在20个数据中心项目赛道中获得7个第一名,综合成绩最佳。
▶优化设计:针对GPU供电和散热进行优化,采用6U风冷设计,并具备多矢量散热技术和动态调节冷却风强度等功能。实现GPU与CPU模组“统一供电”,并优化电源设计,满足峰值功率瞬时140%~170%的需求。高速网卡槽位布置于前面板,增强散热性能。
▶多元异构加速:支持多元异构加速,PowerEdge XE9680 + NVIDIA GPU方案满足企业AI训练、微调、推理等需求。与上一代非加速服务器相比,NVIDIA加速的PowerEdge服务器在大型语言模型上的推理能效提高了300倍。

▶安全及可管理性:基于“零信任”原则设计,具备更强的安全性和抗风险能力。内置iDRAC可动态监控GPU运行状态,并提供碳足迹追踪报告。
PowerEdge XE9680的典型应用场景包括AI模型预训练、微调、大规模推理以及基于单精度(FP32)GPU加速的科学计算。戴尔科技还提供其他搭载GPU的服务器,如PowerEdge R760xa、R760、R660、R7625、R6625等,满足不同企业需求。
打通AI落地“最后一公里”
系统论指出,系统是由相互关联、作用、影响的组织部分构成并具有某些功能的整体。对系统进行分解研究,即使每个部分都研究清楚,也无法理解系统的整体性。这同样适用于AI发展:AI发展是一个完整的系统和生态,每个组成部分都应协同发展,单一技术的突破并不能推动AI的落地和普及。

戴尔科技集团数据中心业务部人工智能资深架构师龚小愿认为,AI时代给数据中心安全高效运行的基础设施和冷却系统带来了更大的压力。例如,“PowerEdge XE9680 6U 3+3 8400W”与“PowerEdge R760*3 6U 1+1 5400W”相比,功耗提高56%以上,重量提高22%以上。因此,如何在AI基础设施部署中统筹绿色节能和降本增效,至关重要。
戴尔科技打造了“PowerEdge XE9680+Datacenter交付”创新服务方案,提供Dell ProDeploy/ProDeploy Plus专业实施服务和Dell Rack Integration机柜集成服务。

▶专业实施服务:提供实用的硬件和软件选择,满足不同预算和运营模式需求,覆盖从核心到云到边缘的各种业务需求。使用Dell ProDeploy Plus服务,部署规划时间可缩短67%,部署速度提升三倍。
▶机柜集成服务:提供“交钥匙”的机柜集成服务,实现“即插即用”,每周平均集成25台机柜,并能根据需求扩大产能。这避免了不同施工团队的施工标准不一致,提高效率并降低成本。
结 语
AI新时代,戴尔科技提供的“端到端全栈AI平台解决方案”能够帮助企业构建健壮的AI基础设施,并通过“PowerEdge XE9680+Datacenter交付”等创新方式,突破硬件、软件、算力、算法和数据的局限,加快AI基础设施的安装和部署,打通AI落地的“最后一公里”,帮助企业激发新质生产力,推动中国数字经济高质量发展。