近日,紫光股份旗下核心企业新华三集团(以下简称新华三)与NVIDIA强强联手,发布了一款基于NVIDIA AI数据平台参考设计的创新技术集成方案。该方案旨在构建一个更智能、更灵活、更安全的大数据处理架构,特别是在AI推理场景下,力求实现效能的显著提升。此举标志着国产厂商在AI基础设施领域的技术实力正逐步赶超国际领先水平。
在人工智能技术飞速发展的当下,用户对于AI服务响应速度的要求日益提高。然而,AI推理的质量与数据的新鲜度息息相关。如果推理所依赖的数据不是最新的,就可能导致信息失真或逻辑错误,严重影响AI应用的可信度和实用价值。新华三此次推出的AI数据平台解决方案,巧妙地连接了“算力”与“存力”,实现了从硬件底层到AI应用上层的数据全链路加速流通。 这项突破性进展,不仅能显著提升AI推理的实时性、相关性和精确度,还能有效优化整体运行效率,从而为现实场景中的大模型应用带来更快的响应速度和更优的用户体验。客观来说,该方案的落地,解决了AI应用中长期存在的“数据时效性”难题,为更广泛的AI应用场景提供了可行性。
新华三的AI数据平台解决方案,是软硬件深度协同的优秀案例。它融合了新华三在存储领域的深厚积累与NVIDIA在AI计算方面的领先技术,打造出一个存算网高度集成的智能数据平台。通过上层软件平台的优化协同,为AI基础设施注入了强大的动力,显著提升了AI大模型的推理能力。这种软硬件一体化的设计思路,也体现了当前AI基础设施发展的趋势,即更加注重整体性能的优化,而非单一硬件的提升。

该方案集成了NVIDIA Spectrum-X AI以太网网络平台,包括高性能以太网交换机、BlueField-3 DPU数据处理器以及ConnectX SuperNIC。通过这些先进的网络技术,普通以太网的带宽利用率被大幅提升至97%以上,从而有效应对流量高峰,确保存储与计算节点之间的高速连接。BlueField-3 DPU与新华三的Polaris X20000存储系统进行了深度融合,支持NVMe over Fabrics和NVIDIA GPU-Direct Storage等多项先进技术,实现了存储的卸载与加速,进一步提升了存储性能并降低了能耗。这种硬件层面的深度优化,为AI应用提供了坚实的性能基础。

新华三的Polaris X20000系列存储系统,正是为AI智算场景量身定制的。它搭载了全新自研存储引擎,能够满足AI/HPC场景下海量数据处理的高性能需求。单个节点即可实现高达120GB/s的带宽和200万的IOPS(每秒输入/输出操作),并且集群性能可以实现近线性增长。这完美契合了AI大模型训练中海量小文件高并发和百TB级带宽的需求。更值得一提的是,该系统将多种存储协议集成于统一平台,实现了数据采集、模型训练到分发全流程的数据零迁移。其卓越的可靠性,如毫秒级故障上报与秒级切换,确保了训练任务的连续性,为企业提供了稳定、高效的存储支持。可以说,Polaris X20000系列是新华三在存储领域多年技术积累的集中体现。
在软件层面,该方案同样展现了强大的实力。在AI-Q NVIDIA Blueprint的加持下,代理式系统能够无缝连接至Polaris X20000高性能数据存储平台。AI-Q利用NVIDIA NeMo Retriever加速数据的提取与检索。这款软件能够高效处理海量结构化、半结构化及非结构化数据,包括文本、PDF、图像、视频等,从而显著提升了RAG(检索增强生成)应用的响应速度。同时,NVIDIA NeMo Guardrails确保了推理问答交互的安全性、准确性和主题相关性。新华三自主研发的灵犀使能平台(LinSeer Hub)则作为上层管理平台,提供了强大的AI智能体和推理引擎功能。这些软件层面的创新,赋予了整个方案更强大的智能化能力。

通过软硬件的深度整合,新华三的AI数据平台解决方案在提升大模型推理性能与Token处理速度方面取得了显著成效。它为企业提供了实时的数据洞察能力,驱动其业务场景的智能化升级。随着AI大模型的蓬勃发展,数据已成为AI生产力的核心要素。新华三作为存储领域的领军企业,凭借Polaris X20000系列的卓越性能和灵活性,进一步增强了AI数据平台的能力。而NVIDIA则通过其硬件加速和软件能力,充分释放了Polaris存储硬件的潜力,助力新华三实现了从“数据仓库”到“智能数据平台”的战略转型,构建了完整的AI数据闭环和高效AI基础设施。展望未来,新华三与NVIDIA的合作,将加速AI技术在各行各业的落地应用,为中国的智能化发展注入新的动力。