在2024年北京举办的AICon全球人工智能开发与应用大会上,英博数科首席技术官李少鹏重磅发布了其“英博云”智能计算产品与服务系列。该系列涵盖智算中心建设与维护、GPU容器服务、先进算力实验室以及产业孵化器四大核心领域,旨在提供高效、多元化的GPU智能计算解决方案,助力企业加速AI技术研发和业务拓展。

当前智算行业正经历从规模化扩张向精细化运营的转变,呈现出三大显著趋势:首先,全球范围内对大模型训练的算力需求激增,集群规模已从千卡级跃升至万卡甚至十万卡级,成为推动大模型技术突破的关键;其次,AI在各垂直行业的应用日益广泛,导致算力需求更加分散且动态变化,不同行业(例如科研、金融、娱乐、零售)对算力资源的灵活性和可扩展性要求更高;最后,随着AI商业化进程加速,推理场景对算力的需求快速增长,甚至超过了训练算力需求,成为市场的主要驱动力。
然而,高昂的算力成本已成为制约大模型发展和应用普及的主要瓶颈。传统评估体系往往侧重于固定成本(如设备成本、运维成本),忽视了实际算力利用效率。为此,英博数科创新性地提出了“单位有效算力成本”这一评价体系,并制定了相应的计算公式。该体系以“卡可用率”、“卡利用率”和“模型算力利用率(MFU)”三大关键指标为核心,更精准地衡量实际算力利用水平,避免了资源闲置、设备故障等问题导致的评估误差,从而提升算力效率和效益评价的准确性。
英博云的推出,标志着智算产品进入一个高效益、多样化的新范式。 针对不同需求,英博云提供以下核心服务:
一、智算中心建设与维护:英博云凭借丰富的经验,为客户提供标准化、模块化的智算中心建设与维护解决方案。这包括自主研发的高性能并行存储解决方案、专业的硬件测评与检测体系以及精细化的集群监控和自动化故障恢复体系,确保高硬件稳定性和集群可用性。此外,依托成熟的算力调度平台,英博云还可通过容器化方式为客户提供高效、可伸缩的算力服务。
英博数科的智算中心建设与维护解决方案已成功应用于京能项目,其在供应链保障和集群运维方面的专业能力,成为项目顺利推进的关键因素。

二、GPU容器服务:面对垂类大模型分散、动态的训练需求,英博云为中小企业提供高效灵活的GPU容器服务。通过Vcluster形式提供GPU和CPU资源混合的弹性K8S集群服务,支持SSH和Kubectl管理操作,并具备秒级容器启停和计费粒度,以及企业级的并行存储服务。此外,英博云还提供内网预定义场景镜像仓库、常用模型库和数据集等,显著提高数据准备和环境配置效率。目前,英博云已服务于京能集团、百川智能等众多企业和科研机构。

三、先进算力实验室:该实验室致力于成为业界顶尖的算力性能评测中心,提供硬件(GPU、交换机、光模块、并行存储等)和软件(基座模型、训练框架、微调框架、推理框架等)评测服务,并为企业提供算力基础设施升级优化建议,助力提升算力效率和业务表现。目前已开展工业界主流GPU芯片的测试。
四、产业孵化器:通过联合AI产业链上下游企业,探索算力组合投资新模式,挖掘AI产业潜在方向,赋能企业实现技术研发和业务拓展的双重突破。
英博云系列产品的发布,展现了英博数科在智能算力领域的强大实力,其创新的评估体系和多元化解决方案,将引领行业迈向高效益、多样化和可持续发展的新阶段。