在瞬息万变的AI产业浪潮中,基础设施的支撑能力至关重要。近日,腾讯云AI产业应用峰会上,腾讯云副总裁李力重磅发布了全新升级的腾讯云智算平台。此次升级并非简单的性能提升,而是针对AI应用和模型爆炸式增长所带来的严峻挑战,在效能、可靠性和易用性三大核心领域进行了全方位的革新,旨在为AI大模型训练、智能体部署等前沿应用场景,构建更坚实、高效的基础设施底座。
李力强调,从云计算时代到AI时代,云基础设施的演进始终围绕着具体的应用需求。随着大模型日益普及,以及智能体、智能驾驶等应用的加速落地,对算力的需求呈指数级增长。腾讯云智算以“AI原生”为核心理念,致力于打造一个既安全又灵活的高性能基础设施平台,与开发者和企业携手,共同探索智能化转型的无限可能。这不仅是对现有云计算能力的升级,更是面向未来的战略布局。

在**效能**方面,腾讯云智算直击数据处理效率低下和资源利用率不足的行业痛点,推出了一系列创新技术。例如,依托国内首个支持跨卡型GPU调度的Serverless平台,腾讯云智算实现了高达10万级的并发数据任务处理能力,每秒请求数(QPS)更是达到行业领先的百万级别。此外,利用腾讯云存储数据万象中预置的100多个数据处理任务模板,企业数据打标效率得以显著提升,最高可达50%。通过优化数据处理流程,企业可以更快地完成AI模型的训练和迭代。
针对大模型训练和推理等算力密集型场景,腾讯云智算利用自研的星脉通讯库,充分释放双端口网卡的带宽潜力,使其利用率达到峰值,相比传统的DeepEP性能提升高达30%。更值得一提的是,腾讯云智算还推出了性价比更高的多机互联网络vRDMA,将数据传输损耗降低至不到2%,实现了模型训练效率的近乎无损扩展。这种技术的突破,意味着企业可以在相同的硬件成本下,获得更高的模型训练速度和效率。
例如,国内某知名车企在采用腾讯云智算方案后,其智能驾驶模型的数据标注效率提高了50%,数据处理的整体成本降低了70%,训练性能提升了30%,模型迭代周期也因此缩短了40%。这一案例充分展示了腾讯云智算在提升AI开发效率、降低运营成本方面的显著优势。
**可靠性**是AI基础设施稳定运行的关键。针对AI基础设施常见的服务不稳定、扩容速度慢、访问速度慢等问题,腾讯云智算通过自研AI服务器与智能巡检系统,将千卡集群的日均故障率控制在极低的0.16%以下。同时,借助腾讯云存储GooseFS,模型分发时间从原本的1小时大幅缩短至20分钟。此外,腾讯云在全球范围内部署了50多个可用区,使得AI应用服务能够就近接入,从而将服务稳定性提升了57%,扩容速度提高了两倍。这为企业提供了更加稳定、可靠的AI部署环境,确保业务的连续性和稳定性。
例如,某头部手机厂商在AI助手项目中应用腾讯云智算方案后,服务网络的丢包和抖动均显著下降了99%,服务稳定性提升了57%,同时实现了200%的扩容速度提升。这使得该手机厂商能够为用户提供更加流畅、稳定的AI助手服务,提升用户体验。
在**易用性**方面,为了加速智能体的规模化落地,腾讯云智算对AI原生工具链进行了全面升级。向量数据库支持向量与关键字的混合检索,能够处理千亿级数据,并支持高达500万QPS的高并发检索。腾讯云智能日志服务则提供统一的日志上报与可观测大盘,支持完整链路追踪与异常快速定位。此外,腾讯云智算还升级了覆盖大模型全生命周期的安全解决方案,确保安全事件能够在两小时内得到快速响应。这为企业降低了AI开发的门槛,提高了AI应用的开发效率,并保障了AI应用的安全可靠运行。
例如,某头部房产中介平台在搜索业务中引入腾讯云向量数据库后,数据召回率增加了30%,检索时间缩短了50%。同时,依靠日志和安全能力,异常定位效率提升了30%,安全响应时间缩短了90%。这使得该房产中介平台能够为用户提供更加精准、高效的房源搜索服务,同时保障了平台的安全稳定运行。
目前,腾讯云智算已广泛应用于智能体及AI应用、具身智能、自动驾驶、互联网应用等多个领域,展现出强大的应用潜力。在Gartner最新发布的生成式AI基础设施象限中,腾讯云智算的产品性能与未来潜力均位居亚太厂商之首,充分体现了其在AI基础设施领域的领先地位。腾讯云智算的领先优势不仅仅体现在技术指标上,更体现在对行业需求的深刻理解和快速响应上。通过不断的技术创新和实践积累,腾讯云智算正在成为企业智能化转型的重要推动力。
值得一提的是,腾讯云还对DeepSeek开源的DeepEP通信框架进行了深度优化,使其在各种网络环境下均实现了显著的性能提升。这一技术方案也获得了DeepSeek的公开致谢,被誉为一次重大的性能加速贡献。这彰显了腾讯云在开源生态建设方面的积极贡献,以及其与合作伙伴共同推动AI技术发展的决心。