随着2025年科技浪潮的席卷,生成式AI技术迎来了新的发展高峰。DeepSeek和OpenAI的GPT-4.5等开源AI模型的涌现,标志着AI技术进入了一个新的阶段。在这场技术变革中,数据作为驱动AI发展的三大关键要素之一,其战略地位愈发凸显,被视为数字经济时代的核心生产要素。
根据国际数据公司(IDC)的统计数据,2024年全球大数据IT总投资已逼近3540亿美元。预计到2028年,这一数字将大幅增长至近6440亿美元,未来五年复合增长率高达16.8%。中国作为全球大数据领域的重要参与者,其发展势头尤为强劲。预计到2028年,中国在大数据IT方面的支出将达到621.7亿美元,占全球总额的10%左右,复合增长率高达24.9%,在全球范围内处于领先地位。目前,中国的数据产量已占全球数据总产量的23%,进一步奠定了其在全球大数据领域的地位。
面对数据量激增和应用场景日益复杂的挑战,OceanBase首席技术官(CTO)杨传辉在接受钛媒体AGI专访时指出,AI时代的到来,不仅拓宽了数据处理的边界,也带来了数据扩展性、数据规模以及数据碎片化等新的挑战。为了应对这些挑战并满足日益增长的客户需求,OceanBase正致力于构建一体化数据处理平台。这种平台旨在简化数据管理,提高数据处理效率,并为AI应用提供坚实的数据基础。

OceanBase作为国内领先的一体化分布式数据库公司,凭借自2010年成立以来在金融、政务、运营商、零售、互联网等多个行业的深厚积累,已经成功助力超过2000家客户完成了关键业务系统的升级。2020年,蚂蚁集团旗下的OceanBase成立了北京奥星贝斯科技有限公司,正式开启商业化运作,并陆续发布了OceanBase4.0、4.2、4.3等多个版本的技术产品和解决方案,以满足不同行业和场景的需求。
2025年4月,OceanBase CEO杨冰在一封全员信中宣布,公司将全面拥抱AI时代,致力于打造“DATA×AI”核心能力,并建设AI时代的一体化数据底座。为支持这一战略的顺利实施,蚂蚁集团将向OceanBase开放全部AI应用场景,提供必要的资源和技术支持。同时,OceanBase也启动了人才和组织体系的升级,任命CTO杨传辉为AI战略负责人,并新成立了AI平台与应用部、AI引擎组等部门,以加强在AI领域的研发和创新能力。
在即将于5月17日举办的2025开发者大会上,OceanBase将以AI为主题,全面展示其在AI领域的最新技术成果和战略布局。杨传辉在被任命为AI战略负责人后的首次公开对话中强调,打造“AI时代的一体化数据底座”是OceanBase现有战略的自然延伸,这既源于市场对AI驱动数据处理解决方案的迫切需求,也基于OceanBase自身已具备的产品和技术优势。
杨传辉认为,在AI时代,数据规模和数据种类的复杂性不断攀升,数据库与AI的关系已不再是简单的DATA+AI,而是DATA×AI。这意味着数据库不仅需要存储和管理海量数据,还需要具备处理不同结构数据的能力,以及将数据与AI模型深度融合的工程能力。OceanBase作为一体化分布式数据库平台,凭借其分布式和一体化的产品特性,有望成为AI时代下的最佳选择。
然而,要真正实现DATA×AI的愿景,OceanBase仍然面临着诸多挑战,包括持续的技术创新和完善的生态系统建设。杨传辉表示,OceanBase需要具备战略定力,坚持长期投入,以时间和耐心来确保公司的可持续发展,最终实现AI时代的一体化数据底座的目标,并满足日益增长的用户需求。
在专访中,杨传辉还进一步阐述了OceanBase在AI战略上的深入思考。他强调,OceanBase对数据库与AI的关系进行了重新定义,认为两者之间应有更深层次的融合和化学反应。他指出,大模型在技术层面主要分为算法能力、工程能力、数据能力和应用能力,而数据库研发团队在工程能力方面具有天然的优势,这有助于DATA与AI技术的进一步融合,从而真正实现DATA×AI。
针对当前生成式AI技术面临的数据量通货膨胀、数据孤岛和碎片化严重、数据分析需求爆发等挑战,OceanBase在4.3版本和即将发布的4.4版本中,都着重加强了其扩展性和工程能力,以更好地处理非结构化数据,并进一步提升向量数据库能力。通过这些技术升级,OceanBase旨在为AI应用提供更高效、更灵活的数据支持。
在即将召开的开发者大会上,OceanBase将发布一系列与AI相关的数据库产品和能力,包括在向量数据库等一体化数据底座的数据处理能力上的显著提升。此外,OceanBase还将推出RAG(Retrieval-Augmented Generation)服务,帮助企业通过一体化的方式将自有数据和公开数据模型相结合,从而挖掘更大的业务价值。OceanBase还将展示其应用大模型所取得的最新成果,并分享在AI领域的实践经验。