悦数科技:Graph RAG先行者,如何领跑向量数据库新赛道?

近年来,向量数据库领域蓬勃发展,成为技术领域的焦点。尤其是在2023年大模型技术突飞猛进之后,高效检索高维向量数据对于大模型的训练和推理变得至关重要。向量检索作为检索增强生成(RAG)技术的关键组成部分,更是被推到了数据库技术的前沿。

尽管RAG技术应用广泛,但其局限性也逐渐显现。RAG主要依赖于向量化的知识本身,难以捕捉独立信息之间的关联,更无法结合关系和语境进行深度语义理解和上下文细微差别的处理。因此,在面对需要复杂推理的查询时,RAG技术的表现往往不尽如人意。这一问题,也催生了对更高级检索技术的需求。

面对RAG技术的挑战,杭州悦数科技有限公司(以下简称悦数)CTO叶小萌及其团队于2023年与LlamaIndex联合提出了Graph RAG的概念,并迅速分享了初步验证结果。Graph RAG的核心思路是将知识图谱和图数据库的优势相结合,力图更精确、更全面地检索相关信息,使模型能够关联上下文,从而给出更准确的答复。 这被认为是提升RAG性能,解决其固有局限性的有效探索方向之一。

悦数CTO叶小萌认为,差异化是悦数的核心竞争力。她指出,虽然大模型的兴起带动了RAG技术的发展,但要让通过公域数据训练的大模型理解私域数据,就需要预先将私域数据保存下来,并进行向量化比较,以便快速找到关联内容。然而,单纯使用向量数据库的局限性让悦数团队开始探索图数据库与向量的融合。这种融合试图弥补向量数据库在关系理解和推理方面的不足,为RAG技术带来新的可能性。

起初,人们对Graph RAG这种结合方式还比较陌生。但是,悦数并未止步,而是迅速组建团队开始研发RAG产品。经过一年的努力,悦数RAG产品终于问世,并已进入产品市场匹配阶段(PMF),预计将在今年进行大规模推广。可以看出,悦数在技术创新方面的投入和决心。

古思为是悦数Graph RAG项目的核心成员之一。他认为,市场上现有的RAG结合方式都存在局限性,而Graph RAG则具有足够的复杂性和想象力。他将Graph RAG比作一个“小帐篷”,能够容纳多种技术和方法。但也正因为如此,如何进行技术选型和取舍也成为了挑战。最终,悦数团队通过反复斟酌,简化了实现方式,并取得了不错的市场反馈。

在Graph RAG概念落地的过程中,悦数团队面临了诸多实际挑战。为了让用户即使对图数据库没有深入了解也能获得良好的使用体验,团队与数十个客户进行了深入沟通,并迭代出了开箱即用的解决方案。目前,悦数RAG已经能够无缝衔接DeepSeek,并正在进行基于蒸馏技术、图上推理等功能的迭代,不断提升产品的性能和易用性。

值得一提的是,悦数不仅在RAG领域不断创新,还在图数据库国际标准制定方面取得了重要进展。2024年4月,国际标准化组织(ISO)正式发布了国际标准图查询语言GQL。悦数长期跟踪并投入研发这一标准,并在GQL标准发布后的同年11月,推出了全球首款原生支持GQL的分布式图数据库产品——悦数图数据库v5.0。这标志着国产图数据库技术在国际标准领域迈出了重要一步。

悦数图数据库的增长势头迅猛。2023年实现了两倍多的增长,2024年又比2023年增长近三倍,已接近收支平衡。叶小萌表示,悦数并非为了做信创而做信创,而是业务发展自然而然地契合了信创的需求。悦数图数据库的每一行代码都是团队自主研发,具有自主可控的特点,是发展信创的良好基础。

当然,进入信创名录并非易事。悦数正在积极适配各种信创操作系统和硬件,以期在信创市场占据一席之地。同时,悦数图数据库还通过了中国信通院举办的“可信数据库”图数据库性能测试,成为国内首个全项完成该测试的图数据库产品,进一步证明了其产品的技术实力。

悦数科技:Graph RAG先行者,如何领跑向量数据库新赛道?

在悦数的客户中,一半以上都有信创需求。叶小萌观察到,目前还愿意为产品支付较高价格的企业往往是国央企或具有国资背景的企业。在政企领域,金融行业的客户竞争尤为激烈。为了避免陷入价格战,悦数在投标时会避开价格分数占比过高的场景,并避免抢低价客户。叶小萌认为,产品价格应该体现其为客户带来的价值,技术竞争对行业发展有利,但价格战则无法体现软件产品的真正价值。

作为图数据库市场发展的亲历者,叶小萌明显感受到市场教育的成效。现在团队与客户沟通时,不再需要从图数据库的定义和功能讲起,而是可以直接介绍行业经验和应用场景。她将数据库市场的竞争比作一场长跑,认为现在已经进入后半程,第一梯队和第二梯队的格局正在逐渐形成。

悦数科技:Graph RAG先行者,如何领跑向量数据库新赛道?

深受硅谷科技公司工程师文化影响的叶小萌,希望将悦数打造成为技术最强的公司。她希望悦数拥有专注技术、技术驱动、高度自驱的工程师文化。然而,对她来说,创业最大的挑战是突破自身边界。在进行商业化后,她需要直接面对客户,观察他们的反应,揣摩他们的想法,这对她来说是一项全新的考验。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
AI快讯网编辑-青青AI快讯网编辑-青青
上一篇 2025年 2月 14日 下午6:24
下一篇 2025年 2月 14日 下午8:07

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!