LIGER：兼顾效率与精度的混合检索模型

Meta AI的研究团队联合威斯康星大学麦迪逊分校、ELLIS Unit、LIT AI Lab、机器学习研究所及JKU Linz等机构，近期发布了名为LIGER（LeveragIng dense retrieval for GEnerative Retrieval）的创新人工智能模型。该模型旨在提升生成式推荐系统的性能，克服传统方法的局限性。

现代推荐系统在连接用户与信息方面至关重要。传统的密集检索方法通过计算项目和用户的向量表示来进行推荐，但其需要为每个项目生成嵌入，导致计算成本和存储需求随数据集规模增长而急剧增加，影响系统可扩展性。

而新兴的生成检索方法，虽然通过生成模型预测项目索引来降低存储需求，但在性能方面，特别是处理冷启动项目（用户交互有限的新项目）时，表现相对较弱。这限制了其在实际应用中的广泛性。

LIGER模型巧妙地融合了密集检索和生成检索的优势。它首先利用生成检索模型快速生成候选项目集，并获取包含语义ID和文本属性的项目表示；然后，利用密集检索技术对候选集进行更精确的筛选和排序。这种混合方法在效率和准确性之间取得了平衡。

LIGER模型采用双向Transformer编码器和生成解码器。密集检索部分整合了项目文本表示、语义ID和位置嵌入，并通过余弦相似度损失进行优化；生成部分则使用波束搜索，根据用户交互历史预测后续项目的语义ID。

实验结果表明，LIGER在Amazon Beauty、Sports、Toys和Steam等多个基准数据集上，性能显著优于现有的先进模型，如TIGER和UniSRec。例如，在Amazon Beauty数据集的冷启动项目场景下，LIGER的Recall@10得分为0.1008，而TIGER的得分为0；在Steam数据集上，LIGER的Recall@10达到了0.0147，同样显著高于TIGER的0。随着生成检索候选数量的增加，LIGER与密集检索的性能差距逐渐缩小，体现了其良好的适应性和高效性。

LIGER模型的成功之处在于有效地解决了传统推荐系统面临的计算资源消耗、存储需求巨大以及冷启动项目处理难题。这种混合检索策略为构建更高效、更精准的推荐系统提供了新的思路，具有重要的学术和应用价值。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

LIGER：兼顾效率与精度的混合检索模型

相关推荐

发表回复