腾讯研究院近期发布了人工智能领域一项突破性成果——DRT-o1系列模型。该模型专注于解决神经机器翻译(NMT)在文学作品翻译中面临的难题,特别是如何精准处理比喻和隐喻等修辞手法,从而显著提升翻译质量。
众所周知,尽管NMT在一般文本翻译上表现出色,但面对充满文学色彩、富含比喻和隐喻的文本时,其翻译效果往往难以令人满意。 这主要是因为这类修辞手法往往蕴含着丰富的文化内涵和情感色彩,难以用简单的字面翻译来准确表达。DRT-o1系列模型的出现,为解决这一长期困扰着翻译领域的难题提供了新的思路与方法。
为了训练DRT-o1模型,腾讯研究团队从古腾堡计划中筛选了400本英文公共领域书籍,从中提取了577,600个句子,并进一步精挑细选出63,000个包含明喻和隐喻的句子作为模型的训练数据集。 如此大规模且高质量的数据集,为模型的精准训练提供了坚实的基础。
DRT-o1模型的核心在于其创新的多智能体框架,该框架模拟了人类翻译过程,由“翻译员”、“顾问”和“评估员”三个虚拟角色组成。 这三个角色分别负责关键词翻译、初步翻译和翻译结果的精炼,通过迭代循环不断优化翻译输出,最终实现对原文神韵和情感的精准捕捉。

例如,英文句子“The mother, with her feet propped up on a stool, seemed to be trying to get to the bottom of that answer, whose feminine profundity had struck her all of a heap.” 在经过DRT-o1模型翻译后,不仅准确地传达了原文的字面意思,更成功地再现了其中蕴含的母亲认真思考、被女儿的回答所触动的情感细微之处,体现了模型对文化内涵和情感色彩的理解能力。
此外,为了进一步提升翻译结果的流畅性和可读性,腾讯研究院还利用GPT-4o对DRT-o1模型的输出结果进行了润色。 DRT-o1系列包含DRT-o1-7B和DRT-o1-14B两个版本,实验结果表明,这两个版本在翻译质量上均显著优于传统的NMT模型,尤其是在处理比喻和隐喻方面的准确性和表达力上。
腾讯研究院的这项研究成果,不仅展现了人工智能技术在文学翻译领域的巨大应用潜力,也为促进不同文化之间的文学交流提供了新的技术手段,为推动跨文化理解做出了积极贡献。 未来,随着技术的不断发展,我们可以期待人工智能在文学翻译领域发挥更大的作用,最终实现“信、达、雅”的翻译目标。