2023 年 6 月 24 日,2023 年度国家科学技术奖在北京揭晓,共评选出 250 个项目。据悉,由科大讯飞股份有限公司牵头,联合中国科学技术大学、清华大学等高校及行业领军企业联合完成的“多语种智能语音关键技术及产业化”项目荣获 2023 年度国家科技进步奖一等奖。这是深度学习引发全球人工智能浪潮以来,过去十年人工智能领域的首个国家科学技术进步奖一等奖,标志着科大讯飞在人工智能领域取得了重大突破,也为中国人工智能产业发展注入了新的活力。
多语种智能语音技术是包含多语种语音识别、多语种语音合成、多语种翻译技术等在内的综合技术,也是新一代人工智能核心技术之一。该技术对于支撑人机交互、人类语言互通及国家安全等需求具有重大战略意义,具有十分广阔的产业前景,是当前国际科技竞争的核心焦点之一。然而,智能语音也面临着如何突破复杂场景语音技术大规模实用门槛,如何基于自主可控的平台、实现国产软硬件的语音产业链自主可控等问题。
为解决这一技术难题,科大讯飞联合各单位、企业持续攻关十余年,通过提出复杂语音信号解耦建模技术、多语种共享建模技术、语音语义联合建模技术、国产异构硬件平台训练及推理加速技术等,实现了国产多语种智能语音的关键技术突破,构建形成了自主可控的智能语音技术体系。据悉,科大讯飞也是唯一获得本届国家科学技术奖一等奖的民营企业。
目前,该技术支持全球 69 个主流语种,除了 6 个联合国通用语言(汉语、英语、法语、西班牙语、俄语、阿拉伯语)之外,还包括挪威语、丹麦语等小语种 54 个,均达国际通用标准。这意味着,科大讯飞的多语种智能语音技术已经具备了覆盖全球绝大多数语言的能力,为中国人工智能技术走向世界打下了坚实的基础。
该技术成果不仅在博鳌论坛等重要政务和商务交流场合得到广泛应用,更在中国品牌“走出去”战略中发挥了关键推动作用。以近年来国产新能源汽车的海外出口为例,中国汽车出口企业十强中,有八家搭载了科大讯飞的多语种智能语音技术,涵盖 23 个语种,服务范围扩展至 60 多个国家和地区,为中国汽车行业的国际化进程提供了有力支撑。除此之外,该技术还在教育、医疗、金融等多个领域得到广泛应用,为推动中国经济社会发展做出了重要贡献。
据悉,近三年,多语种智能语音技术产业化项目累计实现直接经济效益 521.28 亿元,并带动由工业和信息化部和安徽省政府共建、以科大讯飞为核心的“中国声谷”产业集聚发展。该项目不仅为科大讯飞带来了丰厚的经济效益,也为中国人工智能产业发展创造了更大的价值。
6 月 27 日,讯飞星火 V4.0 也将正式发布,底座能力全面对标 GPT-4 Turbo,语音大模型也将迎来全新升级。这表明,科大讯飞将继续在人工智能领域深耕,不断突破技术瓶颈,为人类社会发展创造更多价值。我们期待科大讯飞能在未来的发展中取得更大的成就,为中国人工智能产业发展做出更大的贡献。