香港中文大学联合趣丸科技开源MaskGCT语音大模型

AI快讯网10月24日消息，香港中文大学（深圳）与趣丸科技联合研发的语音大模型“MaskGCT”正式在Amphion系统中开源，面向全球用户开放使用。区别于传统TTS模型，该模型采用掩码生成模型与语音表征解耦编码的创新范式，在声音克隆、跨语种合成、语音控制等任务中展现出卓越性能。据介绍，MaskGCT在三个TTS基准数据集上都达到了SOTA效果，性能超过当前最先进的同类模型，某些指标甚至超过人类水平。

香港中文大学联合趣丸科技开源MaskGCT语音大模型

发表回复