ASR

人工智能

小米发布全链路语音大模型 MiMo-V2.5：TTS 单句即可生成新声音模型，ASR 开源支持方言及多语言混合

在大模型从文本向多模态交互演进的关键节点，语音能力的“情感化”与“可控性”正成为区分产品体验的核心分水岭。以往的行业方案往往侧重于识别准确率或合成自然度，却忽略了声音作为情感载体的…

2026年 4月 24日