Soul App开源端到端多人对话转录模型

AI快讯网6月3日消息,据Soul官方消息,Soul App AI团队(Soul AI Lab)联合西北工业大学音频语音与语言处理研究组ASLP@NPU团队及Moonstep AI,正式开源端到端多人对话转录模型SoulX-Transcriber。作为一款面向长音频、多说话人场景设计的语音理解模型,该模型能够直接从多人对话音频中生成包含时间戳、说话人身份和转录文本的结构化结果。(广角观察)

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!