大皖新闻讯 在日前举办的科大讯飞成立25周年司庆活动上,科大讯飞董事长刘庆峰预告,讯飞星火V4.0将于6月27日发布,并将进一步强化其在国内的领先地位。近期,随着具备语音和音视频能力的GPT-4o发布,底座大模型再次迎来智慧升级,对此刘庆峰也表示,站在当前语音和大模型全新的战略机遇交汇处,讯飞星火将通过五大核心战略来打赢大模型之战。
五大战略打赢大模型之战
刘庆峰详细阐述了大模型时代科大讯飞的核心战略。
第二,开拓以央国企为代表的重点行业客户市场。科大讯飞将根据大模型能力的三個发展阶段,为重点行业客户提供真正解决行业和企业刚需的方案。
第三,开辟新兴赛道的软硬件一体化授权和新硬件机遇,比如机器人硬件、医疗硬件等。 随着大模型技术的成熟,科大讯飞将积极布局新兴赛道,提供软硬件一体化解决方案,拓展机器人、医疗硬件等领域。
刘庆峰通过展示多项行业和产品应用,展现了目前大模型的成果。据了解,目前中国汽车出口的多语种技术几乎全部由科大讯飞提供。奇瑞、蔚来、广汽、一汽等国产品牌都在与讯飞合作,国际汽车品牌大众在评估后也迅速落地应用,于3月13日发布首款搭载星火大模型的车型“ID.UNYX”。
刘庆峰指出,大模型应用落地的关键在于云边端一体化和软硬件一体化。科大讯飞在云侧拥有大参数通用模型和自主可控的硬件平台,在边端侧也有针对汽车等行业的解决方案和小型模型,构建了全面的落地优势。
智能语音应用将迎来全面重构
科大讯飞从语音起家。而OpenAI从GPT-4,到具备视觉功能的GPT-4V,再到语音大模型Whisper、文生视频大模型Sora,以及今年5月份发布的GPT-4o,都对全球语音市场产生了重大影响。
刘庆峰认为,大模型的出现为语音产业带来了全新的战略机遇,几乎所有语音应用都值得用新方式重构一遍。例如,医疗导诊机器人、酒店服务机器人、企业客服机器人等都可以重新设计; 7×24小时营业场所的部分岗位、企业中的服务类岗位等都可以用数字员工取代; 汽车、手机、家庭助手等终端的智能语音服务也能得到很大提升。
他分析,GPT-4o对万物互联时代语音浪潮的推动类似于当年Siri对语音应用的推动。GPT-4o之所以备受关注,是因为它实现了超拟人合成,使得说话不再是朗读腔调,而是像人一样自由对话; 实现了全双工交互,人机对话可以随时打断和继续; 实现了语音到语音的端到端建模,带来快速响应的极致交互体验。
刘庆峰表示,科大讯飞在超拟人合成技术方面已经取得了国际领先地位。下一步,科大讯飞将发力远场高噪音多人说话场景、高表现力个性化场景、云边端一体化、软硬件一体化,从技术优势、市场先机、落地成效构建全方位持续领先优势。