随着通义千问宣布大模型降价,百度也随即宣布旗下两款大模型免费。5月22日,科大讯飞(002230.SZ,股价43.87元,市值1015.76亿元)宣布其讯飞星火LiteAPI永久免费开放。大模型的降价和免费开放,对数字人行业带来了哪些影响呢?
数字人的新机遇:大模型降价与数智人崛起
数字人的互动能力依赖于大模型技术,大模型的降价无疑为数字人行业带来了新的机遇。飞影数字人战略顾问小豪表示,大模型价格下跌对互动数字人产品是利好,结合大模型后,数字人将升级进化为数智人,拥有更强大的互动能力。
讯飞智作产品经理姚仕豪则认为,大模型有利于虚拟人的发展,成本并非关键因素,效果更重要。数字人不仅仅需要大模型技术,还需要图像识别、3D建模、动作捕捉、自然语言处理、计算机视觉等一系列先进技术的融合,才能实现外观、行为和思想的数字化模拟。
数智人:大模型赋能数字人互动
小豪解释了数字人接入大模型后的变化:用户不再需要预先提供文案,数智人可以根据用户的实时提问进行回应。这使得数字人能够应用于更多场景,例如数字人直播,观众可以与数字人进行实时互动。大模型作为“大脑”,数字人作为“身体”,两者结合,开创了新的数智人时代。
大模型降价:C端市场潜力释放
大模型降价后,互动数字人的应用场景将更加广泛,面向C端普通人的用户场景得以真正释放。过去,由于大模型的高昂成本,与数字人聊天一小时的费用十分高昂,现在价格下降90%后,普通用户也能负担得起与数字人进行互动。
技术进步推动数字人逼真
头豹研究院行业分析师陈庆民表示,大模型技术的进步将为数字人提供更好的交互性,结合自然语言处理和语音识别技术,数字人可以更自然地理解和回应人类语言,从而提升用户体验。
淘气叮当工作人员展示了数字人动作捕捉的场景和数字人直播效果展示。多模态建模技术能够捕捉真人主播的表情、动作和语言,并将其数字化,生成逼真的数字人。技术的进步已经让数字人直播几乎与真人直播 indistinguishable。
公司总经理王微也表示,数字人直播之所以能做到那么逼真,与大模型技术、动作捕捉、计算机图形、计算机视觉等技术的进步密切相关。从最初的二次元虚拟人,到如今的1:1拟人数字人,技术的进步推动着数字人不断逼近真实。
陈庆民、深兰科技创始人陈海波等专家都认同,计算机图形、渲染技术在数字人的外观和动作的生成中起着至关重要的作用。深度学习算法能够识别人类的面部表情和身体语言,并生成相应的数字人表情和动作,使得数字人的动作、表情更加逼真、自然。
市场空间:替代还是新增量?
数字人技术不断进步,大模型价格下降,数字人市场能否迎来爆发式增长?
一位人工智能公司高管朱舜水(化名)表示,数字人技术的进步显著提升了视频制作的效率。使用数字人可以替代真人进行各种操作,不仅实现了高度逼真的呈现效果,还大大简化了修改过程,节省了大量时间和成本。
王微认为,数字人可以解决电商行业主播成本高、流动性强的问题。在一些偏远地区,招到合适的主播也并非易事,数字人可以弥补这一缺口。数字人主播可以进行长时间直播,且可以批量复制,无需像真人主播一样休息,可以满足企业的24小时直播需求。
此外,数字人还可以在跨境电商等领域应用,为海外用户提供外语口播视频,省去了外语专业人员的成本和时间成本,提高了效率。
挑战:从“重技术”到“重运营”
尽管数字人技术已经取得了巨大进步,但在实际应用中,数字人直播行业呈现出从“重技术”到“重运营”的趋势。
小豪表示,虽然数字人直播技术已经成熟,但平台规则的限制使得数字人直播的应用受到阻碍。数字人直播需要深入了解用户需求和直播策略,进行精准的运营,才能实现更高的投资回报率。
王微也表示,为了更好地服务用户,公司开始提供“技术+运营”的服务,帮助用户进行数字人主播的运营,降低用户使用门槛,提高数字人直播的应用效率。
陈庆民认为,数字人直播的兴起确实对传统主播的职业生涯产生了影响,但数字人与传统主播可以相互补充,共同发展。数字人更适合进行长时间直播,处理大量用户,而传统主播在情感表达、互动和个性化方面仍然具有优势。
陈海波也指出,数字人在模仿人类行为和表情方面还存在一些局限性,例如情感表达的深度、复杂情感的细微差别等。技术在不断进步,但要完全模仿人类的行为和情感表达,还需要很多年的发展。