中国科大云知声团队在ACM MM 2024竞赛中取得佳绩

近日，在澳大利亚墨尔本举办的第32届ACM国际多媒体会议（ACM MM）上，中国科学技术大学与云知声联合组建的USTC-IAT-United团队在多个AI竞赛中表现出色，斩获5项冠军和2项亚军，彰显了中国在人工智能领域的领先实力。

ACM MM作为CCF A类会议，在多媒体与计算机图形学领域享有盛誉，其学术影响力和行业认可度极高。本次会议汇聚了全球顶尖的学术机构和企业，其设置的多个富有挑战性的赛事吸引了众多团队参与，竞争激烈。

USTC-IAT-United团队在微动作分析、微表情检测、人机交互、多模态群体行为分析以及视觉空间关系描述等多个AI前沿领域取得突破。以下是对其获奖情况的详细介绍：

微动作分析：团队针对微动作持续时间短、难以捕捉的特点，创新性地提出了3D-SENet Adapter，高效聚合时空信息并进行在线视频特征学习。此外，他们开发的交叉注意力聚合检测头通过集成多尺度特征，显著提升了检测精度，最终在两个赛道上分别获得冠军和亚军，相关研究成果已发表在ACM MM会议上。这体现了团队在处理复杂时空数据方面的强大能力。

中国科大云知声团队在ACM MM 2024竞赛中取得佳绩

微表情检测：团队在两个不同的微表情识别赛道中均获得冠军。他们采用基于光流的方法，精确定位微表情的起始和结束时间；并通过边界校准方案和特征增强策略，进一步提升了识别准确性和鲁棒性。另有一项微表情挑战赛中，团队融合VideoMAE V2框架、时间信息适配器（TIA）及多尺度特征融合检测头，在STRS（Overall）评分中达到SOTA水平，再次夺冠。这表明团队在微表情识别算法设计和优化方面处于国际领先地位。

中国科大云知声团队在ACM MM 2024竞赛中取得佳绩

多模态群体行为分析：团队提出的双流AI-BiLSTM模型，通过对齐和交互对话者特征，实现了更准确的参与度估计，在MultiMediate挑战赛的Multi-domain engagment estimation赛道上夺冠，展现了团队在多模态数据分析方面的深厚积累。

深度伪造检测：团队设计的局部全局交互模块（AV-LG模块）显著增强了模型的检测性能。通过增加真实样本的误差权重和将采样帧转换为频域等创新方法，最终获得该赛道冠军。此项成果对于打击深度伪造技术具有重要意义。

中国科大云知声团队在ACM MM 2024竞赛中取得佳绩

USTC-IAT-United团队的优异成绩，是中科大和云知声紧密合作的成果，也展现了云知声在AGI技术架构方面的强大实力。作为国内AGI技术产业化的先行者，云知声的全栈AGI技术与产业布局，正在持续推动各行各业的智慧化升级，为智慧生活和智慧医疗等领域提供高效的产品化支撑。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30

中国科大云知声团队在ACM MM 2024竞赛中取得佳绩

相关推荐

发表回复