Chinaunix首页 | 论坛 | 博客
  • 博客访问: 324431
  • 博文数量: 653
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 5595
  • 用 户 组: 普通用户
  • 注册时间: 2022-03-07 15:28
个人简介

天翼云是中国电信倾力打造的云服务品牌,致力于成为领先的云计算服务提供商。提供云主机、CDN、云电脑、大数据及AI等全线产品和场景化解决方案。

文章分类

全部博文(653)

文章存档

2024年(204)

2023年(247)

2022年(202)

我的朋友

分类: IT业界

2023-04-10 17:23:32

近日,国际人工智能顶会CVPR 2023举办的5届自然场景情感行为分析挑战赛5th Workshop and Competition on Affective Behavior Analysis in-the-wild,简称ABAW)公布比赛结果,天翼云AI团队(CtyunAI)在情感分类任务中表现出色,凭借极高的性能指标荣获本届大赛季军。

 

CVPR会议是由IEEE主办的关于计算机视觉和模式识别的国际学术会议,收录了该领域最新的研究成果和技术发展,是全球计算机视觉三大顶级会议之一

 

ABAW竞赛是由国际顶级计算机视觉研究者和科学家们共同发起的竞赛,致力于解决自然情境下计算机对人的情感行为进行分析的问题,并以此提升人机交互系统的场景应用能力,目标是创造出能够理解人的感觉、情绪和行为的机器和机器人,从而让机器能够以”以人为本"的方式与人类互动,并有效地作为人类的数字助手。

 

比赛共吸引了来自世界各地的100多支团队参加,其中不乏业内知名的机构和公司,如网易、思图等。参赛队伍需要对来源于现实场景的594个视频共300万帧图像进行分析,通过视频中的图像、人物、声音来预测指定人物在连续时间下的情感。

 

相较上届竞赛,本届竞赛的数据标签极度不平衡且标签噪声多,给参赛队伍带来了一定挑战。由于现实世界的环境不受条件控制,所以竞赛所使用的视频数据相较往届呈现更加多样的视频录制条件、背景和显示方式。同时,为了考验算法对不同拍摄环境、不同人群等情况的适应能力(迁移学习能力),竞赛数据的样本分布极不均衡,也增加了竞赛难度。

 

 

天翼云AI团队在本次竞赛中使用了多模态融合技术通过不同模型同时提取视频的图像和音频特征,将这些特征进行融合后利用时域卷积网络Temporal Convolutional Network,TCN)和Transformer对数据在时间维度上进行建模,从而使模型能够通过视频的上下文对结果进行预测,大大提升了模型的任务表现。在情感识别任务中,该模型针对人类的六个基本情感(快乐、厌恶、悲伤、愤怒、惊奇、恐惧),以及中立情感进行识别,实现了F1-score超过0.35的好成绩。

 

本次天翼云AI团队能够在竞争激烈的ABAW竞赛中取得优异成绩,得益于天翼云多年来在图像、音频及多模态领域的深厚积累和不断创新。未来,天翼云将在广阔的人工智能领域持续创新和探索,以更先进的技术和更优秀的成果惠及更多用户,助力千行百业共享数字化发展成果。

 

阅读(361) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~