微信视觉团队斩获CVPR 2023 Video Similarity Challenge双赛道

访客8个月前AI生活71

近日,CVPR 2023 Video Similarity Challenge比赛圆满结束,微信视觉团队凭借出色的表现,成功获得该比赛双赛道冠军。

在比赛中,微信视觉团队以深厚的技术实力成功夺得了Descriptor Track 和 Matching Track两个赛道的冠军,并在Matching Track赛道提出了创新性的解决方案,比赛指标远超其他参赛者。目前,相关技术论文《A Dual-level Detection Method for Video Copy Detection》、《 A Similarity Alignment Model for Video Copy Segment Matching》已发布于论文预印本网站arXiv。

微信视觉团队斩获CVPR 2023 Video Similarity Challenge双赛道

微信视觉团队斩获CVPR 2023 Video Similarity Challenge双赛道

Descriptor Track最终榜单和Matching Track最终榜单

微信视觉团队挑战CVPR 2023 Video Similarity Challenge,成功斩获双赛道冠军

伴随着短视频平台的兴起,短视频搬运、抄袭等问题也日益严峻,视频原创保护意识和视频拷贝检测技术逐渐引起广泛关注与重视。为推动视频拷贝检测领域的不断进步, Meta AI在 CVPR 2023 Workshop上发起Video Similarity Challenge。作为计算机视觉领域的全球顶会,CVPR举办了许多比赛,每次比赛都吸引了众多国内外企业、科研机构的顶尖团队参与角逐,此次也不例外。其中,微信视觉团队也报名参加了此次比赛。

据了解,视频拷贝检测技术是用于检测一个视频是否拷贝了另外一个视频,包括完整拷贝、片段剪辑以及各种滤镜特效花边字幕等编辑对抗。其中,Descriptor Track 和 Matching Track是视频拷贝检测工作中的两个重要的环节。基于此,本次比赛设立了Descriptor Track 和 Matching Track两个赛道。

在比赛中,微信视觉团队表现出色,以0.8717和0.9153的成绩成功揽下双赛道冠军。其中,在Matching Track赛道上,微信视觉团队提出了新的解决方案,得分也远超其他参赛者。

微信视觉团队推出新方案,已部署应用于视频号

据介绍,此次比赛难点在于不仅需要判断两个视频质检是否存在拷贝关系,还需要定位到两个视频拷贝片段具体位置。这里需要高性能的视频特征,用于在巨大视频库中召回拷贝视频。此处主要的挑战是源视频和拷贝视频通常存在大量编辑,而且拷贝时长,位置也是完全随机的。对于拷贝片段的实际匹配关系,则一直是业界的难点,特别是对于时长较短的拷贝片段非常难做到准备的定位。因此, Video Similarity Challenge比赛将这个问题分为Descriptor Track 和 Matching Track两个赛道。

比赛中,微信视觉团队克服重重难点,成功登顶两个赛道榜单的榜首,并且在Matching Track赛道上,还研发出了一套更为精准、高效的解决方案。

在Descriptor Track 赛道中,微信视觉团队经过数据分析后明确了任务难点,并基于此提出了一个两阶段检测方法来识别拷贝视频,该方法分为Frame-Level Embedding、Video Editing Detection和Frame Scenes Detection三个模块。在对3个模块进行深度训练学习后,最终在uAP指标上取得了0.8717的成绩,相比第2名的0.8514有明显提升。

微信视觉团队斩获CVPR 2023 Video Similarity Challenge双赛道

在Matching Track 赛道上,微信视觉团队提出的Matching Track 解决方案由Feature Extraction、Similar Segment Matching和Similar Segment Parsing三部分组成。其中,Feature Extraction 基于Descriptor Track 方案,负责视频帧级别embedding提取;Similar Segment Matching 则基于query视频和reference视频的帧级别embedding相似度矩阵为输入。

首先,基于MobileNet-V3等分类器,从大量召回中筛选正样本,剔除大量简单负样本召回,减少Matching阶段计算开销。其次,使用HRNet-w18作为骨干网络,预测每帧的匹配关系。最后Similar Segment Parsing阶段,经过连通分量算法和RANSAC回归算法的后处理,得到源视频和copy视频的copy片段匹配关系。该方案在比赛评测数据上,uAP指标达到了惊人的0.9153,远超其他参赛者。

微信视觉团队斩获CVPR 2023 Video Similarity Challenge双赛道

目前,微信视觉团队在CVPR 2023 Video Similarity Challenge比赛中的相关技术方案已在视频号落地使用。作为内容记录与创作平台,微信视频号始终尊重并维护每位权利人的知识成果,通过“首发内容保护机制”、“原创声明机制”、线上+线下协同合作、电子侵权投诉系统、关联帐号打击等措施,优化用户体验,提升处理能效。

未来,微信视觉团队也将不断加强在Video Similarity(视频相似性)方面的技术积累,将先进技术落地应用至产品场景,持之以恒地打击短视频拷贝、直播录播盗播等黑灰产,竭力打造繁荣健康的原创内容生态。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

海外淘宝正式打响,SHEIN将如何做得更好?

海外淘宝正式打响,SHEIN将如何做得更好?

近期,围绕SHEIN有不少的话题。 业内备受讨论的是,Temu的下场是否给SHEIN带来冲击。小编曾发文提到,这两家企业的重叠用户仅有2%,似...

深耕滑环细分领域十余载 默孚龙科技多元化产品受青睐

深耕滑环细分领域十余载 默孚龙科技多元化产品受青睐

深圳市默孚龙科技有限公司是全球高端精密滑环制造商-国家高新,专精特新企业以及潜在科技独角兽企业,目前员工400多人,年营业额超1亿,超10...

营收 3 年暴涨 33 倍,韩国也有了“医学影像 AI 第一股

营收 3 年暴涨 33 倍,韩国也有了“医学影像 AI 第一股

图片来源:Lunit官网 近日,韩国AI影像企业Lunit(论影医疗)成功在本国创业板IPO。 这家成立于2013年的AI影像企业,专注于研...

天玑科技受邀出席“2023智慧港口大会”,为港口智慧化发展注入强劲动力

天玑科技受邀出席“2023智慧港口大会”,为港口智慧化发展注入强劲动力

10月19日-20日,为贯彻落实加快建设交通强国、数字中国的决策部署,坚持创新驱动,让网络、数字、智能化为港口经济发展赋能,促进其能级跃升...

加速存算一体商用,知存科技获2亿元B2轮融资

加速存算一体商用,知存科技获2亿元B2轮融资

1月6日,存算一体芯片技术与商业化领跑企业知存科技宣布完成2亿元B2轮融资。本轮融资由国投创业领投,水木春锦资本、领航新界跟投,指数资本继续担...

算了一下,天猫支持商家做生意,2024年要投500亿

算了一下,天猫支持商家做生意,2024年要投500亿

4月2日,天猫TopTalk在上海举办。作为天猫年度最重要的会议,TopTalk会上通常提出下一年的新策略、新定位和新目标。今年的不同首先体现...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。