用AI算法提升视频质量!

访客1年前AI生活133

研究人员越来越多地使用AI将历史镜头转换为高分辨率、高帧率的视频,看起来就像是用现代设备拍摄。为了简化该过程,罗切斯特大学、东北大学和普渡大学的研究人员最近提出了一种框架,该框架可从低帧频、低分辨率视频生成高分辨率慢动作视频。

据研究团队表示,他们使用的“时空视频超分辨率(STVSR)”算法不仅在图像质量上比现有方法更好,而且比以前的最新AI模型快三倍。

就某种意义上而言,这一框架的提出是继英伟达在2018年发布的针对视频处理AI模型后的再次提升,当年英伟达的AI模型可以对任何视频应用进行慢动作处理。据了解,类似的高分辨率技术已经应用于视频游戏领域。去年,《最终幻想》的用户通过使用一款名为AI Gigapixel的软件(售价100美元)来提高《最终幻想VII》的背景分辨率正是基于这类技术。

用AI算法提升视频质量!

具体而言,STVSR同时学习时间插值(如何在原始帧之间合成不存在的中间视频帧)和空间超分辨率(如何从相应的参考帧及其相邻帧中重建高分辨率帧);与此同时,得益于伴随的卷积长短期记忆模型,它能够利用视频上下文和时间对齐来从聚合特征中重建帧,以此合成高分辨率慢动作视频。

研究人员使用来自Vimeo的60000多个7帧剪辑的数据集对STVSR进行了培训,并使用单独的评估语料库将数据集划分为快动作、正常动作和慢动作集,以测量各种条件下的性能。在实验中,他们发现STVSR在快动作的视频上获得了显著的改进,包括那些具有挑战性的动作视频,例如篮球运动员在球场上快速移动的视频。据外媒报道称,该AI模型具有更精确图像结构和更少模糊伪影的帧重建能力,同时又比基准模型小四倍、快至少两倍。

“通过这种单阶段设计,我们的网络可以很好地探索任务中时间插值与空间超分辨率之间的内在联系,” 预印本论文的合著者写道。“它使我们的模型能够自适应地学习,以利用有用的本地和全局时间上下文来缓解大型运动问题。大量的实验表明,我们的框架比现有AI模型更有效、效率更高,并且所建议的特征时间插值网络和可变形模型能够处理非常具有挑战性的快速运动视频。”

据外媒报道称,该项目研究人员打算在今年夏天对外公布源代码。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

2022年toio全方位发力,通过创意机器人助推青少年获得跨越式成长

2022年toio全方位发力,通过创意机器人助推青少年获得跨越式成长

toio™是一款可以激发创意灵感的机器人玩教具产品。2022年是toio™创意机器人套件进入中国市场的第二年,toio™提交了相当亮眼的成绩...

推想医疗科技股份有限公司,拟首次公开发行A股股票并在科创板上市!

推想医疗科技股份有限公司,拟首次公开发行A股股票并在科创板上市!

据报道,推想医疗科技股份有限公司(以下简称推想科技)拟首次公开发行A股股票并在科创板上市。公司已于2020年12月18日与中信建投证...

我们还没有看到小鹏的「技术上限」

我们还没有看到小鹏的「技术上限」

小鹏的技术能力,又一次得到了验证。 4月17日,小鹏与大众官宣了最新的战略合作,双方将基于小鹏最新一代电子电气架构EEA进行联合开发,这一架...

腾讯集团副总裁李强:腾讯坚定推动大模型走入产业全链条

腾讯集团副总裁李强:腾讯坚定推动大模型走入产业全链条

“腾讯坚定推动大模型走入产业全链条,从田间到产线,从实验室到便利店,大模型将无处不在”,2023腾讯全球数字生态大会现场,腾讯集团副总裁、政企...

库克智能推出首款支持多模混合型生物识别 3D 人脸识别智能终端!

库克智能推出首款支持多模混合型生物识别 3D 人脸识别智能终端!

库克智能创立不到一年已发表了业界首款支持多模混合型生物识别 3D 人脸识别智能终端。 2D 人脸识别发展已趋成熟 , 仍发生层...

小编带你去逛服贸会!教育科技的发展被提上了新的台阶!

小编带你去逛服贸会!教育科技的发展被提上了新的台阶!

9月4日,2020年中国国际服务贸易交易会在北京拉开帷幕。作为全球服务贸易领域规模最大的综合型展会,本届服贸会以“全球服务,互惠共享”为主题,...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。