EMO来了!通义APP推出照片唱歌功能

访客2年前AI生活187

把一段音频、一张照片输入AI模型,就能让图中人物开口唱歌说话,让奥黛丽赫本唱《上春山》、陶俑仕女说英文RAP、爱因斯坦说中文段子。不久前,这款名为EMO的模型因为阿里通义实验室的一篇论文火遍海内外,模型的产品化进程也广受关注。4月25日,EMO终于上线通义APP,开放给所有用户免费使用。

打开通义APP,进入“全民舞台”频道,就可来到EMO产品页面“全民唱演”。在歌曲、热梗、表情包中任选一款模板,上传肖像照片,EMO随即就能合成视频。

EMO来了!通义APP推出照片唱歌功能

通义APP首批上线了80多个EMO模板,包括热门歌曲《上春山》《野狼disco》等,网络热梗“钵钵鸡”“回手掏”等。目前通义APP暂不开放用户自定义音频,用户只能选择APP预置的音频来生成视频。

EMO是通义实验室研发的AI模型,其背后的肖像说话(Talking Head)技术是当前大热的AIGC领域。EMO之前的Talking Head技术都需针对人脸、人头或者身体部分做3D建模,通义实验室在业界率先提出了弱控制设计,无需建模就可驱动肖像开口说话,不仅降低视频生成成本,还大幅提升了视频生成质量。EMO学习并编码了人类表达情绪的能力,能将音频内容和人物的表情、嘴型匹配,还能把音频的语气特征和情绪色彩反映到人物微表情上。

EMO来了!通义APP推出照片唱歌功能

2月底,通义实验室公布相关论文,EMO随之成为继SORA之后最受关注的AI模型之一。现在,通义APP让所有人都可免费体验前沿模型的创造力。未来,EMO技术有望应用于数字人、数字教育、影视制作、虚拟陪伴、电商直播等场景。

通义APP近期爆款频出,现象级应用“全民舞王”曾在社交平台掀起“兵马俑跳科目三”“金毛跳舞”的热潮,全民舞王背后的模型Animate Anyone也出自通义实验室。近期,通义APP还陆续推出了超长文档解析、AI编码助手、AI会议助手等免费实用功能。通义大模型正在成为越来越多用户的超级AI助手。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

对话京东健康:大模型背景下,互联网医疗的商业化还是难题吗?

“一款理想的医疗大模型是解决医疗不可能三角,创造生产力价值。” 近日,在小编对话京东健康技术产品部智能算法部负责人王国鑫,他指出,医疗绝对供给...

贾跃亭回归股价大涨,董事接连辞职;iPhone14零件成本上涨,毛利润仍有5千

法拉第未来三名董事辞职,贾跃亭重掌FF后股价大涨10%:将与大股东全面落实治理协议 10月7日,Faraday Future(简称FF)发布公...

「十三香」定律再生效?十三代酷睿夺回主频第一王座,Arc新显卡叫板英伟达3060

「十三香」定律再生效?十三代酷睿夺回主频第一王座,Arc新显卡叫板英伟达3060

北京时间9月28日凌晨,英特尔召开了“英特尔On技术创新峰会”。在峰会上,英特尔首席执行官帕特 ·基辛格身着ASCII码写就的“Bring g...

「深度学习+」时代,百度画出了这张 AI 工业大生产的蓝图

「深度学习+」时代,百度画出了这张 AI 工业大生产的蓝图

1764年的一天,“珍妮纺纱机”诞生在英国一个织工哈格里夫斯的家中,将织布效率提高了八倍,吹响了人类进入机器时代的号角。很快,这股“机器之风...

上半年我国机器人产业总体保持稳定增长态势

上半年我国机器人产业总体保持稳定增长态势

 工业和信息化部装备工业一司副司长汪宏日前在2023世界机器人大会新闻发布会上说,今年上半年,我国机器人产业总体保持稳定增长态势,工业机器人产量达22.2万套,同比增长5.4%,服...

如果无法募集新资金,愿景基金可能会进行裁员!

如果无法募集新资金,愿景基金可能会进行裁员!

软银集团正在为软银愿景基金2号展开募资工作。然而有报道显示,这只基金的募资过程并不顺利。 据《华尔街日报》报道,愿景基金2号筹...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。