阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

访客1年前AI生活304
阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

近日,阿里云机器学习 PAI 开源框架 EasyNLP进行升级发布,推出了融合了丰富电商场景知识的CLIP模型,在电商文图检索效果上刷新了SOTA结果,并且将上述模型免费开源,贡献给开源社区。

CLIP(Contrastive Language-Image Pre-training)是一种经典的文图跨模态检索模型,它在大规模图文数据集上进行了对比学习预训练,具有很强的文图跨模态表征学习能力。EasyNLP借鉴CLIP的轻量化、易迁移的预训练架构,构建基于CLIP包含图像和文本Encoder两部分的双流模型,同时基于商品数据,以优化电商场景的文图检索优化。

Fashion-Gen数据集是一个大规模的时尚场景的图文数据集,以Fashion-Gen数据集为例,EasyNLP基于pai-clip-commercial-base-en和pai-clip-commercial-large-en这两个模型在Fashion-Gen数据集上进行了20个epoch的微调。实验结果表明,相比于现公布的SOTA模型(CommerceMM),电商CLIP-large模型在文到图和图到文的检索结果上均有显著提升,评测指标最高提升了8.7~15个百分点。

除此之外,电商base模型在文到图与CommerceMM相当检索结果下,使用了更少的参数量。由此可见,电商CLIP无论在large还是base图像Encoder的设置下,都取得了有竞争力的电商场景跨模态检索能力。

文到图检索评测结果

999.jpg 

图到文检索评测结果

888(1)_看图王.jpg 

目前,电商CLIP可在EasyNLP中直接安装使用,在未来,EasyNLP框架会集成更多NLP的多模态的知识模型,覆盖各个常见领域和任务,同时也将集成更多SOTA模型(特别是中⽂模型),来⽀持各种NLP和多模态任务,共建NLP和多模态算法库。

Github地址:https://github.com/alibaba/EasyNLP

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

紫光展锐发布第二代5G智能手机平台虎贲T7520!

紫光展锐发布第二代5G智能手机平台虎贲T7520!

2019年是5G商用的元年,各大手机品牌争先推出5G手机。不过,5G目前是旗舰级手机才具备的功能。因此,5G手机什么时候才能人人都买得起多次...

vivo游戏:全程陪伴用户和开发者,携手共创至臻体验

vivo游戏:全程陪伴用户和开发者,携手共创至臻体验

      11月8日,2022vivo开发者大会正式召开,此次大会以“MORE,近你所想”为主题。在次日举办的游戏生态分会场上,vivo生...

即日起深圳中心公园开通无人机外卖 超千种商品空投到手最快仅等10分钟

即日起深圳中心公园开通无人机外卖 超千种商品空投到手最快仅等10分钟

今年五一小长假还没想好去哪里遛娃?或许可以到深圳中心公园看看。 近日,美团无人机在深圳中心公园C2区开通了市属公园首条无人机配送航线,同时这也...

2018数博会:佳格天地诠释AI与农业的深度融合!

2018数博会:佳格天地诠释AI与农业的深度融合!

5月26日,2018中国国际大数据产业博览会(简称数博会)正式在贵阳国际展览中心开幕。在数博会举办期间,由中关村大数据产业联盟主办的“数据智创...

谷歌生气了:三星乱动Android 内核代码!

谷歌生气了:三星乱动Android 内核代码!

近日,Google Project Zero(GPZ)团队向三星发出警告,如果三星在 Galaxy 系列手机中修改内核代码,将会暴露更多安全...

大华占资20%:与天津镕宇、天津取势、湖州旭博共同投资智慧城市合资公司!

大华占资20%:与天津镕宇、天津取势、湖州旭博共同投资智慧城市合资公司!

近日,公告显示,大华股份拟与天津镕宇、天津取势、湖州旭博共同投资设立中睿信数字科技有限公司。 合资公司将在浙江杭州注册,注册资...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。