阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

访客1年前AI生活279
阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

近日,阿里云机器学习 PAI 开源框架 EasyNLP进行升级发布,推出了融合了丰富电商场景知识的CLIP模型,在电商文图检索效果上刷新了SOTA结果,并且将上述模型免费开源,贡献给开源社区。

CLIP(Contrastive Language-Image Pre-training)是一种经典的文图跨模态检索模型,它在大规模图文数据集上进行了对比学习预训练,具有很强的文图跨模态表征学习能力。EasyNLP借鉴CLIP的轻量化、易迁移的预训练架构,构建基于CLIP包含图像和文本Encoder两部分的双流模型,同时基于商品数据,以优化电商场景的文图检索优化。

Fashion-Gen数据集是一个大规模的时尚场景的图文数据集,以Fashion-Gen数据集为例,EasyNLP基于pai-clip-commercial-base-en和pai-clip-commercial-large-en这两个模型在Fashion-Gen数据集上进行了20个epoch的微调。实验结果表明,相比于现公布的SOTA模型(CommerceMM),电商CLIP-large模型在文到图和图到文的检索结果上均有显著提升,评测指标最高提升了8.7~15个百分点。

除此之外,电商base模型在文到图与CommerceMM相当检索结果下,使用了更少的参数量。由此可见,电商CLIP无论在large还是base图像Encoder的设置下,都取得了有竞争力的电商场景跨模态检索能力。

文到图检索评测结果

999.jpg 

图到文检索评测结果

888(1)_看图王.jpg 

目前,电商CLIP可在EasyNLP中直接安装使用,在未来,EasyNLP框架会集成更多NLP的多模态的知识模型,覆盖各个常见领域和任务,同时也将集成更多SOTA模型(特别是中⽂模型),来⽀持各种NLP和多模态任务,共建NLP和多模态算法库。

Github地址:https://github.com/alibaba/EasyNLP

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

「36亿美元市值」基因编辑公司深陷专利纠纷,联合创始人为诺奖得主

「36亿美元市值」基因编辑公司深陷专利纠纷,联合创始人为诺奖得主

Intellia Therapeutics的CEO John Leonard刚刚在公司位于马萨诸塞州剑桥市的总部办公室结束了一个小时的会议,这...

社区团购持久战:美团漫长的生鲜零售梦?

巨头混战告一段落后,社区团购再度迎来新变化。 多多买菜、美团优选以及淘菜菜的调整,也进入一个新阶段。其中,美团优选可谓是占据了资金及组织优势,...

速卖通与菜鸟“全球5日达”正式上线

速卖通与菜鸟“全球5日达”正式上线

品牌出海热下,跨境电商步入“全球5日达”时代。 9月26日,速卖通联合菜鸟正式宣布上线“全球5日达”国际快递快线产品,首批落地英国、西班牙、荷...

去哪儿网内部邮件曝光,取消今年部分绩效奖金;国美获黄光裕公司贷款1.34亿,以解决员工工资问题

去哪儿网内部邮件曝光,取消今年部分绩效奖金;国美获黄光裕公司贷款1.34亿,以解决员工工资问题

今日头条 国美零售获黄光裕公司贷款1.5亿港元,解决员工工资问题 12月8日晚间,国美零售发布公告,公司与 Shinning Crown Ho...

驱动发展,引领未来,长三角(盐城)数字经济论坛活动在亭湖成功举办

驱动发展,引领未来,长三角(盐城)数字经济论坛活动在亭湖成功举办

2023年10月27日,以“驱动发展,引领未来”为主题的数字经济论坛活动在盐城市亭湖区8#新生数字经济创新园成功举办。该活动旨在探讨数字经济...

怎么看人工智能的未来?但未来发展还需久经考验!

怎么看人工智能的未来?但未来发展还需久经考验!

要判断一台机器是否真能够像人类一样“思考”,目前来说还有不少难度,而最常用的方法就是让其进行“图灵测试”。计算机科学家阿兰图灵在1950年发...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。