阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

访客2年前AI生活330
阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

近日,阿里云机器学习 PAI 开源框架 EasyNLP进行升级发布,推出了融合了丰富电商场景知识的CLIP模型,在电商文图检索效果上刷新了SOTA结果,并且将上述模型免费开源,贡献给开源社区。

CLIP(Contrastive Language-Image Pre-training)是一种经典的文图跨模态检索模型,它在大规模图文数据集上进行了对比学习预训练,具有很强的文图跨模态表征学习能力。EasyNLP借鉴CLIP的轻量化、易迁移的预训练架构,构建基于CLIP包含图像和文本Encoder两部分的双流模型,同时基于商品数据,以优化电商场景的文图检索优化。

Fashion-Gen数据集是一个大规模的时尚场景的图文数据集,以Fashion-Gen数据集为例,EasyNLP基于pai-clip-commercial-base-en和pai-clip-commercial-large-en这两个模型在Fashion-Gen数据集上进行了20个epoch的微调。实验结果表明,相比于现公布的SOTA模型(CommerceMM),电商CLIP-large模型在文到图和图到文的检索结果上均有显著提升,评测指标最高提升了8.7~15个百分点。

除此之外,电商base模型在文到图与CommerceMM相当检索结果下,使用了更少的参数量。由此可见,电商CLIP无论在large还是base图像Encoder的设置下,都取得了有竞争力的电商场景跨模态检索能力。

文到图检索评测结果

999.jpg 

图到文检索评测结果

888(1)_看图王.jpg 

目前,电商CLIP可在EasyNLP中直接安装使用,在未来,EasyNLP框架会集成更多NLP的多模态的知识模型,覆盖各个常见领域和任务,同时也将集成更多SOTA模型(特别是中⽂模型),来⽀持各种NLP和多模态任务,共建NLP和多模态算法库。

Github地址:https://github.com/alibaba/EasyNLP

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

夯实数智化转型底座,迈向原生数字化企业

夯实数智化转型底座,迈向原生数字化企业

当二十大报告提出建设“数字中国”时,中国企业的数字化转型已然迈入新样态。 随着大数据、人工智能、云计算、物联网、5G等新技术快速发展,新技术...

欧普照明与武汉大学达成战略合作 设立联合实验室推动科技创新

欧普照明与武汉大学达成战略合作 设立联合实验室推动科技创新

7月25日,欧普照明与武汉大学签署战略合作协议,将就课题研究、产研融合、人才培养等方面开展深度合作。 此次欧普照明携手武汉大学建立“光品质和...

三六零公告:胡欢承诺未来12个月还是大股东,公司没有定增计划

4月6日,三六零(601360.SH,下称“360”)集团发布公告称,近日有媒体报道称公司有关股东可能减持,为避免对投资者产生误导,公司特发公...

造车容易,造好车难!苹果造车之路必定坎坷!

造车容易,造好车难!苹果造车之路必定坎坷!

在造车上,苹果又传来新消息。 2月20日据彭博社报道,苹果正与多个激光雷达供应商谈判中,期望获得更为前沿的激光雷达技术,以领先...

大堂接待、客房配送、后厨回收…… 服务机器人加速酒店业智能化数字化转型

大堂接待、客房配送、后厨回收…… 服务机器人加速酒店业智能化数字化转型

在酒店门口迎接宾客、或端着菜品穿梭在餐厅……如今,越来越多的机器人“服务员”走入酒店、餐厅等场所。 近日,由擎朗智能和马来西亚总代理Dive...

Lydia 动作大模型亮相,虚拟动点助力“利亚德集团2024年生态合作伙伴大会”

Lydia 动作大模型亮相,虚拟动点助力“利亚德集团2024年生态合作伙伴大会”

随着「百模大战」进入白热化阶段,通用大模型的优势和弊端都已渐渐显露。与此同时,能应用在特定行业的垂直大模型,具备优越的落地场景,有更多来自市场...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。