阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

访客2年前AI生活310
阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

近日,阿里云机器学习 PAI 开源框架 EasyNLP进行升级发布,推出了融合了丰富电商场景知识的CLIP模型,在电商文图检索效果上刷新了SOTA结果,并且将上述模型免费开源,贡献给开源社区。

CLIP(Contrastive Language-Image Pre-training)是一种经典的文图跨模态检索模型,它在大规模图文数据集上进行了对比学习预训练,具有很强的文图跨模态表征学习能力。EasyNLP借鉴CLIP的轻量化、易迁移的预训练架构,构建基于CLIP包含图像和文本Encoder两部分的双流模型,同时基于商品数据,以优化电商场景的文图检索优化。

Fashion-Gen数据集是一个大规模的时尚场景的图文数据集,以Fashion-Gen数据集为例,EasyNLP基于pai-clip-commercial-base-en和pai-clip-commercial-large-en这两个模型在Fashion-Gen数据集上进行了20个epoch的微调。实验结果表明,相比于现公布的SOTA模型(CommerceMM),电商CLIP-large模型在文到图和图到文的检索结果上均有显著提升,评测指标最高提升了8.7~15个百分点。

除此之外,电商base模型在文到图与CommerceMM相当检索结果下,使用了更少的参数量。由此可见,电商CLIP无论在large还是base图像Encoder的设置下,都取得了有竞争力的电商场景跨模态检索能力。

文到图检索评测结果

999.jpg 

图到文检索评测结果

888(1)_看图王.jpg 

目前,电商CLIP可在EasyNLP中直接安装使用,在未来,EasyNLP框架会集成更多NLP的多模态的知识模型,覆盖各个常见领域和任务,同时也将集成更多SOTA模型(特别是中⽂模型),来⽀持各种NLP和多模态任务,共建NLP和多模态算法库。

Github地址:https://github.com/alibaba/EasyNLP

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

河南省发布大数据产业发展行动计划 到2025年大数据产业规模突破2000亿元

河南省发布大数据产业发展行动计划 到2025年大数据产业规模突破2000亿元

日前,河南省政府办公厅印发《河南省大数据产业发展行动计划(2022—2025)》(以下简称《行动计划》)。提出到2025年,数据要素市场基本...

科技引领、跨界融合丨中纬亮相河北省测绘地理信息大会

科技引领、跨界融合丨中纬亮相河北省测绘地理信息大会

 2024年3月6-8日,由河北省测绘学会、河北省地理信息产业协会主办的 第一届河北省测绘地理信息大会 在石家庄成功召开。会议以“科技引...

用AI重新定义记录——科大讯飞发布智能办公本Air

用AI重新定义记录——科大讯飞发布智能办公本Air

5月23日,以“专业,轻而易写”为主题的2022年科大讯飞智能办公本新品发布会正式举行,科大讯飞联合创始人、高级副总裁、讯飞研究院院长胡国平,...

俞敏洪称鼓励儿子实习每天工作18个小时吃苦;广汽丰田回应大规模裁员

俞敏洪称鼓励儿子实习每天工作18个小时吃苦;广汽丰田回应大规模裁员

今日头条 广汽丰田回应裁员:正常阶段性调整,对象为部分劳务派遣员工 广汽丰田针对“大规模裁员”一事进行回应称:本次是广汽丰田的正常阶段性调整,...

AI赋能阳光厨房建设 亚略特“互联网+明厨亮灶”守护舌尖安全

AI赋能阳光厨房建设 亚略特“互联网+明厨亮灶”守护舌尖安全

       近日,国务院下发《关于做好2022年秋季学校食品安全工作》的通知(以下简称“通知”),强调各地教育、市场监管部门要持续推进校外...

无人机降落在令人惊讶的陡峭表面

无人机降落在令人惊讶的陡峭表面

无人机能够完成范围广泛的有用任务,但它们通常需要特定条件才能安全着陆。理想情况下,大多数无人机需要以足够慢的速度接近平坦表面以避免弹跳...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。