阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

访客1年前AI生活213
阿里云 EasyNLP 跨模态学习能力再升级,电商文图检索效果刷新SOTA

近日,阿里云机器学习 PAI 开源框架 EasyNLP进行升级发布,推出了融合了丰富电商场景知识的CLIP模型,在电商文图检索效果上刷新了SOTA结果,并且将上述模型免费开源,贡献给开源社区。

CLIP(Contrastive Language-Image Pre-training)是一种经典的文图跨模态检索模型,它在大规模图文数据集上进行了对比学习预训练,具有很强的文图跨模态表征学习能力。EasyNLP借鉴CLIP的轻量化、易迁移的预训练架构,构建基于CLIP包含图像和文本Encoder两部分的双流模型,同时基于商品数据,以优化电商场景的文图检索优化。

Fashion-Gen数据集是一个大规模的时尚场景的图文数据集,以Fashion-Gen数据集为例,EasyNLP基于pai-clip-commercial-base-en和pai-clip-commercial-large-en这两个模型在Fashion-Gen数据集上进行了20个epoch的微调。实验结果表明,相比于现公布的SOTA模型(CommerceMM),电商CLIP-large模型在文到图和图到文的检索结果上均有显著提升,评测指标最高提升了8.7~15个百分点。

除此之外,电商base模型在文到图与CommerceMM相当检索结果下,使用了更少的参数量。由此可见,电商CLIP无论在large还是base图像Encoder的设置下,都取得了有竞争力的电商场景跨模态检索能力。

文到图检索评测结果

999.jpg 

图到文检索评测结果

888(1)_看图王.jpg 

目前,电商CLIP可在EasyNLP中直接安装使用,在未来,EasyNLP框架会集成更多NLP的多模态的知识模型,覆盖各个常见领域和任务,同时也将集成更多SOTA模型(特别是中⽂模型),来⽀持各种NLP和多模态任务,共建NLP和多模态算法库。

Github地址:https://github.com/alibaba/EasyNLP

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

搭载英伟达GPU,全球领先的向量数据库公司Zilliz发布Milvus2.4向量数据库

搭载英伟达GPU,全球领先的向量数据库公司Zilliz发布Milvus2.4向量数据库

在美国硅谷圣何塞召开的 NVIDIA GTC 大会上,全球领先的向量数据库公司 Zilliz 发布了 Milvus 2.4 版本。这是一款革...

AI 大牛景鲲、朱凯华离职百度,二人携手将创业

AI 大牛景鲲、朱凯华离职百度,二人携手将创业

据了解,原小度科技 CEO 景鲲离职,与原小度 CTO 朱凯华携手,于近期将创业。 今日,百度宣布新一轮干部轮岗,即日起,百度集团副总裁、百...

助力产业数字化转型,小赢卡贷荣获年度数字化风控典范奖

助力产业数字化转型,小赢卡贷荣获年度数字化风控典范奖

9月下旬,由华夏时报社、中央财经大学数字经济融合创新发展中心联合主办的“智能金融助力数实融合暨产教融合研讨会”在北京成功举行。期间,备受瞩目...

又一条地铁无人线开通!霞智科技智能清洁机器人正式“上岗”

又一条地铁无人线开通!霞智科技智能清洁机器人正式“上岗”

2024年9月26日12时,又一条无人线开通运营,这是陕西省首条全自动无人驾驶地铁线路。该线路作为北跨战略的先行工程,是连接主城区与渭北地区的轨道交通快线,对优化城市总体空间布局、推动区域...

波场TRON与硬件钱包Tangem达成合作 大幅提升用户体验

波场TRON与硬件钱包Tangem达成合作 大幅提升用户体验

近日,波场TRON 宣布与知名硬件钱包解决方案提供商 Tangem AG 公司正式达成合作。这一合作对双方具有里程碑意义,将在大幅提升用户体...

大模型赋能自动驾驶进入GPT新阶段,六位创业界大咖展望行业未来

大模型赋能自动驾驶进入GPT新阶段,六位创业界大咖展望行业未来

2023年,全球范围内掀起新一波人工智能热潮,“ChatGPT”潮涌点燃科技新奇点,大模型军备竞赛号角响彻产业各界。以产业引导基金为基础,中国...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。