【ATEC2022赛题技术分享】基于预训练的遥感农作物识别

访客2年前AI生活178

一、赛题背景

2019年,农业农村部提出数字农业农村发展规划(2019-2025),明确提出以农业数字化为重点发展主线,全面提升农业农村生产智能化、经营网络化、管理高效化、服务便捷化水平,以数字化引领驱动农业农村现代化,为实现乡村全面振兴提供有力支撑。这其中对核心主粮作物、经济作物种植区域进行数字化建模是实现农业数字化的基础一环。依托现代卫星遥感技术,对地物目标进行多光谱、多时段监测,可以获取大量信号特征,同时基于不同农作物对不同波段光谱的特异性反射差异、生长周期特点,可以实现低成本、高精度、大范围的农作物种类识别,为实现农业数字化生产、高效网格化经营提供基础数据。

二、赛题理解

本赛题主要目的是通过时序多光谱遥感数据序列,设计人工智能算法,识别出对应地点对应时间段的种植农作物种类。

(1)数据集:本赛题给出了约22万条的多光谱传感器数值时序序列,每条序列包含若干个时间点,每个时间点包含了11个通道的值,这些值均为整数。因此,一条多光谱传感器数值时序序列的数据可以表示为

【ATEC2022赛题技术分享】基于预训练的遥感农作物识别

其中T为时间点的数目。

(2)目标:其目标是给定对应的多光谱传感器数值时序序列,以判定该地点种植作物种类(玉米、水稻、大豆中的其中一类),是个三分类问题。

(3)评价指标:本次赛题为机器学习经典的分类问题,评价指标采用分类准确率。

三、赛题分析

该赛题提供了一组序列数据,可以直接将该问题视为一个序列分类问题,并使用GRU(门控循环单元)或Transformer进行建模。对于输入数据,有两种可能的处理方法。

(1)第一种方法是将11个通道的值进行归一化,从而得到一个时长为T的序列,其中每个时刻的输入向量维度为11。这种方法相对简单,但有一个缺点:由于其数值是线性的,归一化后的数值对于相近的整数也是相近的,这使得模型难以区分这些相近的值。

(2)为了解决这个问题,我们的队伍采用了第二种方法:对11个通道的值进行embedding,从而得到一个11×h维度的向量。在输入到序列模型之前,我们通过一个线性变换将这个向量转化为一个[T, H]的矩阵,其中H是序列模型的隐藏层大小,例如256或512。这种方法的优点是能够将原始的、线性的输入值转化为一个更加丰富、更能表征数据特点的高维空间。这使得模型能够捕获到更多的数据特征,从而提高模型的分类性能。

四、解决方案

【ATEC2022赛题技术分享】基于预训练的遥感农作物识别

图1. 解决方案整体框架

我们团队的解决方案如图1所示。在这个解决方案中,我们首先利用BERT模型对多光谱传感器的数值时序序列进行建模。BERT模型能够捕捉时序序列中的上下文信息,这对于理解农作物生长过程中的时空变化是很重要的。然后,我们将从BERT模型的最后一层得到的特征与光谱反射和农作物生长周期的特征进行拼接并通过4层的transformer。这样做的目的是将从不同源获取的信息融合在一起,以提供更全面的信息。最后,我们采用mean pooling和max pooling对transformer的输出进行池化操作,以得到最终的序列特征。这个特征会被用作分类模型的输入。接下来,我们将详细介绍如何预训练BERT特征,以及如何提取光谱反射与农作物生长周期的特征。

(1)BERT模型的预训练

【ATEC2022赛题技术分享】基于预训练的遥感农作物识别

图2. BERT模型MLM预训练任务

为了更有效地捕捉序列中的语义信息和依赖关系,我们采用了改进的Masked Language Modeling(MLM)任务来对BERT模型进行预训练。具体地,我们并不是对一个时刻的所有传感器数值进行掩盖,而是随机掩盖掉20%的传感器数值。这样做的优点是,我们不仅可以使用不同时间点的传感器数值来预测当前的数值,还能使用当前时刻的其他传感器数值来预测某一个传感器的数值。这样的设计有助于模型更好地理解不同传感器数值之间的依赖关系,以及不同时间点之间的依赖关系。这对于捕捉多光谱传感器数据中的时空变化信息是非常重要的。

(2)光谱反射与农作物生长周期特征

【ATEC2022赛题技术分享】基于预训练的遥感农作物识别

【ATEC2022赛题技术分享】基于预训练的遥感农作物识别

遥感农作物识别时,光谱反射特性和农作物生长周期特性是两个关键特征。图3显示了豆科植物对不同光谱波段的反射率示意图,而图4展示了不同农作物生长周期中的NDVI指数变化示意图。这些示意图均来自公开资料,如果存在侵权问题,请联系我们删除。NDVI是一种常用的指数,用于衡量植被的生长状况。它的计算公式如下,其中NIR代表近红外波段,R代表红色光波段:

【ATEC2022赛题技术分享】基于预训练的遥感农作物识别

因此,我们计算每个时间点的NDVI值,并将其作为额外的输入特征。从图4中,我们还可以观察到,不同农作物的NDVI指数变化梯度也不同。这是一个重要的指标,可以帮助我们更好地区分特定地点适合种植哪些农作物。因此,我们也使用了梯度信息作为额外的特征。

五、致谢

首先,我们要对主办方在“科技助实”这一具有深远影响的主题上提供宝贵的数据和有趣的赛题表示感谢。这不仅为我们提供了一个展示科技创新能力的平台,还让我们有机会为农业持续发展贡献一份力量。”科技助实”不仅是一个充满意义的研究领域,而且具有极高的社会价值,它能够助力提高农作物产量、提升农业可持续性,并最终改善农民的生活质量。同时,我们也要对所有参与指导和支持的老师表示由衷的感谢。您们的专业知识和无私奉献为我们提供了强大的技术支持和指导,使我们能够更加自信地面对这个挑战。最后,我们期望接下来的比赛能够继续发扬光大,吸引更多具有激情和创新精神的人才参与,共同推动“科技助实”这一崇高事业不断向前发展。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

深理工院长潘毅:AIGC,能否成为迈向「医疗元宇宙」的重要一环?  |AIGC-MED系列研讨会

深理工院长潘毅:AIGC,能否成为迈向「医疗元宇宙」的重要一环? |AIGC-MED系列研讨会

“随着AIGC技术突飞猛进,带动全球一众科技巨头聚焦AI大语言模型产品开发,推动AI的三大基石–数据、算力、算法加速发展,并为元宇宙产业带来新...

二舅币大崩盘,发行人疑诈骗877万跑路;周鸿祎称微软抄袭360安全模式

美国悄然收紧对华芯片设备出口限制:14nm及以下都禁,或蔓延至台积电 彭博社7月30日报道称,美国两家芯片设备公司泛林半导体(Lam Rese...

蚂蚁集团携手CVPR22 Workshop举办视觉智能竞赛  超1300多支队伍报名

蚂蚁集团携手CVPR22 Workshop举办视觉智能竞赛 超1300多支队伍报名

6 月 19 日,第17届 IEEE 计算机生物识别学会(CVPR22 17th IEEE Computer Society Workshop...

云迹科技亮相HCJ 多功能机器人UP智解日本住宿业人力难题

云迹科技亮相HCJ 多功能机器人UP智解日本住宿业人力难题

近日,世界级专业酒店业贸易展览会——日本东京酒店用品及餐饮展(HCJ 2024)圆满落幕,展览会共吸引了来自全球逾700家展商企业的参与,参...

如今的商汤科技像人工智能工厂经历过了千锤百炼!

如今的商汤科技像人工智能工厂经历过了千锤百炼!

经济观察报 记者 宋笛 2019年夏天,商汤科技从清华大学东南门的科技园搬到了不足三公里外的理想国际大厦,超过4成的员工数量增长让原...

华为为“悟空画画”科幻主题AI创作大赛获奖者颁奖

华为为“悟空画画”科幻主题AI创作大赛获奖者颁奖

 [中国, 成都, 10月25日] 2023世界成都科幻大会华为主题沙龙“当科技与科幻相遇”在成都科幻馆土星厅举行,并为“悟空·画画-科...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。