【ATEC2022赛题技术分享】基于预训练的遥感农作物识别

访客2年前AI生活134

一、赛题背景

2019年,农业农村部提出数字农业农村发展规划(2019-2025),明确提出以农业数字化为重点发展主线,全面提升农业农村生产智能化、经营网络化、管理高效化、服务便捷化水平,以数字化引领驱动农业农村现代化,为实现乡村全面振兴提供有力支撑。这其中对核心主粮作物、经济作物种植区域进行数字化建模是实现农业数字化的基础一环。依托现代卫星遥感技术,对地物目标进行多光谱、多时段监测,可以获取大量信号特征,同时基于不同农作物对不同波段光谱的特异性反射差异、生长周期特点,可以实现低成本、高精度、大范围的农作物种类识别,为实现农业数字化生产、高效网格化经营提供基础数据。

二、赛题理解

本赛题主要目的是通过时序多光谱遥感数据序列,设计人工智能算法,识别出对应地点对应时间段的种植农作物种类。

(1)数据集:本赛题给出了约22万条的多光谱传感器数值时序序列,每条序列包含若干个时间点,每个时间点包含了11个通道的值,这些值均为整数。因此,一条多光谱传感器数值时序序列的数据可以表示为

【ATEC2022赛题技术分享】基于预训练的遥感农作物识别

其中T为时间点的数目。

(2)目标:其目标是给定对应的多光谱传感器数值时序序列,以判定该地点种植作物种类(玉米、水稻、大豆中的其中一类),是个三分类问题。

(3)评价指标:本次赛题为机器学习经典的分类问题,评价指标采用分类准确率。

三、赛题分析

该赛题提供了一组序列数据,可以直接将该问题视为一个序列分类问题,并使用GRU(门控循环单元)或Transformer进行建模。对于输入数据,有两种可能的处理方法。

(1)第一种方法是将11个通道的值进行归一化,从而得到一个时长为T的序列,其中每个时刻的输入向量维度为11。这种方法相对简单,但有一个缺点:由于其数值是线性的,归一化后的数值对于相近的整数也是相近的,这使得模型难以区分这些相近的值。

(2)为了解决这个问题,我们的队伍采用了第二种方法:对11个通道的值进行embedding,从而得到一个11×h维度的向量。在输入到序列模型之前,我们通过一个线性变换将这个向量转化为一个[T, H]的矩阵,其中H是序列模型的隐藏层大小,例如256或512。这种方法的优点是能够将原始的、线性的输入值转化为一个更加丰富、更能表征数据特点的高维空间。这使得模型能够捕获到更多的数据特征,从而提高模型的分类性能。

四、解决方案

【ATEC2022赛题技术分享】基于预训练的遥感农作物识别

图1. 解决方案整体框架

我们团队的解决方案如图1所示。在这个解决方案中,我们首先利用BERT模型对多光谱传感器的数值时序序列进行建模。BERT模型能够捕捉时序序列中的上下文信息,这对于理解农作物生长过程中的时空变化是很重要的。然后,我们将从BERT模型的最后一层得到的特征与光谱反射和农作物生长周期的特征进行拼接并通过4层的transformer。这样做的目的是将从不同源获取的信息融合在一起,以提供更全面的信息。最后,我们采用mean pooling和max pooling对transformer的输出进行池化操作,以得到最终的序列特征。这个特征会被用作分类模型的输入。接下来,我们将详细介绍如何预训练BERT特征,以及如何提取光谱反射与农作物生长周期的特征。

(1)BERT模型的预训练

【ATEC2022赛题技术分享】基于预训练的遥感农作物识别

图2. BERT模型MLM预训练任务

为了更有效地捕捉序列中的语义信息和依赖关系,我们采用了改进的Masked Language Modeling(MLM)任务来对BERT模型进行预训练。具体地,我们并不是对一个时刻的所有传感器数值进行掩盖,而是随机掩盖掉20%的传感器数值。这样做的优点是,我们不仅可以使用不同时间点的传感器数值来预测当前的数值,还能使用当前时刻的其他传感器数值来预测某一个传感器的数值。这样的设计有助于模型更好地理解不同传感器数值之间的依赖关系,以及不同时间点之间的依赖关系。这对于捕捉多光谱传感器数据中的时空变化信息是非常重要的。

(2)光谱反射与农作物生长周期特征

【ATEC2022赛题技术分享】基于预训练的遥感农作物识别

【ATEC2022赛题技术分享】基于预训练的遥感农作物识别

遥感农作物识别时,光谱反射特性和农作物生长周期特性是两个关键特征。图3显示了豆科植物对不同光谱波段的反射率示意图,而图4展示了不同农作物生长周期中的NDVI指数变化示意图。这些示意图均来自公开资料,如果存在侵权问题,请联系我们删除。NDVI是一种常用的指数,用于衡量植被的生长状况。它的计算公式如下,其中NIR代表近红外波段,R代表红色光波段:

【ATEC2022赛题技术分享】基于预训练的遥感农作物识别

因此,我们计算每个时间点的NDVI值,并将其作为额外的输入特征。从图4中,我们还可以观察到,不同农作物的NDVI指数变化梯度也不同。这是一个重要的指标,可以帮助我们更好地区分特定地点适合种植哪些农作物。因此,我们也使用了梯度信息作为额外的特征。

五、致谢

首先,我们要对主办方在“科技助实”这一具有深远影响的主题上提供宝贵的数据和有趣的赛题表示感谢。这不仅为我们提供了一个展示科技创新能力的平台,还让我们有机会为农业持续发展贡献一份力量。”科技助实”不仅是一个充满意义的研究领域,而且具有极高的社会价值,它能够助力提高农作物产量、提升农业可持续性,并最终改善农民的生活质量。同时,我们也要对所有参与指导和支持的老师表示由衷的感谢。您们的专业知识和无私奉献为我们提供了强大的技术支持和指导,使我们能够更加自信地面对这个挑战。最后,我们期望接下来的比赛能够继续发扬光大,吸引更多具有激情和创新精神的人才参与,共同推动“科技助实”这一崇高事业不断向前发展。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

云计算作为“新基建”的底层核心技术,为各行业数字化转型提供支撑帮助!

云计算作为“新基建”的底层核心技术,为各行业数字化转型提供支撑帮助!

作为新一代信息技术演化的基础设施,“新基建”建设的重要意义不仅频繁出现在政府工作报告中,也在引领经济发展朝向下一个风口迈进。而云计算...

培育“数字工匠” 赋能数字经济

培育“数字工匠” 赋能数字经济

“我在网易上班,从事低代码开发。”“我在浙江省集成电路创新平台上班,从事研发中心研发工艺工作。”近年来,杭州萧山技师学院毕业生在各领域承...

中国连锁经营协会报告:线下门店借即时零售再造价值,带动实体经济转型发展

中国连锁经营协会报告:线下门店借即时零售再造价值,带动实体经济转型发展

7月27日,中国连锁经营协会(CCFA)发布了《即时零售开放平台模式研究白皮书》。报告关注到即时零售新模式,并全面分析即时零售与实体零售商开放...

美的集团旗下全新家庭服务机器人品牌WISHUG第一代产品正式开启预售

美的集团旗下全新家庭服务机器人品牌WISHUG第一代产品正式开启预售

日前,美的集团旗下全新家庭服务机器人品牌WISHUG第一代产品——小惟家庭服务机器人,在美的天猫、京东旗舰店及美的智慧家小程序等平台正式开启...

中芯国际联合CEO赵海军辞任执行董事,吴汉明担任独立非执行董事

昨日晚间,中芯国际发布公告称,中芯国际联合首席执行官赵海军为了专注于其作为中芯国际首席执行官的工作,向公司辞任执行董事,自2022年8月11日...

2021春运跟往年不一样!二分钟看懂春节返乡政策!

2021春运跟往年不一样!二分钟看懂春节返乡政策!

近日,《冬春季农村地区新冠肺炎疫情防控工作方案》引发关注。返乡人员如何划定?核酸检测证明如何获得?由谁来查验核酸检测证明?返乡人员能...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。