2022 科大讯飞农业赛道农作物病虫害识别挑战赛
概述
从2004年以来,我国每年中央一号文件都会聚焦“三农”问题,农业是最基础的产业,加快推进农业现代化是现实与历史的重大任务。在国民经济进入新常态的背景下,农业发展需要主动适应这一转变。近年来,农作物病虫害给我国带来了严重的粮食减产问题,因此农作物病虫害识别检测和防治处理的研究对农业生产有着重要意义。
团队于2022年获得科大讯飞农业赛道“基于可见光图像的柑橘花果梢识别挑战赛”和“辣椒病虫害图像识别挑战赛”挑战赛冠军。辣椒病虫害图像识别难度较大,涉及病虫害种类较多,通过肉眼观察、主观认知是很难去划分标准的。此外,训练和测试时可能会存在场景跨域情况,在一定程度上也会增加图像识别难度。
据相关文献显示,人类对此次竞赛中的农业病虫害的主观判断正确率可能只有60%,而我们的模型算法已经超过了人类的水平,达到70%以上,从识别准确率上来看,相当于我们的算法模型是可以减轻他们的工作量,甚至可以补足农业工作人员。在图片识别速度方面,我们的模型算法也达到了一个新高度。如果人类去识别一张图像,观察它的细节,可能需要2到3秒钟。对于我们的模型算法来说,能够做到1秒钟识别30张图片,接近60倍的速度,这也是非常大的突破。
1 背景知识
中国是柑橘的重要原产地之一,柑橘资源丰富,优良品种繁多,并且柑橘是南方重要的经济作物之一。柑橘不同生育时期的措施、柑橘病虫害的防治直接或间接影响着柑橘产量。
春梢是一年中最重要的枝梢,保花坐果膨果需要大量的有机营养。春梢过少甚至不出梢时,就不能制造足够的营养供幼果生长。柑橘花期是柑橘结果的保证,柑橘在花期会大量开花,这样会消耗大量的养分,可能会导致树势生长不良,花期需要注重花的量,不能太少也不能太多,以保证后期柑橘果实的产量。花期应该注意补充好营养,来补充开花消耗的大量营养。
柑橘黄龙病(HLB)是柑橘产业的毁灭性病害,目前尚无公认有效的治疗方法,因此当前黄龙病防控“三板斧”是砍病树、杀木虱和用无病苗。针对当前两大“板斧”——砍病树和杀木虱,开展基于数据驱动的柑橘黄龙病智能且精准防控技术的研究。以“防治未病”为宗旨,开展柑橘黄龙病唯一传播媒介——柑橘木虱智能监测的研究。
基于此,希望对以柑橘新梢、花朵、花苞和青果进行识别检测;对木虱、黄龙病、果蝇等病虫害进行识别检测。
2 技术方案
2.1 数据分析与处理
柑橘图像有如下特点:(1)不同类别的数量不均衡(2)花苞和花目标图像较小(3)背景图像复杂,有明显的光照变化(4)有明显的目标遮挡情况。如图2-1和2-2所示。共计2万余张图像。
为拓展图像数量,缩小类别差距,进行数据增强。主要使用水平翻转、图像随机旋转90度、随机对比度、随机光照变化、网格擦除、bbox框抖动和mixup图像混合增强等增强手段。如图2-3所示。

统计图像GT数目和各类别bbox数目,如图2-4和2-5所示。3类别的数目分布较多。bbox宽高比主要为1:1。
2.2 技术方案与算法分析
由于图像尺度过大,在单卡有限资源下,扩大batchsize进行训练。使用Cross-Batch Memory(XBM),如图2-6所示。将之前batch的样本的特征保存到队列中,保持队列长度一定,与当前batch的样本共同计算loss。该方法用较少的代价获得大量样本对,从而有助于难样本的挖掘,提升模型学习效果。
此外,使用FP32+FP16混合精度对模型进行训练,提高训练效率,减少显存使用。学习率预热+两阶段学习率衰减,加入学习率预热机制,保持分布的平稳和模型深层的稳定性。两阶段学习率衰减,使模型收敛更优。使用Swa随机权重平均融合。正常训练后,再训练一定的epoch,然后对这些epoch进行参数权重融合。
3 性能和可视化展示
基于Res2net骨干网的实验结果如表3-1所示。由消融实验可以看出,我们使用的每一项数据增强都对提升结果有益。
表3-1 基于Res2net骨干网的实验结果
| Baseline | mixup | RandomFlip | Bbox抖动 | 旋转90度 | SWA | 结果 |
|---|---|---|---|---|---|---|
| √ | 80.154 | |||||
| √ | 81.569 | |||||
| √ | 81.746 | |||||
| √ | 82.184 | |||||
| √ | 82.387 | |||||
| √ | 82.482 |
不同骨干网的实验如表3-2所示。数据在CB Swin系列模型上表现良好,Res2Net、ResNeSt上次之,ConvneXt最末。为了综合考虑所有模型的结果,提升模型准确率,使用WBF对6个骨干网对应的结果进行融合,得到85.265的结果。
表3-2 不同骨干网的实验结果
| Baseline | mixup |
|---|---|
| Res2Net | 82.482 |
| ResNeSt | 81.890 |
| CB Swin-small | 83.711 |
| CB Swin-base | 83.407 |
| CB Swin-large | 83.987 |
| ConvneXt small | 80.692 |
| 融合(WBF) | 85.265 |
不同trick所带来的提升如表3-3所示。
表3-3 不同trick所带来的提升
| 编号 | Backbone | Augments | SGN | MFDUM | TTA | 验证得分 |
|---|---|---|---|---|---|---|
| 0 | ResNetibnb101 | 53.69 | ||||
| 1 | ResNetibnb101 | √ | 54.65 | |||
| 2 | ResNetibnb101 | √ | √ | 55.02 | ||
| 3 | ResNetibnb101 | √ | √ | √ | 56.44 | |
| 4 | ResNetibnb101 | √ | √ | √ | √ | 58.27 |
| 5 | SeNetibna50 | √ | √ | √ | √ | 58.46 |
| 6 | ResNextibna101 | √ | √ | √ | √ | 57.02 |
| 7 | Denseibna169 | √ | √ | √ | √ | 57.49 |
最终线上排行榜结果如表3-4所示。
3-4 排名结果
| 队伍名 | 成绩 |
|---|---|
| 乘风破浪的炼丹师(ours) | 85.265 |
| 这就很秃然 | 85.037 |
| Never | 84.912 |