小样本目标检测

商标检测

发布日期: 2023-03-17

2022 ICME小样本商标检测挑战赛

赛题分析

任务：

利用少量有标注的训练样本，检测出商标的位置和类别。

数据简介：

训练集合：共3500张训练图片，100类商品品牌logo，7千多个实例。初赛50类，每类50张训练图片；复赛50类，每类20张训练图片。

评价指标：

$mAP(Iou=.50:.05:95)$

预训练模型：

ImageNet 1K

难点

小目标
解决方案：
1. 高分辨率
2. Global Context
类间差异大
解决方案：
1. 数据增强
2. 大模型

方案介绍

框架

数据端：Copy-Paste & Mixup

Copy-Paste：

如果一张图像内的 bbox 数量少于 6，则随机复制粘贴部分 bbox

Mixup：

以 0.5 的透明度混合两张图

数据端：Multi-Scale

dict(
    type='AutoAugment',
    policies=[[
        dict(
            type='Resize',
            img_scale=[(int(32 * i), 2666) for i in range(32, 65)],
            multiscale_mode='value', override=True, keep_ratio=True)],
        [
            dict(
                type='Resize',
                img_scale=[(1200, 3999), (2400, 3999)],
                multiscale_mode='range', override=True, keep_ratio=True),
            dict(
                type='RandowCrop',
                crop_type='absolute_range',
                crop_size=(1200, 1333), allow_negative_crop=True),
            dict(
                type='Resize',
                img_scale=[(int(32 * i), 2666) for i in range(32, 65)],
                multiscale_mode='value', override=True, keep_ratio=True)]]),

test_pipelin = [
    dict(type='LoadImageFromFile'),
    dict(
        type='MultiScaleFlipAug',
        img_scale=[(2666, 1216 + i * 96) for i in range(15)],
        flip=False,
        transforms=[
            dict(type='Resize', keep_ratio=True),
            dict(type='RandomFlip'),
            dict(type='Normalize', **img_norm_cfg),
            dict(type='Pad', size_divisor=32),
            dict(type='ImageToTensor', keys=['img']),
            dict(type='Collect', keys=['img']),
        ])
]

数据端：初赛数据

预训练 100 epoch + 12 epoch

将初赛训练集中与复赛数据中相同的三类图像加入训练

cat_id_map = {
    33 Diadora/迪亚多纳  :  33 Diadora/迪亚多纳 ,
    26 BOY LONDON       :  31 BOY LONDON,
    23 JORDAN           :  14 Nike/耐克
}

模型端：

Backbone & Neck: ConvNeXt & RFP

RPN Head

Roi Head: Double Head Cascade Roi Head

Roi Head: + Global Context

SWA

后处理： 将 score 最高的类别认为是该图的类别，将不同类别的 score * 0.001

比赛总结

针对小目标：
随机裁剪 + 多尺度训练,Global Context
针对小样本和类间差异大：
大量数据增强 + 大模型
1. Copy-Paste, Mixup, AutoAugment V2
2. ConvNeXt-Base + RFP
泛化能力：
SWA
数据先验：
后处理

IMAG

https://imag-detection.github.io/2023/03/17/%E5%A4%A9%E6%B1%A0%E5%B0%8F%E6%A0%B7%E6%9C%AC%E6%A3%80%E6%B5%8B/

本博客所有文章除特別声明外，均采用 CC BY 4.0 许可协议。转载请注明来源 IMAG !

小样本目标检测

2022 科大讯飞农业赛道识别挑战赛

2023-03-31 物体识别

农作物病虫害识别检测

“华为云-东吴杯”数字化转型创新应用大赛

2023-03-17 缺陷检测

汽车零部件缺陷检测

2022 ICME小样本商标检测挑战赛

赛题分析

任务：

数据简介：

评价指标：

预训练模型：

难点

方案介绍

框架

数据端：Copy-Paste & Mixup

Copy-Paste：

Mixup：

数据端：Multi-Scale

数据端：初赛数据

模型端：

Backbone & Neck: ConvNeXt & RFP

RPN Head

Roi Head: Double Head Cascade Roi Head

Roi Head: + Global Context

SWA

比赛总结

你的赏识是我前进的动力