CVPR2020|深兰科技挑战复杂场景，获雾天条件目标检测挑战赛冠军 - OFweek 人工智能网

当前位置： OFweek 人工智能网 > 操作系统 > 正文

CVPR2020|深兰科技挑战复杂场景，获雾天条件目标检测挑战赛冠军

2020-07-02 15:08

03赛题特点＆主要工作

在这次挑战赛中，主要的难点包含以下几个方面：

1．可视条件差、图像模糊

可视条件差是这个赛道核心问题，雾天收集的数据特点就是能见度低，图像模糊，远处的物体不容易被检测与识别，容易造成大量的目标漏检、误检，从而导致mAP效果下降。

2．图片数量少，数据分布不平衡

总共只有4000多张带标注的图片，增加了训练难度，再加上数据分布的不均衡，很难划分一个具有代表性的验证集，很可能导致模型不具有泛化能力，在新的测试集上表现会不如预期。

检测器

我们先通过常规检测所累积的经验构造出一个baseline：

Baseline＝Backbone＋DCN［1］＋FPN［2］＋CascadeRCNN［3］

这套pipeline，也是去年冠军团队所使用的方法，在这里我们沿用这套算法，以此为基础进行改进。

通过观察实验结果发现，模型误检情况远多于漏检，经常出现一个目标有多个检测结果，并且这些检测结果之间无法使用nms去除。归纳为两方面原因。

1．模型自身能力不足，回归分类能力差，导致大量误检；

2．负样本不足，由于样本个数限制，模型会在一些模棱两可的地方检测出置信度较高的结果，无法通过阈值去处理这些误检结果。

根据目前结果做了一下几个方面的改进：

1．DoubleHeads［6］

当需要提升模型能力时，有2个比较简单高效的方法，一是使用更强的backbone，二是提高RCNN中分类检测head的能力，通过实验比对，我们最终使用了doublehead的结构（如下图所示）。

▲DoubleHeads

Doublehead采用分而治之的思想，将原始head解耦为2个独立的分支，针对不同的需求设计head结构，通过对比实验可发现：使用FC－head做分类，Conv－head做回归，可以得到最好的效果。

因为分类更多地需要语义信息，所以使用全连接层。而坐标框回归需要更多的空间信息，因此使用卷积层。当然这种方法会增加计算量。在平衡速度和准确率的情况下，最终我们选择了3个残差2个Non－local共5个模块。

<上一页 1 2 3 4 下一页>

本地收藏打印推荐给朋友

声明： 本文由入驻维科号的作者撰写，观点仅代表作者本人，不代表OFweek立场。如有侵权或其他问题，请联系举报。

发表评论

共0条评论，0人参与

登录登录即可访问所有OFweek服务

用户名/邮箱/手机：
密码：
忘记密码？
用其他账号登录： QQ | 微信 | 新浪微博

请输入评论内容...

请输入评论/评论长度6~500个字

暂无评论

暂无评论

图片新闻

最新活动更多

一周热点月点击榜

企业服务广告服务猎头服务薪酬报告

人工智能猎头职位更多

高级软件工程师广东省/深圳市
自动化高级工程师广东省/深圳市
光器件研发工程师福建省/福州市
销售总监（光器件）北京市/海淀区
激光器高级销售经理上海市/虹口区
光器件物理工程师北京市/海淀区
激光研发工程师北京市/昌平区
技术专家广东省/江门市
封装工程师北京市/海淀区
结构工程师广东省/深圳市

扫码关注公众号
OFweek人工智能网
获取更多精彩内容

文章纠错

x

_*文字标题：

_*纠错内容：

联系邮箱：

_*验证码：

看不清，点击换一张

粤公网安备 44030502002758号