长治公司网站建设,泉州网站建设方案维护,怎样在领英上做公司网站,最早做美食团购的网站编者按#xff1a;此前#xff0c;在文章《商汤科技57篇论文入选ICCV 2019#xff0c;13项竞赛夺冠》里#xff0c;商汤君报道了商汤科技荣获Open Images Object Detection Challenge 2019 冠军。由Google AI主办的Open Images大赛是目前通用物体检测和实例分割两个领域中数…编者按此前在文章《商汤科技57篇论文入选ICCV 201913项竞赛夺冠》里商汤君报道了商汤科技荣获Open Images Object Detection Challenge 2019 冠军。由Google AI主办的Open Images大赛是目前通用物体检测和实例分割两个领域中数据量最大、数据分布最复杂、最有挑战性的竞赛。它比COCO数据大一个量级标注更不规则场景更复杂。获得此项竞赛冠军的核心算法是基于任务间空间自适应解耦task-aware spatial disentanglementTSD检测算法。如今该算法的论文也被CVPR 2020收录并即将在GitHub上开放源代码有兴趣的同学可关注https://github.com/Sense-X/TSD。随着深度学习的不断发展目标检测精度的提升愈加困难一般而言能提升1~2%的mAP平均准确率便算是很大的突破了。但是商汤研究团队发表的TSD算法提升了难以置信的3~5% mAP而且是在行业难度最高的数据集Open Images和COCO。以该算法作为核心的解决方案链接https://arxiv.org/pdf/2003.07557.pdf荣获Open Images Object Detection Challenge 2019 冠军。图1商汤研究院基础技术与MMLab的联合团队参赛团队名MMfruit获得Open Images Object Detection Challenge 冠军首次提出分类和回归任务分别学习机器认识一个物体需要从两个维度分类和回归。分类是指识别物体的属性例如判断一幅图片上的动物是一只猫还是一只狗回归是指识别物体的区域和位置。传统目标检测方法比如Faster RCNN通常是分类和回归一起学习共享Proposal物体潜在存在的区域框和Sibling head(特征提取器。它是怎样的过程呢如图2的下半部分分类和回归共享一个输入Proposal P即红色框以及同一个特征提取器f·输出结果W/o TSD。但是我们发现最终输出的图片框其分类置信度和检测框的准确度是不一致的如下图检测框的置信度很高但是没有框住飞机机翼即区域框是不准确的。图2传统目标检测方法和商汤TSD方法比较那么为什么会造成这样的问题商汤研究团队通过一个实验来探寻发现分类和回归过程的特点如下图在实验中发现分类任务图中Classification更关注语义信息丰富的地方而回归任务图中Localization比较关注物体的边界处。所以传统的Faster RCNN对于分类任务和回归任务共享同一个Proposal和特征提取器就会出现一些内在的矛盾影响检测器的训练。本文提出的基于任务间空间自适应解耦task-aware spatial disentanglementTSD的检测算法对于分类任务和回归任务分别让其学习各自适应的Proposal和特征提取器。如图2上半部分将输入Proposal P的分类任务变换成P_c回归任务变换成P_r。再分别通过不同的特征提取器f_c·和f_r(·)做分类和回归。这种方法的输入和特征提取器都是不共享的从而最大程度地减少由于优化目标不一样带来的冲突进而显著提升性能。引入损失函数PC大幅度提升检测器性能本文还引入了渐进约束损失函数PCProgressive Constraint帮助TSD检测器性能稳定超越传统的检测器头部让分类任务和回归任务的准确度比原始方法更高。对于分类任务通过以下公式保证分类任务准确度比传统方法更高其中表示对于第y类的预测置信度是预定的Margin。对于回归任务通过以下公式保证回归任务准确度比传统方法更高是原始检测器头部得到的检测框是TSD算法得到的检测框。如果当前的Proposal是一个负样本那么该Loss会被Ignore。综上在整个训练过程中整体检测器的优化为在推理阶段原始的检测器头部不再使用。Classical Loss是原始损失函数TSD Loss是本文提出的损失函数。实验结果1、与不同网络解耦方式比较TSD效果最好首先将TSD与在不同的网络层进行任务间解耦的结构进行比较如上图所示。表1各类解耦方式与TSD解耦方式比较综合参数量和性能提升TSD相比于其他解耦方式具备明显的优势。2、TSD与Sibling head联合训练效果更好在TSD整体的训练中传统的Sibling head仍然可以进行联合训练来优化Backbone同时渐进约束损失(PC)可以进一步提升TSD的性能。表2传统Sibling head与TSD联合训练可提升性能表3加入PC损失函数对于分类和回归准确率影响从表2可以看出两个Head联合训练可以进一步带来性能的提升。从表3可以看出加入损失函数PC之后无论对于分类还是对于回归PC都可以进一步带来准确率提升两者都用PC带来的效果是最好的。3、TSD在COCO、Open Images和网络结构上均能大幅提升准确率从表4可以看出在不同网络结构上包括ResNet-50、ResNet-101、ResNet-152等本文提出的TSD方法在准确度上均有明显提升。且推理时间增长不超过10%。表4在不同网络结构上传统方法与TSD方法准确度对比表5可以看出在谷歌提出的Open Images大规模数据集上TSD方法均有性能上的显著提升。表5在Open Images数据集上传统方法与TSD方法对比表6在COCO分割任务上传统方法与TSD方法对比在表6的COCO分割任务上TSD方法也能带来明显性能提升而且提升幅度较大。4、与当前行业领先算法比较基于ResNet-101的BackboneTSD算法达到了新的state-of-the-art的性能并且在SENet154-DCN的基础结构下COCO的性能达到了51.2 map。结论本文针对通用物体检测算法中分类任务和回归任务之间因为优化目标不一致带来的潜在冲突提出了基于任务间空间自适应解耦的检测算法TSD。在检测器头部通过特定设计的偏移量生成策略以及联合训练优化渐进损失来有效的提升检测器性能在额外的推理时间损耗不超过10%的情况下能够稳定提升3%~5%的检测性能并且成为Open Images 2019 Object detection challenge夺冠的核心算法。大量实验证明TSD可以比较容易的搭配各种不同的网络结构以及Anchor-based的检测框架来进行使用。更多精彩内容可查看原文链接https://arxiv.org/pdf/2003.07540.pdf招聘商汤研究院-基础技术团队招聘研究员见习研究员1.强化学习方向探索在复杂环境如游戏AI、系统优化中的强化学习方法研究包括但不限于multi agent RL、imitation learning、model-free场景下sampling efficiency等基础问题参与实际项目中的RL方法设计与探索。2.巨型网络优化方向研究在billion level数据下的超大型网络结构设计与搜索包括但不限于人脸识别模型优化、sampling based NASoptimizer设计与搜索等。有兴趣的小伙伴请投递简历至liuyusensetime.com。