当前位置: 首页 > news >正文

医院网站推广渠道asp网站生成

医院网站推广渠道,asp网站生成,北京公司网站怎么制作,网站地图页面模板原文链接#xff1a;https://arxiv.org/pdf/2308.09616.pdf 1. 引言 目前的环视图图像3D目标检测方法分为基于密集BEV的方法和基于稀疏查询的方法。前者需要较高的计算量#xff0c;难以扩展到长距离检测。后者全局固定的查询不能适应动态场景#xff0c;通常会丢失远距离…原文链接https://arxiv.org/pdf/2308.09616.pdf 1. 引言 目前的环视图图像3D目标检测方法分为基于密集BEV的方法和基于稀疏查询的方法。前者需要较高的计算量难以扩展到长距离检测。后者全局固定的查询不能适应动态场景通常会丢失远距离目标。本文引入3D自适应查询以增强灵活性。 基于稀疏查询的长距离检测主要的挑战是召回率低。由于2D检测的召回率高可以使用高质量的2D检测先验来改进3D提案从而实现精确定位和全面覆盖。但直接使用来自2D提案的3D查询有两个问题1深度不确定2当距离增加时3D空间中的偏差增大。这会影响训练稳定性需要去噪方法来优化。此外训练会倾向对近距离较为密集的物体进行过拟合而忽略稀疏分布的远距离物体。 本文使用2D提案和相应的深度通过空间变换得到3D提案然后用投影位置嵌入和上下文语义来组成3D自适应查询在解码器中细化。透视图感知的聚合会用在不同尺度和视图的图像上对远距离物体需要关注高分辨率特征而近距离物体反之才能获得高层特征。此外还提出距离调制的3D去噪技术根据GT构建噪声查询解码器学习从噪声提案中恢复正提案并拒绝负提案来缓解查询误差传播和收敛慢的问题。同时查询去噪能减轻距离分布不平衡的问题。 3. 方法 3.1 概述 给定环视图像 I { I 1 , ⋯ . I n } I\{I_1,\cdots.I_n\} I{I1​,⋯.In​}使用主干和FPN提取多尺度图像特征 F { F 1 , ⋯ , F n } F\{F_1,\cdots,F_n\} F{F1​,⋯,Fn​}。使用2D检测器和深度网络获取2D提案和深度然后筛选出其中可靠性高的并转换到3D空间得到3D物体查询。 在3D检测器中将3D自适应查询和3D全局查询输入到Transformer解码层中进行查询间的自注意力和透视感知的查询-特征聚合。 3.2 自适应查询生成 给定图像特征输入到2D检测器和轻量级深度估计网络预测2D边界框和离散深度分布并筛选出分数大于阈值 τ \tau τ的边界框。然后根据深度和相机参数将边界框的中心投影到3D空间得到坐标 c 3 d c_{3d} c3d​。 然后按下式编码为3D自适应查询 Q p o s P o s E m b e d ( c 3 d ) Q_{pos}PosEmbed(c_{3d}) Qpos​PosEmbed(c3d​) Q s e m S e m E m b e d ( z 2 d , s 2 d ) Q_{sem}SemEmbed(z_{2d},s_{2d}) Qsem​SemEmbed(z2d​,s2d​) Q Q p o s Q s e m QQ_{pos}Q_{sem} QQpos​Qsem​ 其中 z 2 d z_{2d} z2d​为边界框2D中心处的图像特征 s 2 d s_{2d} s2d​为边界框的置信度分数。位置编码为正弦变换MLP语义编码为MLP。 最后将3D自适应查询与初始化的全局查询一起输入到Transformer解码层。 3.3 透视感知的聚合 遥远的小物体需要高分辨率特征以精确定位而近处的大物体需要高级特征。本文提出透视图感知的聚合从而在不同的尺度和视图上进行高效的特征交互。 本文首先将图像特征 F F F与相机内外参 I , K I,K I,K组合并使用squeeze-and-excitation块丰富特征。增强的特征 F ′ F F′使用3D可变形卷积。对每个查询参考点预测 M M M个偏移量并投影到不同视图和尺度的2D特征图上。 最后根据2D参考点从 F ′ F F′中采样图像特征并考虑相对重要性聚合到3D查询中。 3.4 距离调制的3D去噪 具体的方案类似于DN-DETR。 与2D查询不同不同距离处的3D查询回归难度往往不同。这一难度差异来自查询密度近距离物体比远距离物体更容易匹配与误差传播2D提案的误差会传播到3D且随距离的增加而增加。因此GT框附近的查询可视为噪声候选对象而远离GT框的查询视为负样本。通过距离调制的3D去噪模型会召回潜在的正样本而拒绝负样本。 本文通过同时添加正负样本基于GT物体创建噪声查询。为了促进长距离感知学习根据物体的位置和尺寸添加随机噪声。噪声查询的位置定义如下 P ~ P G T α f p ( S G T ) ( 1 − α ) f n ( P G T ) \tilde{P}P_{GT}\alpha f_p(S_{GT})(1-\alpha)f_n(P_{GT}) P~PGT​αfp​(SGT​)(1−α)fn​(PGT​) 其中 α ∈ { 0 , 1 } \alpha\in\{0,1\} α∈{0,1}对应正查询和负查询的生成 P G T P_{GT} PGT​与 S G T S_{GT} SGT​为GT框的位置和尺寸 f p f_p fp​与 f n f_n fn​为正负样本编码位置感知的噪声。 对正样本 f p ( S G T ) f_p(S_{GT}) fp​(SGT​)为3D尺寸的线性函数带随机变量这个GT框内的约束用于保证与周围相邻的边界框区分开。对负样本偏移量与位置相关有不同的实施方案。此外对每个GT框会生成多组样本以增强查询多样性每一组包含一个正样本和 K K K个负样本。 4. 实验 4.3 主要结果 Argoverse 2数据集本文的方法能超过基于稀疏查询的方法。基于BEV的方法性能较差这可能是由于深度估计的难度太大。部分模型不能收敛可能也是缺乏精确的深度估计。总的来说长距离检测的收敛问题更加严重本文的3D去噪能起关键作用。 此外本文的方法能超过激光雷达早期方法CenterPoint等。激光雷达方法的定位误差较小但环视图方法的朝向估计更准确。 4.4 消融研究 分析 自适应查询在StreamPETR的基础上添加自适应查询能带来性能提升。可视化表明从自适应查询得到的预测覆盖了更大的范围。 透视感知的聚合进一步增加透视感知的聚合能提高性能。 距离调制的3D去噪通过惩罚负样本减少了错误提案的出现通过考虑物体距离提高了定位精度。实验表明 f n ( ⋅ ) log ⁡ ( ⋅ ) f_n(\cdot)\log(\cdot) fn​(⋅)log(⋅)时能达到最优效果。 全局查询的作用全局查询与自适应查询互补当缺少全局查询时StreamPETR收敛困难。全局查询增多可以提高性能。 6. 补充材料 基于BEV的方法SOLO-Fusion在即使有NMS的情况下仍然产生了大量的冗余预测原因可能是检测头有限的感受野难以处理大的检测范围。 自适应查询的统计数据使用与自适应查询的平均数量相同的额外全局查询替换自适应查询会导致性能下降。 Far3D的更多细节1训练的初期使用真实深度生成3D自适应查询训练稳定后改用预测查询。2本文使用多尺度特征图与查询交互。与手工根据距离选择合适尺度的特征图相比用网络估计的方法效果相近。
http://www.pierceye.com/news/611510/

相关文章:

  • 可以网上做单的网站创建全国文明城市的宗旨是什么
  • 北京诚信建设网站成都蓉城最新消息
  • 上市公司网站建设分析评价网页制作的视频教程
  • 网站营运费网站关键字优化工具
  • 上海企业网站建站中山一站式营销推广平台
  • 想做网站策划怎么做苏州seo关键词排名
  • 中小型企业电子商务网站建设seo优化推广公司
  • 网站开发类型什么意思网页制作与设计千年之恋代码
  • 怎么做公司的网站免费网站建设专业的公司
  • 适合这手机浏览器主页的网站wordpress本地上传服务器
  • 济南百度网站开发寮步镇做网站
  • 营销类型的公司网站专注高密做网站哪家好
  • 公司网站建设找谁做网络渠道
  • 网站建设公司 校园网站html5商城网站
  • 自学it做网站厦门网站推广¥做下拉去118cr
  • 汕头市做网站优化国内时事新闻
  • 网站文章来源seowordpress 搜索 分词
  • 网站建设和网络推广微信开发品牌
  • 湛江网站关键词优化百度推广优化技巧
  • 做盗版网站会怎样网页设计规范2018
  • 做个中英文网站多少钱网页设计图片作品
  • iis7 添加php网站网站为什么需要空间
  • 网站到首页排名h5怎么制作的
  • 网站制作教程 pdf下载培训网站制作网站
  • 网站开发文档范例国外服务器租用价格表
  • 六安网站制作费用怎么做百度提交入口网站
  • centos7做网站做pc端网站讯息
  • 驻马店建设网站安徽全过程网站搭建案例
  • 企业网站推广费用wordpress相册汉化版
  • 怎么做正规网站广告网站设计怎么样