当前位置：首页 > news >正文

网站建设要用到的技术有哪些php 企业网站多少钱

news 2025/12/24 11:57:19

网站建设要用到的技术有哪些,php 企业网站多少钱,做推广哪个食品网站好,wordpress php调优PETR: Position Embedding Transformation for Multi-View 3D Object Detection 作者单位旷视目的 DETR3D 中 2D-3D过程存在的问题#xff1a; 预测的参考点坐标可能不准确#xff0c;在采样图片特征时可能拿不到对应的特征。只有参考点投影位置的图像特征被使用…PETR: Position Embedding Transformation for Multi-View 3D Object Detection 作者单位旷视目的 DETR3D 中 2D-3D过程存在的问题预测的参考点坐标可能不准确在采样图片特征时可能拿不到对应的特征。只有参考点投影位置的图像特征被使用无法学到全局的特征。采样图像特征的过程过于复杂难于应用本文的目标是在 DETR 的基础上提出一个简单优雅的 3D 目标检测框架本文的贡献总结提出了一个简单优雅的框架PETR用于多视角的 3D 目标检测。提出了一个新的 3D position-aware 表示在 nuScenes 数据集上达到了 sota 方法网络结构网络整体结构 N 个 view 的图片送入到 backboneresnet50 中提取特征3D坐标生成器先将图像视锥空间离散化到成 3D 的网格然后使用相机的参数变换网格的坐标并生成 3D 空间的坐标。3D的坐标和 2D feature 一起送入到 3D 位置编码器中生成 3D position-aware 特征每个 view 对应一个特征图。3D position-aware 特征会送入到 transformer decoder 中并且与来自 query 生成器的 object queries 交互更新后的 object queries 被用于生成目标类别和 3D 的 bounding boxes 3D 坐标生成器为了建立起 2D 图像和 3D 空间的联系将相机视锥空间的点投影到 3D 空间因为这两个空间的点是一一对应的。和 DGSN 论文相同首先离散相机视锥空间生成一个网格shape : W_F, H_F, d然后可以用一个变换矩阵将坐标转换到 3D 坐标3D 空间的是所有 view 的相机共享的。然后再对 3D 空间下的坐标做归一化归一化之后的坐标在经过一次 transposed 3D 位置编码器 3D 位置编码器的目的是通过联系 2D 图像特征与 3D 位置信息来获得 3D 的特征 3D 位置编码器的结构 2D特征经过 1x1 卷积降维3D坐标使用 mlp 生成 embedding然后将两者 add 再使用 flatten 生成向量3D position-aware feature, shape NxHxW Query 生成器和 Decoder Query Generator 网络学习的是基于最初的 object queries 的 offset 这样有利于网络收敛。以及该网络生成的是 3D 空间下的坐标点这样可以保证网络的收敛本文尝试了 DETR 中的设置或者生成 BEV 下的 anchor poitns 都不能保证收敛首先初始化一组可学习的 3D 世界空间的 anchor poins 服从 0到1 的均匀分布然后输出两层的 mlp 中生成最初的object queries。 Decoder 使用的 DETR 中标准的 decoder

查看全文

http://www.pierceye.com/news/813339/