网站备案代码如何加到,手机网站开发怎么收费,深圳优化新材料,怎样做seo搜索引擎优化论文地址#xff1a;https://openaccess.thecvf.com/content/ICCV2023/html/Tian_DPS-Net_Deep_Polarimetric_Stereo_Depth_Estimation_ICCV_2023_paper.html 概述 立体匹配模型难以处理无纹理场景的匹配#xff0c;现有的方法通常假设物体表面是光滑的#xff0c;或者光照是…论文地址https://openaccess.thecvf.com/content/ICCV2023/html/Tian_DPS-Net_Deep_Polarimetric_Stereo_Depth_Estimation_ICCV_2023_paper.html 概述 立体匹配模型难以处理无纹理场景的匹配现有的方法通常假设物体表面是光滑的或者光照是受控的这些条件在实际场景中很难满足只适用于物体级别的重建或者特定的拍摄环境。此外这些方法还难以处理偏振图像中表面法向的固有歧义性例如方位角和天顶角的歧义性指从偏振图像中恢复表面法向量时由于不同的反射类型和非线性方程的影响可能存在多个解导致法向量的方位角和天顶角不唯一这些歧义性需要依赖于预先计算的粗糙深度或者已知的反射类型来解决。 针对这些问题文中提出DPS-Net来基于先验几何知识与偏振立体知识用于估计两幅偏振立体图像的深度。通过构建RGB与偏振匹配代价体分别提取RGB与偏振域的匹配知识。针对立体匹配中的固有歧义问题文中引入一种等深度代价体用于解决无纹理区域的匹配模糊性该代价体是一种利用偏振信息和几何约束来消除方位角歧义的方法它基于等深度轮廓与法向量方位角分量正交的性质通过计算偏振图像中的偏振角和方位角之间的差异构建一个统一的代价函数同时考虑了漫反射和镜面反射的情况。此外文中提出一种级联双GRU结构将极化的等深度约束和多域的视觉相似度融合起来通过递归地回归和优化视差处理了极化信息中固有的方位角和天顶角的歧义用于迭代更新视差图与有效地融合多源的关联特征与等深度代价。在合成和真实数据集中的实验结果表明该方法达到了SOTA水准。 背景知识 偏振光图像是指用不同的偏振角度拍摄的一组图像它们可以反映物体表面的法向信息有助于纹理缺乏的场景的匹配。偏振光是指光波的振动方向只沿着一个平面的光它可以通过一个偏振片来产生或筛选偏振片是一种只允许特定方向的偏振光通过的光学器件它可以通过旋转来改变偏振角度。光波是一种横波即光波的振动方向和传播方向垂直。根据横波的性质不同偏振角度的偏振光图像的亮度会有不同的变化这种变化与物体表面的法向量有关。偏振光图像的亮度和偏振角之间的关系可以用一个余弦函数来表示: I ( ϕ c ) I max cos 2 ( ϕ c − ϕ ) I min sin 2 ( ϕ c − ϕ ) , I ˉ ρ I ˉ cos ( 2 ϕ c − 2 ϕ ) , (1) \begin{aligned} I\left(\phi_{c}\right) I_{\max}\cos^2\left(\phi_c-\phi\right)I_{\min}\sin^2\left(\phi_c-\phi\right), \\ \bar{I}\rho\bar{I}\cos\left(2\phi_c-2\phi\right), \end{aligned}\tag{1} I(ϕc)Imaxcos2(ϕc−ϕ)Iminsin2(ϕc−ϕ),IˉρIˉcos(2ϕc−2ϕ),(1) 其中 ϕ c ϕ_c ϕc是偏振角 ϕ ϕ ϕ是物体表面的偏振角 ρ ρ ρ是物体表面的偏振度 I I I是物体表面的亮度 I m i n , I m a x , I ˉ I m i n I m a x / 2 I_{min}, I_{max}, \bar{I} I_{min}I_{max}/2 Imin,Imax,IˉIminImax/2 为物体表面的最小亮度最高亮度与平均亮度。最大亮度和最小亮度是指在不同的偏振角度下偏振光图像的亮度的最大值和最小值。平均亮度是指最大亮度和最小亮度的平均值反映了物体表面的总体亮度。偏振角是指使偏振光图像达到最大亮度的偏振角度它与物体表面的法向量有关可以用于计算物体表面的法向角。偏振度是指最大亮度和最小亮度之间的相对差异它反映了物体表面的偏振特性可以用于判断物体表面的反射类型。这个方程可以用于从偏振光图像中计算出物体表面的偏振角和偏振度进而推导出物体表面的法向量. 当光线从空气射到物体表面时会发生反射和折射反射光会部分地偏振即光波的振动方向只沿着一个平面。反射光的偏振程度和方向取决于物体表面的法向量和反射类型。反射类型分为漫反射和镜面反射漫反射是指光线在物体表面的微小凹凸处发生多次反射镜面反射是指光线在物体表面的平滑处发生一次反射。一般情况下每个像素处的反射类型是由物体表面的材质和光照条件决定的。偏振度 ρ ρ ρ偏振角 ϕ ϕ ϕ天顶角 θ θ θ和方位角 φ φ φ是描述偏振光图像的几个重要参数。偏振度是指反射光的偏振程度偏振角是指反射光的偏振方向天顶角是指物体表面的法向量与视线方向的夹角方位角是指物体表面的法向量在水平面上的投影与水平基准方向的夹角。根据物理原理偏振度偏振角天顶角和方位角之间存在一定的关系这些关系可以用数学方程来表示: ρ d ( η − 1 / η ) 2 sin 2 θ 2 2 η 2 − ( η 1 / η ) 2 sin 2 θ 4 cos θ η 2 − sin 2 θ ϕ d φ o r ϕ d φ π , , (2) \begin{gathered}\rho_d\frac{(\eta-1/\eta)^2\sin^2\theta}{\begin{aligned}22\eta^2-(\eta1/\eta)^2\sin^2\theta4\cos\theta\sqrt{\eta^2-\sin^2\theta}\\\phi_d\varphi\mathrm{~or~}\phi_d\varphi\pi,\end{aligned}},\end{gathered}\tag{2} ρd22η2−(η1/η)2sin2θ4cosθη2−sin2θ ϕdφ or ϕdφπ,(η−1/η)2sin2θ,(2) 其中 η \eta η 为表面材料的折射率对镜面反射有 ρ s 2 sin 2 θ cos θ η 2 − sin 2 θ η 2 − sin 2 θ − η 2 sin 2 θ 2 sin 4 θ , ϕ s φ ± π 2 . (3) \begin{gathered}\rho_s\frac{2\sin^2\theta\cos\theta\sqrt{\eta^2-\sin^2\theta}}{\eta^2-\sin^2\theta-\eta^2\sin^2\theta2\sin^4\theta},\\\phi_s\varphi\pm\frac\pi2.\end{gathered}\tag{3} ρsη2−sin2θ−η2sin2θ2sin4θ2sin2θcosθη2−sin2θ ,ϕsφ±2π.(3) 通过求解上述方程中的方位角和天顶角可以估算出表面法线而由于未知的反射类型和非线性方程方位角和天顶角都存在多解这也被称为方位角模糊性和天顶角模糊性。
模型架构 如图1所示整体模型可以划分为4个步骤1分别从RGB与偏振立体图像提取特征。2分别使用RGB与偏振立体特征构建匹配代价体。3根据偏振信息约束计算等深。4将相关性代价体与等深代价送入GRU单元中不断迭代更新视差图。
Multi Domain Feature and Correlation Volume 多源特征与相关性代价体
特征提取分别使用特征提取模块从RGB立体图像与偏振立体图像中提取维度为256的特征图。RGB图像特征在不同的光照条件下提供了更一致的上下文信息而偏振图像特征可能受到噪声的干扰。RGB图像在不同的光照条件下提供了更一致的上下文信息而极化图像可能受到噪声的干扰。因此文中选择了RGB图像特征作为上下文特征的来源以保证上下文信息的一致性。 相关性代价体参考RAFT构建相关代价体在纹理缺失和特征稀疏的情况下利用偏振信息作为RGB信息的补充从而提高立体匹配的效果 I C i j k ∑ h f i j h I ⋅ g i k h I , I C ∈ R H × W × W , P C i j k ∑ h f i j h P ⋅ g i k h P , P C ∈ R H × W × W , (4) \begin{aligned}\mathbf{IC}_{ijk}\sum_h\mathbf{f}_{ijh}^I\cdot\mathbf{g}_{ikh}^I,\quad\mathbf{IC}\in\mathbb{R}^{H\times W\times W},\\\mathbf{PC}_{ijk}\sum_h\mathbf{f}_{ijh}^P\cdot\mathbf{g}_{ikh}^P,\quad\mathbf{PC}\in\mathbb{R}^{H\times W\times W},\end{aligned}\tag{4} ICijkPCijkh∑fijhI⋅gikhI,IC∈RH×W×W,h∑fijhP⋅gikhP,PC∈RH×W×W,(4) 其中 I C i j k \mathbf{IC}_{ijk} ICijk 表示RGB相关代价体 P C i j k \mathbf{PC}_{ijk} PCijk 为偏振相关代价体。分别对RGB代价体与偏振代价体下采样得到4层的代价体金字塔。
Iso-Depth Cost and Ambiguity Solver 等深代价与模糊匹配
法线的等深约束等深度轮廓与轮廓上点的法向量的方位角分量正交。通过对深度求导并用视差代替深度可以得到方位角的近似表示 tan ( φ ) f y f x ( d 0 , − 1 − d 0 , 1 ) ( d − 1 , 0 d 1 , 0 ) ( d − 1 , 0 − d 1 , 0 ) ( d 0 , − 1 d 0 , 1 ) , (5) \tan(\varphi)\frac{f_y}{f_x}\frac{(\text{d }_{0,-1}-\text{d }_{0,1})(\text{d }_{-1,0}\text{d }_{1,0})}{(\text{d }_{-1,0}-\text{d }_{1,0})(\text{d }_{0,-1}\text{d }_{0,1})},\tag{5} tan(φ)fxfy(d −1,0−d 1,0)(d 0,−1d 0,1)(d 0,−1−d 0,1)(d −1,0d 1,0),(5) 其中 d i , j d_{i,j} di,j 为像素点 P ( u , v ) P(u,v) P(u,v)的邻域像素 P ( u i , v j ) P(ui,vj) P(ui,vj) f f f为焦距。
等深偏振代价如上文所述文中构建了一个统一的等深度代价来显式地利用偏振的几何约束并处理方位角φ和线偏振角 ϕ ϕ ϕ之间的 π − π- π−歧义和 π / 2 − π/2- π/2−歧义。文中提出的等深度代价 C ( φ ) C(φ) C(φ)通过最小化算子将镜面反射和漫反射下的方位角代价进行了整合。此外反射类型的歧义 R ( φ ) R(φ) R(φ)可以由以下方式解决 C s ( φ ) [ s i n ( ϕ ) s i n ( φ ) c o s ( ϕ ) c o s ( φ ) ] 2 , C d ( φ ) [ s i n ( ϕ ) c o s ( φ ) − c o s ( ϕ ) s i n ( φ ) ] 2 , C ( φ ) min { C s ( φ ) , C d ( φ ) } , R ( φ ) arg min { C s ( φ ) , C d ( φ ) } , (6) \begin{aligned} \mathbf{C}_{s}(\varphi)\left[sin\left(\phi\right)sin\left(\varphi\right)cos\left(\phi\right)cos\left(\varphi\right)\right]^{2}, \\ \begin{aligned}\mathbf{C}_d(\varphi)\left[sin\left(\phi\right)cos\left(\varphi\right)-cos\left(\phi\right)sin\left(\varphi\right)\right]^2,\end{aligned} \\ \mathbf{C}(\varphi)\min\left\{\mathbf{C}_s(\varphi),\mathbf{C}_d(\varphi)\right\}, \\ \begin{aligned}\mathbf{R}(\varphi)\arg\min\left\{\mathbf{C}_s(\varphi),\mathbf{C}_d(\varphi)\right\},\end{aligned} \end{aligned}\tag{6} Cs(φ)[sin(ϕ)sin(φ)cos(ϕ)cos(φ)]2,Cd(φ)[sin(ϕ)cos(φ)−cos(ϕ)sin(φ)]2,C(φ)min{Cs(φ),Cd(φ)},R(φ)argmin{Cs(φ),Cd(φ)},(6) 其中 C d C_d Cd和 C s C_s Cs分别表示漫反射和镜面反射的代价。 虚拟视差和虚拟相关特征为了抑制偏振噪声引起的代价扰动并充分利用偏振提供的等深度约束文中根据等深度代价计算虚拟视差并生成相应的虚拟相关特征。虚拟视差和虚拟相关特征可以用于优化GRU中的视差细化优化GRU是双GRU架构的一部分。为了区分不同的视差文中将在更新块中不断更新的视差称为实际视差 d a d_a da把根据等深度代价的梯度和迭代更新的步长 α α α计算的视差称为虚拟视差 d v d_v dv。虚拟视差的计算公式如下 d v d a − α ∇ d C ( φ , d ) . (7) d_vd_a-\alpha\nabla_d\mathbf{C}(\varphi,d).\tag{7} dvda−α∇dC(φ,d).(7)
Hybrid GRU-based Update Operator 混合GRU更新单元 文中使用混合GRU单元来挖掘多源信息并更新视差图。如图2所示 多源上下文信息与集合信息被送入到更新块中融合并基于两个关联代价体金字塔提取多源相似性视觉特征 。最后将真实与虚拟视觉相关特征送入双GRU单元循环优化视差结果。此外虚拟视差和相关的虚拟相关特征是根据等深度代价生成的用于间接地指导优化过程。 级联双GRU结构文中作者提出级联的双GRU结构用于融合等深代价与视觉相似性。级联的双GRU架构由一个回归GRU和一个优化GRU组成。在回归GRU中视差由实际视差的多域相关特征回归计算得到这些特征利用了RGB和偏振图像的相似性为后续的优化提供了一个初始预测。在优化GRU中等深度代价直接作为输入并通过虚拟相关特征以一种间接的方式融入。优化GRU融合了几何约束并进一步纠正了视差。 文中基于虚拟相关特征来引入等深度代价而不是直接用代价梯度计算的增量来更新视差这样可以避免传统优化过程中的以下困难1将与上下文信息耦合的匹配问题显式地转化为优化问题。2由于优化问题的严重非凸性带来的优化难问题。考虑到以上的难点文中引入一个混合优化GRU避免模型在局部收敛与抑制偏振噪声的影响。此外级联方案可以很好地平衡视觉相似性和几何约束。通过回归和优化的级联范式在不同的迭代中逐渐细化视差。
多源输入基于多域信息来构造GRU的输入。级联的双GRU架构中的两个GRU的输入不同。回归GRU的输入是实际视差的多域相关特征利用了RGB和偏振图像的相似性为后续的优化提供了一个初始预测。优化GRU的输入是虚拟视差的多域相关特征利用了偏振图像中的等深度代价来指导视差优化。在将多域相关特征输入到GRU之前使用两层卷积组成的编码器分别对多域输入进行处理。最后将多域相关特征和其他编码特征拼接后输入GRU单元如图2所示。 更新GRU更新单元用来循环地更新视差和代价步长。该模块包括两个GRU门控循环单元分别是回归GRU和优化GRU。回归GRU和优化GRU都有一个隐藏状态隐藏状态会根据编码后的混合输入不断地更新。通过不同的头网络可以从隐藏状态中解码出视差增量和优化步长。最后基于新的增量来更新视差并通过上采样操作来恢复全分辨率的视差图。 损失函数 L ∑ i 1 N γ N − i ∥ d g t − d i ∥ 1 . (8) \mathbf{L}\sum_{i1}^N\gamma^{N-i}\left\|d_{gt}-d_i\right\|_1.\tag{8} Li1∑NγN−i∥dgt−di∥1.(8) 实验结果