【论文精读】CVRecon: Rethinking 3D Geometric Feature Learning For Neural Reconstruction

2023-10-27

今天读的是一篇发表在ICCV2023上的文章,试图使用mvs的方法来助力neural reconstruction。

项目地址:点击前往
文章地址:点击前往

Abstract

由于缺乏深度信息,现有的基于volume的技术只是简单地沿着整个相机光线复制物体表面的2D图像特征。 我们认为这种重复会在空旷和封闭的空间中引入噪声,给生成高质量 3D 几何体带来挑战。 受传统MVS的启发,我们提出了一种端到端 3D 神经重建框架 CVRecon,旨在利用cost volume中丰富的几何嵌入来促进 3D 几何特征学习。 此外,我们提出了射线上下文补偿cost volume(RCCV),这是一种新颖的 3D 几何特征表示,可编码视图相关信息,并提高完整性和鲁棒性。 通过全面的实验,我们证明我们的方法显着提高了各种指标的重建质量,并恢复了 3D 几何形状的清晰细节。 我们广泛的消融研究为开发有效的 3D 几何特征学习方案提供了见解。

1 Introduction

主要有以下贡献:

  • 我们确定了神经重建领域现有特征学习方案的基本局限性,并相应地建议利用多视图cost volume作为直接的 3D 几何特征表示。
  • 我们观察到广泛使用的标准cost volume缺乏沿相机光线的分布参考信息,并提出光线补偿机制来解决这个问题。
  • 为了提高非重叠和低纹理区域中成本量的鲁棒性,我们提出了一种新颖的上下文修复模块。
  • 我们广泛的实验表明了我们提出的 RCCV 的有效性,及其与下游融合和预测模型的不可知性。

2 Related Works

介绍了volumetric-based 3D reconstructions、depth-based 3D reconstructions还有深度估计中的cost volume。

3 Methodology

在这里插入图片描述

3.1 Method Overview

整体架构如上图,每个key frame关键帧会有一系列的reference frame参考帧(注意和mvs里面的reference image与source image作区分,其实就是这两个东西)。首先建立一个标准的cost volume,然后使用提出的光线补偿和上下文修复模块来增强这个代价体,生成的RCCV被通过grid sampling来集成进全局feature volume。再之后,一个3D CNN被使用,来从volumetric表达转变成TSDF volume。

这么做的优势有几个。

  • 直接创建RCCV作为输入图像的3D几何特征表达,与现存的back- projection机制相比,能避免引入噪声、提高重建质量。
  • 我们避免了使用2D深度图作为中间表达,深度图有一致性的问题,并且如果估得不准,会丢失关于物体表面的信息。我们使用端到端框架来保留所有几何信息亿达到准确重建。
  • 我们观察到标准的cost volume缺乏全局信息,代价的分布不是normalized并且出现了多峰的情况,从单个成本值预测几何形状需要光线分布作为参考。
  • 如图3所示,非重叠和无纹理区域的代价体没有携带太多有用的信息。因此,我们提出光线补偿和上下文修复来提高cost volume的完整性和鲁棒性。
    在这里插入图片描述
    在这里插入图片描述

3.2 Ray-contextual Compensated Cost Volume

先介绍了标准的cost volume是怎么做的,只是换了个说法来表达。
然后介绍了Camera Ray Compensation。对每个keyframe创建标准cost volume。基于深度图的方法会把这个volume变成2D,然后对每个像素估算深度。我们直接把它当作3D 特征表达,如果没有整体摄像机光线分布,3D 位置 [ d , h , w ] [d, h, w] [d,h,w] 的单个特征 R C R^{C} RC 不足以解码其几何形状。为此,我们提出这个补偿模块,构建特征,并且concatenate到标准cost volume上。
在这里插入图片描述
最后介绍了一下Contextual In-painting。其实就是简单的卷积
关于fusion,获得每个图像关键帧的 RCCV 后,通过三线性插值的网格采样生成全局特征量。 考虑到我们提出的 RCCV 特征的下游操作的性质,我们发现它可以与各种帧间特征融合技术无缝集成。
关于TSDF,我们采用3D密集或稀疏卷积模块进行几何预测。 粗略和中等级别的预测是占用网格以稀疏化特征网格,而在精细级别,是直接预测 TSDF volume。
关于Loss,遵循NeuralRecon,我们将二元交叉熵(BCE)损失函数应用于粗略和中等水平的占用预测,并将L1损失函数应用于精细水平 TSDF预测。 TSDF真实值的分辨率为4cm。 遵循 Atlas,我们将TSDF volume真值中所有未观察到的列标记为未占用。

3.3 Implementation Details

介绍了实验细节。

4 Experiments

在ScanNet2上做了实验,效果看起来还不错。

5 Conclusion

复述了一下贡献。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【论文精读】CVRecon: Rethinking 3D Geometric Feature Learning For Neural Reconstruction 的相关文章

随机推荐

  • servlet和tomcat安装

    Author Exchanges Version 9 0 2 一 引言1 1 C S架构和B S架构1 2 C S架构 Client Server 客户端 服务器 1 3 B S架构 Browser Server 浏览器 服务器 1 4 资
  • WDK李宏毅学习笔记第四周02_Explainable ML

    文章目录 摘要 一 Explainable Machine Learning 二 Why we need Explainable ML 三 Interpretable VS Powerful 3 1 decision tree为什么容易解释
  • MySQL5.6的zip包安装教程

    没有 exe 怎么安装 小编之前可能安装过的软件比较少 还没有遇到过一个软件不是通过 exe程序图形化界面去安装的 所以这次安装mysql5 6可是下了不少的功夫啊 好在有心人 最后成功的安装好的 安装过程中踩得坑一定要分享给你们啊 免得大
  • Java--Calendar类,Date类的简单使用,日期的格式化

    package demo import java text SimpleDateFormat import java util Calendar import java util Date 描述 Calendar类 Date类的简单使用 日
  • AD导入之后器件变绿的问题

    导入之后器件变绿的问题 元件出现绿色是DRC规则检查出错的警告颜色 如果元件没有问题就要考虑是不是DRC规则检查设置问题 一般可能大家经常碰到的是元件距离问题导致的 大多情况是规则没有设置好 具体方法为 设计 gt 规则 将Silk scr
  • 关于make: *** No rule to make target `clean'. Stop.的解决

    在重新编译makefile工程文件时需要用到 make clean 命令 但是最近工程使用make clean的时候总是提示 make No rule to make target clean Stop 很烦的错误 查看makefile 文
  • Qt的Script、Quick、QML的关系与总结

    背景 最近在学QML 感觉也不难 就是一直以来接触 Qt 的脚本类的东西的顺序是Script Quick1 Declarative Quick2 QML 那么每一个都是干什么的呢 这些东西搞的我有点混乱 所以决定把他们的大概都先弄清楚 以便
  • choose when 改在java中_Mybatis choose when用法实例代码

    mybatis choose when的用法实现代码如下所示 mapper xml select a city id as CITYID a level1 maintain unit id as CITYID a county id as
  • bert处理超过512的长文本(强制改变位置编码position_embeddings )

    最近在做 NER 任务的时候 需要处理最长为 1024 个字符的文本 BERT 模型最长的位置编码是 512 个字符 超过512的部分没有位置编码可以用了 处理措施 将bert的位置编码认为修改成 1 1024 前512维使用原始的 1 5
  • Redis 的安装

    1 下载 Redis 源码并解压 打开 Redis 的官网 然后复制其下载的地址 地址如下 http download redis io releases redis 5 0 8 tar gz 复制 复制到下载地址以后 在 shell 下可
  • 使用git的心得感悟 杂烩

    1 git的 gitignore文件里面配置的东西是对还未加入版本控制系统管理的文件或者是目录才有用 对已经加入版本控制的文件是不生效的 一定要将之前的纳入版本控制系统的文件取消版本控制可以使用命令 git rm r cached 加上某文
  • uniapp 返回上一页 携带参数 修改上页面的参数

    uniapp 返回上一页 携带参数 修改上页面的参数 阐述 有些场景我们需要从A页面带着参数到B页面 然后再B页面去修改A页面的这个参数 实现的两种方式 第一种方式 ps 如果是uniapp封装的app 需要安装uniapp内置的调试器 如
  • elementUI的日期选择器获取选择时间的格式,获取时间戳等

    elementUI的日期选择器获取选择时间的格式 获取时间戳等 在使用日期选择器的时候 我们需要把时间进行格式化 然后再传给后端 比如传时间戳 value format timestamp
  • unity 第五期

    原题1 什么是单例 举一个游戏中使用单列的例子 答 单例 啊 那是一种内功心法 而且是行走江湖必备的一种最基本的内功心法 说到单例 我们得要把后面两个字补全 也就是单例模式 单例模式是传说中的23种设计模式之一 为什么DC老湿说其实内功心法
  • 2-2、java详述scope作用

    创建Java项目 一个类是Test类 包名com jd test 一个类是UserInfo类 包名com jd vo 还有一个application xml
  • 使用Python,Matplotlib显示RGB图像

    使用Python Matplotlib显示RGB格式的 图像 1 效果图 2 源码 参考 这篇博客将介绍如何使用matplotlib显示RGB图像 具体是使用matplotlib pyplot和mpimg来加载和显示图像 调用plt axi
  • 电机驱动详解--从原理到智能车驱动(DRV8701)

    目录 1 全H桥电路驱动电机原理 2 H桥工作模式 3 死区控制 1 全H桥电路驱动电机原理 从上图可以看出 电路是由四个NMOS管 一个motor 以及VCC GND所构成的 可以控制栅极的电平高低 来控制NMOS管的开通与关闭 所以可以
  • Jmeter 课程笔记(四)关联

    LR中有手动关联和自动关联 Jmeter中只有手动关联 自动关联准确性低 1 第一种关联方式 Http请求 右键 后置处理器 正则表达式提取器 将其放在生成想要关联的页面下 在页面中找到其位置复制当前区域 源码中有相似的值对该区域进行拓展复
  • vbs之createobject大全

    2007年10月30日 11 12 00 ADO对象ConnectionCommandRecordSetRecordStreamServer CreateObject Scripting FileSystemObject Server Cr
  • 【论文精读】CVRecon: Rethinking 3D Geometric Feature Learning For Neural Reconstruction

    今天读的是一篇发表在ICCV2023上的文章 试图使用mvs的方法来助力neural reconstruction 项目地址 点击前往 文章地址 点击前往 文章目录 Abstract 1 Introduction 2 Related Wor