Frustum PointNets for 3D Object Detection from RGB-D Data(2018)

3D空间的几何和拓扑结构

直接在3D空间操作可以更自然的参数化以及捕捉 重复、平面、对称等几何结构

2. Related Work
3D Object Detection from RGB-D Data
Front view image based methods(只是介绍了一种表示方法)
Bird’s eye view based methods(难以检测小物体,难以适应垂直方向有多个物体的场景
3D based methods(各种方法各有缺点,如计算大、人工设计几何特征,不灵活等)
Deep Learning on Point Clouds
点云转化成图片或一定分辨率的立体网格,再把2D卷积泛化到3D卷积
利用点云稀疏性设计高效的3DCNN架构
直接处理原始点云(pointnet)
pointnet已经可以做分类和语义分割,本文把它扩展到3D目标检测
3. Problem Definition
输入:点云
目标:在3D空间中分类并且定位目标
3D边框的表示:
size:  h, w, l
center:
orientation: ,相对于预定以的规范姿势
4. 3D Detection with Frustum PointNets
4.1. Frustum Proposal
frustum proposal generation:
① 给定摄像机投影矩阵,2D边框可以被提升到椎体,这个椎体定义了物体的3D搜索空间。
② 收集椎体内所有点形成一个 frustum point cloud
③ 旋转椎体,使椎体的中心轴正交于成像平面,可以提高算法的旋转不变性
基于FPN的模型,先在ImageNet和COCO训练,再在 KITTI 2D object detection dataset 微调
4.2. 3D Instance Segmentation
直接回归物体位置的方法由于物体遮挡及背景复杂不容易
但是物体在空间中是分开的,所以在3D点云中分割是自然且相对容易
使用 3D mask coordinates 预测3D边框中心
3D Instance Segmentation PointNet
① 输入椎体内的点云,预测每个点属于该物体的分数,一个椎体只含有一个感兴趣的物体
多类别检测时,类别进行onehot编码,并和中间点云特征concat
② 3D Instance Segmentation 后,属于物体的点就可以提取出来(mask)
③ 进一步标准化物体点的坐标,提高平移不变性
XYZ值减中心
不对点云缩放,坐标变换对结果很重要
4.3. Amodal 3D Box Estimation
Learning-based 3D Alignment by T-Net
(内容不全)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/539506.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于centos7的k8s最新版v1.29.2安装教程

k8s概述 Kubernetes 是一个可移植、可扩展的开源平台,用于管理容器化的工作负载和服务,可促进声明式配置和自动化。 Kubernetes 拥有一个庞大且快速增长的生态,其服务、支持和工具的使用范围相当广泛。 Kubernetes 这个名字源于希腊语&…

gcc编译初探

记录gcc便编译遇到的问题和积累的经验 文章目录 一、 编译命令编译过程 第二章 遇到问题一、编译的动态库无法正常运行1)设置环境变量 LD_LIBRARY_PATH2)使用rpath将共享库位置嵌入到程序3)将so共享库添加到系统路径 第三章 实用命令一、ldd查…

RN滚动选择组件react-native-wheel-picker-android

安装组件 yarn add react-native-wheel-picker-android我这里的版本为"react-native-wheel-picker-android": "^2.0.6", 示例代码 import { useState } from react import { View } from react-native import { WheelPicker } from react-native-wheel-…

字节飞书前端实习面试

属于是被字节狠狠地拷打了。面试官人很好,让人感觉有很沉稳的感觉。问了一大堆关于底层的问题,属于是把我整麻了。 项目部分问的不多,主要问的都是一些前端涉及的底层知识,层层递进。 1.vue3的响应式是如何实现的 2.computed和wat…

mysql事务(MVCC机制:undo日志)(mysql执行过程:redo日志,Buffer Pool缓存池)

事务 目的:保证数据的最终一致性## 事务的目的 事务的4大特性(ACID) 1.原子性(Atomicity):由undo log日志来保证 2.一致性(Consistency):使用事务的最终目的,由业务代码正确逻辑保证,比如错误的try-catch 3.隔离性(Isolation):…

Unreal发布Android在刘海屏手机上不能全屏显示问题

Unreal 4.27发布Android在刘海屏手机上不能全屏显示问题 Android设置全屏刘海屏全屏设置4.27设置刘海屏在部分手机不能显示问题 Android设置全屏 AndroidManifest.xml文件配置 ...<activity android:name"com.epicgames.ue4.GameActivity" android:label"st…

钉钉魔法盒:解锁企业数字化转型新密码

在数字化的浪潮中&#xff0c;一家公司在企业团队管理和商场综合运营中致力于实现数字化转型。于是&#xff0c;该公司在与无雀科技商讨后&#xff0c;决定引入钉钉平台&#xff0c;不仅要打造商业地产平台&#xff0c;更要优化团队管理流程&#xff0c;提升组织运营效率。 针对…

学习JAVA的二十二天(基础)

目录 网络编程 三要素&#xff1a; IP InetAddress类 端口号 协议 UDP协议 TCP协议 前言&#xff1a;学习JAVA的第二十一天&#xff08;基础&#xff09;-CSDN博客 网络编程 在网络通信协议下&#xff0c;不同计算机上运行的程序,进行的数据传输。 三要素&#xff1a;…

使用Python进行自然语言处理(NLP):NLTK与Spacy的比较【第133篇—NLTK与Spacy】

使用Python进行自然语言处理&#xff08;NLP&#xff09;&#xff1a;NLTK与Spacy的比较 自然语言处理&#xff08;NLP&#xff09;是人工智能领域的一个重要分支&#xff0c;它涉及到计算机如何理解、解释和生成人类语言。在Python中&#xff0c;有许多库可以用于NLP任务&…

ACM记忆化DFS与基于优先队列的BFS

基本概念--记忆化DFS 使用数组保存已经算出来的值&#xff0c;在后续的计算中减少大量的重复计算&#xff0c;提高效率。&#xff08;用于dp不方便&#xff0c;但是搜索方便的情况&#xff0c;可以提升效率。&#xff09; eg. 记忆化dfs求解斐波那契数列 int dfs(int n) {if…

【Node.js从基础到高级运用】十二、身份验证与授权:JWT

身份验证与授权是现代Web应用中不可或缺的部分。了解如何在Node.js应用中实施这些机制&#xff0c;将使你能够构建更安全、更可靠的应用程序。本文将引导你通过使用JWT实现用户注册、登录和权限控制的过程。 JWT&#xff08;Json Web Token&#xff09; JWT是一种用于双方之间…

前端vue3-手动设置滚动条位置

从B页面进行xx操作后需要跳转到A页面&#xff0c;并定位到AA职位&#xff0c;上图为A页面。 A页面的左侧是div&#xff0c;内层包裹List组件 给div定义refleftRef,在代码中写如下&#xff1a; function scrollTop() {if (leftRef.value) {console.log(99, leftRef.value);next…