机器学习笔记 - 用于3D物体检测的KITTI数据集的使用及说明

一、什么是 KITTI 数据集?

        KITTI 是由卡尔斯鲁厄理工学院和芝加哥丰田理工学院开发的自动驾驶数据集(目前分2012和2015版本)。它是计算机视觉研究中使用的图像和 LIDAR 数据的集合,例如立体视觉、光流、视觉里程计、3D 对象检测和 3D 跟踪。

The KITTI Vision Benchmark Suiteicon-default.png?t=N7T8http://www.cvlibs.net/datasets/kitti/        KITTI Odometry 数据集是用于评估视觉里程计算法性能的基准数据集。它由从移动车辆记录的立体图像序列的集合以及车辆运动的相应地面实况数据组成。

        这个项目的主要目的是建立一个具有挑战性的,来自真实世界的测试集。他们使用的数据采集车配备了如下设备。

        1、一对 140万像素的彩色摄像头,Point Grey Flea2(FL2-14S3C-C),10Hz 采集频率

        2、一对 140万像素的黑白摄像头,Point Grey Flea2(FL2-14S3M-C),10Hz采集频率。

        3、一个激光雷达,Velodyne HDL-64E.

        4、一个GPS/IMU 定位系统,OXTS RT3003。

        这辆车在卡尔斯鲁厄的高速和城区的多种交通环境下收集了数据,用激光雷达提供的数据作为 ground truth,建立了面向多个测试任务的数据集。

1、Stereo/0ptical Flow 数据集

        数据集由图片对组成。一个 Stereo 图片对是两个摄像头在不同的位置同时拍摄的,Optical Flow 图片对是同一个摄像头在相邻时间点拍摄的。训练数据集有 194 对,测试数据集有 195 对,大约50%的像素有确定的偏移量数据,如图所示。

2、视觉里程测量数据集

        数据集由22个Stereo 图片对序列组成,一个4万多帧,覆盖 39.2 公里的里程,如图所示。

3、三维物体检测数据集

        手工标注,包含轿车、厢车、卡车、行人、自行车者、电车等类别,用三维框标注物体的大小和朝向,有多种遮挡情况,并且一张图片通常有多个物体实例,如图所示。

4、物体追踪数据集

        手工标注,包含 21 个训练序列和 29 个测试序列,主要追踪的目标类型是行人和轿车,如图 所示。

5、路面和车道检测数据集

        手工标注,包含未标明车道、标明双向单车道和标明双向多车道三种情况,289张训练图片和 290 张测试图片,ground truth 包括路面( 所有车道)和自车道,如图所示。

二、小结

        下面的链接是对于KITTI更详细的介绍。

https://journals.sagepub.com/doi/pdf/10.1177/0278364913491297icon-default.png?t=N7T8https://journals.sagepub.com/doi/pdf/10.1177/0278364913491297        KITTI一个从大众旅行车上采集的新数据集,用于移动机器人和自动驾驶研究。总的来说,使用各种传感器模式,如高分辨率彩色和灰度立体相机、Velodyne 3D激光扫描仪和高精度GPS/IMU惯性导航系统,在10–100 Hz的频率下记录了6个小时的交通场景。

        场景多种多样,捕捉真实世界的交通状况,从农村地区的高速公路到有许多静态和动态对象的市中心场景。

        数据经过校准、同步和时间戳,并提供校正后的原始图像序列。数据集还包含3D轨迹形式的对象标签,为立体、光流、对象检测和其他任务提供在线基准。

        KITTI数据集与以往计算机视觉领域的数据集相比有以下特点。

        由无人车上常见的多种传感器收集,用LiDAR提供高精度的三维空间数据,有较好的 ground truth。

        更接近实际情况,而不是用计算机图形学技术生成的。覆盖了计算机视觉在无人车驾驶上应用的多个方面。

        由于这些特点,很多的研究工作基于这个数据集,一个新的算法在这个数据集上的测试结果有较高的可信度。

三、参考链接

https://medium.com/@desjoerdhaan/kitti-3d-object-detection-data-set-ef8ee6409574

https://github.com/sjdh/kitti-3d-detection/tree/master/kitti

https://medium.com/@jaimin-k/exploring-kitti-visual-ododmetry-dataset-8ac588246cdc

KITTI Dataset for 3D Object Detection — MMDetection3D 0.17.1 documentation

kitti dataset | Kaggle

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/536861.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Ubuntu-20.04】OpenCV-3.4.16的安装并对图片与视频处理

【Ubuntu-20.04】OpenCV-3.4.16的安装并对图片与视频处理 一、安装OpenCV-3.4.161.下载OpenCV-3.4.16安装包2.将安装包放到/home,并解压3.使用 cmake 安装 opencv4.配置环境5.查看 opencv 的版本信息 二、处理图片(一)创建文件夹 code &#…

鸿蒙Harmony应用开发—ArkTS声明式开发(基础手势:Toggle)

组件提供勾选框样式、状态按钮样式及开关样式。 说明: 该组件从API Version 8开始支持。后续版本如有新增内容,则采用上角标单独标记该内容的起始版本。 子组件 仅当ToggleType为Button时可包含子组件。 接口 Toggle(options: { type: ToggleType, is…

【ARM】MDK在programming algorithm界面添加FLM

【更多软件使用问题请点击亿道电子官方网站查询】 1、 文档目标 解决在programming algorithm界面中无法添加想要的Flash编程算法的问题 2、 问题场景 在对于Debug进行Flash Download进行配置的时候,在programming algorithm界面中有对应的Flash编程算法。可以通过…

C++初阶:内存管理

目录 1. C/C中各种资源的内存分布1.1 C/C程序内存区域划分1.2 各资源的内存分布情况(练习) 2. C中的动态内存管理方式2.1 new/delete开辟内置类型空间2.2 new/delete开辟销毁自定义类型空间 3. operator new 与 operator delete函数4. new与delete的实现…

环信ChatroomUIKit功能详解——超详细介绍

聊天室是当下泛娱乐社交应用中最经典的玩法,通过调用环信的 IM SDK 接口,可以快速创建聊天室。如果想根据自己业务需求对聊天室应用的 UI界面、弹幕消息、礼物打赏系统等进行自定义设计,最高效的方式则是使用环信的 ChatroomUIKit 。 文档地址…

解决JVM进程被系统杀掉问题

背景 服务A在测试环境,隔几个小时接口就无法访问。登录机器查看,发现进程已经没了。大致猜想是进程使用的内存或CPU资源使用太多,导致被系统kill。 问题定位 使用dmesg命令查看进程被kill的详情。 > dmesg --time-format iso2024-03-0…

29网课交单平台源码最新修复全开源版本

去除论文编辑 去除强国接码 修复上级迁移 修复聚合登录 修复支付不回调 优化支付接口兼容码/易支付 优化MySQL表,提高网页加载速度 下载地址:https://pan.xunlei.com/s/VNstLrJaRtbvDyovPQ-CbISOA1?pwd622t#

C# 第三方曲线库及其特点

在 C# 中,有几个第三方库可以用于绘制曲线图,每个库都有自己的特点和优势。以下是一些常见的 C# 第三方曲线库及其特点,希望对大家有所帮助。北京木奇移动技术有限公司,专业的软件外包开发公司,欢迎交流合作。 1.LiveC…

跟着GPT学设计模式之桥接模式

说明 桥接模式,也叫作桥梁模式,英文是 Bridge Design Pattern。在 GoF 的《设计模式》一书中,桥接模式是这么定义的:“Decouple an abstraction from its implementation so that the two can vary independently。”翻译成中文就…

观测云在 .NET 业务中分析性能问题的最佳实践

背景 某药业集团是一家以创新技术驱动的线下医疗数据 SaaS 平台建设和运营公司,其主营的某智慧医疗平台产品,围绕线下医疗场景痛点提供一体化服务解决方案。近期集团对其生物检材在线递检系统进行功能升级开发及 IaaS 平台迁移。在针对新系统和新基础设…

WPF RichTextBox 使用Paragraph显示富文本(角标小数字)

最近项目中需要展示和编辑角标小数字&#xff0c;研究下了&#xff0c;可以RichTextBox 的Paragraph实现。 定义组件RichTextBox&#xff0c;添加右上角右下角小数字&#xff1a; <RichTextBox Margin"10" Height"40" Name"richTextBox">…

SpringBoot集成netty实现websocket通信

实现推送消息给指定的用户 一、依赖 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation"http://m…