【北邮鲁鹏老师计算机视觉课程笔记】01 introduction

1 生活中的计算机视觉

在这里插入图片描述

生活中的各种计算机视觉识别系统已经广泛地应用起来了。

2 计算机视觉与其他学科的关系

在这里插入图片描述

认知科学和神经科学是研究人类视觉系统的,如果能把人类视觉系统学习得更好,可以迁移到计算机视觉。是计算机视觉的理论基础。
算法、系统、框架、机器学习等是计算机视觉的工具。
光学设备采集图像给计算机视觉提供输入
图像处理强调的是:我输入的是图像,输出的也是图像,比如增强亮度、去噪
计算机视觉系统:输入的图像,输出的不只是图像。
应用:①图像检索。文字搜图,计算机视觉识别后给图像打了标签。在互联网上占领大的流量的还是图像和视频。②机器人。

3 计算机视觉的介绍

在这里插入图片描述

首先谈谈智能的概念,1997年的人工智能系统“深蓝”,战胜了国际象棋的世界冠军。2015年和2017年AlphaGo战胜了李世石和柯洁。
但是这是不是真的智能,现在的人工智能系统能下棋,但是它不能创作诗歌超过人类最优秀的诗人。从这个角度看,这并不是真的智能,它有一个很好的搜索算法,去搜索出最优解。因此,现在只能在数理和数学计算上部分实现人类的智能。

4 三维重构

在这里插入图片描述

计算机视觉系统还不够完善。

5 什么是视觉系统

在这里插入图片描述

感知 + 解释

人类的视觉系统
机器视觉系统

在这里插入图片描述

机器看到的是什么?是一个灰度图,是一个二维矩阵300 * 400

语义鸿沟:从像素到语义内容。存在的极大的差距

我们首先会从人类的视觉系统中去借鉴

6 人类的视觉系统是什么样的

在这里插入图片描述

在这里插入图片描述

诺贝尔奖成果:让猫去看图片。确定视觉和大脑皮层的关系。
给猫看了大量的图片,但是猫的大脑皮层没有反应。
给猫看简单的图形,某些神经元会有反应。通过后续实验,发现大脑对视觉信息的处理事分层的。
人类的视觉系统非常优秀。

在这里插入图片描述
任务:人类能以多快的速度和多高的精度去区分动物和非动物

在这里插入图片描述
过了150ms,区分动物和非动物的脑电波信号就不一样了。

7 运动视盲

在这里插入图片描述

8 利用上下文去理解语义

在这里插入图片描述
在这里插入图片描述
上下文背景引导了我们理解图像的过程。

在这里插入图片描述
在这里插入图片描述
实际上A、B的颜色是一样的。人类的视觉系统会对B进行自动增强。

在这里插入图片描述

9 计算机视觉的起源

在这里插入图片描述
MIT的研究生暑期项目
1966年,计算机视觉从图像处理中独立出来

在这里插入图片描述
先驱人物:马尔

计算机视觉的框架:①计算理论:任务是什么?②表达和算法:输入和输出是什么?③硬件实现:

10 我们能从图像中获取什么信息

在这里插入图片描述
在这里插入图片描述
3D信息更多地是用于定位
①SLAM
②三维重建
③漫游:一天建成罗马

在这里插入图片描述
从这个角度,计算机视觉分为两个大方向:从图像中恢复3D结构信息、从图像中恢复语义信息

11 计算机视觉的发展历程

在这里插入图片描述

12 为什么要做计算机视觉

在这里插入图片描述
三维重建

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
人脸识别:计算机识别的第一个真正的应用
虹膜识别

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
检测与跟踪:

在这里插入图片描述
VR:虚拟现实

在这里插入图片描述

13 课程资源

在这里插入图片描述

14 路线图

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/464308.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

FPGA_工程_基于rom的vga显示

一 框图 二 代码修改 module Display #(parameter H_DISP 1280,parameter V_DISP 1024,parameter H_lcd 12d150,parameter V_lcd 12d150,parameter LCD_SIZE 15d10_000 ) ( input wire clk, input wire rst_n, input wire [11:0] lcd_xpos, //lcd horizontal coo…

C语言第二十二弹---指针(六)

✨个人主页: 熬夜学编程的小林 💗系列专栏: 【C语言详解】 【数据结构详解】 指针 1. 回调函数是什么? 2、qsort使用举例 2.1、使用qsort函数排序整型数据 2.2 使用qsort排序结构体数据 3、qsort函数的模拟实现 总结 1. 回…

从信息隐藏到功能隐藏

本文主要记录复旦大学张新鹏教授于2022年12月在第三届CSIG中国媒体取证与安全大会上的汇报

Windows10/11程序属性DPI设置(Dots Per Inch,每英寸点数)(属性-->兼容性-->更改高DPI设置)(Change high DPI settings)

文章目录 Windows程序DPI设置什么是DPIDPI和Windows应用程序DPI感知级别不感知DPI系统DPI感知每监视器DPI感知 设置DPI感知级别应用程序清单方式API方式 处理DPI变化 DPI缩放与图像资源自动缩放支持 Windows10/11应用程序属性中的DPI设置如何访问DPI设置DPI设置选项解释程序DPI…

YOLO系列详解(YOLOV1-YOLOV3)

YOLO算法 简介 本文主要介绍YOLO算法,包括YOLOv1、YOLOv2/YOLO9000和YOLOv3。YOLO算法作为one-stage目标检测算法最典型的代表,其基于深度神经网络进行对象的识别和定位,运行速度很快,可以用于实时系统。了解YOLO是对目标检测算…

微服务入门篇:http客户端Feign(远程调用,自定义配置,Feign的性能优化,Feign服务抽取)

目录 1.基于Feign的远程调用1.RestTemplate方式调用存在的问题2.Feign的介绍3.定义和使用Feign客户端 2.自定义配置1.方式一:配置文件方式2.方式二: java代码方式,需要先声明一个Bean: 3.Feign的性能优化1.Feign底层的客户端实现2.连接池配置 4.Feign的最…

【算法与数据结构】42、LeetCode接雨水

文章目录 一、题目二、解法三、完整代码 所有的LeetCode题解索引,可以看这篇文章——【算法和数据结构】LeetCode题解。 一、题目 二、解法 思路分析:   程序如下: 复杂度分析: 时间复杂度: O ( ) O() O()。空间复…

Github 2024-02-11 开源项目日报Top10

根据Github Trendings的统计,今日(2024-02-11统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Python项目4非开发语言项目2C项目1C项目1Solidity项目1JavaScript项目1Rust项目1HTML项目1 免费服务列表 | f…

Qt中程序发布及常见问题

1、引言 当我们写好一个程序时通常需要发布给用户使用,那么在Qt中程序又是如何实现发布的呢,这里我就来浅谈一下qt中如何发布程序,以及发布程序时的常见问题。 2、发布过程 2.1、切换为release模式 当我们写qt程序时默认是debug模式&#x…

备战蓝桥杯---数学基础2

学了常见的筛法,让我们看个题: 首先,我们知道欧拉筛复杂度为nlognlogn,这题可以承受,但是空间上存不了,而如果我们枚举1--n^1/2,复杂度不允许。 其实在枚举的方法中,我们只需找出有无在【2&…

【数学建模】【2024年】【第40届】【MCM/ICM】【C题 网球运动中的“动量”】【解题思路】

一、题目 (一) 赛题原文 2024 MCM Problem C: Momentum in Tennis In the 2023 Wimbledon Gentlemen’s final, 20-year-old Spanish rising star Carlos Alcaraz defeated 36-year-old Novak Djokovic. The loss was Djokovic’s first at Wimbledon…

LeetCode 144 二叉树的前序遍历

大家新年快乐,long年大吉 今天的题很简单,前序用栈就行。 电脑没拿,用我妈的pad艰难敲代码,敲字 知识点随便写点吧,这里基础点挺多,以后补充下 栈:先进后出,数据结构用stack&…