计算机视觉简介(1)

任何计算机视觉处理流程都始于成像系统,它从景物中捕获反射出来的光线,并将光信号转换成计算机可以读取和处理的图像格式 在计算机成像技术发展的早期,图像通过把胶卷或印刷图像素 化后获得;而现在图 像通常直接由数码相机获取,并存储成称为像素的有序数字 目前已有很多关于图像采集和照相机内部工作原理的教科书(例如光学、机械控制和彩色滤波等), 展示了光线进入相机形成图像的采样( 通过图像网格划分)和 量化(即用有限的整数 表示每 个像素的颜 色值) 过程
所有图像可以看作一个矩阵(或三 个矩阵,如果分别考虑色彩平面,该矩阵是景物的反射光在相机成像平面上的强度和色彩信息的量化数据, 显示了景物在数码相机上成像的过程:相机中的传感器阵列决定了 图像的大小和分辨率 假设传感器阵列有 个传感器,则产生大小的图像。每个传感器捕获通过透镜入射到该传感器上的光线。对于一位图像,传感器为每个采样赋予 0到(2的b次方  -1) 间的值 。假设一 位图像,那么采样值就在0到255 之间,如图 1-1 所示 上述过程称为采样和量化.所谓采样就是在连续视场中选择某些点;所谓量化就是把光强的取值限制在有限的离散数值内。在相机设计和相机模型中,采样、量化和图像形成涉及很多主题,感兴趣的读者可以查阅相关文献并进行更深入 的研究 。彩 色图像在照相机中通常会分别对应生成红 ( CR )、绿 ( CG) 和蓝 ( CB ) 个基色图像 。如 产生这些 图像 取决于相机,大多数消 费级相 机在传感器平面前设 置滤色器来捕获所有三个颜色通道的马赛克图像,然后依靠“解马赛克”过程来创建全分辨率 、分离的R,G,B 图像。
有了这个装置,我们就能把图像表示为计算机中可存储的数字数据,称为图像的像素表示。每个图像是表示一个(灰色)或三个(彩色)或更多(深度和其他场)通道的矩阵或张量。像素顺序与采样顺序相同,也就是采集像素的传感器的位置顺序。像素值越大,对应的颜色强度就越大,这可能是图像最明显的表示方法。图像越大,像素越多。当要捕获景物的细节时,传感器需靠得更近,产生的图像分辨率也越高。如果用两个大小不同的图像来拍摄现实世界的相同区域和视场,那么较大图像比较小图像具有更高的分辨率,这是因为较大图像可以分辨更多的细

节。对于灰度图像,我们通常使用二维离散矩阵I(ni,n2)来表示像素值矩阵,其中n1和n2分别索引矩阵的第n行和第n列的像素,I(ni,n2)的值对应像素强度。

虽然每个像素独立于其他像素进行采样,但相邻像素之间通常是相关的。因为典型场景不会在任何地方都有剧烈变化,除了两个不同实体间的边界像素外,相邻像素-般会很相似。因此,图像中像素值不连续(或变化较大)的“边界”能较好地识别出不同实体。通常情况下,除了实体边界的像素之外,自然景观的图像很多区域是平滑的(即没有变化或变化很小)。

如上所述,像素矩阵是图像的基本表示方式,通常称为空域表示。像素是对空间,更准确地说是对成像平面上的光强的测量值进行采样。还有使用所谓的频域方法来观察甚至获取图像,将图像分解成频率分量,类似于棱镜将太阳光分解成不同的色带。还有一些方法,如小波变换,使用时频变换来分析或分解图像,这里的时间在图像领域实际上是指空间。所有这些表示方法都称为图像的变换域表示。通常,图像的变换域表示是可逆的,即可以从变换域表示返回到原始图像。实际上,对于特定的处理任务使用哪种表示确实是个问题。除了空间域和变换域中的表示之外,许多计算机视觉任务首先从图像中(原始图像或一些变换域表示)计算各种类型的特征,然后基于所计算的特征执行- -些分析/推断任务。从某种意义上说,这种计算出的特征充当底层图像的新表示,故将此称为特征表示。下面,简要介绍几种常用的图像变换域表示和特征表示。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/128799.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Window Anaconda 安装pytorch 启用cuda 终究手段

1.首先你的电脑要有NVIDIA 的显卡.没有就走吧,你如果不是window ,也走吧,不一定教程管用。 2.然后要明白,有两种CUDA版本,一个叫运行时api,一个是驱动api 2.1 运行时cuda 版本查看 (是你跑深度学习模型或其…

day30

今日内容概要 继承(面向对象中得核心) 单继承 多继承 单继承下的属性查找 多继承下的属性查找 super和mro的使用 多态和鸭子类型 继承(核心) 面向对象的三大特征:封装、继承、多态 1.什么是继承 继承就是一种新建类的方式&#xff0…

基于maven的项目搭建(已跑通)

1、直接选择archetype-webapp即可 (这里很多人会觉得很慢–解决方案:https://blog.csdn.net/qq_45591895/article/details/133705674?spm1001.2014.3001.5501) 2、手动添加一个java目录即可。 3、添加Tomcat 3、这就跑通了,可以…

OpenCV实现求解单目相机位姿

单目相机通过对极约束来求解相机运动的位姿。参考了ORBSLAM中单目实现的代码&#xff0c;这里用opencv来实现最简单的位姿估计. mLeftImg cv::imread(lImg, cv::IMREAD_GRAYSCALE); mRightImg cv::imread(rImg, cv::IMREAD_GRAYSCALE); cv::Ptr<ORB> OrbLeftExtractor …

Mac navicat连接mysql出现1045 - Access denied for user ‘root‘

Mac navicat连接mysql出现1045 - Access denied for user ‘root’ 前提&#xff1a;如果你的mac每次开navicat都连接不上&#xff0c;推荐试试我这个方法 1.打开设置–>找到左下角最下面的MySQL–>点击Stop MySQL Server 2.开启一个终端&#xff0c;依次输入以下命令&a…

【MySQL】基本查询(二)

文章目录 一. 结果排序二. 筛选分页结果三. Update四. Delete五. 截断表六. 插入查询结果结束语 操作如下表 //创建表结构 mysql> create table exam_result(-> id int unsigned primary key auto_increment,-> name varchar(20) not null comment 同学姓名,-> chi…

网站强制跳转至国家反诈中心该怎么办?怎么处理?如何解封?

在互联网环境中&#xff0c;网站安全是非常重要的。然而&#xff0c;在实际操作过程中&#xff0c;不少网站可能因内容问题、技术安全漏洞等原因被迫下线甚至跳转至国家反诈骗中心网址。面对这一严峻问题&#xff0c;我们如何有效解决&#xff0c;让网站恢复运行并解除强制跳转…

外汇天眼:三大方法提高容错率——成功投资者的秘密策略!

容错率是什么&#xff1f; 虽然A股市场投资体验不佳&#xff0c;但相较于中概股市场的波动&#xff0c;A股投资者仍有幸福感。以中概股的代表&#xff0c;金龙指数ETF为例&#xff0c;仅一年多时间内从85.90元下跌至20.47元&#xff0c;跌幅高达76%。 然而&#xff0c;有一位…

Spring实例化源码解析之Custom Events下集(九)

上集从官网的角度讲解了基本的使用和源码的内容&#xff0c;没有深入的进行分析&#xff0c;本章将从源码的角度分析ApplicationEvent、ApplicationListener、ApplicationEventMulticaster这三者之间的关系。 initApplicationEventMulticaster 上一章后续部分给出了源码的含义…

PTE阶段规划

目录 复习的各个阶段 线下应该如何 rs应对 从来都是流利度大于内容 推荐的练习网站 口语 DI 关键词是不能念错 口语 RL rl每日练习方法 ASQ 写作 swt 阅读 一半靠机经 听力 口语和听力 考模版来熟悉 熟悉模版 强调的是&#xff0c;整个的逻辑思维 字字和句句都…

使用运放产生各种波形

目录复制 文章目录 RC正弦振荡电路文氏电桥振荡电路移项式正弦波振荡电路 集成函数发生器运算放大器驱动电容性负载峰值检波多通道运放未使用的运放接法 RC正弦振荡电路 文氏电桥振荡电路 这个振荡器起振条件RF > 2R1,起振后又希望RF 2R1产生矛盾怎么办&#xff1f; 将RF换…

IP 子网划分(VLSM)

目录 一、 为什么要划分子网 二、如何划分子网 1、划分两个子网 2、划分多个子网 一、 为什么要划分子网 假设有一个B类IP地址172.16.0.0&#xff0c;B类IP的默认子网掩码是 255.255.0.0&#xff0c;那么该网段内IP的变化范围为 172.16.0.0 ~ 172.16.255.255&#xff0c;即…