01现代计算机视觉入门之:什么是图片

news/2025/3/10 19:39:38/文章来源:https://www.cnblogs.com/xiaozhi_5638/p/18632382

## 系列文章目录 ##

01现代计算机视觉入门之:什么是图片(6700字/25图)

02现代计算机视觉入门之:什么是视频

03现代计算机视觉入门之:什么是图片特征编码

04现代计算机视觉入门之:什么是图片分类

05现代计算机视觉入门之:什么是目标检测

06现代计算机视觉入门之:什么是图像分割

07现代计算机视觉入门之:什么是图片生成

08现代计算机视觉入门之:什么硬件加速

访问完整序列文章(更新中)

本文中的图片主要指光栅图片,而非矢量图片。光栅图片也是我们日常最常见的图片类型,智能手机拍照、监控摄像机、屏幕截图、社交网络图片等等都是光栅图片,它主要由成千上万个像素组成,也是计算机视觉(包括传统和现代)领域中图像算法处理的主要图片类型。

像素和分辨率

图片是一个有限二维平面,平面由纵横交叉的像素组成,类似一个二维表格,有明确的像素宽度(W)和像素高度(H),每个像素有自己的颜色,如白色、黑色、红色等等,密密麻麻的像素拼接成图片中各种各样的物体,它们有不同的形状、不同颜色。

图片中的像素由bit位来表示,如果每个像素由1bit位表示的话,那么像素只能有2种颜色(比如0表示黑色,1表示白色),传统图像算法中有很多二值图每个像素由1bit位表示,只有黑白两种颜色。同样的,如果每个像素由2bit位表示的话,那么像素可以有4种颜色(00011011),以此类推。由此可见,bit位数越大,像素颜色种类越多。

 图片的像素宽度W*像素高度H等于该图片包含的总像素数量,一般我们我们常说的500万像素、1200万像素就是用像素宽度W*像素高度H得到的结果,这个也称为图片分辨率。常见的分辨率有以下几种(各种场合定义可能有差别):

1标清。 720 × 576,约40万像素

2、准高清(720P)。1280 × 720,约90万像素

3、全高清(1080P)。1920 × 1080,约200万像素

42K2048 × 1080,约200万像素

54K3840 × 2160,约800万像素

68K7680 × 4320,约3200万像素

 一般情况下,分辨率越大的图片,清晰度也越高。可以设想一下,用1000个像素拼成的目标肯定要比用100个像素拼成的目标细节更丰富、画面更清晰。注意这里的“一般情况”,图片清晰度跟成像设备也有很大关系,分辨率越高图片越清晰只是粗略说法。

(以下为图片格式版本)

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/859253.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微信小程序中supabase在线数据库使用指南

在微信小程序中使用supabase在线数据库可以无需后端和服务器完成个人小项目的开发。本文记录我的使用过程,在阅读本文前,建议您先满足以下条件:持有可用于开发的微信小程序 了解kexue上网第一步 注册与简单使用 首先,我们到https://supabase.com/注册一个账户,并创建一个您…

USB上网快速入门:RNDIS网卡,手把手教你!

本文将带你使用RNDIS的方式,搭配Linux主控终端,快速实现USB上网。 RNDIS是指Remote NDIS,基于USB实现RNDIS实际上就是TCP/IP over USB,就是在USB设备上跑TCP/IP,让USB设备看上去像一块网卡,从而使Linux可以通过USB设备连接网络。 一、Linux驱动配置 1. 虚拟串口 通过串口…

2024.12.26 os lab3

2024.12.26 os lab3 原代码 地址:https://github.com/BUPT-OS/easy_lab/tree/lab3 运行未修改的代码,并且注释掉cout时发生错误: malloc(): corrupted top size如果不注释cout,可以正常运行1.不注释 cout 时堆内存的详细分析 1. 程序启动阶段在程序启动时,堆的初始状态为空…

编译型语言的痛!但无文件落地我可以!!!

再不进来看,哭了我就不管你了!!!声明:本文主要用作技术分享,所有内容仅供参考。任何使用或依赖于本文信息所造成的法律后果均与本人无关。请读者自行判断风险,并遵循相关法律法规。 @目录python 等脚本语言示例演示golang 等静态编译型语言内存文件系统memfd_create 使用…

WPF TabControl 去掉鼠标悬浮效果

1.资源<Window.Resources><Style x:Key="TabStyle" TargetType="TabItem"><Setter Property="TextBlock.FontSize" Value="12" /><Setter Property="Template"><Setter.Value><ControlTem…

Clion创建项目sqlite数据库

1.创建工程并运行 (1)新建——project,选择工程文件夹,创建工程(2)进入界面,等待项目启动,显示main.cpp主文件(3)配置编译环境默认生成了main.cpp文件,但是我们不能运行。我们缺少编译环境,点击Setting打开设置,搜索工具链,发现Clion提供的编译环境有几种MinGW,Cy…

营销相关笔记2:电力营销的业务办理和计量计费

电力营销的业务办理和计量计费 转:电力知识图谱:电力营销(下) - 知乎 一.业务办理 电力营销是和客户打交道的最前线,两大业务:一是市场销售,二是客户需求受理和交付,即业务办理。在一些市场化主导的售电公司里,市场部和营销部可能会分开。但在电网公司,都是统一的营销…

FMC子卡设计原理图:FMC209-基于FMC的4路125MAD输入、2路1GDA输出子卡 中低频信号采集

一、板卡概述本子卡基于FMC连接器实现4路125M采样率AD输出,两路1G采样率DA输出子卡,板卡默认由FMC连接器+12V供电,支持外参考时钟,外输入时钟,外触发。 二、性能指标三、应用领域 中低频信号采集

【安全就业】2024年网络安全技术技能人才职业能力图谱+电子数据取证

电子数据取证,是指利用科学和法律方法对电子设备中的数据进行搜集、分析、保存和报告的过程,以确保这些信息在法律程序中能够作为线索或证据使用。电子数据取证工作,一般需要取证人员具备电子数据提取、电子数据恢复、数据库系统取证、电子数据治理、程序功能分析、现场勘查…

HuntBack(反击狩猎):用于攻防演练中,防守方对恶意ip进行web指纹扫描与识别

#溯源 #攻防演练 HuntBack(反击狩猎),用于攻防演练中,防守方对恶意ip进行web指纹扫描与识别 应用场景 在蓝队职守中,安全设备爆出恶意攻击ip地址,如果对方使用的是自己的服务器,并且搭建了一些安全业务,可使用本工具对目前已知工具进行探测。 功能 1.红队指纹识别 2.ipwh…

代码随想录——贪心23监控二叉树

思路 这道题目首先要想,如何放置,才能让摄像头最小的呢? 从题目中示例,其实可以得到启发,我们发现题目示例中的摄像头都没有放在叶子节点上! 这是很重要的一个线索,摄像头可以覆盖上中下三层,如果把摄像头放在叶子节点上,就浪费的一层的覆盖。 所以把摄像头放在叶子节…

CH585 CH584 I2C时钟配置(超1MHz 最高1.8MHz)

I2C的R16_I2C_CTRL2寄存器描述:[5:0] FREQ :允许的范围在2~36MHz之间。必须设置在000010b 到100100b 之间RB_I2C_FREQ决定SCL的建立时间和SDA的保持时间,理论上I2C 频率可以达到一分频,实际频率可在36MHz之上,可使用最高80MHz。 I2C的R16_I2C_CKCFGR寄存器描述:[11:0] CC…