Computer Vision

news/2025/2/27 22:51:37/文章来源:https://www.cnblogs.com/lightsong/p/18563900

Computer Vision

https://zhuanlan.zhihu.com/p/44420871

 

1.1 概念

计算机视觉(Computer Vision)是研究计算机如何像人类视觉系统

一样,从数字图像或视频中理解其高层内涵的一门学科,简言之就是研究如何让计算机看懂世界,由于它包括对数字图像或视频进行预处理、特征提取、特征分类、分析理解几个过程,才能实现将现实世界中的高维数据向低维符号信息的映射,进而触发自主决策,所以这门学科是一门跨学科的科学,包括概率论与数理统计、计算几何、信号处理、最优化理论

、凸优化等学科。

计算机视觉的应用方向包括场景重建、视频跟踪、图像恢复

、目标物识别等等。其中目标物识别还能细分为物体识别、人脸识别、姿态识别、手势识别、步态识别、动作/行为识别等等。还有一个类似的概念是机器视觉(Machine Vision),相对于计算机视觉来说是更偏工业界的一种说法,而且概念的使用范围主要在工业检测与工业控制场景中,本课程不使用这个概念。

 

1.3 行业应用

计算机视觉的行业应用,已成熟产业化的主要有如下六个领域:

(1). 安防监控领域,包括人脸识别、行为识别、运动跟踪、人群分析等等,利用卡口精准位置布控视频监测,实现了监控区域内异常的自动识别,例如动态视频中的人脸与黑名单库实时比对检测,多视点视频协同分析运行轨迹,视频数据结构化后对关键目标的检索等等;

(2). 互联网娱乐场景,包括拍照优化、视频优化、实时人像美颜、AR特效、自定义背景等等,丰富了直播、短视频等互联网娱乐应用;

(3). 金融身份认证场景,包括各种刷脸的金融应用,如远程开户、支付取款等等;

(4). 无人商场与广告营销,包括线下零售、商品识别、广告AR赋能等等;

(5). 工业机器的视觉系统,包括物品分拣、缺陷检验

等等,通常是自动图像分析与光学成像等其他方法技术相结合;

(6). 无人机无人车控制,包括视觉导航、行人分析、障碍物检测等等,通常作为一种传感器和激光雷达、毫米波雷达、红外探头与惯性测量单元

融合生成供自主决策的信息;

此外,在医疗影像

分析上,计算机视觉也有很广阔的发展前景。例如从医学图像数据中(超声图像、X射线图像

、CT图像)提取信息可对肿瘤、动脉硬化等进行检测或对器官尺寸、血流等测量,从而进行自动诊断。另一方面在军事化用途上,现代军事概念中有“战场感知技术”的概念,即通过包含图像传感器的各类传感器,利用计算机视觉中自主分析、3D重建技术提供一套数据丰富的战斗实景来支撑战略决策。下图是艾瑞咨询关于计算机视觉产业不同层次的应用领域与厂商列表。

图1 计算机视觉应用领域及相关厂商(图片来源于艾瑞咨询)

从技术角度,计算机视觉有如下应用方向:

(1). 图像分类 image classification

(2). 视频分类 video classification

(3). 目标物定位 object localization/detection

(4). 图像内目标物分割 object segmentation

(5). 视频内目标物分割 video segmentation

(6). 目标追踪 visual tracking

(7). 行为识别 action/activity recognition

(8). 行为定位 temporal action/activity localization

(9). 姿态估计

pose estimation

应用领域与技术对照表如下图所示

图2 应用领域与所用技术

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/839506.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

学习笔记(四十二):自定义组件@BuilderParam装饰器

概述: 该装饰器用于声明任意UI描述的一个元素,类似slot占位符。使用示例: 1、初始化@BuilderParam装饰的方法// 自定义组件 @Component export struct CommonView{@Builder customBuilder() {}; // 当前组件@BuilderParam customBuilderParam: () => void = this.customB…

Python创建虚拟环境报错:Error: Command......

目录环境说明问题描述原因分析解决方法 环境说明系统# lsb_release -a No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 22.04.4 LTS Release: 22.04 Codename: jammyPython版本# python3 --version Python 3.13.0问题描述 使用 ve…

使用Redis来实现在线人数的查看

使用Redis来实现在线人数的查看在学习程序员老罗的easylive项目当中,遇到了一个对我现阶段来说很有意思的功能,那就是实现在线人数查看的功能,我第一次接触到这个功能是在学习WebServlet的监听器的时候.那时候是使用Listener监听器的Session事件和Context的生命周期来实现这个功…

PDF 转 HTML API 数据接口

PDF 转 HTML API 数据接口 文件处理 / PDF 高效 PDF 转 HTML 工具 生成HTML站点 / 可永久存储。1. 产品功能高效处理大文件; 支持多语言字符识别; 支持 formdata 格式 PDF 文件流传参; 输出文件永久 CDN 存储; 输出可直接访问的 HTML 站点; 全接口支持 HTTPS(TLS v1.0 / …

圆形直流电(DC)接口和供电特点

、 l定义:圆形接口是一种具有圆形外形的电源接口,通常由插头和插座两部分组成,用于设备之间的电能传输。l特点:结构简单:由金属或塑料制成的外壳包裹内部的引脚或接触子,形状紧凑,易于安装和连接。耐用性强:插头和插座常采用耐磨损的材料制成,能够经受长期插拔和重复使…

抖音自动识别视频标题描述进行点赞评论脚本2020.11.22

抖音自动识别视频标题描述进行点赞评论脚本2020.11.22该 python 脚本可自动实现,针对抖音网页版,识别短视频的标题和描述内容,符合预设题材,自动点赞、评论、关注、收藏。 已绕过检测,可以稳定运行。 可用于广告宣传,刷粉丝等情景。需要的联系抖音账号:太阳不晒晚睡不困…

VMware Workstation Pro 17.0.0 安装

下载 来自考拉软件: https://www.rjctx.com/19784.html 安装包:图 1 安装包安装 鼠标右击【VMware17.0】选择【以管理员身份运行】图 1点击【下一步】

starrycan的pwn随笔——Linux保护机制与基本环境搭建

一.linux下的所有保护机制 0x01 为什么要有保护机制 学校需要大门来禁止外来人员的进入,需要规章制度来约束学生,事在人为,而我们的linux的最核心的代码也由人写出也需要些规定来促使程序的正常运行,其中非常中重要的部分就是内存地址的记录,堆栈空间的正常开辟和清理 0x02 Li…

基于Java+SpringBoot+Mysql在线简单拍卖竞价拍卖竞拍系统功能设计与实现一

超级管理员:系统管理、用户管理、拍卖者管理、拍卖商品管理等。 普通用户:注册登录、个人信息管理(个人资料、密码修改等)、竞价管理、评价等。 企业用户:注册登录、发布竞拍、竞拍管理等。 运行环境:windows/Linux均可、jdk1.8、mysql5.7、redis3.0、idea/eclipse均可。…

CTFWeb篇05-RCE

RCE漏洞 简介RCE(remote code/command execute) 远程代码/命令执行漏洞 RCE漏洞是两个漏洞:代码执行漏洞 # 针对后端语言! 命令执行漏洞 # 针对系统!产生原因 在 Web应用中有时候程序员为了考虑灵活性、简洁性,会在代码调用代码或命令执行函数去处理。比如当应用在调用一些能…

优化注意力层提升 Transformer 模型效率:通过改进注意力机制降低机器学习成本

Transformer 架构由 Vaswani 等人在 2017 年发表的里程碑式论文《Attention Is All You Need》中首次提出,如今已被广泛认为是过去十年间最具开创性的科学突破之一。注意力机制是 Transformer 的核心创新,它为人工智能模型提供了一种全新的方法,使模型能够根据具体任务的需求…