Computer Vision
https://zhuanlan.zhihu.com/p/44420871
1.1 概念
计算机视觉(Computer Vision)是研究计算机如何像人类视觉系统
一样,从数字图像或视频中理解其高层内涵的一门学科,简言之就是研究如何让计算机看懂世界,由于它包括对数字图像或视频进行预处理、特征提取、特征分类、分析理解几个过程,才能实现将现实世界中的高维数据向低维符号信息的映射,进而触发自主决策,所以这门学科是一门跨学科的科学,包括概率论与数理统计、计算几何、信号处理、最优化理论
、凸优化等学科。
计算机视觉的应用方向包括场景重建、视频跟踪、图像恢复
、目标物识别等等。其中目标物识别还能细分为物体识别、人脸识别、姿态识别、手势识别、步态识别、动作/行为识别等等。还有一个类似的概念是机器视觉(Machine Vision),相对于计算机视觉来说是更偏工业界的一种说法,而且概念的使用范围主要在工业检测与工业控制场景中,本课程不使用这个概念。
1.3 行业应用
计算机视觉的行业应用,已成熟产业化的主要有如下六个领域:
(1). 安防监控领域,包括人脸识别、行为识别、运动跟踪、人群分析等等,利用卡口精准位置布控视频监测,实现了监控区域内异常的自动识别,例如动态视频中的人脸与黑名单库实时比对检测,多视点视频协同分析运行轨迹,视频数据结构化后对关键目标的检索等等;
(2). 互联网娱乐场景,包括拍照优化、视频优化、实时人像美颜、AR特效、自定义背景等等,丰富了直播、短视频等互联网娱乐应用;
(3). 金融身份认证场景,包括各种刷脸的金融应用,如远程开户、支付取款等等;
(4). 无人商场与广告营销,包括线下零售、商品识别、广告AR赋能等等;
(5). 工业机器的视觉系统,包括物品分拣、缺陷检验
等等,通常是自动图像分析与光学成像等其他方法技术相结合;
(6). 无人机无人车控制,包括视觉导航、行人分析、障碍物检测等等,通常作为一种传感器和激光雷达、毫米波雷达、红外探头与惯性测量单元
融合生成供自主决策的信息;
此外,在医疗影像
分析上,计算机视觉也有很广阔的发展前景。例如从医学图像数据中(超声图像、X射线图像
、CT图像)提取信息可对肿瘤、动脉硬化等进行检测或对器官尺寸、血流等测量,从而进行自动诊断。另一方面在军事化用途上,现代军事概念中有“战场感知技术”的概念,即通过包含图像传感器的各类传感器,利用计算机视觉中自主分析、3D重建技术提供一套数据丰富的战斗实景来支撑战略决策。下图是艾瑞咨询关于计算机视觉产业不同层次的应用领域与厂商列表。
图1 计算机视觉应用领域及相关厂商(图片来源于艾瑞咨询)
从技术角度,计算机视觉有如下应用方向:
(1). 图像分类 image classification
(2). 视频分类 video classification
(3). 目标物定位 object localization/detection
(4). 图像内目标物分割 object segmentation
(5). 视频内目标物分割 video segmentation
(6). 目标追踪 visual tracking
(7). 行为识别 action/activity recognition
(8). 行为定位 temporal action/activity localization
(9). 姿态估计
pose estimation
应用领域与技术对照表如下图所示
图2 应用领域与所用技术