图像检索与识别——词袋模型(Bag-of-features models)

一、定义

计算机视觉单词袋是一种描述计算图像之间相似度的技术,常用于用于图像分类当中。该方法起源于文本检索(信息检索),是对NLP“单词袋”算法的扩展。在“单词袋”中,我们扫描整个文档,并保留文档中出现的每个单词的计数。然后,我们创建单词频率的直方图,并使用此直方图来描述文本文档。在“视觉单词袋”中,我们的输入是图像而不是文本文档,并且我们使用视觉单词来描述图像。

对于任意一幅图像,视觉词袋(BoVW,Bag of Visual Words)模型模型提取该图像中的基本元素,并统计该图像中这些基本元素出现的频率,用直方图的形式来表示。通常使用“图像局部特征”来类比BoW模型中的单词,如SIFT、SURF、HOG等特征,所以也称视觉词袋模型。图像BoVW模型表示的直观示意图如图所示

如上,每个图有不同种类的纹理,统计每个纹理的直方图(出现数量),右边这就是词袋。

二、步骤

视觉的词袋模型通常分为以下四个阶段:

  1. 图像预处理阶段: 在这个阶段,图像会经过一系列预处理操作,包括灰度化、尺寸调整、边缘检测等操作,以便将图像转化为计算机能够处理的形式。

  2. 特征提取阶段: 在这个阶段,从预处理后的图像中提取出各种特征,比如颜色直方图、边缘信息、纹理特征等,以便能够用来描述图像。

  3. 词袋生成阶段: 在这个阶段,将提取到的图像特征进行聚类,形成一个特征词典,然后将图像中的特征信息映射到这个词典中,形成一个特征向量。

  4. 训练和分类阶段: 在这个阶段,使用机器学习算法(如支持向量机、决策树等)对生成的特征向量进行训练,以便对图像进行分类和识别。

三、词袋模型的问题

  1. 词汇太多、太少都不好。
  2. 计算效率问题(K-means聚类很慢)
  3. 顺序、位置问题。比如:“我爱中国”与“爱我中国”,字都一样但含义不一样。

参考:

https://www.cnblogs.com/wxl845235800/p/10564121.html

视觉词袋模型简介-CSDN博客

计算机视觉CS131:专题10-识别&词袋模型 - 知乎

计算机视觉-图像检索与识别_视觉词袋模型的原理-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/519858.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STL中push_back和emplace_back效率的对比

文章目录 过程对比1.通过构造参数向vector中插入对象(emplace_back更高效)2.通过插入实例对象(调用copy函数)3.通过插入临时对象(调用move函数) 效率对比emplace_back 的缺点 我们以STL中的vector容器为例。…

LeetCode 刷题 [C++] 第300题.最长递增子序列

题目描述 给你一个整数数组 nums ,找到其中最长严格递增子序列的长度。 子序列 是由数组派生而来的序列,删除(或不删除)数组中的元素而不改变其余元素的顺序。例如,[3,6,2,7] 是数组 [0,3,1,6,2,2,7] 的子序列。 题目…

Leetcode 206. 反转链表

给你单链表的头节点 head ,请你反转链表,并返回反转后的链表。 示例 1: 输入:head [1,2,3,4,5] 输出:[5,4,3,2,1] 示例 2: 输入:head [1,2] 输出:[2,1] 示例 3: 输…

forwardRef和useImperativeHandle的配合使用

通过ref调用子组件里的方法 useImperativeHandle往外暴露子组件的方法,注意useImperativeHandle第三个参数中括号依赖,有这个依赖,childFun才能获取到最新的值

计算机基础专升本笔记十四-计算机网络基础(一)

计算机基础专升本笔记十四-计算机网络基础(一) 一、计算机网络的发展历程 第一代计算机网络(数据通信) 以数据通信为主的第一代计算机网络。主要是指美国军方用于防控系统的一种联机系统。它只是计算机网络的雏形。 第二代计算…

【思考】crud接口命名规范

写代码时取名字真的是痛苦。 方法命名 1、阿里命名规范 Service/Dao 层命名规约 1) 获取单个对象的方法用 get 做前缀。 2) 获取多个对象的方法用 list 做前缀。 3) 获取统计值的方法用 count 做前缀。 4) 插入的方法用 save&am…

20240304-使用VS2022编译blender3.6.2源代码

20240304-使用VS2022编译blender3.6.2源代码 一、软件环境 Win10 x64 22h2 JuneVS2022 v17.9.0CMake v3.24.4SVN v1.14.3GIT v2.29.2标签:win10 22h2 vs2022 blender 63335分栏:C 二、硬件环境 Win10 x64的PC台式机 三、获取源码 方法一 网盘下载…

粉色ui微信小程序源码/背景图/头像/壁纸小程序源码带流量主

云开发版粉色UI微信小程序源码,背景图、头像、壁纸小程序源码,带流量主功能。 云开发小程序源码无需服务器和域名即可搭建小程序另外还带有流量主功能噢!微信平台注册小程序就可以了。 这套粉色UI非常的好看,里面保护有背景图、…

【框架学习 | 第二篇】暴打MyBatis-Plus——MyBatis的升级版本

教程来源链接:https://www.quanxiaoha.com/mybatis-plus/mybatis-plus-tutorial.html 教程作者:犬小哈 文章目录 1.Mybatis Plus介绍1.1Mybatis和Mybatis Plus的区别是什么1.1.1什么是Mybatis?1.1.2区分Mybatis Plus和Mybatis 1.2Mybatis Plus特点1.3支…

Vue3_2024_6天【回顾上篇watch常见的前三种场景】另两种待补

第一种情况:监视【ref】定义(基本数据类型) 1.引入watch2.格式:watch(基本数据类型数据,监视变化的回调函数) 注意点: 2.1.watch里面第一个参数,是数据~~【监视的基本类…

泛型 --java学习笔记

什么是泛型 定义类、接口、方法时&#xff0c;同时声明了一个或者多个类型变量&#xff08;如&#xff1a;<E>&#xff09;&#xff0c;称为泛型类、泛型接口&#xff0c;泛型方法、它们统称为泛型 可以理解为扑克牌中的癞子&#xff0c;给它什么类型它就是什么类型 如…

开篇语 | 容器中的⼤模型 (LLM in Containers)

如果我们想搭建一个企业级的大模型应用&#xff0c;不管使用开源的基础模型自己来发布&#xff0c;还是使用类似于 ChatGPT 的闭源 API&#xff0c;我们都需要搭建一个大模型流水线来管理应用体系中除了基础模型之外的功能模块。 Replit 的一篇博客&#xff08;https://blog.r…