【论文阅读】MC:用于语义图像分割的深度卷积网络弱监督和半监督学习

【论文阅读】MC:用于语义图像分割的深度卷积网络弱监督和半监督学习

文章目录

  • 【论文阅读】MC:用于语义图像分割的深度卷积网络弱监督和半监督学习
    • 一、介绍
    • 二、联系工作
    • 三、方法
    • 四、实验结果

Weakly- and Semi-Supervised Learning of a Deep Convolutional Network for Semantic Image Segmentation

深度卷积神经网络在大量具有强像素级标注的图像上进行训练

研究具挑战性的问题:

  • 弱标注的训练数据(如边界框或图像级标签
  • 来自一个或多个数据集的少量强标记和许多弱标记图像的组合中学习用于语义图像分割的DCNNs

开发了期望最大化(EM)方法

在PASCAL VOC 2012图像分割基准上进行训练

一、介绍

在PASCAL VOC 数据集上

将DCNN与全连通条件随机场(CRF)相结合,获得高分辨率分割。

我们开发了新的方法来从弱注释中训练DCNN图像分割模型,无论是单独的还是与少量强注释相结合

现有的从这种非常弱的标签训练语义分割模型的方法使用多实例学习(MIL)技术

开发了新的在线期望最大化(EM)方法

估计潜在像素标签(受弱注释约束)和使用随机梯度下降(SGD)优化DCNN参数之间交替

EM方法在半监督场景中也很出色

主要贡献:

  • 提出了用于图像级或边界框注释训练的EM算法,适用于弱监督和半监督设置。
  • 少量像素级注释图像与大量图像级或边界框注释图像相结合时,获得了优异的性能
  • 数据集之间组合弱注释或强注释可以产生进一步的改进

二、联系工作

仅使用图像级标签训练分割模型一直是一个具有挑战性的问题

他们都为这个问题开发了基于MIL的算法

推断分割时考虑了弱标签

边界框注释用于语义分割,3D边界框实现了汽车分割的人类级精度。边界框注释也常用于交互式分割

分割方法可以有效地估计出足够准确的对象片段,用于训练DCNN语义分割系统

在这里插入图片描述

三、方法

这使用DCNN来预测每个像素的标签分布,然后使用全连接(密集)CRF来平滑预测,同时保留图像边缘

专注于从弱标签训练DCNN参数的方法,仅在测试时使用CRF

完全监督的情况

在这里插入图片描述

θ是DCNN参数的矢量,同时标签分布的公式为:

在这里插入图片描述

Image-level annotations

当只有图像级注释可用时,我们可以观察到图像值x和图像级标签z,但像素级分割y是潜在变量,保存以下概率图形模型:

在这里插入图片描述

其实感觉提出弱监督的人简直是天才,仅依靠图像级的label就可以生成像素级的label

算法步骤:

在这里插入图片描述

在这里插入图片描述

bfg>bbg,比背景更提升当前的前景类别,以鼓励全对象覆盖,并避免将所有像素分配给背景的退化解决方案

在实践中,采用了算法1的变体,自适应地设置依赖于图像和类的偏差bl,以便将图像区域的规定比例分配给背景或前景对象类

EM 与 MIL进行对比

基于EM的方法与最近两种用于学习语义图像分割模型的多实例学习(MIL)方法进行比较是有指导意义的

MIL分类在图像分类任务中效果良好,但它不太适合分割

DCNN被调整为专注于最独特的对象部分,而不是捕捉整个对象(例如人体)


边界框注释

Bbox-Rect方法相当于简单地将边界框内的每个像素视为相应对象类的正示例。

通过将属于多个边界框的像素分配给面积最小的边界框来解决歧义。

探索了第二种Bbox-Seg方法,在该方法中我们执行自动前景/背景分割

分别划分:

  • 边界框的中心区域(框内像素的α%)约束为前景,
  • 边界框外的像素约束为背景

我们的第三种Bbox EM Fixed方法是一种EM算法,它允许我们在整个训练过程中细化估计的分割图

混合强注释和弱注释

我们通常可以访问大量的弱图像级注释图像,并且只能为这些图像中的一小部分获取详细的像素级注释

将固定比例的强/弱注释图像捆绑到每个小批量中,

在每次迭代时使用EM算法来估计弱注释图像的潜在语义分割。

在这里插入图片描述

四、实验结果

数据集所提出的训练方法在PASCAL VOC 2012分割基准上进行评估,该基准由20个前景对象类和一个背景类组成

MS-COCO 2014数据集有80个前景对象类和一个背景类,并在像素级别进行了注释

为了模拟只有弱注释可用的情况并进行公平的比较(例如,对所有设置使用相同的图像),我们从像素级注释生成弱注释

而当只有图像级注释可用时,小FOV(128×128)表现更好

将DCNN和密集CRF训练阶段解耦,并通过交叉验证来学习CRF参数

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/517848.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenAI 大声朗读出来

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…

react中tab选项卡切换

react中tab选项卡切换,直接上代码,简单易懂 jsx代码 /* eslint-disable react-hooks/exhaustive-deps */ import React, { useEffect, useState } from "react"; import DocumentTitle from react-document-title import styles from ./…

程控水冷阻性负载的原理与应用

程控水冷阻性负载是一种利用计算机程序控制水冷系统对阻性负载进行冷却的技术。它主要应用于电力电子设备、电力系统、新能源等领域,以提高设备的稳定性和可靠性,降低能耗,延长设备寿命。 程控水冷阻性负载的原理: 1. 阻性负载&a…

f5——>字符串三角

暴力破解,双层循环,注意复制到新列表用append,这样更不容易出错 格式还是“”.join(str)

MQTT控制报文介绍(2)

一、CONNECT – 连接 服务端 客户端到服务端的网络连接建立后,客户端发送给服务端的第一个报文 必须是 CONNECT 报文。在一个网络连接上,客户端只能发送一次 CONNECT 报文。服务端 必须将客户端发送的第二个 CONNECT报文当作协议违规处理并断开客户端的…

three.js如何实现简易3D机房?(三)显示信息弹框/标签

接上一篇: three.js如何实现简易3D机房?(二)模型加载的过渡动画:http://t.csdnimg.cn/onbWY 目录 七、创建信息展示弹框 1.整体思路 (1)需求: (2)思路:…

一些考证网站

教师资格证1月报名,3月考试 https://www.neea.edu.cn/html1/folder/16013/15-1.htm 导游证 7月10日报名,8月考试 https://c-dy.exam-sp.com/index.html#/e/dy2023/module4 中国教育考试网可考内容 中国人事网 一般报名提前两个月左右 http://cpta.mohrs…

论文笔记 - 基于振动信号的减速器故障诊断方法

1.论文摘要 基于振动信号的减速器故障诊断方法, 沈晴,《起重运输机械》,2018 原作者联系方式: shenqing@zmpc.com 这篇文章包含了一个从工程到数据处理和故障定位的完整过程。是一篇综述文档。它介绍了机械设备常见的三类故障(轴,齿轮、轴承)的故障特征,并在一个故障追…

axios网络请求库语法

post,get方法: 代码示例 请求成功后控制台返回信息 axios统一使用方式:axios(config) 理解为调用一个方法,方法里带上配置信息 Axios API | Axios中文文档 | Axios中文网 (axios-http.cn) axios中文网

为国产信创服务器提供LDAP统一身份认证方案

金融信创作为 8 大行业信创之首,早已成为其他行业信创建设的参考。金融行业有着极为复杂的业务场景,对系统有着极高的稳定可靠需求,因此,在寻找微软 AD 国产化替代方案时,常会涉及到更深层次的场景。例如,最…

C# CallerMemberName、CallerFilePath、CallerLineNumber

CallerMemberName:调用某个方法的主方法名称 CallerFilePath:调用某个方法的主方法所在的类文件地址 CallerLineNumber:调用这个方法所在的行号 用这三个附加属性,需要设置默认值。

本地部署websocket服务端并结合内网穿透实现固定公网地址连接

文章目录 1. Java 服务端demo环境2. 在pom文件引入第三包封装的netty框架maven坐标3. 创建服务端,以接口模式调用,方便外部调用4. 启动服务,出现以下信息表示启动成功,暴露端口默认99995. 创建隧道映射内网端口6. 查看状态->在线隧道,复制所创建隧道的公网地址加端口号7. 以…