MedLSAM:定位和分割任何3D医学图像模型

文章目录

  • MedLSAM: Localize and Segment Anything Model for 3D Medical Images
    • 摘要
    • 本文方法
      • 模型学习过程
      • 模型推理过程
    • 实验结果

MedLSAM: Localize and Segment Anything Model for 3D Medical Images

摘要

SAM (Segment Anything Model)是近年来出现的一种具有开创性的图像分割模型。然而,原始的SAM和它的医疗适应性都需要逐片注释,这直接增加了注释工作负载和数据集的大小。我们提出MedLSAM来解决这个问题,确保无论数据集大小如何都有恒定的注释工作负载,从而简化了注释过程。
本文要点

  1. 引入了一个能够定位身体内任何目标解剖部位的几次定位框架。
  2. 开发了一个3D医学图像的本地化模型(MedLAM),利用两个自我监督任务:相对距离回归(RDR)和多尺度相似性(MSS),跨越14,012个CT扫描的综合数据集。
  3. 然后,我们通过整合MedLAM和SAM建立了一种准确分割的方法。
  4. 通过在几个模板上标注三个方向上的六个极值点,我们的模型可以在所有计划标注的数据上自主识别目标解剖区域。
  5. 这允许我们的框架为图像的每个切片生成一个2D边界框,然后由SAM利用它进行分割。我们在涵盖38个器官的两个3D数据集上进行了实验,发现MedLSAM的性能与SAM及其医学适应性相匹配,同时只需要对整个数据集进行最小的极值点注释。此外,MedLAM具有与未来3D SAM模型无缝集成的潜力,为增强性能铺平了道路
    代码地址

本文方法

在这里插入图片描述
给定任意大小的数据集,MedLSAM首先应用定位过程(MedLAM)来识别任何感兴趣的解剖区域的六个极值点(在z, x和y方向上)。这个过程的结果是生成一个3D bounding box,包围目标器官或结构。随后,对于该3D边界框内的每个切片,生成相应的2D边界框。然后利用这些二维边界框对目标解剖结构进行精确分割,从而实现整个分割过程的自动化。

模型学习过程

在这里插入图片描述
代理任务:Relative Distance Regression (RDR) and Multi Scale Similarity (MSS)
**Relative Distance Regression (RDR):**来自不同个体的3D扫描图像映射到统一的隐式3D解剖坐标系上,确保来自不同个体的相同解剖结构共享相同的坐标。因此,它允许我们在查询扫描中对与我们感兴趣的点共享相同隐式坐标的点执行初始的、粗略的定位。
**Multi Scale Similarity (MSS) :**鉴于不同个体解剖定位的内在差异,在不同图像中共享相同潜坐标的区域仍然可能对应不同的解剖结构。因此,我们需要通过从感兴趣的点提取局部像素级特征来进一步提高定位的精度。这使我们能够精确定位初始定位点附近最相似的特征,从而提高整体定位精度。该工作确保了同一图像的增强实例对同一点产生高度相似的特征,而不同的点则表现出明显不同的特征
在这里插入图片描述
MSS过程的输入包括从xs和xs中提取的多尺度特征图,以及从xs中选择的点c1,其在x ’ s中的对应点为c ’ 1。我们从x的各种尺度特征映射中提取点c1对应的特征向量,并计算这些特征向量与x的相应尺度特征映射的相似度。在将结果相似图的大小调整为原始图像大小之后,我们将它们聚合起来。这个过程使我们能够在x中精确定位与c1点最相似的位置,从而进一步完善我们的定位

模型推理过程

在这里插入图片描述
x和xq是以cs和cq为中心的支持和查询补丁。我们使用共享的Pnet将xs和xq分别转换为3D潜在向量ps和pq。Pnet包含用于提取特征的卷积块和用于投影的全连接层。我们应用比例因子r和双曲正切函数tanh来获得预测的偏移量dqs,即从xs到xq的相对位置。

实验结果

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/2849.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux--时间相关的指令:date、cal

一、data显示 date 指定格式显示时间: date %Y:%m:%d date 用法: date [OPTION]... [FORMAT] 1.在显示方面,使用者可以设定欲显示的格式,格式设定为一个加号后接数个标记,其中常用的标记列表如下 %H : 小时(00..2…

IP地点定位为什么有误差?

随着互联网的不断普及,人们对IP地点定位需求越来越多。然而,即便是在现代技术的支持下IP地点定位仍然存在误差。那么,IP地点定位为什么会出现误差呢? IP(Internet Protocol)地址是指互联网协议(…

基于XDMA 中断模式的 PCIE 上位机与FPGA数据交互架构 提供工程源码和QT上位机源码

目录 1、前言2、我已有的PCIE方案3、PCIE理论4、总体设计思路和方案图像产生、发送、缓存数据处理XDMA简介XDMA中断模式图像读取、输出、显示QT上位机及其源码 5、vivado工程详解6、上板调试验证7、福利:工程代码的获取 1、前言 PCIE(PCI Express&#…

Jenkins + Docker + Maven + Windows 一键部署 Spring Boot 程序到远程 Linux 服务器

Jenkins Docker Maven Windows 一键部署 Spring Boot 程序到远程 Linux 服务器 文章目录 Jenkins Docker Maven Windows 一键部署 Spring Boot 程序到远程 Linux 服务器一、准备1、环境2、基本流程准备步骤基本思路 3、相关命令4、Dockerfile 文件5、配置远程服务器、安装…

机器学习复习5

机器学习复习 1 - 下面是你在课程中看到的代码,在哪种情况下你会使用二值交叉熵损失函数? model.compile(lossBinaryCrossentropy()) A. 回归任务(预测一个数字的任务) B. BinaryCrossentropy()不应该被用于任何任务 C. 有3个或更多类(类别)的分类任务 D…

MUR20100DC-ASEMI快恢复二极管MUR20100DC

编辑-Z MUR20100DC在TO-263封装里采用的2个芯片,其尺寸都是102MIL,是一款共阴极快恢复对管。MUR20100DC的浪涌电流Ifsm为200A,漏电流(Ir)为10uA,其工作时耐温度范围为-55~150摄氏度。MUR20100DC采用抗冲击硅芯片材质,…

搞懂反射我建议选这篇

反射 介绍Class类创建对象测试代码运行结果 属性测试代码运行结果 构造方法测试代码运行结果 成员方法测试代码运行结果 用到的全部代码student类运行的全部代码 介绍 Reflection(反射) 是 Java 程序开发语言的特征之一,它允许运行中的 Java 程序对自身进行检查。被…

win 安装 C++运行环境 - MinGW

目录 一、下载二、安装四、检查是否安装成功五、参考文章 一、下载 官网地址:https://www.mingw-w64.org/downloads/ 1.1点击【MingW-W64-builds】 1.2点击【Github】 1.3下载 如果下载太慢,可以使用GitHub Proxy 代理加速 (ghproxy.com) 二、安装 …

华为新版模拟器-ENSP_PRO发布啦

但是下载的话要去申请权限 安装的话 可以在Vbox里面先把这个包添加进去 然后点击控制-新建 这里要选中刚刚添加的虚拟硬盘, 然后点击创建 到这里虚拟机就创建好了 然后点击设置网卡 然后右键点击启动这个虚拟机就行了 此时再打开这个网址 然后点击创建沙箱-数通模拟…

centos7 配置jenkins run docker

本机环境已有jdk11 一、安装配置maven环境 1、下载maven wget https://dlcdn.apache.org/maven/maven-3/3.9.3/binaries/apache-maven-3.9.3-bin.tar.gz 2、解压 tar -zxvf apache-maven-3.9.3-bin.tar.gz 3、移动位置 mv apache-maven-3.9.3 /usr/local/ 4、加入环境变…

vue属性中的数据绑定v-text与响应式操作v-html+vue中鼠标悬停显示效果+布尔值在vue中引用属性中的操作

1&#xff0c;vue属性中的数据绑定v-text与响应式操作v-html 当我们导入vue框架后&#xff0c;对于数据的绑定功能&#xff0c;我们使用v-text的语法功能&#xff1a; <div v-text "message"><div>在该情况下&#xff0c;我们可以输出对应属性的文本&a…

重新理解 RocketMQ Commit Log 存储协议

最近突然感觉&#xff1a;很多软件、硬件在设计上是有 root reason 的&#xff0c;不是 by desgin 如此&#xff0c;而是解决了那时、那个场景的那个需求。一旦了解后&#xff0c;就会感觉在和设计者对话&#xff0c;了解他们的思路&#xff0c;学习他们的方法&#xff0c;思维…