AAAI论文阅读

文章目录

  • Open-Vocabulary Multi-Label Classifcation via Multi-Modal Knowledge Transfer——知识蒸馏的范畴
  • Med-EASi: Finely Annotated Dataset and Models for Controllable Simplifcation of Medical Texts——医学领域数据集构建
  • “Nothing Abnormal”: Disambiguating Medical Reports via Contrastive Knowledge Infusion
  • Self-Supervised Logic Induction for Explainable Fuzzy Temporal Commonsense Reasoning——时序信息

Open-Vocabulary Multi-Label Classifcation via Multi-Modal Knowledge Transfer——知识蒸馏的范畴

多模式知识传播

在这里插入图片描述

我们的 MKT 主要由视觉和语言预训练(VLP)模型和视觉转换器模型组成。VLP 模型旨在提取输入图像-文本对的多模态知识,而视觉转换器则用于提取输入图像的语义特征。此外,还利用知识提炼来保证图像及其相关标签嵌入的一致性,并通过及时调整来进一步更新标签嵌入。(最佳彩色效果)
在这里插入图片描述
主要贡献:

  1. 我们提出了一种基于开放词汇的多模态知识转移(MKT)框架,该框架基于 VLP 模型,利用图像-文本对中的语义多模态信息进行多标签分类。 据我们所知,这是第一项探索开放词汇多标签分类任务的工作。
  2. 我们的 MKT 框架主要由提取图像特征的图像编码器和提取图像/标签嵌入的 VLP 图像/文本编码器组成。为了保证图像和标签嵌入的一致性,我们在 MKT 框架中加入了知识蒸馏策略,并通过及时调整来迭代更新标签嵌入。此外,为了进一步提高我们方法的特征表达能力,我们提出了双流特征提取模块,通过联合捕捉局部特征和全局特征来提高特征提取的能力。
  3. 大量结果表明,我们的 MKT 方法明显优于之前的 ML-ZSL 方法,并在两个大规模基准测试中为开放词汇多标签分类建立了新的技术水平

Med-EASi: Finely Annotated Dataset and Models for Controllable Simplifcation of Medical Texts——医学领域数据集构建

MedEASi(简化和抽象医学数据集)是一个独特的众包和注释数据集,用于监督医学短文的简化

我们采用多角度训练方法,为文本简化添加了两种可控性:位置感知(使用原位注释输入和输出)和位置无关(模型只知道要编辑的内容,但不知道它们的位置)。

  • 数据集 我们对现有的两个并行医学文本简化语料库进行了四种文本转换注释,即阐述、替换、删除和插入新内容。

“Nothing Abnormal”: Disambiguating Medical Reports via Contrastive Knowledge Infusion

"没有异常 通过对比知识注入消除医疗报告的歧义

我们探讨了医疗保健领域的受众期望差距,并将导致患者对其诊断感到困惑的常见歧义归纳为三类:医学术语、自相矛盾的结论和误导性语法错误

我们的医疗团队对结果进行了分析,并将产生歧义的主要原因归纳为三类:报告句子含糊不清的原因是:(1)医学术语的含义与日常一般用法不同,如unsmarkable;(2)同一句子中的结论相互矛盾;(3)误导性语法错误,如完整句子之间没有句号。

解决方案(模型):我们首先通过对比学习对医学领域的 Seq2Seq 模型进行预训练。然后,通过扰动模型的隐藏状态,使用该模型改写模棱两可的输入,并将生成的结果推向对其考试结果更加明确的方向。

任务表示形式:
对于异常标签为 y(是否存在异常)的模棱两可的句子 x,我们将输出一个对 y 更明确的消歧义句子 x˜。
For an ambiguous sentence x whose abnormality label is y (abnormality presents or not), we will output a disambiguated sentence x˜ that is more explicit about y.
在这里插入图片描述
预训练阶段损失函数:
在这里插入图片描述
重写阶段(Rewriting framework):

在这里插入图片描述

Self-Supervised Logic Induction for Explainable Fuzzy Temporal Commonsense Reasoning——时序信息

问题来源: 最近的一项研究表明,经过大规模预训练的 LM 在复杂语境(如对话)下仍难以进行这种时间推理,因为它们只能隐式地编码相关语境,而不能显式地揭示复杂推理的基本逻辑组合。
定义了三个模块化组件:时态依赖诱导器和时态概念模糊器,以及逻辑验证器。

模型结构:
LECTER 框架。我们利用逻辑归纳模块(logic induction module)来解决模糊时态常识推理的中间推理步骤(intermediate inference steps)。逻辑验证器(The logic validator)从依赖诱导器和概念模糊器中获取预测概率分布,计算时态逻辑蕴含损失。它与基于回归的时值恢复损失一起,以端到端的方式训练模型(regression-based temporal value recovery loss to train the model in an end-to-end manner)。
在这里插入图片描述
we propose two self-supervised learning objectives, i.e., the Regression-based Temporal Value Recovery and Temporal Logical Entailment.
我们提出了两个自监督学习目标,即基于回归的时域价值恢复和时域逻辑不一致
(小trick:将时序做了变换处理,比如7:30 pm →19 + 30/60 → 19.5)

损失函数:

  1. 回归损失(mean square loss——均方误差):
    在这里插入图片描述
  2. 分类损失
    给定训练示例 X 和作为查询的 q,模型需要调整权重,使所有训练示例的查询概率 Pθ(q|X ) 最大化。这可以通过最小化查询的平均负对数似然来实现:
    在这里插入图片描述
  3. 总损失函数
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/63750.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Unity游戏源码分享-植物大战僵尸素材与源码

Unity游戏源码分享-植物大战僵尸素材与源码 完整版本下载地址: https://download.csdn.net/download/Highning0007/88191862

配置Arduino+ESP32走过的巨坑

项目场景: 前几天去淘宝买了块ESP32拿来用,配置Arduino最新版ESP32 2.0.11走过的巨坑。 问题描述 先安装好了ArduinoIDE最新版(教程里介绍去官网下),然后配置ESP32开发板,后面发现安装速度惊人。 去找加速…

C语言 ——函数指针变量

1、概念: 数组指针 - 是指针-是指向数组的指针,是存放数组地址的指针 函数指针 - 是指针 是指向函数的指针 - 是存放函数地址的指针!! 如上所示,函数也是具有地址的,而存放函数地址的指针变量成为函数指针变量。 而有如上所示&a…

用python来爬取某鱼的商品信息(1/2)

目录 前言 第一大难题——找到网站入口 曲线救国 模拟搜索 第二大难题——登录 提一嘴 登录cookie获取 第一种 第二种 第四大难题——无法使用导出的cookie 原因 解决办法 最后 出现小问题 总结 前言 本章讲理论,后面一节讲代码 拿来练练手的&#xff…

Maven的安装与配置(包含所有细节)

一、idea版本和maven配对 这里是很多新手都会遇到的大坑,一定要先将自己的idea版本和maven进行版本配配对。 Maven3.6.3版本兼容问题 注意:针对一些老项目 还是尽量采用 3.6.3版本,针对idea各个版本的兼容性就很兼容 IDEA 2022 兼容maven 3.8…

对于生产者消费者/shutdown/close的补充

信号量解决生产者消费者/读写者问题_右大臣的博客-CSDN博客 一点补充 模拟简单的string&#xff0c;循环队列&#xff0c;vector_右大臣的博客-CSDN博客 补充总结 写一个循环队列 用个循环队列去表示class myqueue{ vector<int>qq capacity 容量 front 头 rear 尾…

Vue组件库

Vue组件库 ViteVue3TypescriptTSX 1、项目搭建 1.1、创建项目&#xff08;yarn&#xff09; D:\WebstromProject>yarn create vite yarn create v1.22.19 [1/4] Resolving packages... [2/4] Fetching packages... [3/4] Linking dependencies... [4/4] Building fresh pa…

HCIP的BGP基础实验

一、实验需求 除R5的5.5.5.0环回外&#xff0c;其他所有的环回均可互相一访问。 二、实验步骤 1.配置ip 2.建立邻居关系 2.1 R1和R2建立直连的EBGP邻居关系 [r1]bgp 1 [r1-bgp]router-id 1.1.1.1 [r1-bgp]peer 12.1.1.2 as-number 2 要建的话双方都要建下面配置R2 [r2]bgp…

SpringCloudGateway配置跨域设置以及如何本地测试跨域

问题背景 有个服务A &#xff0c;自身对外提供服务&#xff0c;几个系统的前端页面也在调用&#xff0c;使用springboot 2.6.8开发的&#xff0c;自身因为有前端直接调用已经配置了跨域。 现在有网关服务&#xff0c;一部分前端通过网关访问服务A&#xff08;因为之前没有网关…

SAP Fiori 将GUI中的自开发报表添加到Fiori 工作台

1. 首先我们在workbench 中开发一个GUI report 这里我们开发的是一个简单的物料清单报表 2. 分配一个事务代码。 注意这里的SAP GUI for HTML 要打上勾 3. 创建语义对象&#xff08; Create Semantic Object&#xff09; 事物代码&#xff1a; path: SAP NetWeaver ->…

SpringBoot案例-部门管理-修改

目录 前言 查看页面原型&#xff0c;明确需求 页面原型 需求 阅读接口文件 思路分析 功能接口开发 控制层&#xff08;Controller类&#xff09; 业务层&#xff08;Service类&#xff09; 业务类 业务实现类 持久层&#xff08;Mapper类&#xff09; 接口测试 前…

mac安装open3d时候出现错误

在测试open3d是否正常顺利安装时&#xff0c;出现了如下错误&#xff1a; python -c "import open3d as o3d; print(o3d.__version__)" Traceback (most recent call last):File "<string>", line 1, in <module>File "/Users/huangzhe/…