论文研读｜生成式跨模态隐写发展综述-编程知识

论文研读｜生成式跨模态隐写发展综述

news/2025/3/13 20:17:34/文章来源:https://blog.csdn.net/qq_36332660/article/details/132625269

前言：本文介绍近5年来生成式跨模态隐写领域的相关工作。

相关阅读：生成式文本隐写发展综述

不同于文本隐写，跨模态隐写需要考虑不同模态间的相关性，常见的跨模态场景有：Image-to-Text（如图像描述）, Text-to-Speech（如语音助手）, Text-to-Image（如按文作画）等。下面对基于深度学习的生成式跨模态隐写相关工作进行介绍。

[1]- 基于图像描述的文本信息隐藏 (北京邮电大学学报，2018) BUPT, Xue et al.

在这里插入图片描述

主要思想：采用CNN+LSTM框架，通过对基于Beam Search 的搜索方法进行改动。首先在密文首部加入16bit信息表示密文长度，然后根据不同的接收方共享场景分别设计了
- 基于句子的隐藏算法（SSH）：使用 Beam Search，在所有单词生成完毕之后，通过对 $2^{n}$ 个候选句等长编码，在最终句的选取过程中嵌入秘密信息；
- 基于单词的隐藏算法（WWH）：Beam 长度为1时，Beam Search 退化为贪婪搜索。在每个时间步生成单词时，固定候选词集为2，密文为1则选择较大概率的词，密文为2则选择较小概率的词。
- 基于散列函数的隐藏算法（HH）：通过下述公式将每个单词对应1bit的秘密信息，这种方法根据文本即可提取秘密信息。
  $v (w, k ey) = (m d 5 (w + k ey)) m o d 2$
数据集：Flicker8k
评价指标：嵌入容量：bpw；语义相关性：BLEU-N

[2]- Rits: real-time interactive text steganography based on automatic dialogue model (ICCCS, 2018) Tshinghua University, Yang et al.

在这里插入图片描述

这篇文章虽然不是跨模态的文章，但它指出生成的隐写文本应具备认知不可感知性，即：其语义应与上下文的语义相关，这一观点在跨模态文本隐写领域同样适用。

主要思想：针对对话场景，使用RNN+强化学习，使用基于完全二叉树的定长编码嵌入秘密信息。
数据集：对话数据集 negotiator
评价指标：效率：time

[3]- Steganographic visual story with mutual-perceived joint attention (EURASIP, 2021) Shanghai University, Guo et al.

在这里插入图片描述

主要思想：本文提出概率分布方差在一定范围之内才能保证认知不可感知性，设计了一种自适应候选词集的信息嵌入和提取方法。
数据集：VIST
评价指标：视觉不可感知性：Perplexity；认知不可感知性：BLEU&METEOR

[4]- ICStega: Image Captioning-based Semantically Controllable Linguistic Steganography (SPL, 2023) USTC, Wang et al.

在这里插入图片描述

主要思想：本文主要提出一个基于语义控制的候选词集构建方法
数据集： MS COCO
评价指标：嵌入量：bpw；视觉不可感知性：Perplexity；安全性：抗隐写分析能力 TS-FCN；认知不可感知性：BLEU&METEOR；多样性：LSA&Self-CIDEr

[5]- Cross-Modal Text Steganography Against Synonym Substitution-Based Text Attack (SPL, 2023) Fudan University, Peng et al.

在这里插入图片描述

主要思想：抗同义词替换攻击，有损隐写，使用DNN编码秘密信息，在解码网络中解锁。
数据集：MS COCO
评价指标：统计不可感知性：KL散度；抗隐写分析能力：LS-CNN&R-BIC&SeSy&BERT-FT
开源代码：https://github.com/hunanpolly/Cross-Modal-Steganography

[6]- Cover Reproducible Steganography via Deep Generative Models (TDSC, 2022) USTC, Chen et al.

在这里插入图片描述

应用场景：Text-to-Speech；Text-to-Image

[7]- Distribution-Preserving Steganography Based on Text-to-Speech Generative Models (TDSC, 2022) USTC, Chen et al.

在这里插入图片描述

应用场景：Text-to-Speech

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/97166.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Python爬虫——新手使用代理ip详细教程

Python爬虫——新手使用代理ip详细教程

Python代理IP爬虫是一种可以让爬虫拥有更多网络访问权限的技术。代理IP的作用是可以为爬虫提供多个IP地址，从而加快其爬取数据的速度，同时也可以避免因为访问频率过高而被网站封禁的问题。本文将介绍如何使用Python实现代理IP的爬取和使用。一、代理IP的…

阅读更多...

Python中重要的条件语句教程

Python中重要的条件语句教程

前言嗨喽，大家好呀~这里是爱看美女的茜茜呐一. 了解条件语句假设一个场景： 同学们这个年龄去过网吧吗？ 去网吧进门想要上网必须做的一件事是做什么？（考虑重点） 为什么要把身份证给工作人员&#xf…

阅读更多...

python中super()用法

python中super()用法

super关键字的用法一、概述二、作用三、语法四、使用示例1.通过super() 来调用父类的__init__ 构造方法：2.通过supper() 来调用与子类同名的父类方法2.1 单继承2.2 多继承一、概述 super() 是python 中调用父类（超类）的一种方法&#xff0…

阅读更多...

学习Bootstrap 5的第三天

学习Bootstrap 5的第三天

文字/排版默认设置 font-size：Bootstrap 5 的默认字体大小为 16px，也可以通过自定义 CSS 样式来修改。line-height：默认行高为 1.5，这意味着每行文本的高度是字体大小的 1.5 倍。也可以通过自定义 CSS 样式来修改行高。字体设置…

阅读更多...

R语言+Meta分析；论文新方向

R语言+Meta分析；论文新方向

Meta分析是针对某一科研问题，根据明确的搜索策略、选择筛选文献标准、采用严格的评价方法，对来源不同的研究成果进行收集、合并及定量统计分析的方法，最早出现于“循证医学”，现已广泛应用于农林生态，资源环境等方面。…

阅读更多...

【DevOps视频笔记】6 - 7. Jenkins 介绍和安装

【DevOps视频笔记】6 - 7. Jenkins 介绍和安装

一、Integrate 工具二、Jenkins 介绍 1. Jenkins 最主要的工作 2. CI / CD 可以理解为： 2.1 CI 过程 2.2 CD 过程三、Jenkins 安装 1. 安装准备工作 2. 安装 Jenkins Stage 1：拉取 jenkins 镜像 Stage 2：编写docker-compose.yml St…

阅读更多...

Redis网络模型

Redis网络模型

目录 Redis网络模型用户空间和内核态空间阻塞IO(BIO) 非阻塞IO(NIO) IO多路复用信号驱动IO 异步IO(AIO) Redis到底是单线程还是多线程？ 为什么要使用单线程？ Redis网络模型进程的寻址空间会划分为两部分：内核空间、用户空间用…

阅读更多...

基于YOLOv8+PyQt5实现的共享自行车识别检测系统，含数据集+模型+精美GUI界面(可用于违规停放检测告警项目)

基于YOLOv8+PyQt5实现的共享自行车识别检测系统，含数据集+模型+精美GUI界面(可用于违规停放检测告警项目)

系列文章目录文章目录系列文章目录前言欢迎来到我的博客！我很高兴能与大家分享关于基于YOLOv8的共享自行车识别检测，违规停放告警系统的内容。一、系统特点7. 带有训练部分标注好的数据集，训练集、验证集二、环境配置2.anaconda环境导入p…

阅读更多...

什么是接口测试，如何做接口测试？

什么是接口测试，如何做接口测试？

比起点点点的功能测试，“接口测试”显得专业又高大上，也因此让有些初级测试人员“望而生畏”。别担心，其实接口测试也是功能测试的一种，它是针对接口进行的功能测试。写在前面：本文参考了茹炳晟老师的《测试工程师全…

阅读更多...

Spring Cloud Alibaba-@SentinelResource的使用

Spring Cloud Alibaba-@SentinelResource的使用

1 SentinelResource的使用在定义了资源点之后，我们可以通过Dashboard来设置限流和降级策略来对资源点进行保护。同时还能通过SentinelResource来指定出现异常时的处理策略。 SentinelResource 用于定义资源，并提供可选的异常处理和 fallback 配置项。…

阅读更多...

陇剑杯2023WriteUp学习笔记【初赛】

陇剑杯2023WriteUp学习笔记【初赛】

文章目录数据分析1、hard_webhard_web_1hard_web_2hard_web_3 2、sevrer savesevrer save_1sevrer save_2sevrer save_3sevrer save_4sevrer save_5sevrer save_6sevrer save_7sevrer save_8 3、WiresharkWireshark1_1Wireshark1_2Wireshark1_3Wireshark1_4 4、Incidentrespon…

阅读更多...

STM32F4XX/APM32F4XX USB OTA升级

STM32F4XX/APM32F4XX USB OTA升级

近期在研究USB CDC协议，使用USB Virtual Port Com功能与上位机通讯做了OTA功能。开发平台：MDK529 开发硬件：APM32F411 首先看下手册Flash分布，Flash总共8个扇区。接下来进行Flash分区。扇区 0 和扇区 1做Boo区。扇区 2做APP跳…

阅读更多...

推荐文章

最新文章