禁止wordpress网站上传图片时自动生成三张图片方法,那个网站可以做微课,服务器租用是什么意思,有没有做课题很好的网站前言#xff1a;本文介绍近5年来生成式跨模态隐写领域的相关工作。 相关阅读#xff1a;生成式文本隐写发展综述
不同于文本隐写#xff0c;跨模态隐写需要考虑不同模态间的相关性#xff0c;常见的跨模态场景有#xff1a;Image-to-Text#xff08;如图像描述#xff… 前言本文介绍近5年来生成式跨模态隐写领域的相关工作。 相关阅读生成式文本隐写发展综述
不同于文本隐写跨模态隐写需要考虑不同模态间的相关性常见的跨模态场景有Image-to-Text如图像描述, Text-to-Speech如语音助手, Text-to-Image如按文作画等。下面对基于深度学习的生成式跨模态隐写相关工作进行介绍。
[1]- 基于图像描述的文本信息隐藏 (北京邮电大学学报2018) BUPT, Xue et al. 主要思想采用CNNLSTM框架通过对基于Beam Search 的搜索方法进行改动。首先在密文首部加入16bit信息表示密文长度然后根据不同的接收方共享场景分别设计了 基于句子的隐藏算法SSH使用 Beam Search在所有单词生成完毕之后通过对 2 n 2^{n} 2n个候选句等长编码在最终句的选取过程中嵌入秘密信息基于单词的隐藏算法WWHBeam 长度为1时Beam Search 退化为贪婪搜索。在每个时间步生成单词时固定候选词集为2密文为1则选择较大概率的词密文为2则选择较小概率的词。基于散列函数的隐藏算法HH通过下述公式将每个单词对应1bit的秘密信息这种方法根据文本即可提取秘密信息。 v ( w , k e y ) ( m d 5 ( w k e y ) ) m o d 2 v(w,key) (md5(wkey)) mod 2 v(w,key)(md5(wkey))mod2 数据集Flicker8k评价指标嵌入容量bpw语义相关性BLEU-N
[2]- Rits: real-time interactive text steganography based on automatic dialogue model (ICCCS, 2018) Tshinghua University, Yang et al. 这篇文章虽然不是跨模态的文章但它指出生成的隐写文本应具备认知不可感知性即其语义应与上下文的语义相关这一观点在跨模态文本隐写领域同样适用。
主要思想针对对话场景使用RNN强化学习使用基于完全二叉树的定长编码嵌入秘密信息。数据集对话数据集 negotiator评价指标效率time
[3]- Steganographic visual story with mutual-perceived joint attention (EURASIP, 2021) Shanghai University, Guo et al. 主要思想本文提出概率分布方差在一定范围之内才能保证认知不可感知性设计了一种自适应候选词集的信息嵌入和提取方法。数据集VIST评价指标视觉不可感知性Perplexity认知不可感知性BLEUMETEOR
[4]- ICStega: Image Captioning-based Semantically Controllable Linguistic Steganography (SPL, 2023) USTC, Wang et al. 主要思想本文主要提出一个基于语义控制的候选词集构建方法数据集 MS COCO评价指标嵌入量bpw视觉不可感知性Perplexity安全性抗隐写分析能力 TS-FCN认知不可感知性BLEUMETEOR多样性LSASelf-CIDEr
[5]- Cross-Modal Text Steganography Against Synonym Substitution-Based Text Attack (SPL, 2023) Fudan University, Peng et al. 主要思想抗同义词替换攻击有损隐写使用DNN编码秘密信息在解码网络中解锁。数据集MS COCO评价指标统计不可感知性KL散度抗隐写分析能力LS-CNNR-BICSeSyBERT-FT开源代码https://github.com/hunanpolly/Cross-Modal-Steganography
[6]- Cover Reproducible Steganography via Deep Generative Models (TDSC, 2022) USTC, Chen et al. 应用场景Text-to-SpeechText-to-Image
[7]- Distribution-Preserving Steganography Based on Text-to-Speech Generative Models (TDSC, 2022) USTC, Chen et al. 应用场景Text-to-Speech开源代码https://github.com/coriverchen/ProvablySecureSteganography