当前位置: 首页 > news >正文

珠海市网站建设品牌关于网站建设项目收取费用

珠海市网站建设品牌,关于网站建设项目收取费用,长春做网站,自己建网站备案今天介绍transformer模型的decoder解码器#xff0c;target mask目标掩码 背景 解码器层是对前面文章中提到的子层的包装器。它接受位置嵌入的目标序列#xff0c;并将它们通过带掩码的多头注意力机制传递。使用掩码是为了防止解码器查看序列中的下一个标记。它迫使模型仅使用… 今天介绍transformer模型的decoder解码器target mask目标掩码 背景 解码器层是对前面文章中提到的子层的包装器。它接受位置嵌入的目标序列并将它们通过带掩码的多头注意力机制传递。使用掩码是为了防止解码器查看序列中的下一个标记。它迫使模型仅使用之前的标记作为上下文来预测下一个标记。然后它再通过另一个多头注意力机制该机制将编码器层的输出作为额外的输入。最后它通过位置全连接前馈网络。在这些子层中的每一个之后它都会执行残差相加和层归一化。 Transformer中的解码器层 如上所述解码器层无非是对子层的包装器。它实现了两个多头注意力子层和一个位置全连接前馈网络每个子层之后都跟着层归一化和残差相加。 参看 编码器encoder Transformer模型-encoder编码器padding填充source mask填充掩码的简明介绍-CSDN博客https://blog.csdn.net/ank1983/article/details/137399110 为什么需要掩码 目标掩码target mask 要理解为什么需要目标掩码最好看一下解码器的输入和输出的示例。解码器的目标是在给定的编码源序列和目标序列的一部分的情况下预测序列中的下一个标记。为了实现这一点必须有一个“开始”标记来提示模型预测序列中的下一个标记。这就是上面图像中“bos”标记的用途。还需要注意的是解码器的输入和输出的大小必须相同。 如果目标是将“Wie heißt du?”翻译为“What is your name?”那么编码器将编码源序列的含义并将其传递给解码器。给定“bos”标记和编码的源序列解码器应该预测出“What”。然后将“What”附加到“bos”后面以创建新的输入即“bos What”。这就是为什么解码器的输入被认为是“向右移动”的原因。这可以传递给解码器以预测What is。这个标记被附加到之前的输入上以创建新的输入“bos What is”。这将被传递给解码器以预测“What is your”。这个过程会一直重复直到模型预测出“eos”标记。 通过使用目标掩码模型可以同时学习每个迭代的目标序列例如“bos What is your name? eos”。 请记住解码器的输入和输出长度必须相同。因此在将目标序列传递给解码器之前需要移除每个目标序列的最后一个标记。如果目标序列存储在trg中那么解码器的输入将是trg[:, :-1]用于选择除最后一个标记之外的所有内容这可以在上面的目标输入中看到。预期的输出将是trg[:, 1:]即除第一个标记之外的所有内容这是上面看到的预期输出。 总结来说与编码器层一样解码器也需要对其输入进行掩码处理。虽然填充掩码对于输入是必要的但目标序列也需要一个前视或后续掩码。在推理过程中模型只会被提供一个开始标记并必须基于它预测下一个标记。然后给定两个标记它必须预测第三个标记。这个过程会一直重复直到预测出序列结束标记。这就是Transformer的自回归行为。换句话说未来的标记只基于过去的标记和来自编码器的嵌入进行预测。 为了模拟这种行为模型使用后续掩码同时学习所有这些迭代。 可以使用PyTorch的torch.tril函数来创建后续掩码。它将具有(trg_seq_length, trg_seq_length)的形状。 填充掩码目标掩码 对于序列中的每个标记概率分布只能考虑之前的标记。但是由于目标序列也必须进行填充因此填充掩码和后续掩码必须结合使用。 这可以通过使用 运算符轻松实现该运算符仅在两个掩码都为1时才返回1。 这个最终的目标掩码必须为每个批次中的序列创建这意味着它将具有(batch_size, 1, trg_seq_length, trg_seq_length)的形状。这个掩码将在每个头之间进行广播。 原文链接https://medium.com/hunter-j-phillips/the-decoder-8882c33de69a
http://www.pierceye.com/news/966937/

相关文章:

  • seo网站设计营销工具抽奖网站插件
  • 家装设计网站大全网站建设用哪个好
  • 青海企业网站建设企业建设网
  • 电子商务网站环境建设怎么劝客户做网站
  • 山西教育学会的网站建设网站投放广告教程
  • 游戏网站的设计方案做装修业务呢有多少网站
  • 口碑好网站建设公司电话百度联盟网站备案信息
  • 网站建设排行公司建筑网页设计详情
  • 德国的网站后缀技术支持 东莞网站建设母婴护理
  • 彩票娱乐网站建设wordpress 邮件推送
  • 如何申请网站备案如何选择邯郸做网站
  • 专注做一家男生最爱的网站北京旅游设计网站建设
  • c 做网站凡科网站免费版怎么做
  • 门户网站开发多少钱wordpress主题文章页面不显示
  • 网站建设丶金手指下拉13个人网站有什么用
  • 企业网站建设解决方案wordpress搜索不了中文linux
  • 怎样在网站上做有效的广告投放手机网站公司哪家好
  • 四川德行天下建设工程有限公司网站ie兼容所有网站
  • 网站seo诊断免费php源码网
  • 微信公众号商城网站开发湖南省新闻最新消息十条
  • 如何做网站家具导购做哈尔滨本地门户网站赚钱吗
  • 建立网站的步骤有哪些wordpress 主题
  • 网站功能建设中页面个体户做网站有用吗
  • 网站建设具体要求wordpress启用注册
  • 重庆好的网站建设公司车辆管理网站开发
  • 十大SEO网站外链建设误区城乡住房建设部网站保证金
  • 自己做一元夺宝网站dede 管理多个网站
  • 做app还是做微网站好聚美网站开发开题报告
  • 网站建设总结与科技网站建设+长沙
  • 网博士自助建站系统手机wap网站程序