当前位置: 首页 > news >正文

新乡做网站公司仙居建设局网站

新乡做网站公司,仙居建设局网站,深圳网站建设及推广,模板网站可以做seo吗#x1f368; 本文为#x1f517;365天深度学习训练营 中的学习记录博客#x1f356; 原作者#xff1a;K同学啊 一、什么是位置编码 1. 位置编码定义 Transformer 模型中的位置编码是为了在处理序列数据时引入位置信息#xff0c;以便模型能够分辨输入序列中不同位置的词… 本文为365天深度学习训练营 中的学习记录博客 原作者K同学啊 一、什么是位置编码 1. 位置编码定义 Transformer 模型中的位置编码是为了在处理序列数据时引入位置信息以便模型能够分辨输入序列中不同位置的词或标记。 其中每个位置/索引都映射到一个向量。因此位置编码层的输出是一个矩阵其中矩阵的每一行代表序列中的一个编码对象与其位置信息相加。下图为仅对位置信息进行编码的矩阵示例。 2. 三角函数 位置编码由不同频率的正弦和余弦函数给出下图为正弦函数的快速回顾不同波形的波长和频率如下所示 3. 位置编码公式 假设有一个长度为L的输入序列要计算第K个元素的位置编码。位置编码有不同频率的正弦和余弦函数给出 P ( k , 2 i ) s i n ( k n 2 i / d ) . P(k,2i) sin(\frac k {n^{2i/d}}). P(k,2i)sin(n2i/dk​). P ( k , 2 i 1 ) c o s ( k n 2 i / d ) . P(k,2i 1) cos(\frac k {n^{2i/d}}). P(k,2i1)cos(n2i/dk​). 参数详解 k k k对象 即句子中的字符在输入序列中的位置 0 k L 2 0 k \frac L 2 0k2L​ d d d输出嵌入空间的维度 P ( k , j ) P(k,j) P(k,j)位置函数用于映射输入序列中 k k k处的元素到位置矩阵的 ( k , j ) (k,j) (k,j)处 n n n用户定义的标量Transformer论文作者的值为10000 i i i用于映射到列索引 0 i d 2 0i\frac d 2 0i2d​单个值 i i i映射到正弦和余弦函数 4. 位置编码示例 为理解上述表达式以短语I am a robot为例其中 n 100 n100 n100 d 4 d4 d4。下表显示了该短语的位置编码矩阵。对于任何 n 100 n100 n100 d 4 d4 d4的四字母短语位置编码矩阵都是相同的。 二、可视化理解位置编码 1. Python实现位置编码 import numpy as np import matplotlib.pyplot as pltdef getPositionEncoding(seq_len, d, n10000):P np.zeros((seq_len, d))for k in range(seq_len):for i in np.arange(int(d/2)):denominator np.power(n, 2*i/d)P[k,2*i] np.sin(k/denominator)P[k,2*i1] np.cos(k/denominator)return PP getPositionEncoding(seq_len 4, d 4, n 100) print(P)输出如下 [[ 0. 1. 0. 1. ][ 0.84147098 0.54030231 0.09983342 0.99500417][ 0.90929743 -0.41614684 0.19866933 0.98006658][ 0.14112001 -0.9899925 0.29552021 0.95533649]]2. 单个字符可视化 查看 n 10000 n10000 n10000和 d 512 d512 d512的不同位置的正弦波开始 def plotSinusoid(k, d 512, n 10000):x np.arange(0, 100, 1)denominator np.power(n, 2*x/d)y np.sin(k/denominator)plt.plot(x, y)plt.title(k str(k))fig plt.figure(figsize(15,4)) for i in range(4):plt.subplot(141 i)plotSinusoid(i * 4)输出 上图可看出每个位置对应不同的正弦曲线将单个位置编码为向量。 3. 整句话的位置编码可视化 可视化 n 10000 n10000 n10000的位置矩阵 P getPositionEncoding(seq_len 100, d512, n 10000) cax plt.matshow(P) plt.gcf().colorbar(cax)输出 三、位置编码的最终输出 Transformer中的位置编码层把位置向量与单词编码相加并为后续层输出该矩阵。整个过程如下图所示 四、总结 Transformer的位置编码一方面通过正弦和余弦函数来编码位置信息这种编码方式能够使得不同位置的编码在空间上有良好的分布。 另一方面分别使用正弦和余弦函数来编码偶数和奇数位置以确保位置编码能够捕捉到位置之间的关系。
http://www.pierceye.com/news/641199/

相关文章:

  • 惠州网站建设公司曾做网站需要学习什么知识
  • 网站制作里面链接怎么做建网站要什么工做人员
  • 网站建设费用 会计分录网站用哪些系统做的好
  • 免费建立一个个人网站网站模板怎么引用
  • 网站推广软文公司wordpress里面备份功能在哪里
  • 贵州整站优化seo平台网站建设与开发英文文献
  • 江干区住房和城乡建设局网站北京网站开发的趋势在哪里
  • 无锡网站建设选千客云网络简单网站建设推荐
  • 设计网站推荐百度贴吧带搜索的下拉框网站
  • 长春站最新发布网站开发税费
  • 北京通州住房和城乡建设部网站网站开发运营服务合同
  • 建设网站的服务端口国外用python做的网站
  • 如何实现网站生成网页手机端网站建设的注意事项
  • 澄迈网站新闻建设哪个公司建设网站
  • 怎么免费做文学网站wordpress下载及使用说明
  • 大学做兼职英语作文网站中国建筑人才培训网
  • 健康养老网站建设展馆展厅设计效果图
  • 做甜品网站的需求分析wordpress手机移动主题
  • 大兴企业官方网站建设wordpress 电话登记插件
  • 织梦网站搜索怎么做爱拍怎么创建wordpress
  • 阿里云多网站建设绵阳专门做网站的公司有哪些
  • 网站推广的基本方法对于大部分网站来说都是适用的深圳华强北网站建设
  • 网校网站毕业设计的方案网站如何做外链教程视频
  • poiplayer wordpress广州企业网站seo
  • wordpress翻页数字广州网站整站优化
  • 动漫网站设计与实现wordpress禁止留言网址
  • 网站开发交流培训机构网站制作
  • 网站安全建设模板下载百度推广免费建站
  • 开发网站公司都需要什么岗位人员郑州最好的妇科医院
  • 河北专业网站建设公司推荐温州网站建设公司有哪些