当前位置: 首页 > news >正文

容桂网站建设找顺的哈密网站建设公司哪家专业

容桂网站建设找顺的,哈密网站建设公司哪家专业,重庆南岸区网站建设,厦门公司注册程序注册程序1.传统RNN网络 每一层都需要上一层执行完才能执行 1.1 自注意力 在一句话中找到it_指代的是什么#xff0c;它的上下文语境是什么#xff1f; self-attetion计算 1.2 multi-header机制 1.3 堆叠多层self-attention#xff0c;相当于再一次卷积 1.4 位置信息编码 1.5 残…1.传统RNN网络 每一层都需要上一层执行完才能执行 1.1 自注意力 在一句话中找到it_指代的是什么它的上下文语境是什么 self-attetion计算 1.2 multi-header机制 1.3 堆叠多层self-attention相当于再一次卷积 1.4 位置信息编码 1.5 残差连接与归一化 归一化让训练速度更快更稳定u0是均值为01是指标准层为1 1.6 decoder 其他的和encoder一样 1.7 整体架构 encoder输入文本序列进行多次N次的encoder(self-attention),然后进行多头的self-attention(multi-head attention),可能越学越差因此加入残差连接和归一化。 dcoder:加入掩码输入为encoder的k1…kn和v1…vn序列及decoder的q1…qn。其他和encoder一样 2 处理图像架构VIT 图像经过卷积提取出特质然后将其转换为300的向量。然后将向量经过全连接层如把300维的向量映射为256的特征重新整合。 2.1 VIT图像分割后位置编码 vit中方式1不加位置编码方式2二维形式比位置编码方式3分割顺序位置编码。 位置编码中0不是所有任务都用到一般用于分类在分割检测时候就没有了。 经过encoder将图像转换为一种计算机可以识别的特征形式。 在处理分类任务时会将1-9的结果整合到0然后用0性*特征向量驱处理分类。 0-9分别是10个token 代码步骤二做完的事情图1 图二 图三 2.2 VIT图像计算公式 E代表编码ppc代表输入一个patch图像分割块D是映射全连接层即将256映射为512映射后变为ppd Epos位置编码最后一个维度D必须和E一样N1代表多了一个0*N代表图像分割的patch块数表示一个分类token。 第一个E表示对D做一个映射。 z0表示将位置编码信息加到每一个数据上。 MSA-多头注意力机制LN-归一化加上Zt-1代表加上残差连接。 3 TNT ↑内部的transformer将每个分割过的图像patch再次分割为多个patch。外部的transformer和一般情况下做的事情一样。 ↑TNT内部序列重组构建 VIT总结 图像进行position_enbeddings只需要进行一次卷积即可。 4.swin Transformer 传统transformer将图像作为一个个的patch每个patch作为序列的一小部分传统的尽可能将patch分的细一点但此时需要构建更长的序列则token就越多。而transformer需要将其中的一个token和其他token做计算此时计算量就大。如第一层输入400个token则下一层还是400个。传统的transformer输入的向量维度和输出的一样。 而swin transformer第一层400个第二层进行合并变为200个后续依次类推。 步骤 4.1 图像的初始输入 4.2 将图像的特征图中的序列转换为多个窗口即基于window的自注意力机制 reshape操作(5656-6477),64个窗口每个窗口为77大小4.3 计算自己窗口内的自注意力得分得到权重矩阵 每个窗口由7749个token组成每个token是由3头注意力机制搞定每一头搞定一个32维向量。 attention结果代表意思64为64个窗口3代表3种不同的权重项4949表示每个774949即49个token其他48自己的权[1]49得分的窗口中自己的自注意力得分。 4.4窗口重构将窗口还原为输入时的特征 新的特征64,49,96分别代表64个窗口每个窗口有7749个点每个点输入为96维向量此时的96维向量还表示了与窗口内其他token点的关系。 每个窗口的点对应96个向量。此时96个向量是做了attention后表达的特征含义。 4.5 计算窗口内部特征后进行窗口滑动再次计算注意力特征 4.6 窗口偏移的问题及解决 原本是4大块ABC和空格部分划分后为0-8九个位置。但是计算还按照四个窗口计算即4还当做其中一个然后5和3当做一块1和7当做一块0、2、6、8四个当做一块等于还是四块。 然后四块内计算块内的自注意力没有意义的地方进行mask补0不影响计算。 W-MSA和SW-MSA输入是一样的都是4.3中3,64,3,49,32,含义也是一样的。只是SW-MSA对窗口做了偏移引入了masked然后其他和W-MSA一样。 4.7 下采样 间隔取图像块。 第一次是64个窗口第二次就变为16个窗口第三次变为4个窗口第四次变为1个窗口选择7是因为7算的开。最终得到特征图 4.8 代码总结 图五 3136相当于3136个特征点每一个点都是由96维向量组成的 图6 图七
http://www.pierceye.com/news/674495/

相关文章:

  • 湛江企业网站建站模板网站开发 平台
  • c做的网站app开发制作专业吗
  • 杭州做网站公司做网站的文章
  • 那里有制作网站公司做网站需要了解的内容
  • 网站防护怎么做企业网站建设的ppt
  • 凡科网的网站建设好用吗wordpress在线朗读
  • 闽侯县建设局网站营销网站seo推广费用
  • 长乐区住房和城乡建设局网站测网站打开的速度的网址
  • 手机网站产品展示模板wordpress评论改成微博
  • 后盾网原创实战网站建设教程做网站和编程序
  • 东莞整站优化推广公司找火速如何做网站连接
  • 做ppt的模板的网站想学服装设计怎么入门
  • 短视频网站如何做推广网站申请域名
  • 餐饮行业网站建设风格建网站费用
  • 北京网站建设与维护石家庄做淘宝网站
  • seo网站关键词优化费用linux wordpress 伪静态
  • 朋友做的网站图片不显示不出来的网站空间哪家公司的好
  • 外贸网站建设公司价格最全做暖暖网站
  • 手机网站建设代理商怎么自己开一个网站
  • 国内比较高端的设计网站如何通过html做网站
  • 做一个网站怎么赚钱网站建设方向
  • 岳阳网站建设哪里便宜连云港网站制作
  • 企业网站内容运营方案策划网络运营是什么意思
  • 深圳建网站信科南京医院网站建设
  • 新开最好的传奇网站js 网站跳转
  • 阿里巴巴国际站做2个网站有用网站制作是怎么学的
  • 做的网站图片不显示企业邮箱什么格式
  • 今天重大新闻优化设计答案五年级下册
  • 网站建设市场报价建站哪家好 discuz
  • 没后台的网站怎么做优化中国联通网站备案