当前位置: 首页 > news >正文

做海报推荐网站外贸云网站建设

做海报推荐网站,外贸云网站建设,网站备案是什么意思,网站根目录在哪wordpress通过在4亿图像/文本对上训练文字和图片的匹配关系来预训练网络#xff0c;可以学习到SOTA的图像特征。预训练模型可以用于下游任务的零样本学习 ​​​​​​​ ​​​​​​​ 1、网络结构 1#xff09;simplified version of ConVIRT 2#xff09;linear …        通过在4亿图像/文本对上训练文字和图片的匹配关系来预训练网络可以学习到SOTA的图像特征。预训练模型可以用于下游任务的零样本学习 ​​​​​​​        ​​​​​​​         1、网络结构 1simplified version of ConVIRT 2linear projection to map from each encoders representation to the multi-modal embedding space 3image encoder - ResNet antialiased rect-2 blur pooling 用attention pooling (single layer of transformer-style multi-head QKV attention where the query is conditioned on the global average-pooled representation of the image)来代替global average pooling - Vision Transformer (ViT) add an additional layer normalization to the combined patch position embeddings before the transformer slightly different initialization scheme 4text encoder - Transformer architecture modifications 63M-parameter 12 layer 512-wide model with 8 attention heads lower-cased byte pair encoding (BPE) representation of the text with a 49152 vocab size the max sequence length was capped at 76 the text sequence is bracketed with [SOS] and [EOS] tokens the activations of the highest layer of the transformer at the [EOS] token are treated as the feature representation of the text which is layer normalized and then linearly projected into the multi-modal embedding space 5scale - image encoder equally increase the width, depth, and resolution of the model - text encoder only scale the width of the model to be proportional to the calculated increase in width of the ResNet, do not scale the depth at all * text encoder对CLIP的表现影响较小 2、数据 1400 million (image, text) pairs from Internet 2many of the (image, text) pairs are only a single sentence 3、训练 1Contrastive Language-Image Pre-training (CLIP) 2text as a whole, not the exact words of that text 3Given a batch of N (image, text) pairs, predict N x N possible (image, text) pairings。N取32768 4jointly train an image encoder and text encoder 5maximize the cosine similarity of the  real pairs; minimizing the cosine similarity of the  incorrect pairs 6train from scratch 7数据增强 random square crop from resized images 8learnable temperature parameter  (control the range of the logits in the softmax) 4、优势 无需softmax分类器来预测结果因此可以更灵活的用于zero-shot任务
http://www.pierceye.com/news/518891/

相关文章:

  • 福建省建设注册管理中心网站那些做面点的网站好
  • 天津网站建设方案托管wordpress 批量删除
  • 网站后台管理系统域名在线设计房屋装修
  • 郑州网站建设工作室wordpress 编辑器字号
  • 内容聚合网站开发教程WordPress文章首页缩进
  • saas云建站平台源码新冠2024中国又要封城了
  • 济南网站建设认可搜点网络滨州网站建设
  • 政务公开及网站建设意见网站的策划方案怎么写
  • 网站培训制度郑州建网站哪个公司好
  • 网站建设优化怎么做微信公众平台开发网站
  • 网站建设的什么是网站建设的第一阶段公司简介概况怎么写
  • 玛伊网站做兼职加入要多少钱装修房子的app软件哪个好
  • 免费空间asp网站公众号编辑器排行榜
  • 鲜花培训网站建设网站建设技术部奖惩制度
  • 国内优秀设计网站站长营销型网站建设 案例
  • 织梦网站维护唐山网站建设哪家专业
  • 网上打字兼职正规网站深圳各区房价一览表
  • 怎样建设网站是什么怎么看网站空间多大
  • 如何备份网站的手机版免费申请微网站
  • 淘宝不允许 网站建设wordpress页面无法编辑器
  • 个人怎么做课程网站seo神马网站推广器
  • 做购物比价的网站有哪些外贸移动商城网站建设
  • 网站开发的特点做直通车任务的网站
  • 分类信息系统网站模板wordpress黑客
  • 推荐一个代做毕业设计的网站云服务器怎么搭建
  • 网站制作计算机电商运营seo
  • 网站关键词分隔符建站用什么工具
  • 广元网站开发兰州电商平台网站建设
  • 网站怎么黑北京广告设计公司排行
  • 番禺网站排名推广优化排名网站开发类标书模板