当前位置: 首页 > news >正文

网站数据分析的重要性酷站字体

网站数据分析的重要性,酷站字体,专科函授网页设计实训报告,爱站网官网查询域名文 #xff5c; 橙橙子如果老板派给你一个任务#xff0c;不使用一张图片#xff0c;让你训练一个视觉预训练模型#xff0c;你会不会觉得老板疯了。最近有一篇论文#xff0c;不仅没用一张真实图片和标注#xff0c;还训练出个媲美SOTA的效果#xff0c;甚至超过了MoCo… 文 橙橙子如果老板派给你一个任务不使用一张图片让你训练一个视觉预训练模型你会不会觉得老板疯了。最近有一篇论文不仅没用一张真实图片和标注还训练出个媲美SOTA的效果甚至超过了MoCov2和SimCLRv2你敢信么今天就让我们来看一下这篇神作论文题目: Can Vision Transformers Learn without Natural Images?论文链接: https://arxiv.org/pdf/2103.13023.pdf项目地址: https://hirokatsukataoka16.github.io/Vision-Transformers-without-Natural-Images/也可以在 【夕小瑶的卖萌屋】订阅号后台回复关键词 【0414】 下载论文PDF~什么是不需要真实图像的ViT视觉TransformerViT最近强势进军CV界并取得绝佳效果大有要取代曾经的王者卷积神经网络CNNs的趋势。不过ViT也有诸多问题在预训练阶段经常需要上亿级别的真实图像数据和标注预训练才能和CNNs一较高低这直接带来了诸如隐私保护、标注成本、AI伦理等问题。随着自监督学习方法Self-Supervised Learning, SSL如Moco、SimCLR的成功, 标注问题被极大地解决但是在真实图像上进行训练仍然会触发诸如侵犯隐私和公平性保护的问题。譬如正因为图像版权相关的问题著名的ImageNet数据集只能用于非商业用途。如果能不使用任何真实图像数据和人工标注情况下训练ViT还能达到甚至超过真实图像训练的最优模型数据问题荡然无存模型轻松放心大胆用这简直完美岂不快哉公式驱动的监督学习重点来了通过什么方式达成这一目标呢本文提出了一种基于公式驱动的监督学习方法Formula-Driven Supervised LearningFDSL。这种方法依赖于没有自然图像的数据库即分形数据库FractalDB。通过分配分形来自动生成图像模式及其类别标签这些分形基于现实世界背景知识中存在的自然规律。FractalDB最早被提出于[1]值得一提的是这篇文章同样也是本文作者所写并获得了ACCV 2020最佳论文提名奖。FractalDB的构造过程可以分为两步1使用迭代函数系统iterated function systemIFS自动生成基础分形和对应的类别。熟悉计算机图形学的同学们会比较熟悉使用IFS生成分形分为选定随机起始像素点、随机生成种仿射变换包含6个参数4个旋转参数和2个平移参数表示采样概率、依据概率分布对当前点采样变换函数生成新的描绘点、重复迭代这个过程直至达到设定像素点阈值这几个过程。最终的分形由这些像素点绘制而成由于它由确定所以对应的类别就是。这种方法能够保证只使用简单的公式就可以生成接近自然物体的复杂模式。2对基础分形做扩展得到当前类下的不同样例intra-category instances。这个步骤的目的是为了扩充数据。类别内扩充的基本原则是在保持分形基本形状不变的情况下尽可能增加多样性。论文提出了三种方式a. 对IFS的6个参数进行一定weight缩放预设了4种weight可以产生25种不同的变种。b.旋转包括不旋转、水平旋转、垂直旋转、水平-垂直共4种。c. 块渲染基础分形使用了的像素渲染为了制造差异性块渲染使用10种的像素块。这样对于每一种类别我们可以构造出1000个样例。最终FractalDB含有两种不同的规模。FractalDB-1K含有1k类别共计1M样例。FractalDB-10k含有10k类别共计10M样例。下图展示了分形数据库的构造过程分形数据库联合ViTFractalDB可以直接应用在ViT上么答案是肯定的不过本文也针对ViT的特点做了一些使用方式上的修改。首先真实图像是彩色图而分形没有背景是灰度图。为了让模型学到一些色彩的分布论文对FractalDB进行了色彩增强即在渲染时随机使用颜色像素。进一步参考自监督学习的成功经验论文进行了更长时间的充分训练。好了数据已ready剩下的就交给强大的ViT了这里论文使用了DeiT (Data-Efficient Image Transformers)[2]. 在FractalDB上训练ViT和在真实图像上训练方法一样将2D图像拆分成大小的多个patch并平铺在一起组成多个visual token的1D输入然后开心快乐的feed到Transormer中训练就好啦呼唤实验效果实验是检验真理的唯一标准效果好不好结果看一下。论文使用了经典的pretrain-finetune方法首先在FractalDB上预训练的DeiT接着在各个视觉下游任务数据集上微调。首先和多种有监督方法进行了效果对比。尽管论文方法没有完全超过在在Imagenet-1k1.28M上训练的效果但是已经非常接近了。这可是完全一张真实图像都没有用啊喂! 另外我们可以看到使用预训练和不使用效果差距是非常明显的。另一方面论文和流行的自监督学习方法进行了实力对比。论文方法的平均表现亮眼超过了MoCov2、SimCLRv2等方法。最后论文也做了一些可视化分析。使用分形数据库训练的模型相对于有监督模型和自监督模型而言过滤器的范围要更广可以在更大的范围内获取特征。总结一下论文另辟蹊径的在不使用任何真实图像和标注的条件下成功训练了一个强大的ViT模型虽然距离现在的有监督方法还有微弱差距但是已经超过了目前最优秀的自监督模型MoCov2和SimCLRv2是一项非常有趣的工作相信它在AI伦理和版权保护方面有重要意义。不过笔者私以为抛开数据使用问题研究角度还是很期望看到自动构造的分形数据和真实图像数据的融合训练说不定会有意想不到的效果呢。后台回复关键词【入群】加入卖萌屋NLP/IR/Rec与求职讨论群后台回复关键词【顶会】获取ACL、CIKM等各大顶会论文集 [1] Pre-training without Natural Images(https://arxiv.org/pdf/2101.08515.pdf)[2] Training data-efficient image transformers distillation through attention(https://arxiv.org/pdf/2012.12877.pdf)
http://www.pierceye.com/news/475382/

相关文章:

  • 网站建设市场分析内蒙古企业网站建设
  • 广州 网站建设公司不用代码做网站的软件
  • 本地php网站搭建wordpress前台注册登入
  • 网站做推广页需要什么软件下载豪禾创意海报设计理念
  • 河北特定网站建设推荐网站建设的技术可行性
  • 招投标 网站建设哈尔滨做网站哪好
  • 骏域网站建设专家东莞展台展馆设计搭建
  • 免费的html网站东丽手机网站建设
  • 网站建设谈客户说什么广州网站快速制作
  • 寻花问柳专注做男人喜爱的网站做网站教程 第一课
  • 个人做外贸接订单网站简道云crm
  • 小程序免费制作平台教学东莞seo关键词
  • 微网站设计平台网络营销相关的岗位有哪些
  • 手机网站建设软件有哪些内容如何做自己的加盟网站
  • 做购物平台网站 民治农业信息网站建设方案
  • 苏州网站建设找哪家东莞seo关键词排名优化排名
  • 怎么描述网站设计软件排行榜
  • 宁波网站制作优化服务公司推广找客户平台
  • 个人网站 域名选择在线画图网页版
  • 外贸网站建设双语网站建设广州景点
  • 深圳宝安p2p网站系统的建设手机网站开发+手机模拟器
  • 合肥营销网站建设设计网站关键词做标签
  • 网站建设与管理实训心得怎么写wordpress图片太大
  • 用个人免费空间快速建立个人网站后方平台网络营销案例2022
  • 网站搭建h5是什么做图软件ps下载网站有哪些内容
  • 企业网站推广技巧和方法免费个人简历模板官网
  • wordpress 全站备份网站建设的实验心得体会
  • 给网站开发APP网站可信度必须做吗
  • 用地方名字做网站做网站那种语言好
  • 天河网站(建设信科网络)濮阳市城乡一体化示范区主任