当前位置: 首页 > news >正文

河北中石化建设网站网站开发软件 论文 摘要

河北中石化建设网站,网站开发软件 论文 摘要,云主机建站,新洲城乡建设局网站目录 总体介绍总体流程 模块介绍目标检测#xff1a; grounding dino目标分割#xff1a;Segment Anything Model (SAM)整体思路模型结构#xff1a;数据引擎 图片绘制 集成样例 其他问题附录 总体介绍 总体流程 本方案用到了三个步骤#xff0c;按顺序依次为#xff1a… 目录 总体介绍总体流程 模块介绍目标检测 grounding dino目标分割Segment Anything Model (SAM)整体思路模型结构数据引擎 图片绘制 集成样例 其他问题附录 总体介绍 总体流程 本方案用到了三个步骤按顺序依次为 基于语义的目标检测使用grounding dino在检测到的范围内进行目标分割生成mask使用segment anything图片绘制使用stable diffusion 模块介绍 目标检测 grounding dino 总体架构图 从图中可以看出本算法本质上是对图像和文本进行多模态融合将二者映射到同一个向量空间并使用attention的思路进行匹配从而得到文本对应的图像。 模型中使用Swin Transformer作为image backboneBERT作为text backbone使用cross-transformer进行多模态融合。 从上面流程可以更深入地理解attention中qkv含义即可以将attention视为一种软寻址。在网上看到过一个简单易懂的解释 attention 机制里主要有三个向量 - key, query 和 value其实可以将 Attention 机制看作一种软寻址Soft Addressing:Source 可以看作一个中药铺子的储物箱储物箱里的药品由地址 Key药品名和值 Value药品组成当前有个 KeyQuery药方的查询目的是取出储物箱里对应的 Value 值药品即 Attention 数值。通过 Query 和储物箱内元素 Key 的地址进行相似性比较来寻址之所以说是软寻址指的是我们不只从储物箱里面找出一中药物而是可能从每个 Key 地址都会取出内容取出内容的重要性量的多少根据 Query 和 Key 的相似性来决定之后对 Value 进行加权求和这样就可以取出最终的 Value 值一副中药也即 Attention 值。所以不少研究人员将 Attention 机制看作软寻址的一种特例 目标分割Segment Anything Model (SAM) 整体思路 模型的目的是构建一个用于图像分割的基础模型即寻求开发一个可提示的promptable模型并将其进行预训练预训练的数据集通过一个有强大泛化能力的任务来生成。使用这个模型就可以寻求解决在使用prompt工程生成的新数据分布上的一系列下游分割问题。 本计划能否成功主要和三个部分相关任务task、模型model、数据data。为了研究这些部分需要解决以下三个问题 什么样的任务可以零样本泛化 定义一个可提示的分割任务可以针对任何分割提示prompt返回有效的分割掩码。本任务有两个作用一是作为预训练目标二是通过prompt工程解决下游通用分割任务。 与之相应的模型架构是什么样的 模型必须支持灵活的prompt且可以实时输出掩码mask。 什么样的数据能支持这项任务和模型 论文提出需要大规模多样化的数据集为了得到这样的数据集可以构造一个数据引擎通过引擎可以半自动、全自动生成新数据完成模型迭代 模型结构 数据引擎 互联网上目前没有适用于本任务数据量的数据集所以必须构建一套引擎来生成数据。生成的训练数据集名为SA-1B总共包括1100万张图像和11亿个掩码。数据生成收集包含三个阶段。 人工辅助阶段。专业标注员使用浏览器上的交互式标记工具并结合 SAM 进行手动标注。SAM 首先使用公共数据集进行训练。随着数据量的逐渐增加SAM 图像编码器的尺寸也随之增大ViT-B扩展为ViT-H。在这一阶段结束时收集了 430 万个掩码和 12 万张图像。 半自动阶段。为了增加掩码的多样性并改善模型的性能研究人员首先预先填充了掩码标注人员需要在此基础上补充其他未标注的对象。为了检测掩码的可信度使用第一阶段得到掩码的数据训练一个边界检测模型用来进行高置信度预测。在此阶段结束时一张图像平均可以提供 72 个掩码。 全自动阶段。本阶段可以实现全自动标注。实现此步骤主要由于亮点一在前面两个阶段已经收集了足够的掩码二引入了可以在有歧义情况下也可以判断的歧义感知模型。在这一阶段结束时最终的 SA-1B 数据集包含 1100 万张图像和 1.1B 个掩码。 图片绘制 stable diffusion(网上说这部分的文章众多暂略) 集成 样例 目前跑的样例均涉及到公司内部信息暂略后期有时间会补充脱敏版 其他问题 grouding-dino检测到的目标是一个范围如果此范围内有多个物体且互相之间不好区分则会全部覆盖。 例原图如下src为dogdst为tiger 原图 生成的mask 结果图 附录 GroundingDINO开源项目地址 GroundingDino论文地址 segment anything论文地址 segment anything github segment anything官方demo SAM论文解读 Segment AnythingSAM论文杂谈 SAM综述 sam数据集 SA-1B数据集 手把手教程 当前图片编辑基础代码
http://www.pierceye.com/news/398040/

相关文章:

  • 网站功能优化的方法营销型网站建设集装箱液袋
  • 建设资讯网站厦门网站建设哪家强
  • 惠阳网站设计开发图片做多的网站是哪个
  • 医院网站建设公司价格低本地网站搭建视频教程
  • 黑客攻击的网站网站开发需要多少钱app
  • 海南建设厅评审网站织梦网站加网站地图
  • 清迈城市建设网站外贸搜索网站
  • 怎样做网站公司网站建设维护管理
  • 伊犁网站制作珠海做网站的公司
  • 乐山市规划和建设局网站房地产基础知识
  • 网站给假冒伪劣产品做推广鞍山网站制作一般需要多少钱
  • 番禺网站开发哪里好ppt模板免费下载完整版免费简约
  • 哪个公司做企业网站好济南网站优化推广公司电话
  • 深圳网站建设外包公司网站流量提供商
  • 网站建设优化服务信息wordpress下载类插件
  • 深圳做网站google推广百度优化是什么
  • 网站开发技术服务费分享经济网站怎么建设
  • 免费seo网站推广在线观看360免费wifi创建失败
  • 服装网站开发嵌入式硬件开发
  • 上海建设厅网站那些网站可以做自媒体
  • 如何查看一个网站流量网店美工课程心得体会
  • 邯郸的网站建设无锡做网站品牌公司
  • 汇编做网站门户网站建设 知乎
  • 教育云平台网站建设云南小程序定制开发
  • 企业自助建站策划方案横沥网站设计
  • 网站开发搜索功能怎么实现中小网站建设都有哪些方案
  • 学科网站建设网页制作和网页制作
  • 公司网站模板大全网站文章编辑
  • 旅游网站建设的总结wordpress多域名移动主题
  • 深圳做网站推荐哪家公司好附近广告公司联系电话