当前位置: 首页 > news >正文

设计师必须知道的十个网站WordPress上传ftp设置

设计师必须知道的十个网站,WordPress上传ftp设置,免费网站统计,番禺网站开发哪里好ControlNet: Adding Conditional Control to Text-to-Image Diffusion Models TL; DR#xff1a;ControlNet 使得我们能通过输入额外的条件图#xff08;如 Canny 边缘、人体姿态、深度图等#xff09;#xff0c;对 SD 生成结果的空间位置有更准确的控制。它拷贝 SD 部分…ControlNet: Adding Conditional Control to Text-to-Image Diffusion Models TL; DRControlNet 使得我们能通过输入额外的条件图如 Canny 边缘、人体姿态、深度图等对 SD 生成结果的空间位置有更准确的控制。它拷贝 SD 部分原权重作为一个新的分支进行微调训练同时维持 SD 原权重分支不变并在开始训练使用零卷积将二者相连。从而能利用已经在大规模图片数据上预训练的 SD 权重尽量保持原模型能力且训练高效。 方法 模型结构 ControlNet 对 SD 原模型的 adapt 如图所示。图中 x 是输入噪声图y 是输出c 是条件图输入。拷贝一份原参数权重作为另一分支进行训练原参数权重分支不动两分支之间用零卷积链接。所谓零卷积就是权重和偏置都初始化为 0 的 1x1 卷积。这样在训练刚开始时由于零卷积的输出都是 0因此改动后的模型和原 SD 模型的输出是完全一致的。随着训练的进行才会产生变化。这样的结构能保证不会对预训练的 SD 模型带来有害的噪声。 文章以 SD txt2img 为例详细介绍了插入 ControlNet 的方法。原 SD 的 UNet 网络共有 12 层降采样12 层上采样和 1 层中间层。其特征图共有 4 中空间分辨率大小64、32、16、8。ControlNet 对 UNet 的 encoder 部分12 层降采样 1 层中间层构建了可训练拷贝。其输出分别经过零卷积输入给原 SD 模型的解码器部分。 此外SD 是隐层扩散模型LDM其扩散过程时发生在 latent 空间的。输入的条件图自然也需要转换到 latent 空间ControlNet 是使用了四层卷积层完成了这个转换将 512x512 的真实图片转换到 64x64 的 latent 空间。 训练 ControlNet 是在预训练好的模型权重上加入一些参数然后进行微调。其训练的目标函数与 SD 是完全一致的但是加入了各种条件图如 Canny、人体姿势等作为输入。在训练时 ControlNet 时还会有 50% 的概率将文本 prompt 替换为空字符串从而训练 ControlNet 直接识别条件图语义的能力。 作者在训练 ControlNet 时还观察到一个奇特的现象即模型并不是逐渐学习到条件控制能力的而是在某一步突然就会了。如下图模型在 6133 步突然就能精准地按照输入的 Canny 边缘进行生成了。作者称这为 “突然收敛现象” sudden convergence phenomenon。 推理 训练结束之后推理时就可以按照输入的条件图来控制空间位置进行生成了。这里作者还交代了几点细节用于更好地控制生成结果。 CFG-RWSD 在训练时使用了 Classifier-Free Guidance 的方法即同时训练模型条件生成和无条件生成的能力然后在生成时也同时生成条件结果和无条件结果并根据指定的 CFG Scale 得到最终的生成结果 ϵ prd ϵ uc β cfg ( ϵ c − ϵ uc ) \epsilon_{\text{prd}}\epsilon_{\text{uc}}\beta_{\text{cfg}}(\epsilon_{\text{c}}-\epsilon_{\text{uc}}) ϵprd​ϵuc​βcfg​(ϵc​−ϵuc​) 。ControlNet 中条件生成的结果既可以加到 ϵ uc \epsilon_{\text{uc}} ϵuc​ 和 ϵ c \epsilon_{\text{c}} ϵc​ 中也可以只添加到 ϵ c \epsilon_{\text{c}} ϵc​ 中。如果 prompt 为空有 50% 概率此时如果同时加到 ϵ uc \epsilon_{\text{uc}} ϵuc​ 和 ϵ c \epsilon_{\text{c}} ϵc​ 中则相当于没有 CFG 了而如果只加到 ϵ c \epsilon_{\text{c}} ϵc​ 中那么 CFG 引导又太强。这里作者的策略是使用分辨率加权CFG-RW即 w i 64 / h i w_i64/h_i wi​64/hi​ 其中 h i h_i hi​ 是第 i 层的空间分辨率如 h 1 8 , h 2 16 , … h_18,h_216,\dots h1​8,h2​16,… 。 从下图的结果来看嘉乐 CFG-RW 的策略后生成的结果会好很多。 组合多种 ControlNet我们可以对同一次生成组合使用多种 ControlNet并不需要任何加权或插值。如下面的例子就组合了人体姿势和手部的深度图作为条件。 实验结果 略 总结 ControlNet 的影响力不言而喻我们终于能对生成结果的空间位置有精确的控制而不需要再一次次的碰运气。ICCV 2023 Best Paper 实至名归。
http://www.pierceye.com/news/664390/

相关文章:

  • 儿童摄影网站建设专业做网站制作自助建站系统
  • 注册做网站的公司有哪些wordpress 4.1 下载
  • 用ps做美食网站一个网站多少钱?
  • 网站建设 试题揭阳专业做网站公司
  • 手机上怎么创建自己的网站河南企业网站优化
  • 定陶区城乡和住房建设局网站新手怎么做网站
  • 工商银行与建设银行网站对比石嘴山网站seo
  • seo快速建站自学程序员的步骤
  • 做旅行网站的依据及意义如何制作自己想要的图片
  • 电子商务网站怎么做网站建设企业建站哪家好?来这里看看
  • 网站备案电话号码购物商城网站建设方案
  • 手机商城系统徐州seo计费管理
  • 西安网站公司哪家好信息推广的方式有哪些
  • 网站开发注意的事项商丘网站制作软件
  • 51zwd一起做网站广州广东省网站备案查询
  • 如何生成一个网站自己弄公司网站
  • 企业信用信息查询网官网孝感网站seo
  • 中淼建设工程有限公司网站分类用wordpress
  • 腾讯建设网站首页做销售网站
  • 推广引流网站聚名网注册
  • 原来做网站后来跑国外了多伦多网站建设多少钱
  • 手机建站平台做母婴网站设计思路
  • 免费个人手机网站九八智能建站
  • 中山网站备案如何做购物网站
  • 常见的简单的网站制作建设网站的好公司
  • 邯郸网站制作建设wordpress+怎么迁移
  • 设计创意广告上海企业网站优化
  • 自己做网站需要购买服务器吗WordPress文章相册修改
  • 校园招聘哪个网站做的好学做川菜网站
  • 大足网站建设公司医院网站建设熊掌号