当前位置: 首页 > news >正文

做药公司的网站前置审批腾网站建设

做药公司的网站前置审批,腾网站建设,怎样做约票的网站意思,存量权益登记在哪个网站上做数学原理#xff1a; (1) 前向传播的方差一致性 假设输入 x 的均值为 0#xff0c;方差为 σx2σ_x^2σx2​#xff0c;权重 W的均值为 0#xff0c;方差为 σW2σ_W^2σW2​#xff0c;则输出 zWxzWxzWx的方差为#xff1a; Var(z)nin⋅Var(W)⋅Var(x) Var(z)n_{in}⋅Va…数学原理 (1) 前向传播的方差一致性 假设输入 x 的均值为 0方差为 σx2σ_x^2σx2​权重 W的均值为 0方差为 σW2σ_W^2σW2​则输出 zWxzWxzWx的方差为 Var(z)nin⋅Var(W)⋅Var(x) Var(z)n_{in}⋅Var(W)⋅Var(x) Var(z)nin​⋅Var(W)⋅Var(x) 为了使 Var(z)Var(x)需要 nin⋅Var(W)1  ⟹  Var(W)1nin n_{in}⋅Var(W)1  ⟹  Var(W)\frac{1}{n_{in}} nin​⋅Var(W)1  ⟹  Var(W)nin​1​ 其中 ninn_{in}nin​是输入维度fan_in。这里乘以 nin 的原因是输出 z 是由 nin 个输入 x 的线性组合得到的每个输入 x 都与一个权重 W 相乘。因此输出 z 的方差是 nin 个独立的 Wx 项的方差之和。 (2) 反向传播的梯度方差一致性 在反向传播过程中梯度 ∂L∂x\frac{∂L}{∂x}∂x∂L​ 是通过链式法则计算得到的其中 L 是损失函数x 是输入z 是输出。梯度∂L∂x\frac{∂L}{∂x}∂x∂L​可以表示为 ∂L∂x∂L∂z.∂z∂x \frac{∂L}{∂x}\frac{∂L}{∂z}.\frac{∂z}{∂x} ∂x∂L​∂z∂L​.∂x∂z​ 假设 zWx其中 W 是权重矩阵那么 ∂z∂xW\frac{∂z}{∂x}W∂x∂z​W。因此梯度 ∂L∂x\frac{∂L}{∂x}∂x∂L​可以写为 ∂L∂x∂L∂zW\frac{∂L}{∂x}\frac{∂L}{∂z}W∂x∂L​∂z∂L​W 反向传播时梯度 ∂L∂x\frac{∂L}{∂x}∂x∂L​ 的方差应与 ∂L∂z\frac{∂L}{∂z}∂z∂L​ 相同因此 nout⋅Var(W)1  ⟹  Var(W)1nout n_{out}⋅Var(W)1  ⟹  Var(W)\frac{1}{n_{out}} nout​⋅Var(W)1  ⟹  Var(W)nout​1​ 其中 noutn_{out}nout​是输出维度fan_out。为了保持梯度的方差一致性我们需要确保每个输入维度 nin 的梯度方差与输出维度 nout 的梯度方差相同。因此我们需要将 W 的方差乘以 nout以确保梯度的方差在反向传播过程中保持一致。 (3) 综合考虑 为了同时平衡前向传播和反向传播Xavier 采用 Var(W)2ninnout Var(W)\frac{2}{n_{in}n_{out}} Var(W)nin​nout​2​ 权重从以下分布中采样 均匀分布 W∼U(−6ninnout,6ninnout) W\sim\mathrm{U}\left(-\frac{\sqrt{6}}{\sqrt{n_\mathrm{in}n_\mathrm{out}}},\frac{\sqrt{6}}{\sqrt{n_\mathrm{in}n_\mathrm{out}}}\right) W∼U(−nin​nout​​6​​,nin​nout​​6​​) 在Xavier初始化中我们选择 a−6ninnouta−\sqrt{\frac{6}{n_{in}n_{out}}}a−nin​nout​6​​ 和 b6ninnoutb\sqrt{\frac{6}{n_{in}n_{out}}}bnin​nout​6​​这样方差为 Var(W)(b−a)212(26ninnout)2124⋅6ninnout122ninnout Var(W)\frac{(b−a)^2}{12}\frac{(2\sqrt{\frac{6}{n_{in}n_{out}}})^2}{12}\frac{4⋅\frac{6}{ninnout}}{12}\frac{2}{n_{in}n_{out}} Var(W)12(b−a)2​12(2nin​nout​6​​)2​124⋅ninnout6​​nin​nout​2​ 正态分布 W∼N(0,2ninnout) W\sim\mathrm{N}\left(0,\frac{2}{n_\mathrm{in}n_\mathrm{out}}\right) W∼N(0,nin​nout​2​) N(0,std2) \mathcal{N}(0, \text{std}^2) N(0,std2) 其中 ninn_{\text{in}}nin​ 是当前层的输入神经元数量noutn_{\text{out}}nout​是输出神经元数量。 在前向传播中输出的方差受 ninn_{in}nin​ 影响。在反向传播中梯度的方差受 noutn_{out}nout​ 影响。
http://www.pierceye.com/news/71877/

相关文章:

  • 做自媒体素材搬运网站在线平面设计免费
  • 办网站 哪些许可微信 公众号导入wordpress
  • 电子商务网站建设需要学什么网站如何上传数据库
  • 佛山模板网站建设大学生网站设计作品
  • 哪些网站有二维码青田县住房和城乡规划建设局网站
  • 长沙做网站开发大概价格泰州网站制作方案定制
  • com都有哪些网站数字营销实训总结
  • 网站建设程序有哪些怎么让百度搜到网站
  • 打开国外网站很慢做的网站百度搜不到
  • 成都网站关键词排名5118和百度指数
  • 网络营销网站建设课程淘宝客做网站还是做app
  • 广州有建网站的公司吗互联网创业项目网站
  • 自做闪图网站怎么制作免费的企业网站
  • 广州番禺网站制作网站推广常用方法包括
  • 做简单的网站多少钱app 网站开发团队人员配置
  • 公司软件网站建设有限责任公司最低注册资本多少钱
  • 怎么制作平台网站肯德基网站建设
  • 广州网站的优化模拟手机营销网站
  • 郴州免费招聘网站团员个人信息查询官网
  • app大全软件网站WordPress构建注册页面
  • 做个公司网站一般多少钱气象服务网站建设
  • 昆山网站公司哪家好如何制作网页视频
  • 公司网站建设方案书怎么写打开百度搜索
  • 创建网站和主页生鲜电商网站开发
  • 山东互联网公司排名厦门关键词优化服务
  • 建网站要使用哪些软件哪里有做桥梁模型的网站
  • 自己做的动画买给网站沈阳seo推广公司
  • 自己用电脑做虚拟机怎么建网站wordpress 外卖
  • 商城网站都有什么功能吗国外免费空间申请
  • 高端网站定制wordpress gif封面