当前位置: 首页 > news >正文

临夏做网站一学一做教育视频网站有哪些

临夏做网站,一学一做教育视频网站有哪些,wordpress 流程,wordpress主题漂亮学习参考#xff1a; 动手学深度学习2.0Deep-Learning-with-TensorFlow-bookpytorchlightning ①如有冒犯、请联系侵删。 ②已写完的笔记文章会不定时一直修订修改(删、改、增)#xff0c;以达到集多方教程的精华于一文的目的。 ③非常推荐上面#xff08;学习参考#x…学习参考 动手学深度学习2.0Deep-Learning-with-TensorFlow-bookpytorchlightning ①如有冒犯、请联系侵删。 ②已写完的笔记文章会不定时一直修订修改(删、改、增)以达到集多方教程的精华于一文的目的。 ③非常推荐上面学习参考的前两个教程在网上是开源免费的写的很棒不管是开始学还是复习巩固都很不错的。 深度学习回顾专栏内容来源多个书籍笔记、在线笔记、以及自己的感想、想法佛系更新。争取内容全面而不失重点。完结时间到了也会一直更新下去已写完的笔记文章会不定时一直修订修改(删、改、增)以达到集多方教程的精华于一文的目的。所有文章涉及的教程都会写在开头、一起学习一起进步。 一、数值稳定性的重要性 到目前为止实现的每个模型都是根据某个预先指定的分布来初始化模型的参数。 有人会认为初始化方案是理所当然的忽略了如何做出这些选择的细节。甚至有人可能会觉得初始化方案的选择并不是特别重要。 相反初始化方案的选择在神经网络学习中起着举足轻重的作用 它对保持数值稳定性至关重要。 此外这些初始化方案的选择可以与非线性激活函数的选择有趣的结合在一起。 选择哪个函数以及如何初始化参数可以决定优化算法收敛的速度有多快。 糟糕选择可能会导致我们在训练时遇到梯度爆炸或梯度消失。 考虑一个具有 层、输入 和输出 的深层网络。 每一层 由变换 定义 该变换的参数为权重 () 其隐藏变量是 ()令 (0)。 网络可以表示为 如果所有隐藏变量和输入都是向量 可以将 关于任何一组参数 () 的梯度写为下式该梯度是 − 个矩阵 ()⋅…⋅(1) 与梯度向量 () 的乘积。 因此上面公式计算的结果容易受到数值下溢问题的影响. 当将太多的概率乘在一起时这些问题经常会出现。 在处理概率时一个常见的技巧是切换到对数空间 即将数值表示的压力从尾数转移到指数。 不幸的是上面的问题更为严重 最初矩阵 () 可能具有各种各样的特征值。 他们可能很小也可能很大 他们的乘积可能非常大也可能非常小。 不稳定梯度带来的风险不止在于数值表示 不稳定梯度也威胁到优化算法的稳定性。 可能面临一些问题 梯度爆炸gradient exploding问题 参数更新过大破坏了模型的稳定收敛梯度消失gradient vanishing问题 参数更新过小在每次更新时几乎不会移动导致模型无法学习。 二、梯度消失 在深度神经网络中梯度消失指的是在反向传播过程中梯度逐渐变小并接近零导致较深层的网络参数无法得到有效更新从而影响模型的训练效果。 梯度消失通常发生在使用激活函数导数具有较小值的情况下尤其是在使用 sigmoid 或 tanh 激活函数时。 sigmoid函数 1/(1exp(−))很流行 因为它类似于阈值函数。 由于早期的人工神经网络受到生物神经网络的启发 神经元要么完全激活要么完全不激活就像生物神经元的想法很有吸引力。 然而它却是导致梯度消失问题的一个常见的原因。下图是sigmoid函数变化图和梯度变化图。 %matplotlib inline import tensorflow as tf from d2l import tensorflow as d2lx tf.Variable(tf.range(-8.0, 8.0, 0.1)) with tf.GradientTape() as t:y tf.nn.sigmoid(x) d2l.plot(x.numpy(), [y.numpy(), t.gradient(y, x).numpy()],legend[sigmoid, gradient], figsize(4.5, 2.5))当sigmoid函数的输入很大或是很小时它的梯度都会消失。 此外当反向传播通过许多层时除非在刚刚好的地方 这些地方sigmoid函数的输入接近于零否则整个乘积的梯度可能会消失。 当网络有很多层时除非很小心否则在某一层可能会切断梯度。 事实上这个问题曾经困扰着深度网络的训练。 因此更稳定的ReLU系列函数已经成为从业者的默认选择虽然在神经科学的角度看起来不太合理。 三、梯度爆炸 梯度爆炸则是指在反向传播过程中梯度变得非常大超过了数值范围导致参数更新过大模型无法稳定训练。 梯度爆炸通常出现在网络层数较多、权重初始化不当或者学习率设置过高的情况下。 相反梯度爆炸可能同样令人烦恼。 为了更好地说明这一点生成100个高斯随机矩阵并将它们与某个初始矩阵相乘。 对于我们选择的尺度方差 ²1 矩阵乘积发生爆炸。 当这种情况是由于深度网络的初始化所导致时导致没有机会让梯度下降优化器收敛。 M tf.random.normal((4, 4)) print(一个矩阵 \n, M) for i in range(100):M tf.matmul(M, tf.random.normal((4, 4)))print(乘以100个矩阵后\n, M.numpy())一个矩阵 tf.Tensor( [[ 3.7436965 2.652792 0.5994665 -0.17366047][ 0.6720035 -0.7297903 0.3705189 -0.5043682 ][ 0.53814566 -0.94948226 0.09689955 -0.4441989 ][ 0.6737587 0.41651404 -0.9230542 0.1903977 ]], shape(4, 4), dtypefloat32) 乘以100个矩阵后[[-1.9263415e26 1.5658991e27 3.4174752e26 -9.1476850e25][ 1.4916346e24 -1.2148971e25 -2.6495698e24 7.0983965e23][ 2.5503458e25 -2.0726612e26 -4.5202026e25 1.2112884e25][ 1.2258523e25 -9.9649782e25 -2.1730161e25 5.8238054e24]]四、解决梯度消失和梯度爆炸的方法 梯度裁剪Gradient Clipping限制梯度的大小防止梯度爆炸。使用恰当的激活函数如 ReLU 可以缓解梯度消失问题。参数初始化使用合适的参数初始化方法如 Xavier 或 He 初始化。批归一化Batch Normalization通过规范化每层输入有助于缓解梯度消失和梯度爆炸问题。残差连接Residual Connections在深层网络中使用残差连接有助于减轻梯度消失问题。 五、模型参数初始化 解决或至少减轻上述问题梯度消失、梯度爆炸的一种方法是进行参数初始化 优化期间的注意和适当的正则化也可以进一步提高稳定性。 选择适当的参数初始化方法取决于网络的结构、激活函数的选择以及具体任务的要求。良好的参数初始化可以帮助加速模型的收敛速度提高模型的性能并有助于避免梯度消失和梯度爆炸等问题。 1.默认初始化 使用正态分布来初始化权重值。如果不指定初始化方法 框架将使用默认的随机初始化方法对于中等难度的问题这种方法通常很有效。 2.Xavier初始化 Xavier初始化Xavier Initialization也称为Glorot初始化根据输入和输出的神经元数量来初始化参数。这种方法旨在使每一层的激活值保持在一个合理的范围内有助于避免梯度消失和梯度爆炸问题。 3.He初始化He Initialization 与Xavier初始化类似但是在计算方差时只考虑了输入神经元的数量适用于使用ReLU激活函数的网络。 4.正交初始化Orthogonal Initialization 通过生成一个正交矩阵来初始化权重有助于避免梯度消失和梯度爆炸问题。 5.自适应方法Adaptive Methods 如自适应矩估计Adagrad、RMSProp、Adam等优化算法这些算法在训练过程中会自动调整学习率有助于更好地初始化参数。 6.其它 深度学习框架通常实现十几种不同的启发式方法。 此外参数初始化一直是深度学习基础研究的热点领域。 其中包括专门用于参数绑定共享、超分辨率、序列模型和其他情况的启发式算法。
http://www.pierceye.com/news/185264/

相关文章:

  • 行业网站建设策划方案系部网站开发计划书
  • 建设部网站投诉核查做网站一般几个人
  • 360网站推广官网网址怎样在网站做咨询医生挣钱
  • 重庆市建设银行网站一站式网站建设有哪些
  • 自学设计软件的免费网站免费ppt模板简约
  • 申请个人网站怎么申请网站类型有哪些
  • 做网站推广托管注意哪个网站做推广好
  • 大竹网站建设泗阳城乡建设局网站
  • 山东省住房和城乡建设厅服务网站做网站的注意点
  • 网站排名优化软件江西网站备案要求
  • 桐柏县建设局网站邢台建设局网站
  • 网站域名变更怎么查英国做网站的人
  • 嘉兴公司的网站设计wordpress 送女友
  • 10个免费的黑科技网站电子元器件商城网站建设
  • 动画型网站做免费推广的平台
  • 购物网站怎么创建深圳地区5g微波网站建设计划
  • 安做省民改厅网站网站带支付模板
  • 做什么网站吸引人建设网站模板
  • 微信官网网站模板京东云网站建设
  • python 网站开发 前端利用vps做网站
  • 网站做下载功能南昌专业做网站的
  • 白山网站设计网站首页鲁大师
  • 网站怎样和首页做链接地址七星彩的网站怎么做的
  • 深圳h5模板建站wordpress 整合ucenter
  • 企业网站策划书下载google adsense
  • 安徽网站建设公司排名竞价托管就选微竞价
  • 笑话小网站模板html做移动网站快速排
  • c2c电子商务网站有哪些电商设计师和美工有什么区别
  • 长春电商网站建设价格低公司网站过期未续费会怎样
  • 农业综合管理网站建设做网站前期工作