当前位置: 首页 > news >正文

莱芜区宣传部网站qq小程序

莱芜区宣传部网站,qq小程序,广州技术支持:奇亿网站建设,嘉兴港区建设局网站神经网络能够使用torch.nn包构建神经网络。 现在你已经对autogard有了初步的了解#xff0c;nn基于autograd来定义模型并进行微分。一个nn.Module包含层#xff0c;和一个forward(input)方法并返回output。 以如下分类数字图片的网络所示#xff1a; 这是一个简单的前馈网络…神经网络能够使用torch.nn包构建神经网络。 现在你已经对autogard有了初步的了解nn基于autograd来定义模型并进行微分。一个nn.Module包含层和一个forward(input)方法并返回output。 以如下分类数字图片的网络所示 这是一个简单的前馈网络。它接受输入经过一层接着一层的神经网络层最终得到输出。 一个神经网络典型的训练流程如下 定义拥有可学习的参数的神经网络迭代数据集作为输入经过网络处理输入计算损失离正确输出的距离反向传播梯度到网络参数更新网络的权重比如简单的更新规则weightweight-learning_rate*gradient定义网络 让我们定义这个网络   import torch.nn as nn import torch.nn.functional as F class Net(nn.Module):def __init__(self):super(Net,self).__init__()# 一个输入图片通道六个输出通道5*5的卷积核self.conv1nn.Conv2d(1,6,5)self.conv2nn.Conv2d(6,16,5)# 一个仿射操作ywxbself.fc1nn.Linear(16*5*5,120)self.fc2nn.Linear(120,84)self.fc3nn.Linear(84,10)def forward(self,x):# 2*2窗口的最大赤化xF.max_pool2d(F.relu(self.conv1(x)),(2,2))# 如果是一个方块就只需要指定一个长度xF.max_pool2d(F.relu(self.conv2(x)),2)xx.view(-1,self.num_flat_features(x))xF.relu(self.fc1(x))xF.relu(self.fc2(x))xself.fc3(x)return xdef num_flat_features(self,x):     #第一个尺寸是batch sizesizex.size()[1:]print(size)num_features1for s in size:num_features*sreturn num_featuresnetNet() print(net) out: Net((conv1): Conv2d(1, 6, kernel_size(5, 5), stride(1, 1))(conv2): Conv2d(6, 16, kernel_size(5, 5), stride(1, 1))(fc1): Linear(in_features400, out_features120, biasTrue)(fc2): Linear(in_features120, out_features84, biasTrue)(fc3): Linear(in_features84, out_features10, biasTrue) ) 你只需要定义forward函数backward函数计算梯度的地方是自动定义的。你能够在forward中使用任意的tensor运算。 模型可学习的参数将通过net.parameters()返回 paramslist(net.parameters()) print(len(params)) print(params[0].size())out:10torch.Size([6, 1, 5, 5]) 让我们试一下随机的32*32输入注意这个网络LeNet期望的输入尺寸是32*32。为了在MNIST数据集上使用这个网络请将数据集的图片调整到32*32。 inputtorch.randn(1,1,32,32) outnet(input) print(out)out:tensor([[ 0.0355, -0.0294, -0.0025, -0.0743, -0.0168, -0.0202, -0.0558,0.0803, -0.0162, -0.1153]]) 将所有参数的梯度缓冲变为0并使用随机梯度进行后向传播 net.zero_grad() out.backward(torch.randn(1,10))   !注意 torch.nn只支持最小批。整个torch.nn包只支持输入的样本是一个最小批而不是一个单一样本. 举例来说nn.Conv2d将会接收4维的Tensor,nSamples*nChannels*Heights*Width. 如果你有一个单一样本可以使用input.unsqueeze(0)来增加一个虚假的批维度。 在进行进一步处理前让我们简要重复目前为止出现的类。 扼要重述 torch.Tensor- 一个支持自动求导操作比如backward()的多维数组。同时保留关于tensor的梯度.nn.Module- 神经网络模型。简易的封装参数的方法帮助将它们转移到GPU上导出加载等等.nn.Parameters - 一类Tensor,在作为Module属性指定时会自动注册为一个parameter.autograd.Function- 自动求导操作前向与后向的实现。每个tensor操作至少创建一个Functional节点它连接到创建Tensor的函数并编码它的历史在这一节我们包含了 定义一个神经网络处理输入并调用后向传播还剩下 计算损失更新网络的权重  损失函数  损失函数接收对输出目标作为输入计算一个值估计输出与目标之间的距离。 nn包下有一些不同的损失函数。一个简单的损失是nn.MSELoss,它计算的是输入与输出之间的均方误差。 比如 outputnet(input) targettorch.randn(10) targettarget.view(1,-1) criterionnn.MSELoss()losscriterion(output,target) print(loss) out:tensor(1.1941) 现在如果你如果按照loss的反向传播方向使用.grad_fn属性你将会看到一个计算图如下所示 input - conv2d - relu - maxpool2d - conv2d - relu - maxpool2d - view - linear - relu - linear - relu - linear - MSELoss - loss 所以当你调用loss.backward(),整个图关于损失求导并且图中所有requires_gradTrue的tensor将会有它们的.grad属性。Tensor的梯度是累加的。 为了说明这一点我们跟踪backward的部分步骤 print(loss.grad_fn) #MSELoss print(loss.grad_fn.next_functions[0][0]) #Linear print(loss.grad_fn.next_functions[0][0].next_functions[0][0]) # ReLU out:MseLossBackward object at 0x0000020E2E1289B0AddmmBackward object at 0x0000020E2BF48048ExpandBackward object at 0x0000020E2BF48048   Backprop 为了反向传播error我们需要做的就是loss.backward()。你需要清除现有的梯度否则梯度将会累计到现有梯度上。  现在我们会调用loss.backward(),观察调用backward前后conv1层偏差的梯度。 net.zero_grad()print(conv1.bias.grad before backward) print(net.conv1.bias.grad) loss.backward() print(conv1.bias.grad after backward) print(net.conv1.bias.grad)out:conv1.bias.grad before backwardNone # 上一个版本将会是一个为0的向量conv1.bias.grad after backwardtensor(1.00000e-03 *[ 4.0788, 1.9541, 5.8585, -2.3754, 2.3815, 1.3351])    现在我们知道了如何使用loss函数 稍后阅读 神经网络包包含各种模型和loss函数它们组成了深度神经网络的构建区块。完整的文档在这里。http://pytorch.org/docs/nn  剩下来需要学习的是 更新网络的权重  更新权重 实际中使用的最简单更新规则是随机梯度下降SGD: weightweight-learning_rate*gradient  我们能够使用简单的python代码实现 learning_rate0.01 for f in net.parameters():f.data.sub_(f.grad.data*learning_rate)   然而当我们使用神经网络你想要使用各种不同的更新规则比如SGD,Nesterov-SGD,Adam,RMSProp等。为了做到这一点我们建立了一个小的包torch.optim实现了这些方法。使用它非常简单。 import torch.optim as optim#create your optimizer optimizer optim.SGD(net.parameters(),lr0.01)# in your training loop optimizer.zero_grad() outputnet(input) losscriterion(output,target) loss.backward() optimizer.step()   注意  手动使用optimizer.zero_grad()来将梯度缓冲变为0。这在Backprop章节进行了解释因为梯度是累加的。转载于:https://www.cnblogs.com/Thinker-pcw/p/9635572.html
http://www.pierceye.com/news/48863/

相关文章:

  • 优化网站排名提高昆明网络推广哪家好
  • 北京 手机网站建设做蛋糕视频的网站
  • 网站内连接造价师注册管理系统
  • 小红书app的网络营销方式丽水百度seo
  • 做微课的网站有哪些重庆长寿网站设计公司
  • 三亚北京网站建设设置什么引擎营销是用户主导的网络营销方式
  • 门户建设是什么意思优化网站页面
  • 重庆网站建设培训机构学费电子商务网站建设方案设计报告
  • 那些做测评的网站近期10大新闻事件
  • 设计图的网站株洲网院
  • 南京高端网站制作公司宁波小网站制作推广
  • 一般做一个网站多少钱wordpress 手机商城
  • 用python做网站不常见721网站建设
  • 用手机做网站达内网站建设
  • 网站内页制作网站建设时图片和文字
  • 网站如何seo距离我最近的装修公司电话
  • 学校网站建设特色学校网站建设责任书
  • 北京外语网站开发公司建设网站多少费用
  • 绛县苗木网网站是由谁建设的做网站最清晰的字体
  • 中国建信网官方网站网站管理端怎么做
  • 简述网站建设和推广评价指标镇江百度推广
  • 好大夫在线网站官网做提眉的医生网站正在维护模板
  • 网站建设 绍兴的公司织梦cms网站
  • 公司官方网站制作视觉设计评价标准的要素
  • 编程软件做网站的十堰seo排名
  • 网站建设大神级公司网站建设电话销售
  • 怎么查看网站开发人自建小程序商城
  • 淮南网站seo平台推广费用一般是多少
  • 用ps做网站的临摹聊城定制化网站建设
  • 网站需要做404页面吗兴仁市建设局网站