个人网站建设方案书备案,自己做培训网站,南京小程序制作公司,泰州seo外包公司文章目录 5、卷积神经网络5.5、经典卷积神经网络#xff08;LeNet#xff09;5.5.1、理论部分5.5.2、代码实现 5.6、深度卷积神经网络#xff08;AlexNet#xff09;5.6.1、理论部分5.6.2、代码实现 5.7、使用块的网络#xff08;VGG#xff09;5.7.1、理论部分5.7.2、代… 文章目录 5、卷积神经网络5.5、经典卷积神经网络LeNet5.5.1、理论部分5.5.2、代码实现 5.6、深度卷积神经网络AlexNet5.6.1、理论部分5.6.2、代码实现 5.7、使用块的网络VGG5.7.1、理论部分5.7.2、代码实现 5.8、网络中的网络NiN5.8.1、理论部分 5.9、含并行连结的网络GoogLeNet5.9.1、理论部分5.9.2、代码实现  闲谈 5、卷积神经网络 
5.5、经典卷积神经网络LeNet 
5.5.1、理论部分 两个⌈ 卷积块 ⌋ 每个卷积块中的基本单元是一个⌈ 卷积层 ⌋、一个 ⌈ sigmoid激活函数 ⌋和 ⌈ 平均汇聚层 ⌋ 三个⌈ 全连接层密集块 ⌋ 
早期神经网络先使用卷积层学习图片空间信息然后全连接层转换到类别空间。 
5.5.2、代码实现 
定义一个 Sequential块 和LeNet-5相比这里去掉了最后一层的高斯激活。 import torch
from torch import nn
from d2l import torch as d2lnet  nn.Sequential(nn.Conv2d(1, 6, kernel_size5, padding2), nn.Sigmoid(),nn.AvgPool2d(kernel_size2, stride2),nn.Conv2d(6, 16, kernel_size5), nn.Sigmoid(),nn.AvgPool2d(kernel_size2, stride2),nn.Flatten(),nn.Linear(16 * 5 * 5, 120), nn.Sigmoid(),nn.Linear(120, 84), nn.Sigmoid(),nn.Linear(84, 10))nn.Conv2d(input_channel_size, output_channel_size, kernel_size,stride,padding)检查输出形状 
X  torch.rand(size(1, 1, 28, 28), dtypetorch.float32)
for layer in net:X  layer(X)print(layer.__class__.__name__,output shape: \t,X.shape)Conv2d output shape: 	 torch.Size([1, 6, 28, 28])
Sigmoid output shape: 	 torch.Size([1, 6, 28, 28])
AvgPool2d output shape: 	 torch.Size([1, 6, 14, 14])
Conv2d output shape: 	 torch.Size([1, 16, 10, 10])
Sigmoid output shape: 	 torch.Size([1, 16, 10, 10])
AvgPool2d output shape: 	 torch.Size([1, 16, 5, 5])
Flatten output shape: 	 torch.Size([1, 400])
Linear output shape: 	 torch.Size([1, 120])
Sigmoid output shape: 	 torch.Size([1, 120])
Linear output shape: 	 torch.Size([1, 84])
Sigmoid output shape: 	 torch.Size([1, 84])
Linear output shape: 	 torch.Size([1, 10])模型训练 使用 Fashion-MNIST数据集 batch_size  256
train_iter, test_iter  d2l.load_data_fashion_mnist(batch_sizebatch_size)def evaluate_accuracy_gpu(net, data_iter, deviceNone): #save使用GPU计算模型在数据集上的精度if isinstance(net, nn.Module):net.eval()  # 设置为评估模式if not device:device  next(iter(net.parameters())).device# 正确预测的数量总预测的数量metric  d2l.Accumulator(2)with torch.no_grad():for X, y in data_iter:if isinstance(X, list):# BERT微调所需的X  [x.to(device) for x in X]else:X  X.to(device)y  y.to(device)metric.add(d2l.accuracy(net(X), y), y.numel())return metric[0] / metric[1]#save
def train_ch6(net, train_iter, test_iter, num_epochs, lr, device):用GPU训练模型def init_weights(m):if type(m)  nn.Linear or type(m)  nn.Conv2d:nn.init.xavier_uniform_(m.weight)net.apply(init_weights)print(training on, device)net.to(device)optimizer  torch.optim.SGD(net.parameters(), lrlr)loss  nn.CrossEntropyLoss()animator  d2l.Animator(xlabelepoch, xlim[1, num_epochs],legend[train loss, train acc, test acc])timer, num_batches  d2l.Timer(), len(train_iter)for epoch in range(num_epochs):# 训练损失之和训练准确率之和样本数metric  d2l.Accumulator(3)net.train()for i, (X, y) in enumerate(train_iter):timer.start()optimizer.zero_grad()X, y  X.to(device), y.to(device)y_hat  net(X)l  loss(y_hat, y)l.backward()optimizer.step()with torch.no_grad():metric.add(l * X.shape[0], d2l.accuracy(y_hat, y), X.shape[0])timer.stop()train_l  metric[0] / metric[2]train_acc  metric[1] / metric[2]if (i  1) % (num_batches // 5)  0 or i  num_batches - 1:animator.add(epoch  (i  1) / num_batches,(train_l, train_acc, None))test_acc  evaluate_accuracy_gpu(net, test_iter)animator.add(epoch  1, (None, None, test_acc))print(floss {train_l:.3f}, train acc {train_acc:.3f}, ftest acc {test_acc:.3f})print(f{metric[2] * num_epochs / timer.sum():.1f} examples/sec fon {str(device)})训练评估LeNet-5 
lr, num_epochs  0.9, 10
train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())loss 0.452, train acc 0.832, test acc 0.812
46735.1 examples/sec on cuda:05.6、深度卷积神经网络AlexNet 
5.6.1、理论部分 
组成 
五个卷积层、两个全连接隐藏层和一个全连接输出层。 较于 LeNet 的改进 丢弃法控制复杂度  ReLu减缓梯度消失  MaxPooling  数据增强  架构卷积窗口更大、通道更多、全连接层更大、网络更深。  
5.6.2、代码实现 
定义Sequential块 
import torch
from torch import nn
from d2l import torch as d2lnet  nn.Sequential(# 这里使用一个11*11的更大窗口来捕捉对象。# 同时步幅为4以减少输出的高度和宽度。# 另外输出通道的数目远大于LeNetnn.Conv2d(1, 96, kernel_size11, stride4, padding1), nn.ReLU(),nn.MaxPool2d(kernel_size3, stride2),# 减小卷积窗口使用填充为2来使得输入与输出的高和宽一致且增大输出通道数nn.Conv2d(96, 256, kernel_size5, padding2), nn.ReLU(),nn.MaxPool2d(kernel_size3, stride2),# 使用三个连续的卷积层和较小的卷积窗口。# 除了最后的卷积层输出通道的数量进一步增加。# 在前两个卷积层之后汇聚层不用于减少输入的高度和宽度nn.Conv2d(256, 384, kernel_size3, padding1), nn.ReLU(),nn.Conv2d(384, 384, kernel_size3, padding1), nn.ReLU(),nn.Conv2d(384, 256, kernel_size3, padding1), nn.ReLU(),nn.MaxPool2d(kernel_size3, stride2),nn.Flatten(),# 这里全连接层的输出数量是LeNet中的好几倍。使用dropout层来减轻过拟合nn.Linear(6400, 4096), nn.ReLU(),nn.Dropout(p0.5),nn.Linear(4096, 4096), nn.ReLU(),nn.Dropout(p0.5),# 最后是输出层。由于这里使用Fashion-MNIST所以用类别数为10而非论文中的1000nn.Linear(4096, 10))读取数据集 
batch_size  128
train_iter, test_iter  d2l.load_data_fashion_mnist(batch_size, resize224)训练 
lr, num_epochs  0.01, 10
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())5.7、使用块的网络VGG 
5.7.1、理论部分 
经典卷积神经网络的基本组成部分是下面的这个序列 带填充以保持分辨率的卷积层  非线性激活函数如ReLU  使用激活函数目的 | 激活卷积结果的含义为了引入非线性变换   汇聚层如最大汇聚层。  
VGG块 
AlexNet 卷积层、汇聚层重复成块实现更大更深的网络。 
不同的卷积块个数和超参数可得到不同的VGG块。 
相较于 AlexNet  5.7.2、代码实现 
定义VGG块 
import torch
from torch import nn
from d2l import torch as d2ldef vgg_block(num_convs, in_channels, out_channels):layers  []for _ in range(num_convs):layers.append(nn.Conv2d(in_channels, out_channels,kernel_size3, padding1))layers.append(nn.ReLU())in_channels  out_channelslayers.append(nn.MaxPool2d(kernel_size2,stride2))return nn.Sequential(*layers)for _ in range(num_convs):# 代码块这段代码在不需要迭代变量的情况下使用下划线 _ 作为一个通用的迭代占位符表示在每次迭代中不需要使用迭代的值。 实现VGG-11 VGG-11网络使用8个卷积层和3个全连接层。 定义超参数 
#指定了每个VGG块里卷积层个数和输出通道数
conv_arch  ((1, 64), (1, 128), (2, 256), (2, 512), (2, 512))def vgg(conv_arch):conv_blks  []in_channels  1# 卷积层部分 # num_convs 表示在该卷积块中有多少个连续的卷积层for (num_convs, out_channels) in conv_arch:# vgg_block这是一个函数用于构建 VGG 模型中的卷积块。该函数将根据传入的 num_convs、in_channels 和 out_channels 参数构建一个卷积块。conv_blks.append(vgg_block(num_convs, in_channels, out_channels))in_channels  out_channelsreturn nn.Sequential(# *conv_blks 被用于将     conv_blks 列表中的所有卷积块解包并作为参数传递给 nn.Sequential 构造器。# nn.Flatten()这是用于将最后一个卷积层输出的特征图展平成一维向量以便连接到全连接层。*conv_blks, nn.Flatten(),# 全连接层部分nn.Linear(out_channels * 7 * 7, 4096), nn.ReLU(), nn.Dropout(0.5),nn.Linear(4096, 4096), nn.ReLU(), nn.Dropout(0.5),nn.Linear(4096, 10))net  vgg(conv_arch)*conv_blks:* 可以用来解包一个列表或元组将其拆分成单独的元素。 构建一个高度和宽度为224的单通道数据样本X 
X  torch.randn(size(1, 1, 224, 224))训练模型 
# 定义一个比例因子 ratio用于缩小 VGG 模型中卷积层的输出通道数。
ratio  4
# // 整除出运算向下取整
small_conv_arch  [(pair[0], pair[1] // ratio) for pair in conv_arch]
net  vgg(small_conv_arch)这里缩小 VGG-11 模型中卷积层的输出通道数的原因 VGG-11比AlexNet计算量更大缩小通道减少计算量但足够用于训练Fashion-MNIST数据集。 lr, num_epochs, batch_size  0.05, 10, 128
# resize224 指定了将图像大小调整为224x224像素
train_iter, test_iter  d2l.load_data_fashion_mnist(batch_size, resize224)
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())5.8、网络中的网络NiN 
5.8.1、理论部分 
为什么提出NiN 
全连接层是网络里参数比重最高的地方参数输入通道*高*宽*输出通道*高*宽尤其是卷积后的第一个全连接层。而卷积层参数就小得多。所以用卷积层替代全连接层参数会更少。 
NiN架构 交替使用NiN块和MaxPoolstride2NiN块的两个1×1卷积层对每个像素增加了非线性  逐步缩小高宽增大通道数  输入通道数类别数   全局AvgPool 得到输出无全连接层使用全局AvgPool代替全连接层这样做不容易过拟合需要的参数更少。  5.9、含并行连结的网络GoogLeNet 
5.9.1、理论部分 
GoogLeNet架构 
5段9个inception块。 模型参数小计算复杂度低  Inception块从四个路径不同层面抽取信息在输出通道维合并。   x.shape 为 n*n通道1n  - 1 1 n通道2n  1 * 2 - 3 1  n通道3n  2 * 2 - 5 1  n通道4n  2 - 3  1  n合并后,shape 为n*4n第一个百层网络有后续改进。  
卷积层后面一定要跟着池化层吗 
卷积层和池化层通常一起使用在卷积神经网络CNN中这是因为它们在不同的层次上提供了一些有益的特性帮助网络更好地捕获图像特征、减少过拟合以及降低计算负担。虽然不是一定要跟着池化层但这种组合在很多情况下被证明是有效的。 
经过卷积层之后特征图包含了更高级的特征表示。池化操作有助于进一步提取这些抽象特征从而让网络更加关注物体的重要特征而不是像素级细节。 
池化操作有助于减少模型对训练数据中微小变化的敏感性从而降低过拟合的风险。通过降低特征图的维度池化层可以在一定程度上提取出更稳定的特征减少模型对噪声的响应。 
池化层可以减小特征图的尺寸通过保留主要信息的同时降低计算复杂度。池化操作还有助于增加模型对于平移、旋转和缩放等空间变化的鲁棒性提供了一定程度的空间不变性。这对于图像识别任务很有帮助因为我们希望模型能够识别出物体不受其在图像中的位置变化的影响。 
池化层在减小特征图尺寸的同时也减少了网络中的参数数量。这有助于减轻模型的计算负担和内存需求特别是在深层网络中。 
5.9.2、代码实现 
定义Inception块 
import torch
from torch import nn
from torch.nn import functional as F
from d2l import torch as d2l# 定义继承自 nn.Module 的类
class Inception(nn.Module):# 类的构造函数# self: 指代对象本身这里指代的是 Inception 模块的实例# **kwargs: 用于接收不定数量的关键字参数以字典的形式传递给函数或方法# c1--c4是每条路径的输出通道数def __init__(self, in_channels, c1, c2, c3, c4, **kwargs):# 调用父类 nn.Module 的构造函数,并传递额外的关键字参数 **kwargssuper(Inception, self).__init__(**kwargs)# 线路1单1x1卷积层self.p1_1  nn.Conv2d(in_channels, c1, kernel_size1)# 线路21x1卷积层后接3x3卷积层self.p2_1  nn.Conv2d(in_channels, c2[0], kernel_size1)self.p2_2  nn.Conv2d(c2[0], c2[1], kernel_size3, padding1)# 线路31x1卷积层后接5x5卷积层self.p3_1  nn.Conv2d(in_channels, c3[0], kernel_size1)self.p3_2  nn.Conv2d(c3[0], c3[1], kernel_size5, padding2)# 线路43x3最大汇聚层后接1x1卷积层self.p4_1  nn.MaxPool2d(kernel_size3, stride1, padding1)self.p4_2  nn.Conv2d(in_channels, c4, kernel_size1)def forward(self, x):p1  F.relu(self.p1_1(x))p2  F.relu(self.p2_2(F.relu(self.p2_1(x))))p3  F.relu(self.p3_2(F.relu(self.p3_1(x))))p4  F.relu(self.p4_2(self.p4_1(x)))# 在通道维度上连结输出return torch.cat((p1, p2, p3, p4), dim1)F.relu()和nn.ReLU()区别  F.relu() F 表示 torch.nn.functional 模块这是 PyTorch 中提供的函数式接口,它是一个纯函数。由于是函数式接口F.relu() 在使用时不会产生可训练的参数也不会被添加到网络的计算图中。 nn.ReLU() nn 表示 torch.nn 模块nn.ReLU() 是一个类它实际上是一个层Layer可以像其他层一样添加到神经网络中。由于是层nn.ReLU() 在使用时会被添加到网络的计算图中可以进行反向传播如果模型是可训练的该层的参数也会被优化器更新。 将GoogLeNet定义成5个 Sequential块 
b1  nn.Sequential(nn.Conv2d(1, 64, kernel_size7, stride2, padding3),nn.ReLU(),nn.MaxPool2d(kernel_size3, stride2, padding1))b2  nn.Sequential(nn.Conv2d(64, 64, kernel_size1),nn.ReLU(),nn.Conv2d(64, 192, kernel_size3, padding1),nn.ReLU(),nn.MaxPool2d(kernel_size3, stride2, padding1))# 它接受的输入通道数是 192然后定义了四个分支
# 64 个输出通道的线路1
# (96, 128) 个输出通道的线路2
# (16, 32) 个输出通道的线路3
# 32 个输出通道的线路4
# 对应类构造函数的 in_channel,c1-c4
b3  nn.Sequential(Inception(192, 64, (96, 128), (16, 32), 32),Inception(256, 128, (128, 192), (32, 96), 64),nn.MaxPool2d(kernel_size3, stride2, padding1))b4  nn.Sequential(Inception(480, 192, (96, 208), (16, 48), 64),Inception(512, 160, (112, 224), (24, 64), 64),Inception(512, 128, (128, 256), (24, 64), 64),Inception(512, 112, (144, 288), (32, 64), 64),Inception(528, 256, (160, 320), (32, 128), 128),nn.MaxPool2d(kernel_size3, stride2, padding1))b5  nn.Sequential(Inception(832, 256, (160, 320), (32, 128), 128),Inception(832, 384, (192, 384), (48, 128), 128),# 自适应平均池化层用于将特征图的尺寸自适应地汇聚到指定的输出尺寸。自适应池化层在网络的最后用于全局特征提取和尺寸统一化适用于不同尺寸的输入。然而在网络的前期普通池化层更适合逐渐减小特征图的尺寸和抽取低级别的特征。nn.AdaptiveAvgPool2d((1,1)),# 卷积和池化等操作后输出多维的特征图也称为张量但在进入全连接层之前需要将这个张量转换为一个一维向量nn.Flatten())# 全连接层输入特征向量的长度为 1024输出为长度为 10 的向量
net  nn.Sequential(b1, b2, b3, b4, b5, nn.Linear(1024, 10))#将输入的高和宽从224降到96这简化了计算
X  torch.rand(size(1, 1, 96, 96))
#可验证块形状略训练模型 
lr, num_epochs, batch_size  0.1, 10, 128
train_iter, test_iter  d2l.load_data_fashion_mnist(batch_size, resize96)
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())闲谈 
个性化定制界面与极简版原装界面我们为什么选择个性化 
随着科技的不断发展人们对于界面设计和用户体验的要求也越来越高。在软件、应用程序、网站等各种数字平台中界面是用户与系统之间的桥梁直接影响着用户的使用感受。在这个背景下个性化定制界面和极简版原装界面成为了用户选择的两种不同趋势。 个性化定制界面作为一种用户体验的关键创新强调了用户的个人喜好和需求。通过允许用户自定义颜色、布局、字体等元素个性化界面能够更好地满足不同用户的审美和操作偏好。这种方式可以使用户感到更加亲近和熟悉提升了用户的情感连接。此外个性化界面还能够提升用户的工作效率和生产力因为用户可以将界面调整为最适合自己工作方式的状态减少不必要的操作和寻找时间。 然而极简版原装界面也有其独特的优势。极简界面强调简洁、直观去除了冗余的元素和复杂的设计使用户能够更加专注地完成任务。这种设计风格适用于那些追求高效率、集中注意力的用户群体。极简界面的设计哲学是“少即是多”它通过减少视觉噪音和干扰使用户能够更轻松地掌握操作逻辑降低了学习成本。 那么为什么选择个性化界面个性化界面在满足用户需求方面具有独特的优势。每个人的审美和操作习惯都不同个性化界面可以让用户在熟悉和舒适的环境中工作提升工作效率和用户满意度。同时个性化界面还有助于品牌塑造和用户情感连接的建立因为用户可以将界面个性化地定制成与品牌形象相符的样式。 综合来看个性化定制界面和极简版原装界面各有其适用场景。在不同的用户需求和使用场景下选择合适的界面设计风格能够更好地满足用户的期望。无论是追求与品牌形象一致的个性化还是追求高效率和专注的极简体验界面设计都应该以用户为中心创造出更优秀的用户体验。