最新移动网站趋势,深圳营销型网站建设费用,设备管理系统网站模板,简单大气网站欣赏博客导读#xff1a;
《AI—工程篇》
AI智能体研发之路-工程篇#xff08;一#xff09;#xff1a;Docker助力AI智能体开发提效
AI智能体研发之路-工程篇#xff08;二#xff09;#xff1a;Dify智能体开发平台一键部署
AI智能体研发之路-工程篇#xff08;三
《AI—工程篇》
AI智能体研发之路-工程篇一Docker助力AI智能体开发提效
AI智能体研发之路-工程篇二Dify智能体开发平台一键部署
AI智能体研发之路-工程篇三大模型推理服务框架Ollama一键部署
AI智能体研发之路-工程篇四大模型推理服务框架Xinference一键部署
AI智能体研发之路-工程篇五大模型推理服务框架LocalAI一键部署
《AI—模型篇》
AI智能体研发之路-模型篇一大模型训练框架LLaMA-Factory在国内网络环境下的安装、部署及使用
AI智能体研发之路-模型篇二DeepSeek-V2-Chat 训练与推理实战
AI智能体研发之路-模型篇三中文大模型开、闭源之争
AI智能体研发之路-模型篇四一文入门pytorch开发
AI智能体研发之路-模型篇五pytorch vs tensorflow框架DNN网络结构源码级对比 目录 一、引言
二、pytorch模型结构定义
三、tensorflow模型结构定义
四、总结 一、引言
本文是上一篇AI智能体研发之路-模型篇四一文入门pytorch开发的番外篇对上文中pytorch的网络结构和tensorflow的模型结构部分进一步详细对比与说明水一篇为了得到当天的流量卷哈哈如果想更详细的了解pytorch辛苦移步上一篇哈。
二、pytorch模型结构定义
def __init__(self, input_size, hidden_size, output_size):super(ThreeLayerDNN, self).__init__()self.fc1 nn.Linear(input_size, hidden_size) # 第一层全连接层self.fc2 nn.Linear(hidden_size, hidden_size) # 第二层全连接层self.fc3 nn.Linear(hidden_size, output_size) # 输出层self.sigmoid nn.Sigmoid() 首先定义了一个名为ThreeLayerDNN的类它是基于PyTorch框架的用于构建一个具有三个全连接层也称为密集层的深度神经网络特别适用于二分类问题。下面是对代码的详细解释 __init__: 这是Python中的构造函数当创建ThreeLayerDNN类的新实例时会被调用。 super(ThreeLayerDNN, self).__init__(): 这行代码调用父类的初始化方法。因为ThreeLayerDNN继承自PyTorch的nn.Module类这一步确保了ThreeLayerDNN具有nn.Module的所有基本属性和方法。 self.fc1 nn.Linear(input_size, hidden_size): 这里定义了神经网络的第一层全连接层fully connected layer。input_size是输入数据的特征数量hidden_size是这一层的神经元数量。全连接层意味着输入数据的每个特征都将与这一层的每个神经元相连接。 self.fc2 nn.Linear(hidden_size, hidden_size): 定义了第二层全连接层结构与第一层相同保持了相同的隐藏层大小这在某些架构中用于加深网络而不立即增加模型复杂度。 self.fc3 nn.Linear(hidden_size, output_size): 这是网络的输出层其输入大小与隐藏层相同输出大小为output_size对于二分类问题通常为1。 self.sigmoid nn.Sigmoid(): 这行代码定义了一个Sigmoid激活函数它将在网络的输出层之后应用。Sigmoid函数将输出映射到(0, 1)之间非常适合二分类问题其中输出可以解释为属于正类的概率。 综上所述这段代码构建了一个基础的神经网络结构适合进行二分类任务通过全连接层提取特征并使用Sigmoid函数将网络输出转换为概率估计。 三、tensorflow模型结构定义
model Sequential([Dense(512, input_shape(X_train.shape[1],)), # 第一层Activation(relu),Dense(512), # 第二层Activation(relu),Dense(1), # 输出层Activation(sigmoid) # 二分类使用sigmoid
]) 使用Keras库现在是TensorFlow的一个部分定义了一个简单的深度学习模型具体来说是一个顺序Sequential模型适用于进行二分类任务。下面是对这段代码的详细解释 Sequential模型: 这是一种线性堆叠层的模型适合于简单的前向传播神经网络。 Dense层: 也称为全连接层每个神经元都与前一层的所有神经元相连。 Dense(512, input_shape(X_train.shape[1],)): 第一层有512个神经元input_shape(X_train.shape[1],)指定了输入数据的形状这里假设X_train是一个二维数组其中每一行是一个样本X_train.shape[1]表示每个样本的特征数量。Dense(512): 第二层同样有512个神经元由于是在Sequential模型中它自动接收前一层的输出作为输入。Dense(1): 输出层只有一个神经元适用于二分类问题。 Activation层: 激活函数层为神经网络引入非线性。 Activation(relu): 使用ReLURectified Linear Unit作为激活函数它在输入大于0时输出输入值小于0时输出0有助于解决梯度消失问题。最后一层使用Activation(sigmoid): 二分类任务中输出层常用sigmoid激活函数将输出映射到(0, 1)之间便于解释为概率。 四、总结
两种框架在定义模型结构时思路基本相同pytorch基于动态图更加灵活。tensorflow基于静态图更加稳定。
如果还有时间可以看看我的其他文章 《AI—工程篇》
AI智能体研发之路-工程篇一Docker助力AI智能体开发提效
AI智能体研发之路-工程篇二Dify智能体开发平台一键部署
AI智能体研发之路-工程篇三大模型推理服务框架Ollama一键部署
AI智能体研发之路-工程篇四大模型推理服务框架Xinference一键部署
AI智能体研发之路-工程篇五大模型推理服务框架LocalAI一键部署
《AI—模型篇》
AI智能体研发之路-模型篇一大模型训练框架LLaMA-Factory在国内网络环境下的安装、部署及使用
AI智能体研发之路-模型篇二DeepSeek-V2-Chat 训练与推理实战
AI智能体研发之路-模型篇三中文大模型开、闭源之争
AI智能体研发之路-模型篇四一文入门pytorch开发
AI智能体研发之路-模型篇五pytorch vs tensorflow框架DNN网络结构源码级对比