当前位置: 首页 > news >正文

网站服务器如何搭建学校网站设计的功能

网站服务器如何搭建,学校网站设计的功能,wordpress 前台不显示内容,深圳网站制作哪里好目录 一、环境准备1.进入ModelArts官网2.使用CodeLab体验Notebook实例 二、案例实现 梯度累加的训练算法#xff0c;目的是为了解决由于内存不足#xff0c;导致Batch size过大神经网络无法训练#xff0c;或者网络模型过大无法加载的OOM#xff08;Out Of Memory#xff… 目录 一、环境准备1.进入ModelArts官网2.使用CodeLab体验Notebook实例 二、案例实现 梯度累加的训练算法目的是为了解决由于内存不足导致Batch size过大神经网络无法训练或者网络模型过大无法加载的OOMOut Of Memory问题。 如果你对MindSpore感兴趣可以关注昇思MindSpore社区 一、环境准备 1.进入ModelArts官网 云平台帮助用户快速创建和部署模型管理全周期AI工作流选择下面的云平台以开始使用昇思MindSpore获取安装命令安装MindSpore2.0.0-alpha版本可以在昇思教程中进入ModelArts官网 选择下方CodeLab立即体验 等待环境搭建完成 2.使用CodeLab体验Notebook实例 下载NoteBook样例代码梯度累加 .ipynb为样例代码 选择ModelArts Upload Files上传.ipynb文件 选择Kernel环境 切换至GPU环境切换成第一个限时免费 进入昇思MindSpore官网点击上方的安装 获取安装命令 回到Notebook中在第一块代码前加入命令 conda update -n base -c defaults conda安装MindSpore 2.0 GPU版本 conda install mindspore2.0.0a0 -c mindspore -c conda-forge安装mindvision pip install mindvision安装下载download pip install download二、案例实现 基于MindSpore的函数式自动微分机制正向和反向执行完成后函数将返回与训练参数相对应的梯度。因此我们需要设计一个梯度累加类Accumulator对每一个Step产生的梯度值进行存储。下面是Accumulator的实现样例我们需要维护两份与模型可训练参数的Shape相同的内部属性分别为inner_grads和zeros。其中inner_grads用于存储累加的梯度值zeros用于参数优化更新后的清零。同时Accumulator内部维护了一个counter变量在每一次正反向执行完成后counter自增通过对counter取模的方式来判断是否达到累加步数。 import mindspore as ms from mindspore import Tensor, Parameter, opsms.jit_class class Accumulator():def __init__(self, optimizer, accumulate_step, clip_norm1.0):self.optimizer optimizerself.clip_norm clip_normself.inner_grads optimizer.parameters.clone(prefixaccumulate_, initzeros)self.zeros optimizer.parameters.clone(prefixzeros_, initzeros)self.counter Parameter(Tensor(1, ms.int32), counter_)assert accumulate_step 0self.accumulate_step accumulate_stepself.map ops.HyperMap()def __call__(self, grads):# 将单步获得的梯度累加至Accumulator的inner_gradsself.map(ops.partial(ops.assign_add), self.inner_grads, grads)if self.counter % self.accumulate_step 0:# 如果达到累加步数进行参数优化更新self.optimizer(self.inner_grads)# 完成参数优化更新后清零inner_gradsself.map(ops.partial(ops.assign), self.inner_grads, self.zeros)# 计算步数加一ops.assign_add(self.counter, Tensor(1, ms.int32))return True ms.jit_class为MindSpore即时编译修饰器可以将普通的Python类作为可编译计算图使用。 接下来我们使用快速入门中手写数字识别模型验证梯度累加的效果。 from mindspore import nn from mindspore import value_and_grad from mindspore.dataset import vision, transforms from mindspore.dataset import MnistDatasetfrom download import downloadurl https://mindspore-website.obs.cn-north-4.myhuaweicloud.com/ \notebook/datasets/MNIST_Data.zip path download(url, ./, kindzip, replaceTrue)def datapipe(path, batch_size):image_transforms [vision.Rescale(1.0 / 255.0, 0),vision.Normalize(mean(0.1307,), std(0.3081,)),vision.HWC2CHW()]label_transform transforms.TypeCast(ms.int32)dataset MnistDataset(path)dataset dataset.map(image_transforms, image)dataset dataset.map(label_transform, label)dataset dataset.batch(batch_size)return datasetclass Network(nn.Cell):def __init__(self):super().__init__()self.flatten nn.Flatten()self.dense_relu_sequential nn.SequentialCell(nn.Dense(28*28, 512),nn.ReLU(),nn.Dense(512, 512),nn.ReLU(),nn.Dense(512, 10))def construct(self, x):x self.flatten(x)logits self.dense_relu_sequential(x)return logitsmodel Network() 假设我们在使用快速入门中配置的batch_size64会导致显存不足此时我们设置累加步数为2通过执行两次batch_size32进行梯度累加。 首先我们使用Accumulator传入实例化的optimizer并配置累加步数。然后定义正向计算函数forward_fn此时由于梯度累加的需要loss值需要进行相应的缩放。 accumulate_step 2loss_fn nn.CrossEntropyLoss() optimizer nn.SGD(model.trainable_params(), 1e-2) accumulator Accumulator(optimizer, accumulate_step)def forward_fn(data, label):logits model(data)loss loss_fn(logits, label)# loss除以累加步数accumulate_stepreturn loss / accumulate_step 接下来继续使用value_and_grad函数进行函数变换并构造单步训练函数train_step。此时我们使用实例化好的accumulator进行梯度累加由于optimizer作为accumulator的内部属性不需要单独执行。 grad_fn value_and_grad(forward_fn, None, model.trainable_params())ms.jit def train_step(data, label):loss, grads grad_fn(data, label)accumulator(grads)return loss 接下来我们定义训练和评估逻辑进行训练验证。 def train_loop(model, dataset, loss_fn, optimizer):size dataset.get_dataset_size()model.set_train()for batch, (data, label) in enumerate(dataset.create_tuple_iterator()):loss train_step(data, label)if batch % 100 0:loss, current loss.asnumpy(), batchprint(floss: {loss:7f} [{current:3d}/{size:3d}]) def test_loop(model, dataset, loss_fn):num_batches dataset.get_dataset_size()model.set_train(False)total, test_loss, correct 0, 0, 0for data, label in dataset.create_tuple_iterator():pred model(data)total len(data)test_loss loss_fn(pred, label).asnumpy()correct (pred.argmax(1) label).asnumpy().sum()test_loss / num_batchescorrect / totalprint(fTest: \n Accuracy: {(100*correct):0.1f}%, Avg loss: {test_loss:8f} \n) 接下来同样进行3个epoch的训练注意此时根据我们的假设数据集需要设置batch_size32每两步进行累加。 train_dataset datapipe(MNIST_Data/train, 32) test_dataset datapipe(MNIST_Data/test, 32) 开始训练验证此时由于batch_size调小需要训练的step数增加至2倍。最终Accuracy验证结果与快速入门结果一致均为93.0%左右。 epochs 3 for t in range(epochs):print(fEpoch {t1}\n-------------------------------)train_loop(model, train_dataset, loss_fn, optimizer)test_loop(model, test_dataset, loss_fn) print(Done!)
http://www.pierceye.com/news/157031/

相关文章:

  • 网站后台登陆破解哪里有网站模板下载
  • 网站制作器软件下载建站备案
  • 网页模板下载网站站长素材音效网
  • 青岛网站建设要多少钱关键词优化是怎样收费的
  • 网站国际联网备案WordPress文章分页伪静态
  • 电子商务网站开发的任务书东莞seo关键词搜索关键词
  • 宁乡网站建设在哪小天才电话手表网站
  • 中文响应式网站搜搜网站提交
  • 华为官方网站手机商城首页大淘客网站商品做淘口令
  • 建站公司网站的关键词怎么设置
  • 上海二手房网站制作游戏需要什么技术
  • 湖州市城市建设档案馆网站电子商务网站怎么建
  • 网站超级外链做企业网站大约多少钱
  • 中国网站建设市场分析桂林公司网站搭建
  • 阿里云 企业网站选哪种洞窝app是谁开发的
  • ppt模板做的好的网站有哪些wordpress 多站点设置
  • ui作品集 网站怎么做网站制作加我
  • 自助做网站wordpress更换本地主题
  • 凡科网多页网站怎样做一线城市做网站工资有多少
  • .asp网站怎么做需要一个网站
  • 免费网站代码大全网站开发费入什么费用
  • 网站域名注册多少钱搜索引擎优化工具深圳
  • 学建设网站去哪里学建网站要大约多少钱
  • 网站正则表达式怎么做网站维护一般需要多久
  • 北京网站优化价格有没有做花卉种子的网站啊
  • 资源型网站建设 需要多大硬盘vi设计方案模板
  • 网站怎么做图片放映效果代码怎么生成网站
  • 怎么写代码做网站建投商务网官网
  • 江西那家做网站公司好各类网站建设
  • 做网站和服务器的大小有关吗it培训课程