网站开发笔记,厦门seo厦门起梦,重庆快速网络推广,dedecms精仿学校网站模板#xff08;一#xff09;前言#xff1a;强化学习入门顺序。 以前主要学习硬件PCB单片机等知识#xff0c;后来接触的项目也大多与电气相关#xff0c;从一窍不通到稍微找到点门道#xff0c;中间走过不少弯路#xff0c;误打误撞中#xff0c;也留下了一些经验。 我的…一前言强化学习入门顺序。 以前主要学习硬件PCB单片机等知识后来接触的项目也大多与电气相关从一窍不通到稍微找到点门道中间走过不少弯路误打误撞中也留下了一些经验。 我的学习顺序在后面给出评价 1学习神经网络
途径某站的编程培训机构的白嫖课程通俗易懂小白能看得进去。
内容卷积概念实现原理激活函数全连接bp,cnnbnn稍微了解一下 2深度学习
途径某站的吴恩达深度学习全套视频讲的更严谨当然也更加抽象一些不过是真的好。
内容梯度下降激活函数前向传播和反向传播局部最优解决方法等多了解。 这个是深度学习CNN图片特征提取过程
3强化学习
途径某站的李宏毅或王树森的强化学习视频
内容基本常识蒙特卡洛马尔可夫链SARSA算法TD算法DQN算法等基础。 4python编程 途径莫烦python课程可以用python在线编辑器先学着。
内容python的基本语法调用numpy库等反正跟着课程走。莫烦的强化学习编程课我没看 5安装强化学习编程环境
途径某站或者CSDN上就有很多教程也可某宝直接带下安装省事。、
内容pycharm安装anaconda安装gym,numpy等常见库记得学习这个软件怎么用。 6找强化学习代码 途径不必多说应该都很多的不过最恐怖的是好多代码是不能直接拿来用或者需要代码给的不全根本就跑不起来所以在这里需要头疼一下多费点心思。 内容用DQN等算法跑起来的python程序提醒一下是要基于pytorch的而不是tensorflow的前者好像更友好一点后者我也没接触过。找到代码之后主要看懂代码和复现代码这个很重要。看不懂代码就跳回去再找理论视频看弄懂算法原理。
二学习感触 1.建议先学python,下载强化学习代码调试再去看视频学习理论知识。因为我看强化学习和深度学习的时间有点早导致下载代码看代码有困难忘记算法的原理又回去回炉重造。 2.做强化学习RL或者深度强化学习(DRL)对于硬件都是有较高要求的。入门阶段可以用普通配置的笔记本电脑跑代码若想真想投身这个领域显卡GPUCPU运存之类的硬件配置一定要跟上这时候如果课题组有前期基础就太棒了。我的代码开始比较晚一方面是没有完整时间另一方面是硬件配置跟不上自己后来更换电脑了。 3.看SCI二区及以上的论文国内论文你稍微多看几篇就明白了不必多说。一开始我是边看论文边看视频学理论知识后来发现没啥用因为没有跑代码就很容易忘记。如果现在回过头来我想说应该先搞定强化学习入门之后再去看论文这样才能看明白别人讲的啥创新点在哪里为什么优秀。而不是盲目从众去杠论文因为你没有理论基础实操基础是真看不懂顶多是认识了一下汉字而已汉字背后的意思你又可能蒙蔽了。 4.一定一定要静下心来学习的东西比较杂比较多不静下心来真的很容易崩溃。 5.可以通过写博客的方式激励自己持续学习我也是到此刻突然明白自己为啥学起来很苦闷了。将所学的知识输出这就是最快掌握的方式。 在后续文章中就不讲解最最基础的知识了因为这些最最基础的知识可以通过看视频快速学到用文字表述反而慢半拍。