当前位置: 首页 > news >正文

a做爰网站网站程序是什么?

a做爰网站,网站程序是什么?,学校网站模板 中文,wordpress 内容 权限一、Qlearning简介 Q-learning是一种强化学习算法#xff0c;用于解决基于奖励的决策问题。它是一种无模型的学习方法#xff0c;通过与环境的交互来学习最优策略。Q-learning的核心思想是通过学习一个Q值函数来指导决策#xff0c;该函数表示在给定状态下采取某个动作所获…一、Qlearning简介 Q-learning是一种强化学习算法用于解决基于奖励的决策问题。它是一种无模型的学习方法通过与环境的交互来学习最优策略。Q-learning的核心思想是通过学习一个Q值函数来指导决策该函数表示在给定状态下采取某个动作所获得的累积奖励。 Q-learning的训练过程如下 1. 初始化Q值函数将所有状态-动作对的Q值初始化为0。 2. 在每个时间步根据当前状态选择一个动作。可以使用ε-greedy策略来平衡探索和利用。 3. 执行选择的动作并观察环境返回的奖励和下一个状态。 4. 根据Q值函数的更新规则更新Q值。Q值的更新公式为Q(s, a) Q(s, a) α * (r γ * max(Q(s, a)) - Q(s, a))其中α是学习率γ是折扣因子r是奖励s是当前状态a是选择的动作s是下一个状态a是在下一个状态下选择的动作。 5. 重复步骤2-4直到达到停止条件。 Q-learning的优点是可以在没有先验知识的情况下自动学习最优策略并且可以处理连续状态和动作空间。它在许多领域中都有广泛的应用如机器人控制、游戏策略和交通路线规划等。 二、TSP问题介绍 旅行商问题Traveling salesman problem, TSP是一个经典的组合优化问题它可以描述为一个商品推销员去若干城市推销商品要求遍历所有城市后回到出发地目的是选择一个最短的路线。当城市数目较少时可以使用穷举法求解。而随着城市数增多求解空间比较复杂无法使用穷举法求解因此需要使用优化算法来解决TSP问题。TSP问题的应用非常广泛不仅仅适用于旅行商问题本身还可以用来解决其他许多的NP完全问题如邮路问题、转配线上的螺母问题和产品的生产安排问题等等。因此对TSP问题的有效求解具有重要意义。解决TSP问题的方法有很多其中一种常用的方法是蚁群算法。除了蚁群算法还有其他一些常用的解决TSP问题的方法如遗传算法、动态规划和强化学习等。这些方法各有特点适用于不同规模和特征的TSP问题。 三、Qlearning求解TSP问题 1、部分代码 可以自动生成地图也可导入自定义地图只需要修改如下代码中chos的值即可。 import matplotlib.pyplot as plt from Qlearning import Qlearning #Chos 1 随机初始化地图 0 导入固定地图 chos1 node_num36 #当选择随机初始化地图时自动随机生成node_num-1个城市 # 创建对象初始化节点坐标计算每两点距离 qlearn Qlearning(alpha0.5, gamma0.01, epsilon0.5, final_epsilon0.05,choschos,node_numnode_num) # 训练Q表、打印路线 iter_num1000#训练次数 Curve,BestRoute,Qtable,Mapqlearn.Train_Qtable(iter_numiter_num) #Curve 训练曲线 #BestRoute 最优路径 #Qtable Qlearning求解得到的在最优路径下的Q表 #Map TSP的城市节点坐标## 画图 plt.figure() plt.ylabel(distance) plt.xlabel(iter) plt.plot(Curve, colorred) plt.title(Q-Learning) plt.savefig(curve.png) plt.show() 2、部分结果 1以国际通用的TSP实例库TSPLIB中的测试集bayg29为例 Q-learning得到的最短路线: [1, 28, 6, 12, 9, 3, 29, 26, 5, 21, 2, 20, 10, 4, 15, 18, 14, 22, 17, 11, 19, 25, 7, 23, 27, 8, 24, 16, 13, 1] 2随机生成35个城市 Q-learning得到的最短路线: [1, 22, 3, 9, 5, 24, 7, 4, 29, 35, 25, 21, 12, 20, 8, 27, 18, 11, 33, 23, 31, 6, 26, 19, 2, 13, 15, 34, 30, 28, 14, 32, 10, 16, 17, 1] 3随机生成40个城市 Q-learning得到的最短路线: [1, 16, 31, 20, 14, 26, 13, 5, 22, 10, 29, 37, 7, 15, 34, 3, 30, 4, 25, 9, 39, 32, 2, 27, 36, 23, 12, 28, 33, 35, 17, 19, 8, 21, 38, 6, 40, 18, 11, 24, 1] 四、完整Python代码 文件夹内包含完整Python代码点击main.py即可运行可以自定义TSP数据集。
http://www.pierceye.com/news/9340/

相关文章:

  • 马鞍山做网站公司排名网站做3儿童车开场动画
  • 沧州做家装的公司网站宁波网站快速优化
  • 南宁h5建站推广渠道怎么写
  • 网站上怎么做动画广告视频在线观看建设工程报建备案网站
  • 邢台有什么网站广西南宁网站空间
  • 网站建设和实现数据网站建设
  • 网站开发kpi专门培训seo的网站
  • 网站301是什么意思php7跨设备网站开发pdf
  • 攀枝花建设规划网站设计师网上接私单app
  • 电脑版和手机版网站怎么做的济南网络公司排行
  • 福州市有哪些制作网站公司衡阳建设网站公司
  • wordpress 站点身份西安广告公司
  • 网站制作工具目前最好的oa系统
  • 网站制作比较好的公司网站管理员权限
  • 只做动漫的网站jsp网站开发详解书籍
  • 怎么看网站用的什么cmswordpress 和shopify
  • 建设网站注册会员创新的做pc端网站
  • 遵义公司网站制作哪家好h5页面制作图片
  • 网站合作流程适合奖励自己的网站免费
  • 3维网站制作技术网站seo设置是什么意思
  • 做简单的网站巢湖网站建设公司
  • wordpress教程 pdf下载地址排名优化哪家好
  • 郑州网站制作需要多少钱企业网站建设方案论文
  • 为什么要用h5建站网站后台管理模板psd
  • 天门市网站建设seo婚礼案例网站
  • 手机网站 域名解析广告投放平台主要有哪些
  • 哪个网站可以做私单专业网站设计师去哪找
  • 中国十大外贸平台seo优化课程
  • 广西网站建设电话品牌vi设计一般多少钱
  • 服务好的南京网站建设赣州市做网站设计