蚁群算法再优化:combine aco algorithm with Sarsa in RL
创始人
2024-05-28 14:41:27
0

蚁群算法再优化:combine aco algorithm with Sarsa in RL

  • 蚁群算法、Sarsa介绍和TSP问题介绍
    • TSP和Sarsa
    • aco algorithm
  • 具体的改进和代码
    • 改进说明
    • 部分代码
  • 数值实验
    • 结论分析
  • 参考文献

蚁群算法、Sarsa介绍和TSP问题介绍

在进行蚁群算法优化介绍之前,笔者先将涉及到的算法等应用背景与大家说清楚。

TSP和Sarsa

TSP问题叫旅行商问题,即给定n个城市和他们的坐标,城市之间的距离表示为dij(i,j分别为不同城市的下标),d的距离一般用欧式距离,且为对称问题(就是i->j 和 j->i的距离是相等的),我们要寻找一个哈密顿回路,来使得回路的消耗最小,这就是我们的TSP问题的目标。
Sarsa算法是强化学习中智能体在未知空间学习策略的一种经典算法。其大致思路是智能体(agent)下一时刻采取的动作参考动作所带来的收益,且以ε的概率采取获得收益的最大动作,1-ε的概率随机选取剩下的动作进行寻优。
具体的相关的文章可以参看笔者之前的blog,强化学习的Sarsa与Q-Learning的Cliff-Walking对比实验.下面引用文章中Sarsa的伪代码。
在这里插入图片描述

aco algorithm

蚁群算法是一种仿生的启发式算法,也是经典的启发式算法之一。提出多年来有不少学者在研究蚁群并进行改进,很多算法会将蚁群算法和其他启发式算法结合起来,或者和现在流行的深度学习,强化学习结合,从而产生寻优能力更加强大的算法。当然经典的蚁群算法在解决TSP问题中的效果已经远不如最好的方法,但是从基础小部分研究改进起,才能构建好高楼大厦。这也是文章的目的。
蚁群算法根据之前蚂蚁留下的信息素来决定接下来将要走的道路,直到到达目的地,也就是著名的蚂蚁效应。该思路被用来设计成ACO,在TSP问题中进行了应用。下面是蚁群算法的流程图
在这里插入图片描述

具体的改进和代码

改进说明

以一定概率rr(用伪随机数),当rr>0.1时,选最大的下一个城市,来进行城市回路的构建
以1-ε的概率选择3个最好的下一个城市中的一个
改进的原因:

 引用了Sarsa的思路进行探索且探索的是较好的那几个城市中一个不是所有城市是因为,最优解的边不会太差,所以不是选取所有的边进行等概率的选择

全部的代码,笔者已经上传到了CSDN中,有需要的可以下载实验
蚁群算法改进

部分代码

下面是根据原来的蚁群算法中,进行改进的部分,其他与原来的一致

        if rr > 0.1:for i, probability in enumerate(probabilities):rand -= probabilityif rand <= 0:selected = ibreakelse:sorted_allowed = sorted(enumerate(probabilities), key=lambda x: x[1],reverse=True)ex_allowed = sorted_allowed[:2]selected = random.choice([tup[0] for tup in ex_allowed])while probabilities[selected] == 0:selected = random.choice([tup[0] for tup in ex_allowed])

图取自参考文献【1】

数值实验

笔者经过在TSP的公开测试机att48上进行实验证明,经过调参和参数的确定,在进行了1000次的总体实验中,进行数据的收集和总结,最后证明该改进是有效果的,比原来本身的算法取得**1%**的进步。
数据集和代码在签名的代码csdn文件的分享中。
笔者用两组参数进行原蚁群算法和改进蚁群算法的实验,一共4组实验,下面给出参数和实验结果,并进行讨论。
参数的意义分别是,ant数,迭代次数,α,β,衰减率r,固定的Q值 和 选取的计算信息素方式

第一组参数
10, 100, 1.0, 10.0, 0.5, 10, 3
改进的蚁群:ave = 36366      min = 34575
未改进的蚁群:ave = 36536    min=35251第二组参数
40, 50, 0.1, 18.0, 0.7, 48, 3
改进的蚁群:ave = 35949      min = 34448
未改进的蚁群:ave = 35667    min=34852

结论分析

在参数等控制变量的前提下,改进的蚁群比未改进的最小值要小,注意到第二组参数的改进的ave比没改进的ave高,但是最小值更小,这说明改进的蚁群进行的搜索空间比未改进的更大,所以获得的寻优结果更好。

参考文献

【1】MATLAB智能算法30个案例分析,ISBN:9787512403512,作者:史峰,王辉 等编著

相关内容

热门资讯

安卓系统和oppo系统哪个流畅... 你有没有想过,手机系统哪个更流畅呢?安卓系统和OPPO系统,这两个名字听起来就让人心动。今天,咱们就...
安卓怎么用微软系统,利用微软系... 你是不是也和我一样,对安卓手机上的微软系统充满了好奇?想象那熟悉的Windows界面在你的安卓手机上...
安卓系统如何安装nfc,安卓系... 你有没有想过,用手机刷公交卡、支付账单,是不是比掏出钱包来得酷炫多了?这就得归功于NFC技术啦!今天...
ios系统可以转安卓,跨平台应... 你有没有想过,你的iPhone手机里的那些宝贝应用,能不能搬到安卓手机上继续使用呢?没错,今天就要来...
iOSapp移植到安卓系统,i... 你有没有想过,那些在iOS上让你爱不释手的app,是不是也能在安卓系统上大放异彩呢?今天,就让我带你...
现在安卓随便换系统,探索个性化... 你知道吗?现在安卓手机换系统简直就像换衣服一样简单!没错,就是那种随时随地、随心所欲的感觉。今天,就...
安卓系统安装按钮灰色,探究原因... 最近发现了一个让人头疼的小问题,那就是安卓手机的安装按钮突然变成了灰色,这可真是让人摸不着头脑。你知...
安卓7.1.1操作系统,系统特... 你知道吗?最近我在手机上发现了一个超级酷的新玩意儿——安卓7.1.1操作系统!这可不是什么小打小闹的...
安卓os系统怎么设置,并使用`... 你有没有发现,你的安卓手机有时候就像一个不听话的小孩子,有时候设置起来真是让人头疼呢?别急,今天就来...
安卓降低系统版本5.1,探索安... 你知道吗?最近安卓系统又来了一次大动作,竟然把系统版本给降到了5.1!这可真是让人有点摸不着头脑,不...
解放安卓系统被保护,解放安卓系... 你有没有想过,你的安卓手机其实可以更加自由地呼吸呢?是的,你没听错,我说的就是解放安卓系统被保护的束...
校务帮安卓系统下载,便捷校园生... 你有没有想过,你的手机里装了一个神奇的助手——校务帮安卓系统下载?没错,就是那个能让你轻松管理学校事...
安卓系统没有拼多多,拼多多崛起... 你知道吗?最近我在手机上发现了一个小小的秘密,那就是安卓系统里竟然没有拼多多这个应用!这可真是让我大...
甜城麻将安卓系统,解锁全新麻将... 你有没有听说过那个超级火的甜城麻将安卓系统?没错,就是那个让无数麻将爱好者为之疯狂的软件!今天,就让...
安卓系统卸载的软件,深度揭秘卸... 手机里的软件越来越多,是不是感觉内存不够用了?别急,今天就来教你怎么在安卓系统里卸载那些不再需要的软...
安卓系统推荐好游戏,畅享指尖乐... 手机里的游戏可是咱们休闲娱乐的好伙伴,尤其是安卓系统的用户,选择面那可是相当广呢!今天,就让我来给你...
王者安卓系统怎么卖,揭秘如何轻... 你有没有听说最近王者安卓系统的火爆程度?没错,就是那个让无数玩家沉迷其中的王者荣耀!今天,我就来给你...
安卓开发系统内置证书,基于安卓... 你有没有想过,你的安卓手机里那些神秘的内置证书,它们到底是个啥玩意儿?别急,今天就来给你揭秘这些隐藏...
荣耀安装安卓原生系统,深度体验... 你知道吗?最近荣耀手机界可是掀起了一股热潮,那就是——荣耀安装安卓原生系统!这可不是什么小打小闹,而...
安卓13小米系统,创新功能与流... 你知道吗?最近安卓13系统可谓是风头无两,各大手机厂商纷纷推出自家的新版系统,其中小米的安卓13系统...