《产业与环境》杂志社
首页 > 期刊导读
 
/ / /
 

自动化技术论文_基于组合训练的规则嵌入多智能体强化学习方法

 
来源:产业与环境 栏目:期刊导读 时间:2021-11-17
 

文章摘要:多智能体强化学习方法在仿真模拟、游戏对抗、推荐系统等许多方面取得了突出的进展。然而,现实世界的复杂问题使得强化学习方法存在无效探索多、训练速度慢、学习能力难以持续提升等问题。该研究嵌入规则的多智能体强化学习技术,提出基于组合训练的规则与学习结合的方式,分别设计融合规则的多智能体强化学习模型与规则选择模型,通过组合训练将二者有机结合,能够根据当前态势决定使用强化学习决策还是使用规则决策,有效解决在学习中使用哪些规则以及规则使用时机的问题。依托中国电子科技集团发布的多智能体对抗平台,对提出的方法进行实验分析和验证。通过与内置对手对抗,嵌入规则的方法经过约1.4万局训练就收敛到60%的胜率而没有嵌入规则的算法需要约1.7万局的时候收敛到50%的胜率,结果表明嵌入规则的方法能够有效提升学习的收敛速度和最终效果。

文章关键词:

项目基金:国家自然科学基金资助项目,

论文作者:李渊 徐新海 

作者单位:军事科学院 

论文DOI: 10.19734/j.issn.1001-3695.2021.09.0351

论文分类号: TP18

相关文献:多智能体强化学习综述.《计算机科学》
深度强化学习综述.《计算机学报》

相似文献:多智能体深度强化学习研究综述.....作者:孙彧,曹雷,陈希亮,徐志雄,赖俊,刊载期刊:《计算机工程与应用》
数据驱动的多智能体网络鲁棒包容控制.....作者:于镝,刊载期刊:《控制理论与应用》
基于零和博弈的多智能体网络鲁棒包容控制.....作者:于镝,刊载期刊:《控制与决策》
一种基于深度强化学习的多智能体协作方法.....作者:厉子凡,王浩,方宝富,刊载期刊:《计算机工程》
多智能体协作场景下基于强化学习值分解的计算卸载策略.....作者:张鹏,田辉,赵鹏涛,贺硕,童一帆,刊载期刊:《通信学报》
面向车联网多智能体强化学习边云协同卸载.....作者:叶佩文,贾向东,杨小蓉,牛春雨,刊载期刊:《计算机工程》
基于优先经验回放的多智能体协同算法.....作者:黄子蓉,甯彦淞,王莉,刊载期刊:《太原理工大学学报》
基于过滤机制筛选信息的多智能体策略方法研究.....作者:陈亮,郭婷,刘韵婷,杨佳明,刊载期刊:《控制与决策》
基于多智能体混沌鸟群算法的机构优化.....作者:吴冬梅,郝凤鸣,蒋国平,刊载期刊:《信息与控制》
基于分布式自适应的多智能体容错一致性控制.....作者:张普,薛惠锋,高山,刊载期刊:《航空学报》

相关文章:人工智能在智能制造中的应用.....作者:杨磊
大数据人工智能驱动图书馆知识服务和学科建设.....作者:姜爱蓉
商业航天背景下的遥感应用产业化.....作者:刘东升
Artificial Intelligence: Where Maybe Next Steps? “人工智能热”之后的冷静思考.....作者:Tony Qiu
Computational Analysis of the Voynich Manuscript 十五世纪伏尼契码的智能解析.....作者:Greg Kondrak
深度强化学习系列课程第四讲.....作者:汪荣贵
北京二号遥感卫星星座及其应用服务.....作者:屈鸿钧
第一讲:人工智能时代的刑事责任演变: 过去·现在·将来.....作者:刘宪权


文章来源:产业与环境 网址: http://cyyhj.400nongye.com/lunwen/itemid-136445.shtml


上一篇: 数学论文_“聚点均衡”视角下有为政府引领企业生产区位选择机制研究
下一篇: 暂无



点击在线投稿

 
/ / /
 
 
 
 

Copyright 2001-2021 400农业期刊网版权所有 做最专业学术期刊论文发表网站
本站不是《产业与环境杂志社》官网,如果需要联系官方杂志社,请联系客服索取网站或者电话。