资源预览内容
第1页 / 共83页
第2页 / 共83页
第3页 / 共83页
第4页 / 共83页
第5页 / 共83页
第6页 / 共83页
第7页 / 共83页
第8页 / 共83页
第9页 / 共83页
第10页 / 共83页
亲,该文档总共83页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
1RoboCup 仿真中的分布式智能决策与 优化学习 Distributed Intelligent Decision and Optimized Learning in RoboCup Simulation学生姓名: 马 洁所在专业: 计算机科学与技术指导教师: 张 志 涌 教 授2005 年 6 月 3 日2目 录摘 要.4 ABSTRACT.5 第一章第一章 背景介绍背景介绍.6 61.1 引 言 .61.2 多智能体系统 .71.3 对抗性多智能体 .91.4 RoboCup 仿真平台介绍 .101.5 RoboCup 仿真的软件构成 .121.6 RoboCup 仿真中的 Client 模型 .141.6.1 Client 感知模型 .14 1.6.2 Client 的动作模型 .181.7 RoboCup 仿真平台的发展与研究趋势 .221.7.1 Online Coach .22 1.7.2 Keepaway 模式 .24 1.7.3 3D 比赛 .24 第二章第二章 多智能体的分层决策结构多智能体的分层决策结构.25252.1 多智能体的各种结构模型 .252.2 多智能体的分层决策结构 .262.3 分层决策结构框架逻辑模型 .27第三章第三章 RoboCupRoboCup 中多智能体的个体技术中多智能体的个体技术 .31313.1 问题综述 .313.2 截球技术 .323.2.1 问题介绍 .32 3.2.2 牛顿迭代法解决截球问题 .33 3.2.3 牛顿迭代法的弊端和改进方法 .363.3 带球技术 .373.3.1 问题介绍 .37 3.3.2 传统的解决方法 .38 3.3.3 本文的带球算法 .40 第四章第四章 动态世界模型动态世界模型.48484.1 背景介绍 .4834.2 动态世界模型的信息融合 .484.3 RoboCup 中基于相对环扇的几何跟踪法 .51第五章第五章 选择性信息共享选择性信息共享.53535.1 多智能体系统中的信息共享 .535.2 选择性信息共享 .535.3 选择性信息共享在 RoboCup 中的应用 .545.3.1 信息压缩编码与解码 .54 5.3.2 信息选择 .55 5.3.3 Attention 策略 .55 第六章第六章 在线对手建模在线对手建模.57576.1 对抗性多智能体系统需要对手建模 .576.2 在线对手建模 .586.3 在 RoboCup 中的应用举例 .59第七章第七章 建议机制建议机制.61617.1 背景研究 .617.2 建议机制流程 .627.3 实验总结 .64第八章第八章 多智能体集团多智能体集团性性协同战略战术协同战略战术.66668.1 问题的提出 .668.2 战略战术的描述 .668.3 战术的执行与合作的产生 .688.4 战术的自适应调整 .718.5 RoboCup 中的应用举例 .718.6 战术执行效果及测试 .73结论.74 致谢.75 参考文献.76 附录 1 :Team Description of Apollo .80 附录 2 :本课题研究在 RoboCup 比赛中所获荣誉及证书 .834摘摘 要要随着人工智能理论在军事对抗和国民生产中的各个领域的广泛运用,多智能体已成为智能控制的研究热点。诸多问题的解决都需要多智能体系统(MAS)的出现,如:多弹头导弹的攻击与拦截,集群式作战机器人,多智能体坦克系统,电网调度系统,交通控制,网络路由的智能控制,集群搜索与探查机器人,医用集群式机器人,智能型电脑游戏等。因此多智能体系统的研究是当今世界上的迫切课题。在各种多智能体系统中,对抗性多智能体系统的分布式决策是亟待解决的技术难点之一。其研究的核心在于实时、异步、有噪声的对抗环境下,多个智能体自主决策相互配合,实现单个智能体无法完成的对抗目标。在该领域,世界上还没有形成一个完整的科学体系。尤其在全局利益表示、带噪对抗环境下多智能体分布式决策方法、多智能体对手识别与对手建模、在线战术的生成与指导方面,一直是国内外科研工作者的技术难题。RoboCup即机器人世界杯足球锦标赛,是国际上对抗性多智能体标准的验证平台。本文研究了RoboCup仿真中多智能体对抗系统的分布式自主决策问题,描述了智能体对抗系统中的技术难点和问题特性。针对这些问题,本文设计出了一套完整的多智能体实时分层决策结构。世界模型在多智能体对抗系统的分布式决策与智能协作中发挥着举足轻重的作用。本文采用粒子滤波器实现了噪声环境下的位置状态更新、信息融合、动态世界模型的维护,为上层决策提供依据。为提高群体智能决策能力,本文提出了建议机制和集团性协同战略战术方法。本文用一套战略战术语言,在离线环境下组建对手模型的结构特征库,并提出了对手模型的自适应辨识方法和共享信息的择优机制,对特征库中的特征信息进行合作性在线调整,生成实时的反制指导。RoboCup比赛中获得的优异成绩证明本文提出的
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号