RoboCup仿真中的分布式智能决策与优化学习-

1RoboCup 仿真中的分布式智能决策与优化学习 Distributed Intelligent Decision and Optimized Learning in RoboCup Simulation学生姓名：马洁所在专业：计算机科学与技术指导教师：张志涌教授2005 年 6 月 3 日2目录摘要.4 ABSTRACT.5 第一章第一章背景介绍背景介绍.6 61.1 引言 .61.2 多智能体系统 .71.3 对抗性多智能体 .91.4 RoboCup 仿真平台介绍 .101.5 RoboCup 仿真的软件构成 .121.6 RoboCup 仿真中的 Client 模型 .141.6.1 Client 感知模型 .14 1.6.2 Client 的动作模型 .181.7 RoboCup 仿真平台的发展与研究趋势 .221.7.1 Online Coach .22 1.7.2 Keepaway 模式 .24 1.7.3 3D 比赛 .24 第二章第二章多智能体的分层决策结构多智能体的分层决策结构.25252.1 多智能体的各种结构模型 .252.2 多智能体的分层决策结构 .262.3 分层决策结构框架逻辑模型 .27第三章第三章 RoboCupRoboCup 中多智能体的个体技术中多智能体的个体技术 .31313.1 问题综述 .313.2 截球技术 .323.2.1 问题介绍 .32 3.2.2 牛顿迭代法解决截球问题 .33 3.2.3 牛顿迭代法的弊端和改进方法 .363.3 带球技术 .373.3.1 问题介绍 .37 3.3.2 传统的解决方法 .38 3.3.3 本文的带球算法 .40 第四章第四章动态世界模型动态世界模型.48484.1 背景介绍 .4834.2 动态世界模型的信息融合 .484.3 RoboCup 中基于相对环扇的几何跟踪法 .51第五章第五章选择性信息共享选择性信息共享.53535.1 多智能体系统中的信息共享 .535.2 选择性信息共享 .535.3 选择性信息共享在 RoboCup 中的应用 .545.3.1 信息压缩编码与解码 .54 5.3.2 信息选择 .55 5.3.3 Attention 策略 .55 第六章第六章在线对手建模在线对手建模.57576.1 对抗性多智能体系统需要对手建模 .576.2 在线对手建模 .586.3 在 RoboCup 中的应用举例 .59第七章第七章建议机制建议机制.61617.1 背景研究 .617.2 建议机制流程 .627.3 实验总结 .64第八章第八章多智能体集团多智能体集团性性协同战略战术协同战略战术.66668.1 问题的提出 .668.2 战略战术的描述 .668.3 战术的执行与合作的产生 .688.4 战术的自适应调整 .718.5 RoboCup 中的应用举例 .718.6 战术执行效果及测试 .73结论.74 致谢.75 参考文献.76 附录 1 ：Team Description of Apollo .80 附录 2 ：本课题研究在 RoboCup 比赛中所获荣誉及证书 .834摘摘要要随着人工智能理论在军事对抗和国民生产中的各个领域的广泛运用，多智能体已成为智能控制的研究热点。诸多问题的解决都需要多智能体系统(MAS)的出现，如：多弹头导弹的攻击与拦截，集群式作战机器人，多智能体坦克系统，电网调度系统，交通控制，网络路由的智能控制，集群搜索与探查机器人，医用集群式机器人，智能型电脑游戏等。因此多智能体系统的研究是当今世界上的迫切课题。在各种多智能体系统中，对抗性多智能体系统的分布式决策是亟待解决的技术难点之一。其研究的核心在于实时、异步、有噪声的对抗环境下，多个智能体自主决策相互配合，实现单个智能体无法完成的对抗目标。在该领域，世界上还没有形成一个完整的科学体系。尤其在全局利益表示、带噪对抗环境下多智能体分布式决策方法、多智能体对手识别与对手建模、在线战术的生成与指导方面，一直是国内外科研工作者的技术难题。RoboCup即机器人世界杯足球锦标赛，是国际上对抗性多智能体标准的验证平台。本文研究了RoboCup仿真中多智能体对抗系统的分布式自主决策问题，描述了智能体对抗系统中的技术难点和问题特性。针对这些问题，本文设计出了一套完整的多智能体实时分层决策结构。世界模型在多智能体对抗系统的分布式决策与智能协作中发挥着举足轻重的作用。本文采用粒子滤波器实现了噪声环境下的位置状态更新、信息融合、动态世界模型的维护，为上层决策提供依据。为提高群体智能决策能力，本文提出了建议机制和集团性协同战略战术方法。本文用一套战略战术语言，在离线环境下组建对手模型的结构特征库，并提出了对手模型的自适应辨识方法和共享信息的择优机制，对特征库中的特征信息进行合作性在线调整，生成实时的反制指导。RoboCup比赛中获得的优异成绩证明本文提出的