资源预览内容
第1页 / 共3页
第2页 / 共3页
第3页 / 共3页
亲,该文档总共3页全部预览完了,如果喜欢就下载吧!
资源描述
1 1 5 82 0 0 5 中国控制与决策学术年会论文集P r o c e e d i n g so f2 0 0 5C h i n e s eC o n t r o la n dD e c i s i o nC o n f e r e n c e基于神经网络反馈误差学习控制在智能假肢中的研究杨鹏,王辉,陈玲玲,郭欣( 河北工业大学电气及自动化学院,天津3 0 0 1 3 0 )搐要:针对膝上假肢位置拉制中存在的非线性和不确定性特性,基于H e b b i a n 学习算法,通过 体下肢建模,提出了一种应用干智能假肢的控制策略从而达到对谚时变非线性秉统的实时跟踪控制仿真鲒果表明谈控制器具有照好的跟踪精度、较强的自适应能力和鲁棒性关键词:学习控制 神经网络;智能假艘R e s e a r c ho ff e e d b a c k e r r o rl e a r n i n gn e u r a ln e t w o r ki nt h ei n t e l l i g e n tp r o s t h e s e sY A N GP e n g ,W A N GH u i ,C H E NL i n g l i n g ,G U OX i n( S c h o o lo fE l e c t r i c a lE n g i n e e r i n gT e c h n o l o g y ,H e b e iU n i v e r s i t yo fT e c h n o l o g y T i a n j i n3 0 0 13 0 C h i n ac o r r e s p o n d e n t :W A N GH u i ,E m a i l :w w h u i e y o u t o m )A b s t r a c t :Af e e d b a c k e r r o rl e a r n i n gc o n t r o ls t r a t e g yb a s e do nH e b b i a nl e a r n i n gs c h e m ei sp r e s e n t e d ,a i m i n ga tt h en o n l i n e a r i t ya n du n c e r t a i n t yo ft h ep o s i t i o nc o n t r o li nt h ei n t e l l i g e n ta r t i f i c i a ll i m b T h u st h er e a lt i m et r a c k i n go ft h i st i m e v a r y i n gn o n l i n e a rs y s t e me g nb ea c h i e v e d T h es i m u l a t i o nr e s u l t si n d i c a t et h a tt h ec o n t r o l l e rh a sh i g ht r a c k i n gp r e c i s i o n tg o o da d a p t i v ea b i l i t ya n dr o b u s t n e s s K e yw o r d s :l e a r n i n gc o n t r o l ,n e u r a ln e t w o r k i n t e l l I g e 丑a r t i f i c i a ll i m b1 引言目前对主动式膝上假肢的技术基础以及控制理论还不成熟,其主要难点在于:1 ) 在行走的双支撑期,系统形成运动闭环链。因此系统是一个动态不确定系统;2 ) 人体运动结构具有冗余性;3 ) 闭环以及开环控制所需的运动轨迹无法提前预知;4 ) 干扰高度紊乱对于提高假肢运动性能的运动策略主要有固定参数反馈控制1 1 和自适应参考模型控制2 1 等固定参数反馈控制需要构建精确的数学模型来描述肌骨系统然而肌肉骨骼非常复杂,构造模型也将非常复杂且精确性不高尽管模型参考自适应控制不需要肌骨的精确模型但其控制性能只有在模型参数选择适当的条件下才能达到满意结果本文以主动式膝上假肢为研究对象,利用神经网络的学习能力和非线性映射能力,将神经网络与传统控制技术相结合,设计出既能满足系统快速跟踪的需要,又能提高系统对非线性和不确定性的适应能力的自适应控制器,使假肢膝关节以期望的运动轨迹运动 2 系统描述围1 系统构成如图1 所示,控制系统由一个反馈控制器和一个前馈控制器组成前馈控制器为神经网络,反馈控制器采用P D 控制反馈控制器保证系统全局稳定并实现无静差控制神经网络学习控制对象的逆运动学特征,其作用是通过在线学习补偿被控系统的非线性和不确定性基金项目t 河北省自然科学基金项目( E 2 0 0 4 0 0 0 0 5 5 ) 作者简介:杨鹏( 1 9 6 0 ) ,男,教授,博士,从事计算机智能控制等研究扬鹂等:基于神经网络反馈误差学习控制在智能假肢中的研究1 1 5 9从本质上讲,P D 控制器的输出体现了假肢的运动学模型与神经网络所代表的逆运动学模型之间的不匹配程度若神经网络J I 练后“学”会了真实的逆运动学模型,那么神经网络单独作用就可产生所期望的运动轨迹所需的控制信号开始阶段,由于控制器的学习不够完善,神经网络产生的控制信号与P D 控制器的输出相比较小,存在较大的跟踪误差随着神经网络在线学习次数的增加,逐步成为主导作用,从而达到很高的控制精度人体下肢可以看作三刚体两自由度模型,本文膝上假肢的模型是二刚体简化模型,如图2 所示将大腿、小腿和足分别简化为杆件( 设大腿质心位于C G 。点处,小腿质心位于C G 。点处) H 表示臀关节,K 表示膝关节;_ 和F 分别表示地面对于假肢的垂直和水平作用力;F ,表示人体躯干作用于臀部的作用力;z 。表示臀关节在水平方向的速度( 蛳= o ) # 和r :分别表示质心到最近身体侧的关节点的距离L ,和L 2 表示大腿和小腿的长度;口,和以表示关节转动的角度根据拉格朗日方法,此系统的数学模型是3 个二阶耦合非线性微分方程“ 因篇幅有限,放在图2 人体下肢模墼豳3反馈惺差学习控翻叠螭构F出此省略反馈误差学习控制器的结构如图3 所示其中:以是期望轨迹l 系统总能量由神经网络输出,神经网络包括函数 ,B ,c ( 由系统能量公式获得,将在下一节介绍) 和权值。,“ ,”。;”。是与阻尼损耗有关的系数( 以经验给定) 神经网络输出的系统能量对时间求导,然后除以期望角速度,再加上能量损耗( 期望角速度乘以权值”。) ,最后和P D 控制器的输出共同作用于系统3反馈误差学习算法反馈误差算法如下( 此算法基于H e b b i a n 学习算法,由K a w a t o 等提出口1 ) W + 1 = w 。+ “P D A 口血( 1 )其中:w 。是权值的新值,”。是权值的旧值,“,o 是P D 控制器的输出,4 是与权值有关的神经网络函数,_ 是学习率,出是计算机仿真的步长值在推导模型的能量时作出如下假设:1 ) 下肢模型简化成只有饺链连接的双钟摆模型;2 ) 臀关节简化成一个点,而且只沿水平方向运动;3 ) 粘滞摩擦由假肢关节吸收;4 ) 传动结构的时间常数相对于系统的其他部分可以忽路,故其动态性可忽略;5 ) 假肢各部分都视为刚体根据如图所示的假肢模型,推得大腿和小腿的质心位置用矢量表示如下:;1 一( z + s i n 0 1 ) i r l c o n 0 1 j ,( 2 )r 2 = ( z + L 1 s i n 0 1 - i - r 2 s i n 岛) i 一( 厶c o n 0 1 + r 2 C O n 0 2 ) j ( 3 )大腿和小腿的速度的平方为口= ( 王 + r 1 0 I c o n 0 1 ) 2 + ( n o l s i n 0 1 ) 2 ,( 4 )口b 2 = ( 西+ L l 口i c o n o l + r 2 0 2 c o n e 02 +( L 1 0s i n 0 1 + r 2 0 。s i n 0 :) 2 ( 5 )总能量由动能和势能两郝分组成,即 E = B + E 。=111 告m l 镌G l + 寺, 1 2 u 色2 + 吉,1 研+ o1 - 1 2 暖十m l g r l ( 1 一c o n 0 0 + m 2 9 ( L 1 ( 1 c o n 0 0 + 屯( 1 一c o n 0 0 ) ( 6 )其中,和,:是转动惯量总能量可表示成位置和速度的函数,其中势能总是非负则总能量对于所有岛和以非负大腿的参数以及权值由z 一和以决定,假定z 一l 】6 02 0 0 5 中国控制与决策学术年会论文集和0 。对时间的导数为零,则总能量可表示为11-1 E 一寺m 。r 御十音,1 2 L f 四十J l 研+-oom l g r 】( 1 一c o n 1 ) + ”2 9 ( 工1 ( 1 c o n 0 1 ) + r 2 ( 1 一c o h O s ) ) ( 7 )由上式可得E 一“ 。鳄+ “ ,( 1 一c o n 0 1 ) + w ( 1 一c o n 8 2 ) ,( 8 )由此可得出关于大腿的神经网络参数函数为A 一0 ,B 一1 一c o r n 0 ,C = 1 一c o n 0 2 同理,小腿的神经网络参数函数可由下式得出:E w ,鹾+ ”0 ( 1 一c o n 0 】) + “ j ( 1 一c o n 0 2 ) ( 9 )4仿真研究本文仿真未考虑脚跟的碰撞以及在步态周期中假肢的储能的影响大腿和小腿分别用单独的神经网络( 两者为并联关系) 进行训练神经网络的输入包括位置给定值及其导数神经网络的权值由P D 控制的输出值来训练用正弦曲线作为期望轨迹,调整学习速率使权值的收敛速度大致相同,权值初值都定为o ,训练次数设为10 0 0 次P D 控制器参数根据系统的稳定 性要求( 这些值不是唯一的) 设为b = l O , n =2 5 ( 大腿) ;b = 0 1 2 5 , D 一0 2 5 ( 小腿) 人体下肢模型中的各参数取值如下:m ,一3 7 2k g ,”:= 8 0 5k g ,L 】一0 4 3 5m ,L 2 ;0 4 1 2m ,1 1 = 0 0 6k g m 2 ,1 2 0 1 1k g m 2 如图4 所示,随着学习的进行,误差逐渐减小直至为零,经过训练的神经网络的结构将与系统的逆动力学模型一致在控制和学习过程中,当反馈控制器的输出为。时t 神经网络的学习暂告结束这时,圈4 蓐关节硼蜂误差神经网络控制器完全取代反馈控制器对系统实行控制直至对象或环境发生变化为止5结语本文对人体下肢模型的研究对于膝上假肢的设计以及各种情况的分析具有很大的价值反馈误差学习算法具有许多优点,例如神经网络的训练不是取自于事先决定的训练数据,而是使用误差信号;学习和控制可同时进行但它也有缺点,对于神经网络,期望轨迹及其一阶导数必须连续今后需要用实验来验证仿真结果,进一步改进控制算法参考文献( R e f e r e n c e s ) 1 P t i lKM 。C h a k r a b o r t yJK A n a l y s i so fan e wp o l y c e n t r i ca b o v e k n e ep r o s t h e s i sw i t hap n e u m a t i cs w
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号