基于人工神经网络BP算法的倒立摆控制研究.pdf

上传人:罗晋 文档编号:7208093 上传时间:2020-11-06 格式:PDF 页数:4 大小:334.01KB
返回 下载 相关 举报
基于人工神经网络BP算法的倒立摆控制研究.pdf_第1页
第1页 / 共4页
基于人工神经网络BP算法的倒立摆控制研究.pdf_第2页
第2页 / 共4页
基于人工神经网络BP算法的倒立摆控制研究.pdf_第3页
第3页 / 共4页
基于人工神经网络BP算法的倒立摆控制研究.pdf_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《基于人工神经网络BP算法的倒立摆控制研究.pdf》由会员分享,可在线阅读,更多相关《基于人工神经网络BP算法的倒立摆控制研究.pdf(4页珍藏版)》请在三一文库上搜索。

1、兵工自动化 测控技术 O. I. Automation 2003年第22卷第3期 Measurement Back Propagation algorithm; Inverted pendulum control 1 引言 倒 立 摆 装 置 被 公 认 为 自 动 控 制 理 论 中 的 典 型实验设备,也是控制理论教学和科研中不可多 得的典型物理模型。倒立摆本身是一个自然不稳 定体,在控制过程中能有效地反映控制中的许多 关键问题,如非线性问题、系统的鲁棒性问题、 跟踪问题及镇定性问题等。其最终的控制目标是 使倒立摆这样一个不稳定的被控对象,通过引入 适当的控制方式使之成一个稳定的系统。 一

2、般情况下, 模糊逻辑控制算法的模糊控制 规则在多变量输入下计算繁琐,实现困难。与之 相比,人工神经网络(ANN:Artificial Neural Networks)中的前馈网络的误差反传(BP:Back Propagation)算法,在多变量输入情况下具有 精度高、实现快、算法简单、鲁棒性好等优点, 从而满足了系统的要求。 2 人工神经网络BP算法结构 人工神经网络(ANN)是由大量简单单元以 及 这 些 单 元 的 分 层 组 织 大 规 模 并 行 联 结 而 成 的 一种网络,它力图象一般生物神经系统一样处理 事物,实现人脑的某些功能。人工神经网络可以 忽略过程或系统的具体物理参数,根

3、据系统的运 行或实验数据,建立输入和输出状态之间的非线 性映射关系。 半个多世纪以来, 它在非线性系统、 优化组合、模式识别等领域得到了广泛应用。 前 馈 网 络的误差反传(BP)算法具有很强 的非线性映射能力,理论早已证明:具有偏差和 收 稿 日 期 :2002-12-22; 修 回 日 期 :2003-02-17 作者简介:于秀芬(1979- ) ,女 ,山东人,南京航空航天大学在读硕士,2001年毕业于山东 轻 工 业 学 院 , 从 事 计 算 机 控 制 、 机 器 人 视 觉 伺 服 控 制 、 图 像 处 理 研 究 。 兵工自动化 测控技术 O. I. Automation 2

4、003年第22卷第3期 Measurement & Control Technique 2003, Vol. 22, No. 3 42 至少一个S型隐含层加上一个线性输出的网络, 能够逼近任意有理函数,从而在多变量、非线性 系统中具有显著的优势。特别是20世纪80年代 以来,人们应用BP算法对小规模相似模式的识 别进行了大量的研究。 人工神经网络BP算法网络模型一般由三个 层次组成:最上层为输出层,中间层为隐含层, 最下层为输入层。各个层次之间的神经元相互连 接,同一层内的各个神经元互不连接。图1给出 了BP网络结构示意图。 y2yM x1x2xN y1 图1 BP网络结构示意图 BP算法主要

5、由信息信号的正向传播和误差 信号的反向传播两部分组成。在信息信号的正向 传播过程中,输入信息信号从输入端经隐含层逐 层计算传向输出层,每一层神经元的状态只影响 下一层神经元的状态。若在输出层没有得到所期 望的输出,则计算输出层的误差变化值,然后再 转向反向传播,通过网络将误差信号沿着原来的 连接通路反传回来,修改各层神经元的权值以使 神经网络具有自学习能力,直至达到所期望的目 标值。图2给出了BP算法的流程图。 权值初始化 输入样本X 并计算各输出 计算输出误差 选择步幅 修正输出层权值 修正隐含层权值 训练集中是否还有 未曾学习过的样本 E0 EEmax 结束 N N 图2 BP算法的流程图

6、 Y Y 3 倒立摆装置控制原理 一倒立摆小车系统如图3所示, 它由质量为 M的小车,长为2L的倒立摆构成,倒立摆质量 为m,铰链在小车上。小车在控制函数作用下, 沿滑轨在x方向运动,使倒立摆在垂直平面内稳 定。 2L m M X 图3 倒立摆结构原理简图 为简单起见,设倒立摆为均匀细杆,执行机 构和轴无摩擦。此时,系统的动力学非线性微分 方程为: x & & )cos1 (mM ug/xf2singsinLm 2 4 3 8 3 + +& & &3/4L (gsin- x & & cos) 其 中 ,M1kg,m0.1kg,L1m,f 50N/s,g9.81m/s2 控制目标是使倒立摆稳定在

7、铅直位置附近。 考虑系统的物理结构特点,控制目标也可表示为 0,0,&0。并约定,启动时刻小车位 置为零。以此为参照,在初始位置右侧小车位移 为正,在初始位置左侧小车位移为负。摆杆在铅 垂线右侧偏角为正,在铅垂线左侧偏角为负。在 这里利用设计的BP网络取代状态反馈控制使倒 立摆系统稳定。 4 实验仿真训练研究 在进行BP网络设计前,一般从网络层数、 每层神经元数、初 始值、以及学习方法等方面来 考虑。增加层数主要可以进一步降低误差,提高 精度,但同时使网络复杂化。而增加隐含层的神 经元数也可提高误差精度,且训练效果更易观察 和调整。初始值对于学习是否达到局部最小、是 否能够收敛以及训练时间的长

8、短关系很大。一般 总是希望经过初始化加权后的每个神经元的输出 值都接近于零,这样可以保证每个神经元的权值 都能够在它们的S型激活函数变化最大之处进行 调节。学习速率决定每次训练中所产生的权值变 化量。一般情况下,选取较小值以保证系统的稳 定性,学习速率的选取范围在0.010.8之间。比 较合适的方法是采用变化的自适应学习速率。 兵工自动化 测控技术 O. I. Automation 2003年第22卷第3期 Measurement & Control Technique 2003, Vol. 22, No. 3 43 4.1 倒立摆的BP网络结构 取激励函数为sigmoid函数,对BP算法按

9、照最陡下降法进行推导。设输入样本为x,输入 神经元有N个;隐含层有K个神经元;输出层 有M个神经元。假设对于训练样本p,定义误差 函数为: = = 1M 0i 2 pip E i0, 1, , M-1 其中:pi(dpiypi) 是神经网络总输出矢 量Y理想值与实际值之间的误差;dpi是各个分 量的理想值;ypiopi(3) 是这些分量的实际值。 改变网络中的各个加权系数wij(l),使Ep尽 可 能 减 小 。 采 用 最 陡 下 降 法 修 改 权 值 , 即 由 公 式 j j w k(J )k(w ) 、j0, 1、0导出(针对 于编号为p的训练样本)各加权系数的调整量 pwij(k)

10、 的计算公式为: )l ( ij p )l ( ijp w E w = i0, 1, , Q-1;j0, 1, , L;l1, 2, 3 )l ( ij ) l( Pi )l ( Pi p )l ( ij p w I I E w E = 经推导最后得到系数调整量为: )1l ( Pj ) l ( Pi ) l( ijP ow = 其中:Opj(l -1) 可直接从神经网络中得到,而 pi(l)不能直接得到。 为保证权重系数的收敛性, 学习的初期阶段 可选得大一些,从而使学习的速度加快,而在 接近最佳点的时候必须很小。 此处采用 “惯性” 调整算法: )t (w)t (o )t (w 1k )

11、l ( ijk )1l ( Pjk ) l ( Pi ) l ( ijP += 式中:t0, t1, , tk-1, tk, 表示学习的时序 编号。 为求得 ) l ( Pi ,可用复合函数的微分法得到: ) l ( Pi - ) l( Pi P I E - ) l ( Pi ) l ( Pi ) l ( Pi p I o o E ) l ( Pi ) l ( Pi I o I f ) l ( Pis 最后得到三层BP神经网络中所有权重系数 调整量的计算公式: 当l=3时: pwpi(3)2(dpi-Opi(3)Opi(3)(1-Opi(3)Opi(2) i0, 1, , M-1;j0, 1,

12、 , K 当l=2时: )1( Pj )2( Pi )2( Pi )3( ki 1M 0K )3( PK )2( ijP o)o1(oww= = i0, 1, , K-1;j0, 1, , J 当l1时: )0( Pj )1( Pi )1( Pi )2( ki 1K 0K )2( PK )1( ijP o )o1(oww= = i0, 1, , J-1;j0, 1, , N 注意:Opi(2)rpi; i0, 1, , M-1; Opi(0) xpj;j0, 1, , N 这一算法的计算过程是首先计算第三层(即 输出层)的各项“误差分量”pi(3),然后用pi(3) 计算第二层(隐含层)的“等

13、效误差分量”pi(2), 最后再用pi(2) 计算第一层(输入层)的“等效 误差分量”pi(1)。只要算出这些误差分量,系数 调整量即可立即求得。 现设计4输入3层BP神经网络, 输入层分 别为小车位移x,小车速度 x & ,摆杆偏离铅垂线 的角度、角速度&。中间层单元数为16个; 输出层设为一个输出单元,即外作用控制力u。 输入层、 隐含层、 输出层分别采用tansig、logsig、 purelin函 数 。 利 用 高 性 能 数 值 计 算 软 件 MATLAB 6.5对小车系统BP神经网络模型进行 学习训练。 训练样本数的多少对训练结果有很大影响。 样本数越多,网络训练结果越精确,但

14、运行时间 增长,计算成本也增高,所以合理选择样本数据 非常重要。根据实际需要,设定精度误差指标为 0.0001。经过试探训练样本数为50时结果较为 合理,此时样本数据能够反映系统的基本特征, 可以得到预期的仿真结果。 4.2 倒立摆BP网络训练结果 图4(a) 给出了倒立摆小车位移x仿真曲线, 图4(b) 给出了倒立摆小车摆杆偏离铅垂线的角 度仿真曲线,图4(c) 给出了倒立摆小车外作 用控制力u仿真曲线。图中的实线表示基于BP 算法的仿真曲线;虚线表示采用模糊控制所得到 的控制曲线。 兵工自动化 测控技术 O. I. Automation 2003年第22卷第3期 Measurement &

15、 Control Technique 2003, Vol. 22, No. 3 44 0 5 10 15 20 25 30 (a) 0.3 0.2 0.1 0 x(m) t(s) 0 2 4 6 8 10 (b) 0.08 0.06 0.04 0.02 0 -0.02 -0.04 -0.06 (rad) t(s) 0 2 4 6 8 10 (c) t(s) 16 12 8 4 0 -4 u(N) 图4 基于BP算法的倒立摆小车仿真曲线 实验仿真结果表明:与模糊逻辑控制算法相 比,BP算法精度高、实现快、鲁棒性好,倒立 摆小车在BP算法下只需4s左右就可以达到所设 定精度的稳定效果,从而满足了系

16、统的要求。而 模 糊 逻 辑 控 制 算 法 的 模 糊 控 制 规 则 在 多 变 量 输 入下计算繁琐,实现相当困难。 5 结论 通过对人工神经网络BP算法网络模型理论 分析,进行了倒立摆小车BP算法以及模糊逻辑 算法的控制系统仿真实验。仿真中未采用传统的 对系统线性化的方法,消除了由此引起的误差。 表明该BP算法收敛性好、计算量小,尤其在非 线性和鲁棒控制等领域具有良好的应用前景。 参考文献: 1 闻新, 等. MATLAB神经网络应用设计M. 北京: 科学出版社, 2001. 2 左洪福, 吴振锋, 杨忠. 双BP神经网络在磨损颗粒 自 动 识 别 中 的 应 用J. 航 空 学 报,

17、 2000, (7): 372-375. 3 Wu Q, He S. Neural-Based Control and Stability of a Nonlinear, non-Autonomous, Base-Excited Inverted Pendulum System A. Proceedings of IEEE International Conference on Systems: Man and Cybernetics C. 2000. 2661-2666. 4 Wilkins CA, Sands WA. Comparison of a Back Propagation Art

18、ificial Neural Network Model with a Linear Regression Model for Personnel Selection R. San Diego, CA: Navy Personnel Research and Development Center, 1994. 摘登编号:1006-1576(2003)03-05;收稿日期:2002-09-09来稿摘登 PLC在磷酸生产过程自动化中的应用 朱广波,张元峰,王保京 (山东红日阿康化工股份有限公司,山东 临沂 276021) 摘要:磷酸生产过程自动监控系统由工控机和PLC组成,对生产过程全程控制和管理

19、。工控机通过监控 画面对PLC进行参数设置、设备启/ 停操作、串级调节算法,监视执行机构工作状态,接受参数后PLC执行 闭环控制。硬件使用电源模块、AO模块、CPU、编程器、外设端口和与PLC主机组网专用网络口。通过 Modsoft软件梯形图语言和语句表对PLC编程、程序管理,实现联机调试、在线程序维护。监控画面使用组 态软件Intouch7.0设计。计算机与PLC间采用Modbus Plus协议,监控画面采集使用DDE协议。 Application of PLC in Automatic Production Procedure of Phosphoric Acid ZHU Guang-bo

20、, ZHANG Yuan-feng, WANG Bao-jing (Shandong Hongri Acron Chemical Joint Stock Co. Ltd., Linyi 276021, China) Abstract: The automatic monitoring and control system for the phosphoric acid manufacture process consists of IPC and PLC, the whole process was controlled and supervised by this system. IPC g

21、ive reports for PLC through the monitoring of the displays, such as setting parameter, starting or stopping device, executing cascaded regulation algorithm, watching the work state of machine and so on, and the PLC executes closed-loop control after it accepts the parameters. The hardware is made up

22、 of power supply module, analog output module, CPU, programmable console, peripheral equipment port and the special network interface of PLC host computer. The software Modsoft performs the functions of programming ladders and managing programs, debugging and maintenance online. All sorts of monitor displays are designed with configuration software INTOUCH7.0. Modbus Plus protocol was applied in communication between IPC and PLC, DDE protocol used in data acquisition of the monitor display.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1