《机电工程》杂志,月刊( 详细... )

中国标准连续出版物号 ISSN 1001-4551 CN 33-1088/TH
主办单位浙江省机电集团有限公司
浙江大学
主编赵 群
副 主 编唐任仲、罗向阳(执行主编)
总 经 理罗向阳
出 版浙江《机电工程》杂志社有限公司
地 址杭州市上城区延安路95号浙江省机电集团大楼二楼211、212室
电话Tel+86-571-87041360、87239525
E-mailmeem_contribute@163.com
国外发行中国国际图书贸易总公司
订阅全国各地邮局   国外代号M3135
国内发行浙江省报刊发行局
邮发代号32-68
广告发布登记证:杭上市管广发G-001号

在线杂志

当前位置: 机电工程 >>在线杂志

基于遗传算法优化的深度强化学习-PI空气舵伺服系统控制策略

作者:洪子祺,许文波,吕晨,等 日期:2023-09-20/span> 浏览:309 查看PDF文档

基于遗传算法优化的深度强化学习-PI空气舵伺服
系统控制策略*
洪子祺1,许文波2*,吕晨1,欧阳权1,王志胜1

(1.南京航空航天大学 自动化学院,江苏 南京 210016;2.北京精密机电控制
设备研究所 航天伺服驱动与传动技术研究室,北京 100076)


摘要:针对传统比例积分控制难以选定控制性能更好参数的问题,以空气舵伺服系统为研究对象,提出了一种基于遗传算法优化的强化学习PI的控制方法。首先,建立了空气舵伺服系统的数学模型;然后,采用遗传算法优化了PI控制器的初始参数;采用深度确定性策略梯度算法对当前PI控制器进行了实时整定,从而实现了对空气舵伺服系统进行位置指令控制的功能;最后,在Simulink中通过仿真分析,对所采用的方法应用于空气舵伺服系统的效果进行了验证。研究结果表明:改进的算法在参数摄动时,具备一定的在线稳定性;在空载情况下,所需要的调节时间要小于遗传算法-PI、DDPG-PI与传统PI算法,至少缩短了20%;同时,在负载情况下,相比其他3种方法,改进算法的波动幅值与负载结束后回到稳态时间至少缩短了15%,证明了所使用方法在空气舵伺服系统里的有效性。

关键词:伺服系统;比例积分(PI)控制器;遗传算法;深度确定性策略梯度算法;参数优化;Simulink

中图分类号:TH-39;TJ765文献标识码:A文章编号:1001-4551(2023)07-1071-08

本文引用格式:

洪子祺,许文波,吕晨,等.基于遗传算法优化的深度强化学习-PI空气舵伺服系统控制策略[J].机电工程,2023,40(7):1071-1078.

HONG Zi-qi, XU Wen-bo, LV Chen, et al. Deep reinforcement learning-PI control strategy of air servo system based on genetic algorithm optimization[J].Journal of Mechanical & Electrical Engineering, 2023,40(7):1071-1078.





友情链接

浙江机械信息网