HI,欢迎来到好期刊网,发表咨询:400-888-9411 订阅咨询:400-888-1571证券代码(211862)

基于异步优势执行器评价器学习的自适应PID控制设计

摘要:针对已有自适应PID控制器收敛速度慢和计算效率低的不足,基于异步优势行动者评论家(Asynchronous Advantage Actor-Critic,A3C)算法设计了一种新的自适应PID控制器.该控制器利用A3C结构的多线程异步学习特性,并行训练多个行动者评论家(Actor-Critic,AC)结构的智能体,每个智能体采用多层前馈神经网络逼近策略函数和值函数实现在连续动作空间中搜索最优的参数整定策略,以达到最佳的控制效果.算法在提高计算效率的同时降低了学习样本的相关性.在仿真实验中通过与已有的多种自适应PID控制器性能的对比分析说明,该方法具有收敛速度快、自适应能力强的特点.

关键词:
  • 深度强化学习  
  • 异步优势执行器评价器  
  • 自适应pid控制  
作者:
孙歧峰; 任辉; 段友祥
单位:
中国石油大学(华东)计算机与通信工程学院; 山东青岛266580
刊名:
信息与控制

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:信息与控制

信息与控制杂志紧跟学术前沿,紧贴读者,国内刊号为:21-1138/TP。坚持指导性与实用性相结合的原则,创办于1972年,杂志在全国同类期刊中发行数量名列前茅。