基于强化学习的倒立摆平衡车控制系统simulink建模与仿真

news/2025/1/17 3:05:35/文章来源:https://www.cnblogs.com/51matlab/p/18339816

1.算法仿真效果

matlab2022a仿真结果如下(完整代码运行后无水印):

 

 

 

 

 

 

2.算法涉及理论知识概要

       基于强化学习的倒立摆平衡车控制系统是一个典型的动态系统控制问题,它通过不断的学习和决策过程,使倒立摆维持在垂直平衡位置,即使受到外力干扰或系统内部噪声影响。强化学习在此类问题中的应用,展示了其在解决复杂控制问题中的强大潜力。

 

2.1强化学习基础

       强化学习(Reinforcement Learning, RL)是一种通过与环境交互学习策略的机器学习方法,目的是最大化长期奖励。其核心要素包括状态(State, s)、动作(Action, a)、奖励(Reward, r)、策略(Policy, π)和环境(Environment)。在倒立摆平衡控制问题中:

 

状态 s:描述系统当前的配置,通常包括倒立摆的角度θ、角速度θ˙、小车的位置x和速度x˙。

动作 a:控制小车向左或向右施加的力,如-10N至10N的力。

奖励 r:每一步给予智能体的反馈,例如,当倒立摆保持平衡时给予正奖励(如+1),当倒立摆倒下或偏离预定范围时给予负奖励或终止。

策略 π:基于当前状态选择动作的策略,目标是找到最优策略π∗最大化期望累积奖励。

2.2 倒立摆模型

倒立摆系统可由以下二阶线性微分方程组描述其动力学特性:

 

 

 

其中,g是重力加速度,l是摆长,m是摆的质量,b是摩擦系数,u是小车对系统施加的控制力。

 

2.3 Q-Learning算法应用于倒立摆控制

      Q-Learning是一种无模型的强化学习算法,通过学习一个动作价值函数Q(s,a)来决定在给定状态下采取什么行动。该函数表示在状态s采取动作a后,预期能获得的累积奖励。Q-Learning的更新规则如下:

 

 

 

这里,α是学习率,γ是折扣因子,rt+1​是采取动作at​后立即获得的奖励,st+1​是下一个状态。

 

       由于倒立摆控制问题的维度较高,经典的Q-table可能不切实际,因此常采用DQN来解决。DQN使用深度神经网络近似Q函数,可以处理高维状态空间。其关键创新在于引入了经验回放(Experience Replay)和固定Q-targets,以减少关联性和提高学习稳定性。

 

       经验回放是指将智能体与环境交互的历史数据存储在经验池中,然后在更新网络参数时随机抽取一批样本来学习,这有助于打破数据之间的相关性,提高学习效率。固定Q-targets则是指在网络更新时,目标Q值基于一个较慢更新的网络来计算,避免了目标函数的剧烈波动。

 

3.MATLAB核心程序

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/776874.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[VS Code扩展]写一个代码片段管理插件(一):介绍与界面搭建

@目录VS Code扩展机制项目搭建创建UI元素活动栏按钮主边栏视图主边栏工具栏按钮侧边栏右键菜单编辑器右键菜单项目地址[VS Code扩展]写一个代码片段管理插件(一):介绍与界面搭建 [VS Code扩展]写一个代码片段管理插件(二):功能实现写代码的时候,经常要输入重复的内容,虽…

批量登录软件,聚合登录,同时支持:小红书,快手,B站,视频号,淘宝光合,公众号一键运营管理,降本增效。

在数字化时代,我们常常需要管理多个在线账号,这不仅增加了管理的复杂性,还可能导致效率的降低。为了帮助用户简化这一过程,我们推出了六款功能强大的聚合登录软件,涵盖了小红书、快手、B站、视频号、公众号和淘宝等平台。每款软件都具备登录管理多个账号的功能,助力用户更…

2560战法+选股指标+主图

2560战法+选股指标+主图 作者: 深海游鱼 QQ:396068801 日期:2024年8月 需要指标的朋友请加QQ交流。 买点1:冲量,量价金叉 买点2:做量,即日线回踩25日均线后反弹上穿25日均线,同时五日均量线<=60日均量线 卖点3:二次金叉

数据类型之面试题

1.整数拓展 二进制在数字前输入0b 以此类推2.浮点数拓展正常来说,c1和c2输出的小数都是0.1。那么c1就应该等于c2,但是java程序最后给到的却是错误。很明显c4要大于c3,但是java程序却给到正确。 由此得出结论:浮点数是有误差的,是一种约等于,并不精确 一定不要用浮点数进行…

代码随想录Day3

203.移除链表元素 给你一个链表的头节点 head 和一个整数 val ,请你删除链表中所有满足 Node.val == val 的节点,并返回 新的头节点 。 示例 1: 输入:head = [1,2,6,3,4,5,6], val = 6 输出:[1,2,3,4,5]示例 2: 输入:head = [], val = 1 输出:[]示例 3: 输入:head = …

利用开源可视化报表工具进入流程化办公!

低代码技术平台、开源可视化报表工具优势功能特点多,是提质高效的办公利器。很多客户朋友都希望能实现流程化办公,因为只有这样才能帮助企业顺利降本、增效、提质,利用好企业内部数据资源,打破信息孤岛壁垒,实现高效发展。低代码技术平台、开源可视化报表工具优势功能特点…

易优cms网站后台登陆验证码错误,如何不使用验证码登陆?或者如何修复?

可能几个问题1、目录及文件夹权限问题,所有者必须为WWW2、PHP版本问题,我一直用5.6从来没有问题,可以切换下试下3、空间是不是满了,我之前客户遇到这个问题,原来是空间满了,升级空间即可都排查下如果解决了,后期从后台关闭登录验证码,一了百了扫码添加技术【解决问题】…

错误内容:You have an error in your SQL syntax; check the manual that corresponds to your MySQL server

备份数据库时出的问题错误内容:You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near -1 at line 1解决方法:到参数设置那,把支持sql查询方式去掉扫码添加技术【解决问题】专注中小企业…

易优CMS模板目录各文件说明

一般网站模板默认统一保存在template目录下面的PC目录里面 template PC ---电脑端 mobie ---移动(app)端/PC 目录介绍 -/skin --目录为存放样式、JS、网站基础图片等。包括: --/css --样式.css文件目录 --/JS --JS动态文…

2024 AICAS Grand Challenge

2024 AICAS Grand Challenge 比赛 比赛介绍 这个比赛是AICAS(Artificial Intelligence Circuit and System)国际会议举办的挑战赛,旨在通过软硬件协同优化在倚天CPU上更快更准地运行QWEN大模型。 有兴趣的同学移步link:https://tianchi.aliyun.com/competition/entrance/5321…

织梦dedecms搭建网站虚拟主机(空间)可以运行吗?

虚拟主机(空间)可以运行DedeCMS吗?​答: 支持 php + MySQL 的虚拟主机(空间)可以安装、运行 DedeCMS 程序。推荐 Linux 主机,不推荐 “万能主机” 、“全能主机” 。扫码添加技术【解决问题】专注中小企业网站建设、网站安全12年。熟悉各种CMS,精通PHP+MYSQL、HTML5、C…