【模糊神经网络】基于模糊神经网络的倒立摆轨迹跟踪控制

admin • 2023-02-04 19:56 • 人工智能

临近春节没啥事做，突然想起前两年未完成的模糊神经网络，当时是学了一段时间，但是到最后矩阵求偏导那块始终不对，最后也不了了之了，趁最近有空，想重新回顾回顾，看看会不会产生新的想法。经过不断尝试后，竟然达到了想要的效果，所以简要记录一下留个笔记。以下内容只讲干货，不玩虚的。

0 引言

模糊神经网络结合了模糊控制与神经网络两者的优点，不仅具备对非线性、时变、模型不完全系统的控制，同时还具备很好的自学习和自适应能力。模糊神经网络主要用于模型控制以及函数逼近等领域。

1 倒立摆模型

被控对象为单级倒立摆，其动力学方程为

(

)

(

)

dot{x}_1=x_2 \ dot{x}_2=fleft( boldsymbol{x} right) +gleft( boldsymbol{x} right) u

$x ˙_{1} = x_{2} x ˙_{2} = f (x) + g (x) u$ 其中，

(

)

sin

⁡

−

cos

⁡

sin

⁡

(

)

(

−

cos

⁡

(

)

fleft( boldsymbol{x} right) =frac{gsin x_1-mlx_{2}^{2}cos x_1sin x_1/left( m_c+m right)}{lleft( 4/3-mcos ^2x_1/left( m_c+m right) right)}

$f (x) = \frac{g s i n x _{1} - m l x _{22} c o s x _{1} s i n x _{1} / ( m _{c} + m )}{l ( 4/3 - m c o s ^{2} x _{1} / ( m _{c} + m ) )}$ ；

(

)

cos

⁡

(

)

(

−

cos

⁡

(

)

gleft( boldsymbol{x} right) =frac{cos x_1/left( m_c+m right)}{lleft( 4/3-mcos ^2x_1/left( m_c+m right) right)}

$g (x) = \frac{c o s x _{1} / ( m _{c} + m )}{l ( 4/3 - m c o s ^{2} x _{1} / ( m _{c} + m ) )}$ ，

x_1

$x_{1}$ 和

x_2

$x_{2}$ 分别为摆角和摆速，

$g$ 为重力加速度，

m_c

$m_{c}$ 为小车质量，

$m$ 摆的质量，

$l$ 为摆长的一半，

$u$ 为控制输入。

2 控制器设计

2.1 模糊神经网络结构

第一层：输入层。输入层为双输入，分别为系统偏差

$e$ 和系统偏差变化率

dot{e}

$e ˙$ ，然后通过激活函数

(

)

f_1left( x right)

$f_{1} (x)$ 输出到模糊化层。

(

)

f_1left( x_i right) =x_i

$f_{1} (x_{i}) = x_{i}$ 第二层：模糊化层。本层的激活函数即隶属函数，采用逼近能力较好的高斯函数

(

)

exp

⁡

[

−

(

−

)

]

f_2left( i,j right) =exp left[ -frac{left( x_i-c_{ij} right) ^2}{2sigma _{ij}^{2}} right]

$f_{2} (i, j) = exp [- \frac{( x _{i} - c _{ij} ) ^{2}}{2 σ _{ij 2}}]$ 其中，

；

i=1,2；j=1,2,...n；

$i = 1, 2 ； j = 1, 2, ... n ；$

c_{ij}

$c_{ij}$ 和

sigma _{ij}

$σ_{ij}$ 分别为高斯函数的中心和基宽。
第三层：模糊推理层。本层使用的激活函数为

(

)

∏

(

)

(

)

(

)

∑

(

)

varphi left( j right) =prod_{j=1}^N{f_2left( i,j right)} \ f_3left( j right) =frac{varphi left( j right)}{sum_{j=1}^N{varphi left( j right)}}

$φ (j) = j = 1 \prod N f_{2} (i, j) f_{3} (j) = \frac{φ ( j )}{\sum _{j = 1 N} φ ( j )}$ 其中，

∏

N=prod_{i=1}^n{n_i}

$N = \prod_{i = 1 n} n_{i}$ ，为神经元和。
第四层：输出层。本层主要是输出模型控制量

$u$ 。

(

)

⋅

∑

(

)

⋅

(

)

f_4left( i right) =boldsymbol{omega }cdot f_3=sum_{j=1}^N{boldsymbol{w}left( i,j right) cdot f_3left( j right)}

$f_{4} (i) = ω \cdot f_{3} = j = 1 \sum N w (i, j) \cdot f_{3} (j)$ 其中，

boldsymbol{omega }

$ω$ 为模糊推理层与输出层的连接权矩阵。

2.2 模糊神经网络的训练算法

LM算法结合高斯牛顿算法和梯度下降法，兼具局部收敛法和全局搜索的优点。但是，由于LM算法的计算复杂度和存储容量会随着训练样本数目的增加而增加，为了解决该问题，利用IALM算法优化所有的参数。参数向量

(

)

boldsymbol{varTheta }left( t right)

$Θ (t)$ 的更新规则如下：

(

)

(

)

−

(

)

(

)

−

(

)

boldsymbol{varTheta }left( t+1 right) =boldsymbol{varTheta }left( t right) -left( boldsymbol{varPsi }left( t right) +eta left( t right) boldsymbol{I} right) ^{-1}boldsymbol{varOmega }left( t right)

$Θ (t + 1) = Θ (t) - (Ψ (t) + η (t) I)^{- 1} Ω (t)$ 其中，

(

)

[

(

)

(

)

(

)

]

boldsymbol{varTheta }left( t right) =left[ boldsymbol{omega }left( t right) , boldsymbol{c}left( t right) , boldsymbol{sigma }left( t right) right] ^{mathrm{T}}

$Θ (t) = [ω (t), c (t), σ (t)]^{T}$ 为参数向量，

boldsymbol{I}

$I$ 为用于矩阵求逆时避免奇异的单位矩阵，

(

)

boldsymbol{varPsi }left( t right)

$Ψ (t)$ 为准海森(quasi-Hessian)矩阵，

(

)

boldsymbol{varOmega }left( t right)

$Ω (t)$ 为梯度向量。自适应学习率

(

)

boldsymbol{eta }left( t right)

$η (t)$ 的调整规则如下：

(

)

∥

(

)

∥

(

−

)

∥

(

)

∥

boldsymbol{eta }left( t right) =beta _mleft| boldsymbol{e}left( t right) right| +left( 1-beta _m right) left| boldsymbol{varOmega }left( t right) right|

$η (t) = β_{m} ∥ e (t) ∥ + (1 - β_{m}) ∥ Ω (t) ∥$ 其中，

(

)

beta _mleft( 0<beta _m<1 right)

$β_{m} (0 < β_{m} < 1)$ 为预设的常量，

(

)

boldsymbol{varPsi }left( t right)

$Ψ (t)$ 和

(

)

boldsymbol{varOmega }left( t right)

$Ω (t)$ 分别为所有样本的子矩阵

(

)

boldsymbol{psi }_pleft( t right)

$ψ_{p} (t)$ 和子向量

(

)

boldsymbol{omega }_pleft( t right)

$ω_{p} (t)$ 的累加，即

(

)

∑

(

)

(

)

∑

(

)

boldsymbol{varPsi }left( t right) =sum_{p=1}^P{boldsymbol{psi }_pleft( t right)} \ boldsymbol{varOmega }left( t right) =sum_{p=1}^P{boldsymbol{omega }_pleft( t right)}

$Ψ (t) = p = 1 \sum P ψ_{p} (t) Ω (t) = p = 1 \sum P ω_{p} (t)$ 其中，子矩阵

(

)

boldsymbol{psi }_pleft( t right)

$ψ_{p} (t)$ 和子向量

(

)

boldsymbol{omega }_pleft( t right)

$ω_{p} (t)$ 分别定义为

(

)

(

)

(

)

(

)

(

)

(

)

boldsymbol{psi }_pleft( t right) =dot{J}_{p}^{mathrm{T}}left( t right) dot{J}_Pleft( t right) \ boldsymbol{varOmega }left( t right) =dot{J}_{p}^{mathrm{T}}left( t right) e_Pleft( t right)

$ψ_{p} (t) = J ˙_{p T} (t) J ˙_{P} (t) Ω (t) = J ˙_{p T} (t) e_{P} (t)$ 其中，

(

)

e_Pleft( t right)

$e_{P} (t)$ 为对于第

$p$ 个样本，期望输出和网络实际输出之间的误差

(

)

(

)

−

(

)

e_Pleft( t right) =y_{d}^{p}left( t right) -y^pleft( t right) , p=1,2,...P

$e_{P} (t) = y_{d p} (t) - y^{p} (t), p = 1, 2, ... P$ ，

(

)

dot{J}_pleft( t right)

$J ˙_{p} (t)$ 为

mathrm{Jacobian}

$Jacobian$ 矩阵的行向量，即

(

)

[

∂

]

dot{J}_pleft( t right) =left[ frac{partial e_p}{partial w_1},...,frac{partial e_p}{partial w_r},frac{partial e_p}{partial c_{11}},...,frac{partial e_p}{partial c_{ij}},...,frac{partial e_p}{partial c_{nr}},frac{partial e_p}{partial sigma _{11}},...,frac{partial e_p}{partial sigma _{ij}},...,frac{partial e_p}{partial sigma _{nr}} right]

$J ˙_{p} (t) = [\frac{\partial e _{p}}{\partial w _{1}}, ..., \frac{\partial e _{p}}{\partial w _{r}}, \frac{\partial e _{p}}{\partial c _{11}}, ..., \frac{\partial e _{p}}{\partial c _{ij}}, ..., \frac{\partial e _{p}}{\partial c _{n r}}, \frac{\partial e _{p}}{\partial σ _{11}}, ..., \frac{\partial e _{p}}{\partial σ _{ij}}, ..., \frac{\partial e _{p}}{\partial σ _{n r}}]$ 根据梯度下降学习算法的更新规则，

mathrm{Jacobian}

$Jacobian$ 矩阵行向量的元素可表示为

∂

(

)

∂

(

)

−

(

)

∂

(

)

∂

(

)

−

(

)

∑

≠

(

)

(

∑

(

)

∏

≠

(

)

∂

(

)

∂

(

)

∂

(

)

∂

(

)

−

(

)

∑

≠

(

)

(

∑

(

)

∏

≠

(

)

∂

(

)

∂

(

)

frac{partial e_pleft( t right)}{partial w_jleft( t right)}=-h_jleft( t right) \ frac{partial e_pleft( t right)}{partial c_{ij}left( t right)}=-w_jleft( t right) frac{sum_{kne j}^r{varphi _kleft( t right)}}{left( sum_{k=1}^r{varphi _kleft( t right)} right) ^2}prod_{kne i}^n{mu _{kj}left( t right) frac{partial mu _{ij}left( t right)}{partial c_{ij}left( t right)}} \ frac{partial e_pleft( t right)}{partial sigma _{ij}left( t right)}=-w_jleft( t right) frac{sum_{kne j}^r{varphi _kleft( t right)}}{left( sum_{k=1}^r{varphi _kleft( t right)} right) ^2}prod_{kne i}^n{mu _{kj}left( t right) frac{partial mu _{ij}left( t right)}{partial sigma _{ij}left( t right)}}

$\frac{\partial e _{p} ( t )}{\partial w _{j} ( t )} = - h_{j} (t) \frac{\partial e _{p} ( t )}{\partial c _{ij} ( t )} = - w_{j} (t) \frac{\sum _{k \neq = j r} φ _{k} ( t )}{( \sum _{k = 1 r} φ _{k} ( t ) ) ^{2}} k \neq = i \prod n μ_{kj} (t) \frac{\partial μ _{ij} ( t )}{\partial c _{ij} ( t )} \frac{\partial e _{p} ( t )}{\partial σ _{ij} ( t )} = - w_{j} (t) \frac{\sum _{k \neq = j r} φ _{k} ( t )}{( \sum _{k = 1 r} φ _{k} ( t ) ) ^{2}} k \neq = i \prod n μ_{kj} (t) \frac{\partial μ _{ij} ( t )}{\partial σ _{ij} ( t )}$ 其中，

∂

(

)

∂

(

)

(

)

−

(

)

exp

⁡

(

−

(

)

−

(

)

(

)

(

)

∂

(

)

∂

(

)

(

)

−

(

)

exp

⁡

(

−

(

)

−

(

)

(

)

(

)

frac{partial mu _{ij}left( t right)}{partial c_{ij}left( t right)}=frac{2left( x_ileft( t right) -c_{ij}left( t right) right) exp left( -left( x_ileft( t right) -c_{ij}left( t right) right) ^2/sigma _{ij}^{2}left( t right) right)}{sigma _{ij}^{2}left( t right)} \ frac{partial mu _{ij}left( t right)}{partial sigma _{ij}left( t right)}=frac{2left( x_ileft( t right) -c_{ij}left( t right) right) ^2exp left( -left( x_ileft( t right) -c_{ij}left( t right) right) ^2/sigma _{ij}^{2}left( t right) right)}{sigma _{ij}^{3}left( t right)}

$\frac{\partial μ _{ij} ( t )}{\partial c _{ij} ( t )} = \frac{2 ( x _{i} ( t ) - c _{ij} ( t ) ) exp ( - ( x _{i} ( t ) - c _{ij} ( t ) ) ^{2} / σ _{ij 2} ( t ) )}{σ _{ij 2} ( t )} \frac{\partial μ _{ij} ( t )}{\partial σ _{ij} ( t )} = \frac{2 ( x _{i} ( t ) - c _{ij} ( t ) ) ^{2} exp ( - ( x _{i} ( t ) - c _{ij} ( t ) ) ^{2} / σ _{ij 2} ( t ) )}{σ _{ij 3} ( t )}$ 至此，就是IALM算法的所有公式，根据以上步骤，便可编写出模糊神经网络各层的程序以及参数向量的学习算法，控制器程序也就得到了。
IALM算法相比LM算法来说，可以直接计算准海森矩阵

(

)

boldsymbol{varPsi }left( t right)

$Ψ (t)$ 和梯度向量

(

)

boldsymbol{varOmega }left( t right)

$Ω (t)$ ，不需要执行

mathrm{Jacobian}

$Jacobian$ 矩阵的乘法，从而降低了算法计算复杂度，并且自适应学习率

(

)

boldsymbol{eta }left( t right)

$η (t)$ 也有助于加快学习速度和提高泛化能力。

3 模型搭建与仿真

仿真目的：使用模糊神经网络控制器控制倒立摆完成轨迹跟踪运动。
在Simulink中搭建如下图所示的系统模型：

参数设置：取

x_1=theta

$x_{1} = θ$ ，期望轨迹为

(

)

0.1

sin

⁡

(

)

theta _{mathrm{d}}left( t right) =0.1sin left( t right)

$θ_{d} (t) = 0.1 sin (t)$ ，系统的初始状态为

[

]

left[ pi /60, 0 right]

$[π /60, 0]$ ，网络初始权值取随机值，宽度取2，中心取-2至2 。模糊神经网络控制器的输入为误差和误差变化率，输出为控制量。

仿真结果
角度跟踪效果

角度跟踪误差

仿真分析
根据仿真结果可得，角度跟踪效果良好，角度跟踪误差在1e-2数量级，较好的完成轨迹跟踪的目的，因此可得，模糊神经网络控制器设计成功。

4 总结

模糊神经网络控制器的仿真程序比较复杂，涉及到很多数学运算，尤其是矩阵运算以及各种函数求导，在编写代码的时候要特别注意矩阵的维度问题。
回想前两年学习的过程，我突然想到最开始我想用李雅普诺夫稳定性来更新神经网络权值，但最后始终有一个矩阵求偏导问题解决不了，而这次我用的梯度下降法来更新神经网络，各个矩阵求导公式也比较清晰，所以能够完成复现。
模糊神经网络仿真初见成效，也算是解决了历史遗留问题，心里舒服多了。

5 参考文献

[1] 周红标,张钰,柏小颖,等. 基于自适应模糊神经网络的非线性系统模型预测控制[J]. 化工学报,2020,71(7):3201-3212. DOI:10.11949/0438-1157.20191531.

[2] 陶征勇,童仲志,侯远龙,等. 基于模糊神经网络的破障武器PID控制[J]. 电光与控制,2020,27(9):99-104. DOI:10.3969/j.issn.1671-637X.2020.09.020.

[3] 张璐,张嘉成,韩红桂,等. 基于模糊神经网络的污水处理生化除磷过程控制[J]. 化工学报,2020,71(3):1217-1225. DOI:10.11949/0438-1157.20191514.

[4] 徐智浩,李胜,张瑞雷,等. 基于LuGre摩擦模型的机械臂模糊神经网络控制[J]. 控制与决策,2014(6):1097-1102. DOI:10.13195/j.kzyjc.2013.0510.

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。

THE END

轨迹跟踪控制

二维码

41 锚框【动手学深度学习v2】】

< <上一篇

)">

国电投-光伏电站人工智能运维大数据处理分析比赛(记录)

下一篇>>

搜索内容

【模糊神经网络】基于模糊神经网络的倒立摆轨迹跟踪控制

0 引言

1 倒立摆模型

2 控制器设计

2.1 模糊神经网络结构

2.2 模糊神经网络的训练算法

3 模型搭建与仿真

4 总结

5 参考文献

最新文章

分类

标签云