時間:2006-11-15 15:10:00來源:shenyan
引入反饋控制增強了系統(tǒng)的抗干擾性能,提高了系統(tǒng)的魯棒性,從而保證每次學習時都能跟蹤補償誤差。
2.2 神經網絡辨識器設計
機器人非線性自回歸滑動平均模型(NARMAX模型)的一般形式為
y(t)=f(y(t-1),y(t-2),…,y(t-n);u(t-1),u(t-2),…,u(t-m))
其中,u(t)和y(t)分別是系統(tǒng)的輸入和輸出向量;m和n為輸入和輸出的最大時延。f為未知的輸入輸出非線性函數。將上式簡記為y(t)=f(I(t-1)),其中,I(t-1)=[y(t-1)[SUP]T[/SUP],…,Y(t-n),…,u(t-1)[SUP]T[/SUP],…,u(t-m)[SUP]T[/SUP]]∈R[SUP]nq+mp[/SUP]
則三層神經網絡結構的BP神經網絡辨識模型可以表示為
其中,W代表網絡的權值,N代表神經網絡輸入輸出映射函數,神經網絡的輸入為I(t)∈R[SUP]nq+mp[/SUP],網絡的輸出為
,它由N[SUB]0[/SUB]個輸出神經元構成,可以確定該神經網絡輸出層神經元的個數為N[SUB]0[/SUB]=q。
對于確定的神經網絡結構,對其進行訓練和學習,找到滿足要求的權值參數,使給定的目標函數最優(yōu)。通常,找到最優(yōu)權值比較困難,只能找到真實函數的一個近似。為此,給定一個逼近精度ε>0,只要找到權值W*使得網絡輸出與期望輸出的誤差小于ε,便認為網絡模型y(t+1)=N(I(t),W*)是對未知函數的一個逼近。假設神經網絡的辨識誤差是
當此神經網絡經過訓練后,獲得最優(yōu)權值(W*)時滿足
‖f(I(t))-N(I(t),W*)‖=‖e[SUB]n[/SUB](t+1)‖≤ε,
,D為R[SUP]nq+mp[/SUP]上的一個集合。
至此,我們得到了逼近機器人系統(tǒng)的神經網絡模型,將神經網絡的訓練與學習控制結合起來,在第次迭代學習的過程中,使神經網絡學習一定的次數以逼近機器人系統(tǒng)模型。通常以誤差準則
來作為網絡模型逼近機器人系統(tǒng)的標準。g(·)是e(t)的函數,e是定義在[0,r]上的誤差函數,是網絡模型與實際系統(tǒng)的偏差,是網絡模型參數(通常表現(xiàn)為權值)的非線性函數,于是,辨識問題歸結為非線性優(yōu)化問題。神經網絡具有處理非線性優(yōu)化問題的能力,且能并行處理信息,速度較快,因此,在神經網絡辨識中采用這種誤差準則。
采用BP算法修整神經網絡的權值和閾值,使誤差性能函數
最小,其中k代表迭代學習的次數,
和
代表實際輸出和網絡模型的輸出,T為神經網絡采樣時間。采用梯度下降法遞推和修正權值
其中β為學習因子,也就是按梯度法搜索的步長,當其取值大時,學習速度就快,但容易引起權值震蕩甚至發(fā)散,其取值小時,網絡訓練的時間長,學習速度較慢。α為動量因子,它的大小決定過去權值變化對目前值的影響程度,其作用為記憶上次連接權值的變化方向,抑制系統(tǒng)可能產生的振蕩,起平滑的作用。選擇適當的動量因子,可以降低反傳算法對誤差表面的靈敏度,使網絡避免陷入局部最小點,一般選在0.9左右。γ為網絡訓練次數。
在第k次重復試驗的過程中,權值
隨γ的增加朝最優(yōu)方向修整,使得辨識模型誤差逐漸減少,當達到給定的逼近精度時便可以結束訓練,得到最優(yōu)權值
,利用
計算得到網絡的輸出
,用此輸出構造第k+1次迭代學習的前饋作用,與實時反饋作用共同產生控制輸入
2.3機器人控制方案設計
完成神經網絡辨識器以及反饋控制器的設計后,引入迭代學習控制器,完成整個控制方案的設計。整個系統(tǒng)控制框圖如圖1。
[align=center]
圖1 控制系統(tǒng)結構框圖[/align]
迭代學習控制器采用簡單的P型結構,u[SUB]fb[/SUB]、u[SUB]ff [/SUB]分別是由反饋控制器和學習控制器確定的控制律,第k次迭代學習過程中,機器人的迭代學習控制律為
其中
為反饋控制項,k[SUB]p[/SUB]和k[SUB]d[/SUB]為正定的位置和速度增益矩
陣,
是系統(tǒng)的期望軌跡,
是第k次迭代學習過程
系統(tǒng)的實際輸出。
為學習控制項,k[SUB]ILC[/SUB]為學習增益矩
陣,
為第k次迭代學習過程神經網絡的輸出。
前面所用的學習律不能利用其它控制方法得到的先驗知識,對于新的期望軌跡必須重新開始學習,這種學習機制不符合人類的學習行為,這是迭代學習控制難以推廣的重要原因,有關文獻針對于此引入了遺忘因子。遺忘因子的引入抑制了迭代開始時跟蹤誤差的大幅度擺動,對要求跟蹤的新的期望軌跡先利用系統(tǒng)的歷史控制經驗,用神經網絡估計系統(tǒng)的期望輸入,作為迭代學習控制算法的初始控制輸入,再由迭代學習律逐步改善控制輸入,使得只需少數的迭代次數就能達到跟蹤精度的要求,大大提高了系統(tǒng)的學習速度,使所研究的控制方法更具有實用價值。為了實現(xiàn)對期望軌跡y[SUB]d[/SUB](t)的漸近跟蹤,采用改進的學習律:
式中γ為遺忘因子0≤γ≤1,e[SUB]k[/SUB](t)為跟蹤誤差,e[SUB]k[/SUB](t)=y[SUB]d[/SUB](t)-y[SUB]k[/SUB](t)
R(t)為有界學習增益矩陣,R(t)∈R[SUP]mxr[/SUP]
初始修正項γu0(t)可以避免迭代軌跡的大幅度擺動,從而可以加快迭代收斂速度。
3 機器人控制仿真
通過仿真分析機器人系統(tǒng)控制方案效果并與常規(guī)機器人PID控制進 行對比。由仿真結果可以看出,基于神經網絡的迭代學習控制收斂速度快、跟蹤精度高,超調小,具有良好的魯棒性和控制性能。
[align=center]
圖2 基于神經網絡模型辨識的迭代學習控制響應曲線
圖3 常規(guī)PID控制響應曲線[/align]
迭代學習控制響應曲線、常規(guī)PID 響應曲線分別如圖2、圖3所示。仿真曲線縱軸單位為弧度,橫軸單位為秒。
[align=center]
圖4 有干擾輸入無神經網絡辨識器作用響應曲線
圖5 有干擾輸入有神經網絡辨識器作用響應曲線
圖6 迭代學習控制跟蹤誤差輸出曲線[/align]
神經網絡辨識器給出了機器人較為精確的模型并消除系統(tǒng)不確定性和外部干擾的影響神經網絡辨識器作用響應曲線如圖4、圖5、圖6所示。
4 結語
先進的建模與控制技術應用到以機器人為代表的非線性、時變、強耦合對象中去已經成為智能控制方法研究的熱點。隨著智能控制方案的成熟發(fā)展,必將加快機器人的應用速度。當然,各種智能控制方案在機器人中的實際應用還需要很長的路要走。
標簽:
![]()
傳動網版權與免責聲明:凡本網注明[來源:傳動網]的所有文字、圖片、音視和視頻文件,版權均為傳動網(connectcrack.com)獨家所有。如需轉載請與0755-82949061聯(lián)系。任何媒體、網站或個人轉載使用時須注明來源“傳動網”,違反者本網將追究其法律責任。
本網轉載并注明其他來源的稿件,均來自互聯(lián)網或業(yè)內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。
產品新聞
更多>2025-10-09
2025-09-23
2025-09-23
2025-09-08
華為昇騰Atlas800iA2 910B服務器Deepsee...
2025-09-04
2025-09-03