遺傳算法在神經(jīng)網(wǎng)絡(luò)控制中的應(yīng)用與實(shí)現(xiàn)
本文關(guān)鍵詞:遺傳算法在神經(jīng)網(wǎng)絡(luò)控制中的應(yīng)用與實(shí)現(xiàn),,由筆耕文化傳播整理發(fā)布。
第 13 卷第 5 期 2001 年 9 月
文章編號(hào) 1004-731X (2001) 05-0567-04
系 統(tǒng) 仿 真 學(xué) 報(bào) JOURNAL OF SYSTEM SIMULATION
Vol. 13 No. 5 Sept. 2001
遺傳算法在神經(jīng)網(wǎng)絡(luò)控制中的應(yīng)用與實(shí)現(xiàn)
楊國(guó)軍, 崔平
遠(yuǎn), 李琳琳
哈爾濱工業(yè)大學(xué)航天學(xué)院, 哈爾濱 150001
摘 要 比較了遺傳算法與神經(jīng)網(wǎng)絡(luò)的特點(diǎn) 并對(duì)將遺傳算法用于前向神經(jīng)網(wǎng)絡(luò)的可能性進(jìn)行了 研究 同時(shí)闡明了遺傳算法和神經(jīng)網(wǎng)絡(luò)結(jié)合的必要性 提出了一種融合遺傳算法的神經(jīng)網(wǎng)絡(luò)控制 方法 該方法采用多層前向神經(jīng)網(wǎng)絡(luò)作為遺傳搜索表示方式的思想 以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ) 用遺傳 算法來學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的權(quán)系數(shù) 既保留了遺傳算法的強(qiáng)全局隨機(jī)搜索能力 又具有神經(jīng)網(wǎng)絡(luò)的魯 棒性和自學(xué)習(xí)能力 將遺傳算法和神經(jīng)網(wǎng)絡(luò)相結(jié)合 分析了遺傳算法基本參數(shù)及神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 隱層和輸出層節(jié)點(diǎn)非線性函數(shù)的選擇 設(shè)計(jì)了用遺傳算法學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)權(quán)系數(shù)的軟件實(shí)現(xiàn)方法 成功地實(shí)現(xiàn)了機(jī)械手逆運(yùn)動(dòng)學(xué)求解問題及倒立擺的控制 仿真結(jié)果顯示了遺傳算法快速學(xué)習(xí)神經(jīng) 網(wǎng)絡(luò)權(quán)系數(shù)的能力 并且能夠有效抑制遺傳算法初期收斂的發(fā)生 有效地提高了多層前向神經(jīng)網(wǎng) 絡(luò)權(quán)系數(shù)的學(xué)習(xí)效率與收斂精度 確保了快速達(dá)到全局收斂 克服了多層前向神經(jīng)網(wǎng)絡(luò)傳統(tǒng)的 BP 學(xué)習(xí)算法精度 低 收斂速度慢 容易陷入局部極小的缺陷 表明了該方法的可行性與有效性 關(guān)鍵詞 遺傳算法 神經(jīng)網(wǎng)絡(luò) 非線性控制 適應(yīng)度函數(shù) 中圖分類號(hào) TP18
文獻(xiàn)標(biāo)識(shí)碼 A
Applying and Realizing of Genetic Algorithm in Neural Networks Control
YANG Guo-jun, CUI Ping-yuan, LI Lin-lin
(School of Astronautics, Harbin Institute of Technology, Harbin 150001, China)
Abstract: The characteristics of neural networks and genetic algorithm are described. The possibility and the method of the application of genetic algorithm to the multi-layer forward neural networks are discussed. The necessity of combining neural networks with genetic algorithm is demonstrated. A kind of neural networks control method is proposed in which genetic algorithm and neural networks are mixed. In this method, the notion of using the multi-layer forward neural networks as the representation method of the genetic searching technique is introduced, and the weighs of neural networks are trained by genetic algorithm. So the method remains the global stochastically searching ability of genetic algorithm and the robustness and self-learning ability of neural networks. After the neural networks with genetic algorithm are combined organically, the selection of the basic parameters in genetic algorithm and the structure of neural networks and the nodes of the hidden layer and the output layer are all analyzed. The software in which the weights of neural networks are learned by genetic algorithm is designed. The inverse kinematics solution of the robot manipulators and the inverted pendulum control are successfully realized by the combination of genetic algorithm and neural networks. The simulation results indicate the capability of the new method in fast learning of neural networks and guarantee a rapid global convergence. Moreover, the premature convergence in genetic algorithm is restrained effectively, and the learning efficiency and the convergent precision for the weights of the multi-layer forward neural networks are improved greatly. The motivation of this approach is to overcome the shortcomings of traditional error back propagation algorithm for updating the weights of the multi-layer forward neural networks, such as the low precision of the solutions, the slow search speed and easy convergence to the local minimum points. These results show the proposed method in this paper is feasible and effective. Keywords: genetic algorithm; neural networks; nonlinear control; fitness function
1
引言1
神經(jīng)網(wǎng)絡(luò) Neural Networks, NN 是一個(gè)具有高度非線
采用反向傳播 Back Propagation, BP 算法及其改進(jìn)算法來 學(xué)習(xí) BP 算法是沿梯度下降 平方誤差函數(shù) 來指導(dǎo)搜索 因而易陷入局部極小點(diǎn) 而且學(xué)習(xí)時(shí)間長(zhǎng) 甚至達(dá)不到學(xué)習(xí) 的目的 難以解決應(yīng)用問題的實(shí)例規(guī)模與網(wǎng)絡(luò)規(guī)模之間的矛 盾 求解精度不高 遺傳算法 Genetic Algorithm, GA 在一定程度上可以 克服 BP 算法的局限性 GA 是一種模擬自然選擇和遺傳機(jī) 制 在計(jì)算機(jī)上模擬生物進(jìn)化機(jī)制的自適應(yīng)概率性全局尋優(yōu) 搜索算法 是近些年發(fā)展起來的新型優(yōu)化算法 GA 在尋優(yōu) 過程中 是在高維可行解空間隨機(jī)產(chǎn)生多個(gè)起始點(diǎn)并同時(shí)開 始搜索 由適應(yīng)度函數(shù)來指導(dǎo)搜索方向 因而 搜索區(qū)域廣
性的超大規(guī)模連續(xù)時(shí)間自適應(yīng)信息處理系統(tǒng) 它的應(yīng)用已經(jīng) 滲透到各個(gè)領(lǐng)域 并在智能控制 非線性優(yōu)化 機(jī)器人控制 等領(lǐng)域取得了令人鼓舞的進(jìn)展
[1]
多層前向神經(jīng)網(wǎng)絡(luò)是一個(gè)
強(qiáng)有力的學(xué)習(xí)系統(tǒng) 系統(tǒng)結(jié)構(gòu)簡(jiǎn)單且易于編程 一個(gè)三層前 向網(wǎng)絡(luò)可以逼近任意非線性函數(shù) 以往神經(jīng)網(wǎng)絡(luò)的權(quán)系數(shù)常
收稿日期 2000-09-12 作者簡(jiǎn)介: 楊國(guó)軍(1970-) 男 制 神經(jīng)網(wǎng)絡(luò) 遺傳算法等
博士, 研究方向?yàn)闄C(jī)器人軌跡規(guī)劃及控
568
系
統(tǒng)
仿
真
學(xué)
報(bào)
2001 年 9 月
搜索效率高 GA 不需計(jì)算梯度 因而其目標(biāo)函數(shù)不受限制 不必要求目標(biāo)函數(shù)連續(xù)可微以及其它輔助信息 很強(qiáng)的魯棒性 可以廣泛應(yīng)用于工程技術(shù)中 本文對(duì) GA 在 NN 中的應(yīng)用的可行性進(jìn)行了分析 提 出了一種融合遺傳算法的神經(jīng)網(wǎng)絡(luò)控制方法 該方法兼有遺 傳算法的強(qiáng)全局隨機(jī)搜索能力及神經(jīng)網(wǎng)絡(luò)的魯棒性和自學(xué) 習(xí)能力 首先研究了 GA 實(shí)現(xiàn)中的一些問題 如編碼方式 適應(yīng)度函數(shù)的選擇及調(diào)整 遺傳操作的選擇等 設(shè)計(jì)了軟件 的實(shí)行方法 并對(duì)二自由度機(jī)械手逆運(yùn)動(dòng)學(xué)求解及倒立擺控 制做了仿真研究
[2]
2.2 GA 在 NN 學(xué)習(xí)中的應(yīng)用
利用 GA 設(shè)計(jì) NN 的關(guān)鍵問題是選擇待編碼的參數(shù) 確定網(wǎng)絡(luò)參數(shù)的編碼方案 選擇 GA 控制參數(shù) 選取適應(yīng)度 函數(shù)等 1 網(wǎng)絡(luò)待學(xué)習(xí)的參數(shù) 有許多參數(shù)需要確 針對(duì)一個(gè)具體問題設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)
上述特點(diǎn)
使 GA 成為一種全局性 并行性 快速性的優(yōu)化方法 具有
定 雖然用 GA 確定的參數(shù)越多 神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)的自動(dòng)化程 度越高 網(wǎng)絡(luò)的動(dòng)態(tài)性能也越好 但參數(shù)越多 參數(shù)的位串 則越長(zhǎng) 導(dǎo)致 GA 的搜索空間加大 搜索時(shí)間變長(zhǎng) 因此神 經(jīng)網(wǎng)絡(luò)中究竟有那些參數(shù)需要 GA 來學(xué)習(xí) 是一個(gè)需要考慮 的問題 為了保證這一方法能夠真正地投入工程應(yīng)用 應(yīng)該有 選擇地預(yù)先處理神經(jīng)網(wǎng)絡(luò)的部分參數(shù) 僅用 GA 確定其余參 數(shù) 本文根據(jù)先驗(yàn)知識(shí)確定神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu) 然后用 GA 去 學(xué)習(xí)網(wǎng)絡(luò)的權(quán)系數(shù) 2 編碼方式 常見的編碼方式主要包括二進(jìn)制編碼 實(shí)數(shù)值編碼 在二進(jìn)制編碼中 需要將二進(jìn)制數(shù)轉(zhuǎn)換成十進(jìn)制數(shù) 存在量 化誤差 降低了尋優(yōu)速度 而實(shí)數(shù)值編碼是對(duì)原參數(shù)直接進(jìn) 行遺傳操作 提高了求解精度 加快了尋優(yōu)速度 使尋優(yōu)范 圍充滿整個(gè)最優(yōu)解可能存在的空間 本文采用實(shí)數(shù)值編碼方 式 3 適應(yīng)度函數(shù) GA 的適應(yīng)度函數(shù) 即神經(jīng)網(wǎng)絡(luò)性能評(píng)價(jià)函數(shù) 是遺傳 算法指導(dǎo)搜索的唯一信息 它的選取是算法好壞的關(guān)鍵 適 應(yīng)度函數(shù)要能有效地指導(dǎo)搜索沿著面向優(yōu)化參數(shù)組合的方 向 逐漸逼近最佳參數(shù)組合 而不會(huì)導(dǎo)致搜索不收斂或陷入 局部最優(yōu)解 同時(shí) 這個(gè)函數(shù)也應(yīng)該易于計(jì)算 的倒數(shù) 即 (1) (2) 本文適應(yīng)度函數(shù)采用均方差
2
遺傳算法在神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中的應(yīng)用與實(shí)現(xiàn)
2.1 GA 在 NN 中應(yīng)用的可行性和必要性
GA 和 NN 都是將生物學(xué)原理用于科學(xué)研究的仿生學(xué)理 論成果 并且它們都有極強(qiáng)的解決問題的能力 已成為當(dāng)前 研究的熱點(diǎn) 二者各有各的優(yōu)點(diǎn) 卻也存在某些不足 不能 廣泛地解決問題 對(duì)于某一具體問題 人工設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)是件極其復(fù)雜 的工作 迄今尚沒有系統(tǒng)的規(guī)則可循 僅憑主觀經(jīng)驗(yàn)判斷或 試驗(yàn)的方法 通過試驗(yàn)設(shè)計(jì)網(wǎng)絡(luò)不僅浪費(fèi)大量的時(shí)間和資 源 而且很難保證一定能找到一個(gè)合適的 滿足實(shí)際需要的 神經(jīng)網(wǎng)絡(luò) 更不能保證所設(shè)計(jì)出的網(wǎng)絡(luò)是一定是最佳的 因 此 應(yīng)該拋棄人工設(shè)計(jì)網(wǎng)絡(luò)的方法 NN 需要高效的自動(dòng)的 設(shè)計(jì)方法 描述一個(gè)神經(jīng)網(wǎng)絡(luò)模型的參數(shù)主要包括 網(wǎng)絡(luò)層數(shù) 各層神經(jīng)元數(shù) 神經(jīng)元的互連方式 各連接權(quán)值及傳遞函數(shù) 等 設(shè)計(jì)一個(gè)網(wǎng)絡(luò),實(shí)質(zhì)上就是根據(jù)某個(gè)性能評(píng)價(jià)準(zhǔn)則搜索 確定適合于解決某個(gè)問題或某類問題的這些參數(shù)的組合 當(dāng) 待解決的問題比較復(fù)雜時(shí) 完成這項(xiàng)工作就很困難 主要原 因有 1 在目前研究的神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)中 BP 算法由于其 結(jié)構(gòu)簡(jiǎn)單 算法穩(wěn)定而得到了最廣泛的應(yīng)用 但它是一種沿 梯度下降來指導(dǎo)搜索的方法 因此會(huì)不可避免地存在有局部 極小問題 2 對(duì)神經(jīng)網(wǎng)絡(luò)初值的選取也有一定要求 若初值和步 長(zhǎng)選取不當(dāng) 則在控制過程中系統(tǒng)有可能出現(xiàn)一定的振蕩 動(dòng)態(tài)特性很不理想 3 對(duì)絕大多數(shù)應(yīng)用 性能評(píng)價(jià)函數(shù)往往是多形態(tài)及不 連續(xù)的 由于這些原因 許多傳統(tǒng)的搜索算法 如隨機(jī)法 梯 度下降法 模擬退火法等 應(yīng)用于完成搜索都存在著一定的 問題[3] Holland 的模式定理證明了遺傳算法有解決這些問 題的能力 因而可將遺傳算法與神經(jīng)網(wǎng)絡(luò)結(jié)合起來應(yīng)用于控 制領(lǐng)域中
MSE 1 f = MSE 1 num MSE = ∑ [ y(k ) y(k )]2 Num k =1
其中 Num 為網(wǎng)絡(luò)輸入輸出樣本對(duì)的個(gè)數(shù) 別為網(wǎng)絡(luò)理想輸出與實(shí)際輸出
y(k) 和 y (k ) 分
選擇好適應(yīng)值函數(shù)后 還需進(jìn)行適應(yīng)值調(diào)整 這是因 為 1 在 GA 剛開始運(yùn)行時(shí) 通常在多數(shù)平常個(gè)體存在幾 個(gè)超級(jí)個(gè)體 這些個(gè)體往往會(huì)在后代中大量復(fù)制 從而導(dǎo)致 初期收斂 2 在 GA 運(yùn)行后期 種群中需存在多樣性 而 這時(shí)種群中大多數(shù)個(gè)體都有很高的適應(yīng)值 從而種群平均適 應(yīng)值與最大適應(yīng)值相差無幾 使選擇變成了近乎隨機(jī)的過程 了 為抑制初期收斂 采用線性調(diào)整法來調(diào)整適應(yīng)度 其 表達(dá)式如下
f ′ =af +b
(3)
第 13 卷第 5 期
其中
楊國(guó)軍等 遺傳算法在神經(jīng)網(wǎng)絡(luò)控制中的應(yīng)用與實(shí)現(xiàn)
為原適應(yīng)度 調(diào)整前后應(yīng)滿
569
f ' 為調(diào)整后的適應(yīng)度 f
f ′ avg = f avg ′ f max = cf max
足的條件為 (4)
p c = k1 ( f max f c′ ) / ( f max f ) p =k c 3 p m = k 2 ( f max f ) / ( f max f ) pm = k 4
其中 k1=k3 =1.0, k2 =k4 =0.5 應(yīng)值較大的那個(gè)適應(yīng)值
f c′ ≥ f f c′ < f f≥f f<f
(8)
其中 f max 和 f avg 分別為種群中最大及平均適應(yīng)度 a, b 為調(diào)整系數(shù) 它們的選擇如下
a=(c1.0)× favg / 1 b= favg×(fmax c× favg) /1 a= favg / 2 b=fmin× favg /2
2 = f avg f min
c 是種
f c ′ 為要交叉的兩個(gè)父串中適
群最優(yōu)成員的期望復(fù)制 對(duì)小種群(N=50~100) 選 c =1.2~2
f 為需變異位串的適應(yīng)值 這樣
對(duì)于性能好的解 防止 GA 陷于局
使 pc 和 pm 隨解的適應(yīng)度函數(shù)而變化 均適應(yīng)值的解 令 pc 和 pm 是取高一些
令 pc 和 pm 取低一些 幫助 GA 快速收斂 而對(duì)于低于平 (5)
其 他
fmin>(cfavg fmax) / (c1.0)
部解
[4]
2.3 GA 學(xué)習(xí) NN 的流程圖
遺傳算法設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)的流程可見圖 1
種群初始化
其 中 f min 為 種 群 最 小 適 應(yīng) 度 4 遺傳操作
1 = f max f avg
遺傳操作主要包括繁殖 交叉和變異 繁殖 又稱選擇 復(fù)制 是從舊種群中選擇生命力強(qiáng) 的個(gè)體產(chǎn)生新種群的過程 選擇的根據(jù)是每個(gè)位串所對(duì)應(yīng)的 適應(yīng)值的大小 一般說來 一個(gè)位串的適應(yīng)值越高 則它在 種群中擴(kuò)大的機(jī)率也越多 即適合于生存環(huán)境的優(yōu)良個(gè)體有 更多繁殖后代的機(jī)會(huì) 從而使優(yōu)良特性得以遺傳 常見的選 擇方法有適應(yīng)值比例法 兩兩競(jìng)爭(zhēng)法 排位次法等幾種 本文采用適應(yīng)度比例法與最優(yōu)保留策略進(jìn)行繁殖操作 某個(gè)體 Ai 被選中進(jìn)行復(fù)制的概率 ps 為
解碼參數(shù)集位串 計(jì)算適應(yīng)度函數(shù) 評(píng)價(jià)網(wǎng)絡(luò) 是
網(wǎng)絡(luò)性能是否收斂到 指定的精度范圍內(nèi) 否 遺傳操作 形成新一代種群
p s = fi / ∑ f j (6) 其中 f i 為 Ai 的適應(yīng)值 ∑ f j 為種群中各個(gè)體適應(yīng)值之和 具體是這樣實(shí)現(xiàn)的 先計(jì)算出當(dāng)前種群中的 ∑ f j 然后產(chǎn) 生一個(gè) 0 與 ∑ f j 之間的隨機(jī)數(shù) rand ( ∑ f j ) 并將滿足下列
條件的第 m 個(gè)位串加入到匹配池
m 1 i =1
輸出學(xué)好的神經(jīng)網(wǎng)絡(luò) 圖1 遺傳算法學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)流程圖
3
仿真研究
為了驗(yàn)證遺傳算法學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的可行性與有效性
∑
f i < rand ( ∑ f j ) 和
i =1
∑ f i ≥ rand (∑ f j )
m
本文以兩自由度機(jī)械手逆運(yùn)動(dòng)學(xué)求解及倒立擺控制為例 應(yīng) (7) 用 Matlab 軟件進(jìn)行了仿真研究
重復(fù)此過程 直至匹配池中包含 N 個(gè)位串為止 交叉是兩個(gè)位串重組的操作 是遺傳算法區(qū)別于其他 傳統(tǒng)優(yōu)化方法的重要標(biāo)志 交叉分兩步進(jìn)行 首先按一定的 交叉概率隨機(jī)地從匹配池中取出要匹配的兩個(gè)位串 然后以 某種交叉方法互換這兩個(gè)位串中的信息 勻交叉等 盡管選擇和交叉很重要 但也不能確保一些重要的位 碼信息不被丟失 需進(jìn)行變異操作 變異是以一定變異概率 從種群中隨機(jī)選取若干個(gè)體 對(duì)于選中的個(gè)體 在需變異的 整數(shù)位上隨機(jī)產(chǎn)生 0~9 之間的數(shù)來取代原來的數(shù) 本文采用單點(diǎn)交叉 按照下式自適應(yīng)調(diào)整交叉概率 及變異概率 產(chǎn)生一對(duì)新的位 串 常見的交叉方式有單點(diǎn)交叉 兩點(diǎn)交叉 多點(diǎn)交叉及均
3.1 兩自由度機(jī)械手
圖 2 為一兩桿平面機(jī)械手 表 1 給出了兩個(gè)連桿的參 數(shù) 機(jī)械手的前向運(yùn)動(dòng)學(xué)方程為
x1 = cos θ1 + cos ( θ 1 +θ 2 )
x 2 = sin θ 1 + sin(θ 1 + θ 2 )
其中 x1
(9a) (9b)
θ2 為機(jī)械手連桿轉(zhuǎn)角
兩桿平面機(jī)械手參數(shù)
[5]
x 2 為機(jī)械手終端位置
θ1
表1
圖2
兩桿平面機(jī)械手模型
pc
圖 3 給出了兩桿機(jī)械手所要達(dá)到的期望運(yùn)動(dòng)軌跡 欲 求相應(yīng)的連桿轉(zhuǎn)角 采用三層前向神經(jīng)網(wǎng)絡(luò)建立機(jī)械手逆運(yùn)動(dòng)學(xué)模型 所選
pm
570
系
統(tǒng)
仿
真
學(xué)
報(bào)
2001 年 9 月
神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為 N 2,5,2 手的位置 x1
其中輸入層兩個(gè)節(jié)點(diǎn)分別接收機(jī)械 其節(jié)點(diǎn)激發(fā)函數(shù)為
(1+ex)
初始位置 由神經(jīng)網(wǎng)絡(luò)控制器給小車底座施加一個(gè)向左或向 右的力 F 在盡可能長(zhǎng)的時(shí)間 如 100 s 內(nèi) 將小車保持 在預(yù)先定義的軌跡界限 如 1.2 m 內(nèi) 且不讓擺倒下 即不超過一預(yù)先定義好的垂直偏離角度范圍 如 10 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)為 N4,5,1 輸入層四個(gè)節(jié)點(diǎn)分別接收倒 立擺系統(tǒng)的 4 個(gè)狀態(tài)值 網(wǎng)絡(luò)的權(quán)系數(shù)為 31 個(gè) 隱層的激發(fā)函數(shù)仍為非對(duì)稱的 Sigmoid 函數(shù) 輸出層的激發(fā)函數(shù)為 F(x) =10(1ex) (1+e+x) 分布在[ 511.5 +511.5]之間 & 倒立擺系統(tǒng)的初值如下選擇 [ θ 0 , X 0 ,θ&0 , X 0 ]=[-2,
1 (1+ex)
輸出層有兩個(gè)節(jié)點(diǎn) 其輸出在 [π, π] 連續(xù)取值 其節(jié)點(diǎn)激發(fā)函數(shù)為 π (1ex) 網(wǎng) 圖 4
x2
隱層五個(gè)節(jié)點(diǎn)
的機(jī)械手連桿轉(zhuǎn)角
絡(luò)的權(quán)系數(shù)為 27 個(gè) 假定網(wǎng)絡(luò)權(quán)值分布在區(qū)間 [20,+20] 經(jīng)過近 1500 代的學(xué)習(xí) 得到了較理想的結(jié)果 給出了每代中的最大適應(yīng)度 線
f max 隨迭代次數(shù)
T 變化的曲
θ1 與 θ 2 的均方差分別為 2.29×104 與 3.56×104
-0.1, 0, 0] 圖 6 給出了仿真結(jié)果 由圖可見 在控制過程中 倒立擺能較好地控制在擺動(dòng)范圍不大于 40 的狀態(tài) 小車位 置偏離中心點(diǎn)不超過 0.2 m 滿足控制要求
圖 6 控制過程中倒立擺系統(tǒng)的狀態(tài)變化圖
4
結(jié)論
本文研究了遺傳算法和神經(jīng)網(wǎng)絡(luò)的結(jié)合 實(shí)現(xiàn)了機(jī)械手
逆運(yùn)動(dòng)學(xué)求解問題及倒立擺的控制 通過仿真可以看出 采 用遺傳算法學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)權(quán)系數(shù)的方法 兼顧了神經(jīng)網(wǎng)絡(luò)的 廣泛映射能力和遺傳算法的快速全局收斂的優(yōu)點(diǎn) 可以避免 傳統(tǒng)的 BP 算法易陷于局部極小點(diǎn)的缺點(diǎn) 具有良好的學(xué)習(xí)
3.2 倒立擺
圖 5 為一級(jí)倒立擺系統(tǒng) 一個(gè)帶輪的小車 其頂端用 鉸鏈系一剛性擺 小車可沿一筆直的有界軌跡自由地向左或 向右運(yùn)動(dòng) 同時(shí)擺可在垂直平面內(nèi)自由運(yùn)動(dòng) 在任一時(shí)刻 該系統(tǒng)的狀態(tài)可由四個(gè)變量描述 即小車位置 X 小車平
與控制能力
參考文獻(xiàn)
[1] Hunt K J, Sbarbaro D, Zbikowski R, Gawthrop P J. Neural Networks for Control Systems — A Survey [J]. Automatica. 1992, 28(6): 1083-1112. [2] [3] Goldberg D E. Genetic Algorithms in Search, Optimization, and Machine Learning [M]. Addison-Wesley, Reading, MA, 1989. 梁化樓, 戴貴亮. 人工神經(jīng)網(wǎng)絡(luò)與遺傳算法的結(jié)合:進(jìn)展與展望 [J]. 電子學(xué)報(bào). 1995, 23(10): 194-199. Srinivas M, Patnaik L M. Adaptive Probability of Crossover and Mutation in Genetic Algorithms [J]. IEEE Trans on SMC, 1994, 24(4): 656-667. [5] [6] Tejomurtula S, Kak S. Inverse Kinematics in Robotics Using Neural Networks [J]. Information Science, 1999, 116(2): 147-158. Anderson C W. Learning to Control an Inverted Pendulum Using Neural Network [J]. IEEE Control Systems Magazine, 1989, 4(1): 31-35.
& 移速度 X
& 擺偏離垂直方向的角度 θ 以及擺的角速度 θ
&2 & ( M + m ) g sin θ cos θ [ F + ml θ sin θ ] θ&= 2θ ( 4 / 3 )×( M + m ) l ml cos & && && F + ml [ θ sinθ θ cos θ ] X= (M + m )
該系統(tǒng)運(yùn)動(dòng)方程如下 (10a) (10b)
[4]
其中小車的質(zhì)量 M = 0.455 kg 倒立擺的質(zhì)量 m = 0.21 kg 擺長(zhǎng)的一半 l = 0.3 m 忽略小車對(duì)地及倒立擺對(duì)小車的摩 擦 重力加速度 g =9.8 m/s 控制的目的
2
F 為神經(jīng)網(wǎng)絡(luò)控制器輸出的控 小車一個(gè)
制力 在[-10,+10]N 范圍內(nèi)連續(xù)取值[6] 先給定倒立擺一個(gè)初始偏角
本文關(guān)鍵詞:遺傳算法在神經(jīng)網(wǎng)絡(luò)控制中的應(yīng)用與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號(hào):183365
本文鏈接:http://www.sikaile.net/kejilunwen/rengongzhinen/183365.html