滑翔導(dǎo)彈末段多約束智能彈道規(guī)劃
來源:《光學(xué)精密工程》,作者邵會兵等
摘要:滑翔導(dǎo)彈末段飛行時空復(fù)雜度高、不確定性強、約束多,給彈道規(guī)劃與制導(dǎo)算法帶來了較大的建模和求解難度。針對這一問題,同時增大末段機動范圍并提高彈道規(guī)劃效率,本文提出一種利用連續(xù)型深度置信神經(jīng)網(wǎng)絡(luò)(Convolutional Deep Brief Networks,CDBN)預(yù)測機動能力、設(shè)計經(jīng)由點狀態(tài)實現(xiàn)末段多約束智能彈道規(guī)劃的方法。過程中采用CDBN對機動能力進行在線預(yù)測,快速判定經(jīng)由點狀態(tài)的可行性,并且通過經(jīng)由點狀態(tài)智能設(shè)計,實現(xiàn)前后段能量的優(yōu)化分配,擴大彈道機動包絡(luò);通過設(shè)計三角函數(shù)型彈目視線角實現(xiàn)末段彈道擺動機動,推導(dǎo)機動彈道最優(yōu)末制導(dǎo)律對視線角進行跟蹤,并調(diào)節(jié)機動頻率以滿足速度約束。仿真結(jié)果表明,CDBN相對BP網(wǎng)絡(luò)具有更高的機動能力預(yù)測精度;本文所提智能彈道規(guī)劃方法在滿足末端速度約束的前提下,可以實現(xiàn)彈道擺動機動并大幅增加飛行包絡(luò)。彈道規(guī)劃能夠在0.5 s內(nèi)完成,滿足工程應(yīng)用的快速性要求。
關(guān)?鍵?詞:滑翔導(dǎo)彈;機動能力預(yù)測;連續(xù)型深度置信網(wǎng)絡(luò);機動彈道規(guī)劃
1 引 言
滑翔導(dǎo)彈是一種區(qū)別于傳統(tǒng)彈道導(dǎo)彈、可在臨近空間長時間高速滑翔、機動飛行的新型武器裝備[1],具有飛行速度快、飛行高度高、飛行環(huán)境復(fù)雜的特點。為了滿足現(xiàn)代化戰(zhàn)爭中實際作戰(zhàn)需要,滑翔導(dǎo)彈需要具有對威脅區(qū)和攔截網(wǎng)進行規(guī)避、對攔截彈和探測網(wǎng)有效突防、為滿足制導(dǎo)或偵察需求經(jīng)由特定區(qū)域以及對目標進行高精度打擊等能力。復(fù)雜的飛行環(huán)境、多變的戰(zhàn)場態(tài)勢、多類型的任務(wù)要求使滑翔導(dǎo)彈任務(wù)規(guī)劃及彈道規(guī)劃的時空復(fù)雜度急劇增加,亟需在相關(guān)技術(shù)中獲得突破。
滑翔導(dǎo)彈末段打擊任務(wù)對彈道末端傾角、速度等多種約束具有嚴苛的要求。同時,飛行過程中的繞飛探測任務(wù)需要導(dǎo)彈在滿足速度、過載、姿態(tài)、終點狀態(tài)等多約束前提下增加飛行通道、擴大機動區(qū)域、增加機動形式[2]。因此,需要開展末段多約束彈道規(guī)劃和制導(dǎo)方法研究。
然而,滑翔導(dǎo)彈末段飛行的高時空復(fù)雜度、強不確定性和多約束的特點使相應(yīng)的彈道規(guī)劃與制導(dǎo)問題也具有了類似的特征,既難以精確建模,又難以快速精確求解,需要研究行之有效的解決方案。近年來,人工智能基礎(chǔ)理論獲得了突破發(fā)展,人工智能以其強大的學(xué)習(xí)能力與適應(yīng)性在自動控制、航空航天等領(lǐng)域表現(xiàn)出突出的優(yōu)勢與應(yīng)用前景。其中,基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的智能方法在解決各領(lǐng)域中具有復(fù)雜、不確定、多約束等特點的問題上獲得了巨大成功。深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)可通過大量樣本的訓(xùn)練來逼近實際問題的真實模型,然后根據(jù)新的輸入迅速給出對應(yīng)的結(jié)果。因此,本文將結(jié)合深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),一方面解決滑翔導(dǎo)彈末段規(guī)劃與制導(dǎo)中部分環(huán)節(jié)的復(fù)雜系統(tǒng)建模問題,一方面滿足在線彈道規(guī)劃與制導(dǎo)的快速性要求。
深度學(xué)習(xí)和傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò)不同,在采用監(jiān)督學(xué)習(xí)進行網(wǎng)絡(luò)訓(xùn)練前,引入了梯度向上的非監(jiān)督學(xué)習(xí),利用無標記的訓(xùn)練樣本逐層訓(xùn)練參數(shù),通過對輸入數(shù)據(jù)信息的充分利用有效地解決了上述問題,深度學(xué)習(xí)的深層非線性網(wǎng)絡(luò)結(jié)構(gòu)通過訓(xùn)練大量的樣本數(shù)據(jù)學(xué)習(xí)有用的特征,逼近復(fù)雜的非線性函數(shù)。目前較為公認的深度學(xué)習(xí)基本模型包括卷積神經(jīng)網(wǎng)絡(luò)[3]、基于自動編碼器的堆疊自動編碼器[4]和基于限制玻爾茲曼機 (Restricted Boltzmann Machine, RBM)的深度置信網(wǎng)絡(luò)(Deep Belief Network, DBN)[5]。DBN不僅在圖像、語音、金融預(yù)測、模式識別等領(lǐng)域表現(xiàn)出較好的特征提取及學(xué)習(xí)能力,而且在多因素影響的特征提取及回歸預(yù)測問題中也得到越來越多的應(yīng)用研究,如儲層預(yù)測[6]、用戶投訴預(yù)測[7]、油井熱采效率預(yù)測[8]、工業(yè)軟測量建模[9]、疾病風險預(yù)警[10]等問題。
在智能彈道規(guī)劃方面,魏黎明等人[11]利用BP神經(jīng)網(wǎng)絡(luò)設(shè)計了吸氣式高超聲速導(dǎo)彈突防彈道,在導(dǎo)彈工作動壓窗口、攻角窗口的條件下,通過大量離線仿真數(shù)據(jù)訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)以擬合得出導(dǎo)彈初始機動高度、馬赫數(shù)、質(zhì)量與機動時間之間的非線性映射關(guān)系,從而實現(xiàn)了通過機動初始條件預(yù)測機動時間。方科等人[12]基于BP神經(jīng)網(wǎng)絡(luò)設(shè)計了高超聲速再入飛行器時間可控再入制導(dǎo)律,通過離線仿真獲得時間預(yù)估BP網(wǎng)絡(luò)訓(xùn)練集,并采用貝葉斯正則化算法進行離線訓(xùn)練,從而實現(xiàn)了對剩余再入飛行時間的預(yù)估。相關(guān)研究主要集中于采用智能優(yōu)化算法進行軌跡優(yōu)化設(shè)計,以及采用大量離線數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)以實現(xiàn)對彈道規(guī)劃過程中相關(guān)參數(shù)的在線快速預(yù)測兩個方面。
為了增大滑翔導(dǎo)彈的末段機動范圍并降低彈道規(guī)劃難度,本文提出一種利用經(jīng)由點設(shè)計實現(xiàn)末段多約束智能彈道規(guī)劃的方法。通過智能規(guī)劃經(jīng)由點狀態(tài),擴大導(dǎo)彈機動包絡(luò),同時保證有足夠的能量實現(xiàn)對目標的多約束精確打擊。經(jīng)由點的智能設(shè)計中,將采用深度置信神經(jīng)網(wǎng)絡(luò)建立機動能力預(yù)測模型,快速判定經(jīng)由點狀態(tài)的可行性,實現(xiàn)經(jīng)由點前、后段能量的合理分配,提高經(jīng)由點在線設(shè)計的效率。
為滿足彈道擺動機動需求,本文將導(dǎo)彈相對目標點的視線角設(shè)計為三角函數(shù)形式,并通過設(shè)計機動彈道最優(yōu)末制導(dǎo)律,實現(xiàn)對期望視線角的跟蹤,最后通過調(diào)節(jié)視線角的機動頻率滿足期望的速度約束。
2 基于CDBN的末段機動能力預(yù)測
2.1 機動能力預(yù)測流程
結(jié)合任務(wù)需求,彈頭在滑翔末段需要判斷從當前狀態(tài)是否能夠到達給定終端狀態(tài),為經(jīng)由點或機動指令的設(shè)計提供基礎(chǔ)。滑翔末段機動能力可通過比較導(dǎo)彈當前位置能量狀態(tài)與限定終端狀態(tài)后反向推算出的當前位置所需最小能量狀態(tài)進行衡量。其中當前位置所需最小能量狀態(tài)是指,彈頭從當前位置按當前速度方向,以最省能量彈道到達給定終端位置時,恰好滿足終端速度大小及方向約束,所對應(yīng)的初始能量狀態(tài)。由于無動力導(dǎo)彈質(zhì)量恒定,故能量狀態(tài)可用速度來表示。
因此,對導(dǎo)彈機動能力的預(yù)測可以通過建立相應(yīng)的神經(jīng)網(wǎng)絡(luò)模型來進行。即選取關(guān)鍵的狀態(tài)變量作為神經(jīng)網(wǎng)絡(luò)的輸入,預(yù)測的能量狀態(tài)作為輸出。通過優(yōu)化設(shè)計獲得樣本庫,利用樣本庫對神經(jīng)網(wǎng)絡(luò)進行離線訓(xùn)練,通過神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)對機動能力的在線預(yù)測。機動能力預(yù)測流程圖如圖1所示。
圖1 機動能力預(yù)測流程圖
Fig.1 Flowchart of maneuverability prediction
假定地球模型為均質(zhì)非旋圓球,則滑翔末段機動能力主要受當前點的狀態(tài)、終點狀態(tài)以及當前點與終點的相對狀態(tài)的影響。輸入變量包括當前點狀態(tài)中的速度傾角θ、高度H,終點狀態(tài)中的末端速度VfD、末端落角θfD、末端高度HfD,當前點與終點相對狀態(tài)中的航向角偏差Δψ、水平距離L、末端航向角偏差ΔψfD。
輸出變量為當前位置、當前速度方向下,保證飛行終點滿足給定終端狀態(tài)的當前最小速度Vmin。
樣本生成中,內(nèi)層采用角度約束最優(yōu)末制導(dǎo)律獲得滿足末端約束的能量最優(yōu)彈道,外層采用牛頓迭代法獲得滿足末端約束的最小初始速度。
預(yù)測模型采用連續(xù)型深度置信神經(jīng)網(wǎng)絡(luò)。
2.2 機動能力預(yù)測樣本庫構(gòu)建
對每一個包含當前狀態(tài)、終端狀態(tài)和相對狀態(tài)的輸入X=(H,?L,?θ,Δψ,?VfD,?θfD, ΔψfD,?HfD),采取牛頓迭代的方法,可得到滿足末端約束的最小初始速度Vmin,步驟如下:
(1)取當前時刻速度大小初值為V0,基于角度約束最優(yōu)末制導(dǎo)律[13]:
(1)
其中:γD為彈道傾角,
為剩余飛行時間,λD為高低視線角。
從當前位置積分到終端狀態(tài),得到末速Vfmax,得到f(V0)=(Vfmax-VfD)2。
(2)通過牛頓迭代法搜索速度V0f
(2)
直至式(3)成立:
|Vfmax-VfD|<ε,
(3)
最終得到的V0f即為滿足末端約束的最小初始速度Vmin。
給定多組輸入,通過上述計算可獲得相應(yīng)的Vmin作為機動能力預(yù)測輸出變量,構(gòu)成機動能力預(yù)測樣本庫。
2.3 深度置信網(wǎng)絡(luò)及其訓(xùn)練
深度置信網(wǎng)絡(luò)(DBN)是典型的深度學(xué)習(xí)算法,于2006年由Hinton研究組在《Science》上提出,其通過無監(jiān)督貪婪學(xué)習(xí)算法逐層優(yōu)化深度置信網(wǎng)絡(luò)的連接權(quán)重和閾值。深度置信網(wǎng)絡(luò)實際上借鑒了人腦的多層抽象的機能,通過大量的限制玻爾茲曼機單元(可看作神經(jīng)元)構(gòu)成深度置信網(wǎng),利用輸入和輸出的非線性關(guān)系,近似復(fù)雜的多輸入函數(shù),它在提取輸入樣本的特征時具有較好的性能。
通常DBN網(wǎng)絡(luò)中RBM單元可視層的輸入必須為二值狀態(tài),由于機動能力預(yù)測問題中輸入數(shù)據(jù)為連續(xù)型數(shù)值,因此直接利用傳統(tǒng)二值DBN網(wǎng)絡(luò)來進行預(yù)測會存在問題。為解決這一問題,本文通過在網(wǎng)絡(luò)的RBM單元可視層中加入高斯噪聲附加項使其轉(zhuǎn)變成連續(xù)型RBM(Continuous RBM, CRBM),使得網(wǎng)絡(luò)具有對連續(xù)型特征值的處理能力。
深度置信網(wǎng)絡(luò)是一個概率生成模型,擁有深層的網(wǎng)絡(luò)結(jié)構(gòu),可以看作由多個CRBM堆疊而成,最底層接收輸入數(shù)據(jù)向量,并通過CRBM轉(zhuǎn)換輸入數(shù)據(jù)到隱含層,通過對多個CRBM進行堆疊可從機動能力預(yù)測問題的復(fù)雜原始輸入數(shù)據(jù)中獲得一些高層非線性特征,在最頂層添加一層BP網(wǎng)絡(luò),即可對輸出量即最小初始速度,進行回歸預(yù)測。深度置信網(wǎng)絡(luò)的訓(xùn)練由無監(jiān)督的逐層預(yù)訓(xùn)練和有監(jiān)督的微調(diào)兩個過程組成。下面給出用于機動能力預(yù)測的深度置信網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練過程。
對應(yīng)于機動能力預(yù)測的完整深度置信網(wǎng)絡(luò)結(jié)構(gòu)如圖 2所示,深度置信網(wǎng)絡(luò)模型由最底層接收機動能力預(yù)測問題的輸入數(shù)據(jù)(H,?L,?θ, Δψ,?VfD,?θfD, ΔψfD,?HfD),第一層和第二層形成一個CRBM,第二層和第三層形成第二個CRBM,依次類推。將最上層CRBM的輸出層得到的結(jié)果,即提取得到的高層非線性特征,輸入到BP網(wǎng)絡(luò)中進行回歸預(yù)測。輸入層的節(jié)點數(shù)由輸入數(shù)據(jù)的維數(shù)決定,輸出層為歸一化后的最小初始速度,節(jié)點數(shù)為1。
圖2 深度置信網(wǎng)絡(luò)的結(jié)構(gòu)圖
Fig.2 Diagram of deep belief network structure
限制玻爾茲曼機CRBM模型基于能量生成,能夠?qū)W習(xí)數(shù)據(jù)的固有內(nèi)在表示。每個CRBM包含一個可視層和一個隱含層,只有可視層和隱含層單元之間有雙向連接權(quán)值,而可視層內(nèi)部各單元及隱含層內(nèi)部各單元之間沒有連接。
傳統(tǒng)RBM的結(jié)構(gòu)單元為二值狀態(tài),為了處理連續(xù)數(shù)據(jù),CRBM在可視層sigmoid激活函數(shù)sig(x)=1/(1+e-x)中加入一個均值為0、方差為σ2的高斯單元,常數(shù)σ和Nj(0, 1)共同產(chǎn)生了高斯輸入分量nj=σNj(0, 1)。
隱含層的激活概率為:
(4)
其中,函數(shù)φj的表達式為:
(5)
同理,可視層的激活概率為:
(6)
(7)
其中:?I為可視單元的數(shù)量,J為隱含單元的數(shù)量。θL,?θH分別為sigmoid函數(shù)的下漸近線和上漸近線,一般取θH=1,?θL=-1,參數(shù)bj是控制sigmoid函數(shù)斜率的變量,當bj由小變大時,單元就可以從無噪聲的確定性狀態(tài)向二進制隨機狀態(tài)平滑過渡。
在給定可視層單元v={v1,?v2,?v3, …,?vI}∈[0, 1]、隱含層單元h={h1,?h2,?h3, …,?hJ}∈[0, 1]、權(quán)重矩陣w、可視層單元的斜率a和隱含層單元斜率b的條件下,所有可視單元和隱含單元聯(lián)合狀態(tài)(v,?h)的能量函數(shù)為[14]:
(8)
可視層向量v的獨立分布為:
(9)
因為CRBM的同一層任何兩個單元之間沒有連接,因此給定一個隨機輸入的可視層向量v,各隱含層單元相互獨立,隱含層向量h的概率如式(10)所示。類似的,給定一個隨機輸入隱含層向量h,得到對應(yīng)可視層向量v的概率如式(11)所示:
(10)
(11)
CRBM的本質(zhì)就是使學(xué)習(xí)到的模型符合輸入樣本分布的概率最大,即在給定訓(xùn)練數(shù)據(jù)的情況下,通過調(diào)節(jié)相應(yīng)的參數(shù),使式(9)的概率p(v)的值達到最大。由式(9)可知,可以通過調(diào)節(jié)權(quán)重矩陣w、可視層單元斜率a和隱含層單元斜率b去降低能量函數(shù)值,間接提高p(v)的值?;跇O大似然估計理論,對式(9)兩邊取對數(shù),然后執(zhí)行隨機梯度下降,可以從訓(xùn)練樣本中學(xué)習(xí)CRBM模型的參數(shù)θ={ai,?bj,?wji},使概率p(v)的值最大。
以對比散度(Contrastive Divergence,CD-k)算法應(yīng)用最為廣泛[14]。通過使用對比散度算法,k次更新即可完成訓(xùn)練,一般取為1,參數(shù)更新公式如式(12):
Δwji=γ(〈vihj〉0-〈vihj〉k),
?
?
(12)
其中γ表示學(xué)習(xí)率,取值在[0, 1]之間,一般根據(jù)經(jīng)驗確定。
在逐層無監(jiān)督訓(xùn)練完成后,通過在最頂層添加標簽數(shù)據(jù),對深度置信網(wǎng)絡(luò)進行有監(jiān)督訓(xùn)練,即采用反向傳播算法對深度置信網(wǎng)絡(luò)的相關(guān)參數(shù)進行微調(diào)。與無監(jiān)督訓(xùn)練中每次訓(xùn)練一層相比,反向傳播有監(jiān)督微調(diào)同時對所有層的參數(shù)進行更新,以進一步減少訓(xùn)練誤差和提高深度置信網(wǎng)絡(luò)的預(yù)測精度。
全局有監(jiān)督微調(diào)利用網(wǎng)絡(luò)輸出誤差對各權(quán)值的梯度來調(diào)整所有權(quán)值,直至誤差收斂。在模型的微調(diào)過程中,有兩類參數(shù)需要調(diào)整:層之間的連接權(quán)值、斜率控制項。先求出連接權(quán)值、斜率控制項的梯度值[15],再利用擬牛頓法優(yōu)化算法對各參數(shù)進行優(yōu)化。
樣本的目標函數(shù)值為:
(13)
其中:x是CRBM的樣本輸出數(shù)據(jù),F(xiàn)W,?a(x)是網(wǎng)絡(luò)的輸出數(shù)據(jù)。
3 飛行末段多約束智能彈道規(guī)劃
為了增大滑翔導(dǎo)彈的末段機動范圍并降低彈道規(guī)劃難度,本文通過智能規(guī)劃經(jīng)由點,實現(xiàn)末段多約束智能彈道規(guī)劃。
導(dǎo)彈通過智能規(guī)劃末段經(jīng)由點狀態(tài),可以擴大機動包絡(luò),同時保證有足夠的能量實現(xiàn)對目標的多約束精確打擊。在經(jīng)由點的智能規(guī)劃過程中,采用上節(jié)中訓(xùn)練好的深度置信網(wǎng)絡(luò)進行機動能力預(yù)測,快速判定經(jīng)由點狀態(tài)的可行性,實現(xiàn)經(jīng)由點前、后段能量的合理分配,提高經(jīng)由點在線設(shè)計的效率。經(jīng)由點位置的設(shè)計,需要為后段增強突防能力的彈道擺動機動預(yù)留一定的速度增量,因此在迭代搜索經(jīng)由點位置時,在期望終端速度的基礎(chǔ)上增大一定速度增量作為經(jīng)由點位置迭代的速度約束。
為滿足彈道擺動機動需求,本文將導(dǎo)彈相對目標點的視線角設(shè)計為三角函數(shù)形式,并通過設(shè)計機動彈道最優(yōu)末制導(dǎo)律,實現(xiàn)對期望視線角的跟蹤,最后通過機動頻率迭代滿足期望的速度約束。
3.1 經(jīng)由點規(guī)劃
經(jīng)由點規(guī)劃采用內(nèi)外兩層規(guī)劃的方法:內(nèi)層固定經(jīng)由點的位置,通過搜索最優(yōu)的經(jīng)由點速度方向約束,使到達目標點的終端速度最大;外層基于經(jīng)由點Z向位置與終端速度的單調(diào)關(guān)系,以期望終端速度為約束,通過牛頓法迭代得到經(jīng)由點Z向位置。經(jīng)由點規(guī)劃流程見圖3所示。
圖3 經(jīng)由點規(guī)劃流程圖
Fig.3 Flow diagram of waypoint planning
(1)經(jīng)由點的位置設(shè)計。將以下壓段起始點作為始點、目標點作為終點、采用角度約束最優(yōu)制導(dǎo)律獲得的彈道,作為基準彈道。
為降低規(guī)劃難度,取基準彈道上射程中點對應(yīng)的點作為經(jīng)由點包絡(luò)的中心。導(dǎo)彈從經(jīng)由點到達目標點時末端速度恰好滿足給定約束時對應(yīng)的經(jīng)由點位置,即為最大機動能力對應(yīng)的經(jīng)由點位置。
經(jīng)由點在該點彈道法平面上的不同坐標,對應(yīng)著不同的機動范圍,因此將經(jīng)由點位置對應(yīng)的設(shè)計量取為Z向坐標。
(2)對于經(jīng)由點處的速度方向,可根據(jù)初始點及終端狀態(tài)給出其可行的范圍,并以此為基礎(chǔ)進行經(jīng)由點速度方向設(shè)計。
如圖4所示,設(shè)從當前點到經(jīng)由點為A段,從經(jīng)由點到終端狀態(tài)為B段。導(dǎo)彈按比例導(dǎo)引律從當前點導(dǎo)引至經(jīng)由點,到達經(jīng)由點時的速度矢量方向可視為使A段能量最優(yōu)的經(jīng)由點速度方向eviaA;固定經(jīng)由點位置及終端狀態(tài),使經(jīng)由點速度最小的速度方向即為使B段能量最優(yōu)的經(jīng)由點速度方向eviaB。經(jīng)由點速度矢量ev在eviaA與eviaB形成的扇面內(nèi)取值,可留出更多能量用于機動。
圖4 經(jīng)由點速度方向設(shè)計示意圖
Fig.4 Diagram of waypoint velocity direction designing
(3)在固定經(jīng)由點位置時,隨著經(jīng)由點速度方向約束的變化,末端速度呈現(xiàn)先增大后減小的單峰曲線形式,采用黃金分割法即可一維搜索求得在當前經(jīng)由點位置下使末端速度最大的最優(yōu)速度方向約束:
J=-Vfmax.
(14)
過程中基于當前位置和速度方向狀態(tài)和經(jīng)由點的位置及速度方向約束計算X=(H,?L,?θ, Δψ,?VfD,?θfD, ΔψfD,?HfD),將其輸入訓(xùn)練好的深度置信網(wǎng)絡(luò),得到在當前位置、當前速度方向下,保證飛行終點滿足給定終端狀態(tài)的當前最小速度Vmin。進而判定經(jīng)由點狀態(tài)的可行性。
通過牛頓迭代法更新經(jīng)由點位置,并搜索相應(yīng)的最優(yōu)航向角。由于經(jīng)由點位置與末端速度存在單調(diào)關(guān)系,可搜索得到滿足期望速度約束的經(jīng)由點位置。
(15)
由于經(jīng)由點位置的設(shè)計,需要為后段的彈道擺動機動預(yù)留一定的速度增量,因此在迭代搜索經(jīng)由點位置時,在期望終端速度的基礎(chǔ)上增加一定速度增量作為經(jīng)由點位置迭代的速度約束。
VDf=Vf+ΔV,
(16)
其中ΔV為彈道擺動機動所需的速度增量。
3.2 三角函數(shù)型機動彈道規(guī)劃
對于從經(jīng)由點到目標點的飛行段,本文引入三角函數(shù)型機動,即在期望角度上疊加三角函數(shù)型視線角函數(shù)。機動彈道規(guī)劃流程如圖5所示。
(1)視線角函數(shù)幅值根據(jù)局部機動范圍需求而確定,一般取1°左右即可滿足。在局部機動范圍較小時,將機動形式由單邊改為雙邊并進行相位調(diào)整,以滿足機動范圍及機動形式要求。
(2)通過機動彈道最優(yōu)制導(dǎo)律得到制導(dǎo)指令,積分得到到達目標點時的終端速度。
(3)針對末端速度約束,根據(jù)機動頻率與末端速度的正比關(guān)系,通過在線大步長彈道快速積分,對視線角函數(shù)的機動頻率進行迭代修正,得到滿足末端速度約束的機動頻率,完成彈道規(guī)劃。
(4)在實際飛行中,由于大氣密度偏差等因素,實際彈道狀態(tài)量(主要是速度)相對規(guī)劃彈道會存在一定偏差,因此每隔一定周期需要進行一次彈道重規(guī)劃。
圖5 機動彈道規(guī)劃流程圖
Fig.5 Flow diagram of maneuvering trajectory planning
3.3 機動彈道最優(yōu)制導(dǎo)律設(shè)計
對于局部機動范圍需求,將導(dǎo)彈相對目標點的視線角設(shè)計為三角函數(shù)形式,通過調(diào)節(jié)三角函數(shù)型視線角的幅值、頻率和相位,滿足期望的機動形式和局部機動范圍,并通過最優(yōu)控制實現(xiàn)對期望視線角的跟蹤,最終實現(xiàn)末制導(dǎo)與機動的一體化設(shè)計。
以第二段角度約束末制導(dǎo)與三角函數(shù)型機動的一體化設(shè)計為例,分別在俯沖平面和側(cè)向平面內(nèi)進行設(shè)計。
為實現(xiàn)在精確攻擊前提下的機動飛行,設(shè)計以射程為自變量的俯沖平面附加視線角為:
(17)
其中:kD為頻率系數(shù),φDN為幅值系數(shù),Lf為末段總射程,L為當前射程。考慮防空系統(tǒng)的最低攔截高度,同時減小機動對制導(dǎo)精度的影響,設(shè)置機動結(jié)束高度hme。
在俯沖平面內(nèi),為了在滿足落角約束的同時使視線角按照期望的運動規(guī)律變化,可取狀態(tài)變量分別為視線角偏差以及視線角速率偏差:
(18)
其中:γDF為終端期望落角,λDN為期望視線角,λD為高低視線角。
為了簡化制導(dǎo)問題,將俯沖段運動分解到俯沖平面及側(cè)向平面內(nèi),分別建立相對運動方程:
(19)
其中:γD為彈道傾角,γT為彈道偏角。
轉(zhuǎn)化為狀態(tài)空間方程的形式:
(20)
其中
為剩余飛行時間。
為簡化制導(dǎo)問題的建模及求解,可引入偽控制量:
(21)
狀態(tài)空間方程可進一步改寫為:
(22)
根據(jù)最優(yōu)控制理論極大值原理,線性系統(tǒng)二次型性能指標對應(yīng)的最優(yōu)控制律形式為:
us=-R-1BTPx.
(23)
基于最優(yōu)控制理論及Riccati方程,得俯沖平面機動突防最優(yōu)制導(dǎo)律:
(24)
在側(cè)向平面內(nèi),同樣以射程為自變量設(shè)計附加視線角為:
(25)
其中:kT為頻率系數(shù),φDT為幅值系數(shù)。
假設(shè)對飛行器進入方向沒有約束,則在側(cè)向平面取狀態(tài)變量為:
(26)
同理,以能量最省為性能指標,可獲得側(cè)向平面機動最優(yōu)制導(dǎo)律為:
(27)
4 仿真分析
采用美軍CAV滑翔彈頭的總體及氣動參數(shù),取俯沖段高度h0=30 km,距目標點射程L0=100 km,速度V0=2 500 m/s,速度傾角θ0=-10°,航跡偏航角σ0=0°,攻角α∈[-20°, 20°],落角約束λDF=-60°,末端速度約束Vf≥800 m/s。落點位置精度要求Δx≤1 m,落角精度要求Δλ≤1°,速度精度要求ΔV≤2 m/s。φDN=φDT=1°,kD=kT,機動結(jié)束高度hme=2 km。
機動能力預(yù)測的樣本容量取為30 000,其中27 000個作為訓(xùn)練樣本,3 000個作為測試樣本。依據(jù)隨機運行的平均結(jié)果選擇最優(yōu)的參數(shù)配置,本文使用平均相對誤差(Mean Relative Error,MRE)作為評價指標,通過下式計算得到:
(28)
其中:yi為真實值,
為預(yù)測值,n為樣本數(shù)據(jù)量。
深度置信網(wǎng)絡(luò)模型的結(jié)構(gòu)參數(shù),影響訓(xùn)練過程和預(yù)測結(jié)果誤差。根據(jù)已有研究以及數(shù)據(jù)特點,CDBN的學(xué)習(xí)率取為γ= 0.02,CRBM最大迭代次數(shù)取為200。為了使訓(xùn)練效果達到最優(yōu)化,減小誤差,對預(yù)測模型訓(xùn)練的隱層層數(shù)和隱層節(jié)點數(shù)進行對比優(yōu)選。本文取隱層數(shù)目為2~6 層,設(shè)定隱層節(jié)點數(shù)為24,對隱層數(shù)目進行優(yōu)選,結(jié)果如表1 所示。
表1?隱層數(shù)目的影響
Tab.1 Effect of number of hidden layers
表中比較了隱層數(shù)目對預(yù)測誤差的影響,當隱層數(shù)目為3時,MRE值為4.6%,預(yù)測模型準確度最高。隱層數(shù)目小于3時,模型誤差隨隱層數(shù)目增加而減小;隱層數(shù)目大于3 時,模型誤差隨隱層數(shù)目增大而增大,模型凸顯“過擬合”效應(yīng)。
對于隱含層神經(jīng)元個數(shù)的選取尚無理論上的指導(dǎo),沒有統(tǒng)一的經(jīng)驗公式。假定隱層數(shù)目為3,討論和確定適宜的節(jié)點數(shù)目。本文討論最后一層隱含層節(jié)點數(shù)目為4~20時的預(yù)測效果。
表2?最后一層隱含層節(jié)點數(shù)目的影響
Tab.2 Effect of nodes number in the last hidden layer
由表2可知,節(jié)點數(shù)為12時,模型預(yù)測效果最佳。綜上,本文設(shè)定預(yù)測模型的隱層數(shù)目為3,各隱層的節(jié)點數(shù)為24-24-12。最終確定CDBN的網(wǎng)絡(luò)結(jié)構(gòu)為8-24-24-12-1。
將設(shè)計好的CDBN與BP網(wǎng)絡(luò)進行對比,考慮多層BP網(wǎng)絡(luò)存在梯度消失問題,取BP網(wǎng)絡(luò)結(jié)構(gòu)為8-80-80-1,對3 000個測試樣本進行預(yù)測,對比散點圖與擬合誤差散點圖分別如圖6與圖7所示。從圖 7可以看出,相對于BP網(wǎng)絡(luò),CDBN明顯具有更小的訓(xùn)練誤差。
圖6 CDBN的預(yù)測結(jié)果散點圖
Fig.6 Scatter diagram of CDBN prediction results
圖7 CDBN與BP的測試誤差散點圖
Fig.7 Scatter diagram of test results for CDBN and BP
由圖8可以看出,CDBN網(wǎng)絡(luò)的初始誤差得到減小,誤差的下降速度也快于BP網(wǎng)絡(luò)。這是由于CDBN通過對三層CRBM的貪婪無監(jiān)督預(yù)訓(xùn)練,獲得了更好的神經(jīng)網(wǎng)絡(luò)權(quán)值。
圖8 CDBN與BP的訓(xùn)練殘差對數(shù)曲線
Fig.8 Logarithm of training error results for CDBN and BP
接下來進行經(jīng)由點規(guī)劃,并進一步規(guī)劃末段機動彈道。首先將經(jīng)由點位置的Z向坐標初值取為Z=5 km,不同的經(jīng)由點速度方向?qū)?yīng)著不同的末端速度,一般隨著航向角的增大,末端速度呈現(xiàn)先增大后減小的趨勢,由此可以得到在該經(jīng)由點位置下的最優(yōu)速度方向。
表3?航向角對末端速度的影響
Tab.3 Effect of heading angle on terminal velocity
經(jīng)過黃金分割法搜索,當前經(jīng)由點位置Z=5 km 下的最優(yōu)航向角為-10°。進一步,根據(jù)牛頓迭代法更新經(jīng)由點位置,并搜索相應(yīng)的最優(yōu)航向角。為了給彈道機動預(yù)留速度增量,在期望終端速度的基礎(chǔ)上增大100 m/s作為經(jīng)由點位置設(shè)計的速度約束,通過牛頓迭代搜索得到滿足該速度約束的經(jīng)由點位置。
終端速度隨經(jīng)由點Z向位置的變化曲線如圖9所示。經(jīng)過迭代搜索,經(jīng)由點的最大側(cè)向位置為Z=5.36 km,對應(yīng)的最優(yōu)航向角約束為-12°。
圖9 終端速度隨經(jīng)由點Z向位置的變化
Fig.9 Terminal velocity versus?Z?position of waypoint
對于期望的末端速度約束,根據(jù)機動頻率與末端速度的單調(diào)性,迭代搜索得到三角函數(shù)型視線角的機動頻率系數(shù)kD=4.02。終端速度隨機動頻率的變化曲線如圖10所示。
圖10 終端速度隨機動頻率系數(shù)的變化
Fig.10 Terminal velocity versus maneuvering frequency coefficient
末段規(guī)劃彈道如圖11~圖15所示。
圖11 攻角隨時間的變化曲線
Fig.11 Time histories of attack angle
圖12 傾側(cè)角隨時間的變化曲線
Fig.12 Time histories of bank angle
由俯沖段彈道參數(shù)曲線,落點位置誤差為0.2 m,落角誤差為0.4°,速度誤差為0.5 m/s,機動彈道規(guī)劃耗時0.5 s。表明本文所提的彈道規(guī)劃方法在實現(xiàn)擺動機動飛行的同時,能夠高精度地滿足終端落點、落角及速度約束條件。
圖13 三維彈道曲線
Fig.13 Three-dimensional trajectory curve
圖14 速度曲線
Fig.14 Time histories of velocity
圖15 彈道傾角曲線
Fig.15 Time histories of flight path angle
5 結(jié) 論
本文針對滑翔導(dǎo)彈末段多約束智能彈道規(guī)劃問題展開研究,取得了如下研究成果:
針對連續(xù)數(shù)值型機動能力預(yù)測問題,提出了一種離線訓(xùn)練CDBN用于在線預(yù)測的方法。仿真表明基于CDBN的機動能力預(yù)測相對于BP網(wǎng)絡(luò)具有更高精度,且具有較高的效率。通過智能規(guī)劃經(jīng)由點的Z向位置與航向角,優(yōu)化了末段能量分配,在保證對目標多約束精確打擊的同時增大了末段機動范圍。針對增強突防能力的彈道擺動機動,引入了三角函數(shù)形式的彈目視線角,設(shè)計了機動彈道最優(yōu)末制導(dǎo)律,實現(xiàn)了對期望視線角的跟蹤,最后通過調(diào)節(jié)機動頻率實現(xiàn)了速度控制。落點位置、落角、速度誤差分別為0.2 m,0.4°,0.5 m/s。彈道規(guī)劃最大耗時為0.5 s,能夠滿足工程應(yīng)用的快速性要求。
關(guān)注微信公眾號:人工智能技術(shù)與咨詢。了解更多咨詢!
審核編輯:符乾江
評論
查看更多