0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google氣球互聯(lián)網(wǎng):用 AI 控制氣球?qū)Ш?,不?WiFi 被 “吹”出服務(wù)區(qū)

工程師鄧生 ? 來源:雷鋒網(wǎng) ? 作者:貝爽 ? 2020-12-04 11:11 ? 次閱讀

更長的飛行時(shí)間,更少的能量消耗,更復(fù)雜的飛行動(dòng)作?!边@是 Google「氣球互聯(lián)網(wǎng)」項(xiàng)目 “Project Loon”交回的最新成績單。

Google 母公司 Alphabet 于 2013 年 6 月正式啟動(dòng) Project Loon 計(jì)劃,該計(jì)劃旨在將 AI 技術(shù)與超壓氣球相結(jié)合,為更多地區(qū)提供低價(jià)且高速的無線互聯(lián)網(wǎng)服務(wù),尤其是與市中心相距甚遠(yuǎn)的偏遠(yuǎn)地區(qū)。

前段時(shí)間,Loon 順利完成了最新一輪飛行測(cè)試。

昨日,最新分析結(jié)果顯示,在飛躍太平洋的 39 天里,Loon 氣球表現(xiàn)出了比以往更好的性能——基于最新人工智能系統(tǒng),它能夠更快地計(jì)算出氣球的最佳導(dǎo)航路徑;在目標(biāo)區(qū)域上飛行的時(shí)間更長,消耗的能量更少,更關(guān)鍵的是,它還提出了研究團(tuán)隊(duì)此前未曾想到過的新的導(dǎo)航動(dòng)作。

而這一最新人工智能系統(tǒng)正是基于強(qiáng)化學(xué)習(xí)( Reinforcement-Learnin,RL)算法的 AI 系統(tǒng)。

研究人員稱,這是他們首次將 RL 系統(tǒng)應(yīng)用到航空航天產(chǎn)品中。Loon 取得的成績,表明 RL 可以作為解決現(xiàn)實(shí)世界自主控制問題的有效解決方案。

目前,有關(guān)這項(xiàng)研究發(fā)現(xiàn)的論文成果已經(jīng)登上了《Nature》雜志。

接下來,我們來具體聊一下:Google 為什么要開展「氣球互聯(lián)網(wǎng)」計(jì)劃,以及強(qiáng)化學(xué)習(xí)系統(tǒng)到底解決了哪些難題。

「氣球互聯(lián)網(wǎng)」計(jì)劃

你可能難以想象,在互聯(lián)網(wǎng)如此普及的當(dāng)下,全球還有一半的以上的用戶無法享受到這項(xiàng)服務(wù)。

2013 年,為了讓 30 多億用戶所在的偏遠(yuǎn)地區(qū)覆蓋互聯(lián)網(wǎng),Alphabet 正式啟動(dòng)了高空互聯(lián)網(wǎng)服務(wù)項(xiàng)目。之后幾年,陸續(xù)有不少科技公司也加入了這個(gè)隊(duì)伍,比如 SpaceX、OneWeb 等。

其中最值得一提的,是馬斯克的 “太空互聯(lián)網(wǎng)”計(jì)劃,他計(jì)劃向太空發(fā)射 42000 顆通信衛(wèi)星,在地球低空軌道形成一個(gè)巨型星座來完成與地面的通信任務(wù)。目前他已經(jīng)成功發(fā)射了近 900 顆衛(wèi)星。

相比于馬斯克的「太空衛(wèi)星」,Alpbet 則把通信業(yè)務(wù)的核心放在了「高空氣球」上。

具體來說,用「高空氣球」實(shí)現(xiàn)地面通信的過程如下:當(dāng)氣球上升到高空平流層后(超過云層 12 英里高),利用 “太陽能技術(shù)”吸收能量以作為電力支持,然后通過 “算法系統(tǒng)控制( Algorithmic Control)”讓氣球上下飄動(dòng),并根據(jù)風(fēng)向捕捉風(fēng)流信號(hào),將氣球穩(wěn)定在一個(gè)固定區(qū)域。

最后通過 “網(wǎng)狀回路(Mesh Networking)技術(shù)”,將互聯(lián)網(wǎng)數(shù)據(jù)包從一個(gè)氣球傳輸至另一個(gè)氣球;從氣球傳輸至在屋頂建立天線的家庭和企業(yè)用戶;最后將這些用戶的數(shù)據(jù)傳輸出去。

這一過程中,如果氣球在平流層飛行的時(shí)間越長,意味著 Loon 越可以在較低成本下為目標(biāo)區(qū)域提供更長久的連通性,這也意味著互聯(lián)網(wǎng)服務(wù)將不僅可以覆蓋到更偏遠(yuǎn)的地區(qū),而且它的價(jià)格也會(huì)更便宜。

在近幾年的飛行測(cè)試中,Loon 的平流層飛行時(shí)長不斷刷新著世界紀(jì)錄,目前最高成績已經(jīng)達(dá)到 312 天,接近一整年。

這項(xiàng)最高飛行紀(jì)錄開始于 2019 年 5 月,Loon 從波多黎各(Puerto Rico)起飛,進(jìn)入秘魯(Peru),然后在那里進(jìn)行為期三個(gè)月的飛行測(cè)試。測(cè)試結(jié)束后,向南越過太平洋,于今年 3 月在墨西哥的巴哈(Baja)登錄。

這項(xiàng)記錄刷新了當(dāng)時(shí) 223 天的最高記錄,Loon 首席技術(shù)官 Sal Candido 在博客中表示,創(chuàng)紀(jì)錄的飛行成績是該公司努力發(fā)展技術(shù),并以創(chuàng)新的方式推動(dòng)硬件和軟件向不斷升級(jí)的結(jié)果。

當(dāng)時(shí) Loon 的軟件系統(tǒng)還并未引入 RL。

目前,Loon 已經(jīng)在澳大利亞、昆士蘭、肯尼亞、新西蘭、加州中央峽谷以及巴西利亞東北部等多個(gè)地區(qū)提供了 Loon 測(cè)試服務(wù)。去年,因受到颶風(fēng)襲擊的影響,美國電信運(yùn)營商還利用 Project Loon 為超過 25 萬的災(zāi)民提供了網(wǎng)絡(luò)連接。

不過,在以上服務(wù)過程中,Loon 的平流層導(dǎo)航問題依然面臨很大的挑戰(zhàn)。

此次,基于 RL 系統(tǒng)的提出為解決當(dāng)前的挑戰(zhàn)提供了一種全新的解決方案,與原有的氣球?qū)Ш较到y(tǒng)相比,RL 算法改善了飛行過程中的決策時(shí)間問題。

谷歌加拿大公司的研究科學(xué)家、論文一作馬克 · 貝勒馬爾(Marc Bellemare)表示,

通過強(qiáng)化學(xué)習(xí),我們可以根據(jù)數(shù)據(jù)決定該如何操作,AI 不僅可以做出決策,而且可以根據(jù)移動(dòng)的時(shí)間做出實(shí)時(shí)決策。

Loon:強(qiáng)化學(xué)習(xí)飛行控制器

如果在一個(gè)區(qū)域提供完全的網(wǎng)絡(luò)覆蓋,Loon 一次至少要運(yùn)行 5 到 10 個(gè)氣球。如果覆蓋范圍擴(kuò)大,需要調(diào)用周圍的備用氣球,在空中組建一個(gè)更大的網(wǎng)狀網(wǎng)絡(luò)。

在這一過程中,氣球一般會(huì)出現(xiàn)以下狀況:一是因電池報(bào)廢等因素,導(dǎo)致氣球壽命縮短并自動(dòng)降落。二是受颶風(fēng)等惡劣天氣影響,氣球被吹出固定服務(wù)區(qū);

三是最關(guān)鍵也是難度最高的氣球?qū)Ш健?/p>

上文已經(jīng)提到過,Loon 的氣球?qū)Ш绞峭ㄟ^球體上下移動(dòng),尋找合適的氣流來進(jìn)行導(dǎo)航。

如下圖(a)氣球通過在不同高度的風(fēng)之間移動(dòng)來接近它的指定位置。(b)顯示了氣球的飛行線路,藍(lán)色圓直徑代表 50 公里,為氣球之間的最佳距離。

但氣流是不穩(wěn)定的東西??匡L(fēng)在天空中移動(dòng)就像使用一個(gè)道路網(wǎng),在那里街道會(huì)改變方向、車道數(shù)和速度限制,甚至在不可預(yù)知的時(shí)間完全消失。

因此要做到這一點(diǎn)就需要一套更復(fù)雜的算法—強(qiáng)化學(xué)習(xí)。通過訓(xùn)練飛行控制器,RL 可以形成一套控制策略,以處理高維的、異質(zhì)的輸入,并優(yōu)化長期目標(biāo)。比如,RL 已經(jīng)在 Dota 2 等即時(shí)策略性游戲中多次戰(zhàn)勝人類頂級(jí)玩家,而且在長遠(yuǎn)策略方面表現(xiàn)驚人。

而對(duì)于一個(gè)好的飛行控制器,需要確保三點(diǎn):精準(zhǔn)且豐富和數(shù)據(jù)集,最低負(fù)載消耗以及低計(jì)算成本。

在數(shù)據(jù)集方面,研究人員根據(jù)歐洲中期天氣預(yù)報(bào)中心(ECMWF)的全球再分析數(shù)據(jù)(ERA5)創(chuàng)建了可信的風(fēng)數(shù)據(jù)集,并通過數(shù)據(jù)集的模型訓(xùn)練重新解釋歷史天氣觀測(cè)的結(jié)果。(ERA5 提供了用程序噪聲修改的基準(zhǔn)風(fēng),通過產(chǎn)生高分辨率風(fēng)場(chǎng)改變驅(qū)動(dòng)程序噪聲的隨機(jī)種子,可以提高控制器建模誤差的魯棒性。)

在最低負(fù)載消耗方面,研究人員將部署控制器的平均功率控制在了 StationSeeker 之下(之前的風(fēng)控制系統(tǒng)),同時(shí)使用獎(jiǎng)勵(lì) r 對(duì)目標(biāo)進(jìn)行了編碼。當(dāng)氣球距離保持在 50 公里范圍內(nèi)時(shí),r=1 為最大值。當(dāng)然這種獎(jiǎng)勵(lì)也與氣球的狀態(tài)有關(guān),也就是說,它的響應(yīng)隨時(shí)間 t 的變化而提供不同的指示(上升、下降或停留)

當(dāng)系數(shù)小于 1 時(shí),最優(yōu)控制器將使未來回報(bào)的預(yù)測(cè)折現(xiàn)總和最大化,即 “回報(bào)”。

其中 E 表示期望值。Rs 表示飛行控制器從初始狀態(tài)形成的長期值。

最后,計(jì)算成本主要體現(xiàn)在風(fēng)的測(cè)量上,研究人員使用高斯過程將氣球的測(cè)量結(jié)果與 ECMWF 的預(yù)報(bào)結(jié)果相結(jié)合,將風(fēng)預(yù)報(bào)作為先驗(yàn)平均值。后驗(yàn)分布的方差量化了不同風(fēng)估計(jì)的不確定性。作為控制器的輸入,對(duì)氣球正上方和下方的風(fēng)大小和相對(duì)方位進(jìn)行編碼,在 181 個(gè)氣壓等級(jí)下,范圍為 5 kPa 到 14 kPa。

太平洋高空測(cè)試

基于以上 RL 控制器,研究人員在太平洋上空進(jìn)行了為期 39 天的氣球?qū)Ш綔y(cè)試。

從 2019 年 12 月 17 日—2020 年 1 月 25 日,Loon 累計(jì)飛行了約 2884 小時(shí)。這些數(shù)據(jù)被劃分為 851 個(gè)三小時(shí)時(shí)間,每個(gè)時(shí)間段作為一個(gè)獨(dú)立樣本。最終測(cè)試結(jié)果顯示,

RL 控制器在平流層內(nèi)飛行的時(shí)間更長(TWR50 79% 對(duì) 72%;U=850, 410.5,P《10-4);高度控制使用的功率更少(29w 對(duì) 33w,U=1048,814,P》10-4)。

與 StationSeeker 相比,在 50 公里射程內(nèi),RL 控制器根據(jù)風(fēng)況使用不同的策略,可以使其在 25-50km 射程內(nèi)花費(fèi)更多的時(shí)間(圖 4b);通過主動(dòng)移動(dòng)以返回目標(biāo)區(qū)域,縮短了偏移時(shí)間(圖 4c)。同時(shí)也讓它節(jié)省了更多能耗(圖 d)最后,RL 控制器利用海拔高度將電池容量過剩的太陽能轉(zhuǎn)化為了勢(shì)能(圖 4e)。

這些結(jié)果表明,強(qiáng)化學(xué)習(xí)是解決現(xiàn)實(shí)世界中自主控制問題的有效解決方案,在傳統(tǒng)控制方法(StationSeeker)無法滿足要求的情況下,需要?jiǎng)?chuàng)建與真實(shí)動(dòng)態(tài)環(huán)境持續(xù)交互的人工智能體。更長的飛行時(shí)間,更少的能量消耗,更復(fù)雜的飛行動(dòng)作。

這是 Google「氣球互聯(lián)網(wǎng)」項(xiàng)目“Project Loon”交回的最新成績單。

Google 母公司 Alphabet 于 2013 年 6 月正式啟動(dòng) Project Loon 計(jì)劃,該計(jì)劃旨在將 AI 技術(shù)與超壓氣球相結(jié)合,為更多地區(qū)提供低價(jià)且高速的無線互聯(lián)網(wǎng)服務(wù),尤其是與市中心相距甚遠(yuǎn)的偏遠(yuǎn)地區(qū)。

前段時(shí)間,Loon 順利完成了最新一輪飛行測(cè)試。

昨日,最新分析結(jié)果顯示,在飛躍太平洋的 39 天里,Loon 氣球表現(xiàn)出了比以往更好的性能——基于最新人工智能系統(tǒng),它能夠更快地計(jì)算出氣球的最佳導(dǎo)航路徑;在目標(biāo)區(qū)域上飛行的時(shí)間更長,消耗的能量更少,更關(guān)鍵的是,它還提出了研究團(tuán)隊(duì)此前未曾想到過的新的導(dǎo)航動(dòng)作。

而這一最新人工智能系統(tǒng)正是基于強(qiáng)化學(xué)習(xí)( Reinforcement-Learnin,RL)算法的 AI 系統(tǒng)。

研究人員稱,這是他們首次將 RL 系統(tǒng)應(yīng)用到航空航天產(chǎn)品中。Loon 取得的成績,表明 RL 可以作為解決現(xiàn)實(shí)世界自主控制問題的有效解決方案。

目前,有關(guān)這項(xiàng)研究發(fā)現(xiàn)的論文成果已經(jīng)登上了《Nature》雜志。

接下來,我們來具體聊一下:Google 為什么要開展「氣球互聯(lián)網(wǎng)」計(jì)劃,以及強(qiáng)化學(xué)習(xí)系統(tǒng)到底解決了哪些難題。

「氣球互聯(lián)網(wǎng)」計(jì)劃

你可能難以想象,在互聯(lián)網(wǎng)如此普及的當(dāng)下,全球還有一半的以上的用戶無法享受到這項(xiàng)服務(wù)。

2013 年,為了讓 30 多億用戶所在的偏遠(yuǎn)地區(qū)覆蓋互聯(lián)網(wǎng),Alphabet 正式啟動(dòng)了高空互聯(lián)網(wǎng)服務(wù)項(xiàng)目。之后幾年,陸續(xù)有不少科技公司也加入了這個(gè)隊(duì)伍,比如 SpaceX、OneWeb 等。

其中最值得一提的,是馬斯克的“太空互聯(lián)網(wǎng)”計(jì)劃,他計(jì)劃向太空發(fā)射 42000 顆通信衛(wèi)星,在地球低空軌道形成一個(gè)巨型星座來完成與地面的通信任務(wù)。目前他已經(jīng)成功發(fā)射了近 900 顆衛(wèi)星。

相比于馬斯克的「太空衛(wèi)星」,Alpbet 則把通信業(yè)務(wù)的核心放在了「高空氣球」上。

具體來說,用「高空氣球」實(shí)現(xiàn)地面通信的過程如下:當(dāng)氣球上升到高空平流層后(超過云層 12 英里高),利用“太陽能技術(shù)”吸收能量以作為電力支持,然后通過“算法系統(tǒng)控制( Algorithmic Control)”讓氣球上下飄動(dòng),并根據(jù)風(fēng)向捕捉風(fēng)流信號(hào),將氣球穩(wěn)定在一個(gè)固定區(qū)域。

最后通過“網(wǎng)狀回路(Mesh Networking)技術(shù)”,將互聯(lián)網(wǎng)數(shù)據(jù)包從一個(gè)氣球傳輸至另一個(gè)氣球;從氣球傳輸至在屋頂建立天線的家庭和企業(yè)用戶;最后將這些用戶的數(shù)據(jù)傳輸出去。

這一過程中,如果氣球在平流層飛行的時(shí)間越長,意味著 Loon 越可以在較低成本下為目標(biāo)區(qū)域提供更長久的連通性,這也意味著互聯(lián)網(wǎng)服務(wù)將不僅可以覆蓋到更偏遠(yuǎn)的地區(qū),而且它的價(jià)格也會(huì)更便宜。

在近幾年的飛行測(cè)試中,Loon 的平流層飛行時(shí)長不斷刷新著世界紀(jì)錄,目前最高成績已經(jīng)達(dá)到 312 天,接近一整年。

這項(xiàng)最高飛行紀(jì)錄開始于 2019 年 5 月,Loon 從波多黎各(Puerto Rico)起飛,進(jìn)入秘魯(Peru),然后在那里進(jìn)行為期三個(gè)月的飛行測(cè)試。測(cè)試結(jié)束后,向南越過太平洋,于今年 3 月在墨西哥的巴哈(Baja)登錄。

這項(xiàng)記錄刷新了當(dāng)時(shí) 223 天的最高記錄,Loon 首席技術(shù)官 Sal Candido 在博客中表示,創(chuàng)紀(jì)錄的飛行成績是該公司努力發(fā)展技術(shù),并以創(chuàng)新的方式推動(dòng)硬件和軟件向不斷升級(jí)的結(jié)果。

當(dāng)時(shí) Loon 的軟件系統(tǒng)還并未引入 RL。

目前,Loon 已經(jīng)在澳大利亞、昆士蘭、肯尼亞、新西蘭、加州中央峽谷以及巴西利亞東北部等多個(gè)地區(qū)提供了 Loon 測(cè)試服務(wù)。去年,因受到颶風(fēng)襲擊的影響,美國電信運(yùn)營商還利用 Project Loon 為超過 25 萬的災(zāi)民提供了網(wǎng)絡(luò)連接。

不過,在以上服務(wù)過程中,Loon 的平流層導(dǎo)航問題依然面臨很大的挑戰(zhàn)。

此次,基于 RL 系統(tǒng)的提出為解決當(dāng)前的挑戰(zhàn)提供了一種全新的解決方案,與原有的氣球?qū)Ш较到y(tǒng)相比,RL 算法改善了飛行過程中的決策時(shí)間問題。

谷歌加拿大公司的研究科學(xué)家、論文一作馬克·貝勒馬爾(Marc Bellemare)表示,

通過強(qiáng)化學(xué)習(xí),我們可以根據(jù)數(shù)據(jù)決定該如何操作,AI 不僅可以做出決策,而且可以根據(jù)移動(dòng)的時(shí)間做出實(shí)時(shí)決策。

Loon:強(qiáng)化學(xué)習(xí)飛行控制器

如果在一個(gè)區(qū)域提供完全的網(wǎng)絡(luò)覆蓋,Loon 一次至少要運(yùn)行 5 到 10 個(gè)氣球。如果覆蓋范圍擴(kuò)大,需要調(diào)用周圍的備用氣球,在空中組建一個(gè)更大的網(wǎng)狀網(wǎng)絡(luò)。

在這一過程中,氣球一般會(huì)出現(xiàn)以下狀況:一是因電池報(bào)廢等因素,導(dǎo)致氣球壽命縮短并自動(dòng)降落。二是受颶風(fēng)等惡劣天氣影響,氣球被吹出固定服務(wù)區(qū);

三是最關(guān)鍵也是難度最高的氣球?qū)Ш健?/p>

上文已經(jīng)提到過,Loon 的氣球?qū)Ш绞峭ㄟ^球體上下移動(dòng),尋找合適的氣流來進(jìn)行導(dǎo)航。

如下圖(a)氣球通過在不同高度的風(fēng)之間移動(dòng)來接近它的指定位置。(b)顯示了氣球的飛行線路,藍(lán)色圓直徑代表 50 公里,為氣球之間的最佳距離。

但氣流是不穩(wěn)定的東西??匡L(fēng)在天空中移動(dòng)就像使用一個(gè)道路網(wǎng),在那里街道會(huì)改變方向、車道數(shù)和速度限制,甚至在不可預(yù)知的時(shí)間完全消失。

因此要做到這一點(diǎn)就需要一套更復(fù)雜的算法—強(qiáng)化學(xué)習(xí)。通過訓(xùn)練飛行控制器,RL 可以形成一套控制策略,以處理高維的、異質(zhì)的輸入,并優(yōu)化長期目標(biāo)。比如,RL 已經(jīng)在 Dota 2 等即時(shí)策略性游戲中多次戰(zhàn)勝人類頂級(jí)玩家,而且在長遠(yuǎn)策略方面表現(xiàn)驚人。

而對(duì)于一個(gè)好的飛行控制器,需要確保三點(diǎn):精準(zhǔn)且豐富和數(shù)據(jù)集,最低負(fù)載消耗以及低計(jì)算成本。

在數(shù)據(jù)集方面,研究人員根據(jù)歐洲中期天氣預(yù)報(bào)中心(ECMWF)的全球再分析數(shù)據(jù)(ERA5)創(chuàng)建了可信的風(fēng)數(shù)據(jù)集,并通過數(shù)據(jù)集的模型訓(xùn)練重新解釋歷史天氣觀測(cè)的結(jié)果。(ERA5 提供了用程序噪聲修改的基準(zhǔn)風(fēng),通過產(chǎn)生高分辨率風(fēng)場(chǎng)改變驅(qū)動(dòng)程序噪聲的隨機(jī)種子,可以提高控制器建模誤差的魯棒性。)

在最低負(fù)載消耗方面,研究人員將部署控制器的平均功率控制在了 StationSeeker 之下(之前的風(fēng)控制系統(tǒng)),同時(shí)使用獎(jiǎng)勵(lì)r對(duì)目標(biāo)進(jìn)行了編碼。當(dāng)氣球距離保持在 50 公里范圍內(nèi)時(shí),r=1 為最大值。當(dāng)然這種獎(jiǎng)勵(lì)也與氣球的狀態(tài)有關(guān),也就是說,它的響應(yīng)隨時(shí)間t的變化而提供不同的指示(上升、下降或停留)

當(dāng)系數(shù)小于 1 時(shí),最優(yōu)控制器將使未來回報(bào)的預(yù)測(cè)折現(xiàn)總和最大化,即“回報(bào)”。

其中E表示期望值。Rs表示飛行控制器從初始狀態(tài)形成的長期值。

最后,計(jì)算成本主要體現(xiàn)在風(fēng)的測(cè)量上,研究人員使用高斯過程將氣球的測(cè)量結(jié)果與 ECMWF 的預(yù)報(bào)結(jié)果相結(jié)合,將風(fēng)預(yù)報(bào)作為先驗(yàn)平均值。后驗(yàn)分布的方差量化了不同風(fēng)估計(jì)的不確定性。作為控制器的輸入,對(duì)氣球正上方和下方的風(fēng)大小和相對(duì)方位進(jìn)行編碼,在 181 個(gè)氣壓等級(jí)下,范圍為 5 kPa 到 14 kPa。

太平洋高空測(cè)試

基于以上 RL 控制器,研究人員在太平洋上空進(jìn)行了為期 39 天的氣球?qū)Ш綔y(cè)試。

從 2019 年 12 月 17 日—2020 年 1 月 25 日,Loon 累計(jì)飛行了約 2884 小時(shí)。這些數(shù)據(jù)被劃分為 851 個(gè)三小時(shí)時(shí)間,每個(gè)時(shí)間段作為一個(gè)獨(dú)立樣本。最終測(cè)試結(jié)果顯示,

RL 控制器在平流層內(nèi)飛行的時(shí)間更長(TWR50 79% 對(duì) 72%;U=850, 410.5,P《10-4);高度控制使用的功率更少(29w 對(duì) 33w,U=1048,814,P《10-4)。

與 StationSeeker 相比,在 50 公里射程內(nèi),RL 控制器根據(jù)風(fēng)況使用不同的策略,可以使其在 25-50km 射程內(nèi)花費(fèi)更多的時(shí)間(圖 4b);通過主動(dòng)移動(dòng)以返回目標(biāo)區(qū)域,縮短了偏移時(shí)間(圖 4c)。同時(shí)也讓它節(jié)省了更多能耗(圖d)最后,RL 控制器利用海拔高度將電池容量過剩的太陽能轉(zhuǎn)化為了勢(shì)能(圖 4e)。

這些結(jié)果表明,強(qiáng)化學(xué)習(xí)是解決現(xiàn)實(shí)世界中自主控制問題的有效解決方案,在傳統(tǒng)控制方法(StationSeeker)無法滿足要求的情況下,需要?jiǎng)?chuàng)建與真實(shí)動(dòng)態(tài)環(huán)境持續(xù)交互的人工智能體。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1752

    瀏覽量

    57333
  • 互聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    54

    文章

    11042

    瀏覽量

    102460
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29435

    瀏覽量

    267752
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    淺談高速公路服務(wù)區(qū)光儲(chǔ)充電站運(yùn)行解決方案

    環(huán)節(jié)的用電便利性?;诖?,本文首先簡(jiǎn)要分析了工程概況,其次闡述了高速公路服務(wù)區(qū)光儲(chǔ)充電站運(yùn)行控制問題,之后提出了高速公路服務(wù)區(qū)光儲(chǔ)充電站運(yùn)行控制措施,以期對(duì)相關(guān)部門的工作有所幫助。 關(guān)
    的頭像 發(fā)表于 10-18 10:57 ?42次閱讀
    淺談高速公路<b class='flag-5'>服務(wù)區(qū)</b>光儲(chǔ)充電站運(yùn)行解決方案

    中國高速服務(wù)區(qū)加油站應(yīng)用觸摸屏查詢一體機(jī)智慧便民

    隨著數(shù)字化科技的飛速發(fā)展,OBOO鷗柏觸摸屏查詢一體機(jī)在高速公路服務(wù)區(qū)、加油站等交通領(lǐng)域發(fā)揮著越來越重要的作用。服務(wù)區(qū)展廳展館應(yīng)用可以提供包括自駕車導(dǎo)航、餐飲連鎖、旅游景區(qū)、娛樂、商務(wù)、教育、信息
    的頭像 發(fā)表于 07-29 11:15 ?219次閱讀
    中國高速<b class='flag-5'>服務(wù)區(qū)</b>加油站應(yīng)用觸摸屏查詢一體機(jī)智慧便民

    ESP8266無法連接到互聯(lián)網(wǎng)是怎么回事?

    您好,我更改了路由器上的頻道,現(xiàn)在我的ESP8266無法連接到互聯(lián)網(wǎng)。它仍然連接到本地網(wǎng)絡(luò),但即使將路由器切換回原始頻道也無法解決我的問題。我在下面發(fā)布了at命令,如果可以的話,請(qǐng)幫忙! 在
    發(fā)表于 07-16 06:14

    【HZHY-AI300G智能盒試用連載體驗(yàn)】+ 智能工業(yè)互聯(lián)網(wǎng)網(wǎng)關(guān)

    的接口實(shí)現(xiàn)WiFi和RS485傳感器的連接工作,構(gòu)建工業(yè)互聯(lián)網(wǎng)關(guān)。 4)將所接收到的數(shù)據(jù)上傳至MQTT服務(wù)器平臺(tái)。 外觀介紹 周末就拿到了開發(fā)板,非常的小巧,和實(shí)驗(yàn)室使用的工業(yè)網(wǎng)關(guān)做個(gè)對(duì)比,簡(jiǎn)直是美女
    發(fā)表于 07-15 19:49

    esp8266已連接到Wifi但無法連接到互聯(lián)網(wǎng),為什么?

    首先,我想說對(duì)不起,如果我的帖子在錯(cuò)誤的線程中。在那之后,我想問一個(gè)問題,我的 esp12E 已連接到 Wifi,但它無法連接到互聯(lián)網(wǎng),即使 wifi 連接到互聯(lián)網(wǎng)和其他設(shè)備,它仍然完
    發(fā)表于 07-09 07:11

    工業(yè)互聯(lián)網(wǎng)平臺(tái)中什么是關(guān)鍵

    工業(yè)互聯(lián)網(wǎng)平臺(tái)是工業(yè)領(lǐng)域數(shù)字化轉(zhuǎn)型的重要支撐,其關(guān)鍵要素包括以下幾個(gè)方面: 網(wǎng)絡(luò)基礎(chǔ)設(shè)施 網(wǎng)絡(luò)基礎(chǔ)設(shè)施是工業(yè)互聯(lián)網(wǎng)平臺(tái)的基礎(chǔ),包括有線網(wǎng)絡(luò)、無線網(wǎng)絡(luò)、物聯(lián)網(wǎng)等。工業(yè)互聯(lián)網(wǎng)平臺(tái)需要實(shí)現(xiàn)設(shè)
    的頭像 發(fā)表于 07-02 09:37 ?560次閱讀

    什么是衛(wèi)星互聯(lián)網(wǎng)?衛(wèi)星互聯(lián)網(wǎng)的組成

    衛(wèi)星互聯(lián)網(wǎng)是指基于衛(wèi)星通信技術(shù)接入互聯(lián)網(wǎng),其業(yè)務(wù)可覆蓋全球。通過一定數(shù)量衛(wèi)星的規(guī)模組網(wǎng),構(gòu)建具備實(shí)時(shí)信息傳輸能力的星座系統(tǒng),衛(wèi)星互聯(lián)網(wǎng)可向終端用戶提供以寬帶互聯(lián)網(wǎng)接入為主的通信
    發(fā)表于 04-17 10:01 ?916次閱讀
    什么是衛(wèi)星<b class='flag-5'>互聯(lián)網(wǎng)</b>?衛(wèi)星<b class='flag-5'>互聯(lián)網(wǎng)</b>的組成

    工業(yè)互聯(lián)網(wǎng)平臺(tái)是什么

    融合,以實(shí)現(xiàn)工業(yè)設(shè)備、系統(tǒng)和過程的智能化連接、管理和優(yōu)化。工業(yè)互聯(lián)網(wǎng)平臺(tái)的主要功能包括設(shè)備連接、數(shù)據(jù)采集、數(shù)據(jù)分析、應(yīng)用開發(fā)和工業(yè)應(yīng)用服務(wù)等。 工業(yè)互聯(lián)網(wǎng)平臺(tái)具有以下特點(diǎn): 1. 設(shè)備連接:通過各種通信協(xié)議和接口,將海量的工業(yè)設(shè)
    的頭像 發(fā)表于 03-28 15:38 ?1351次閱讀

    工業(yè)互聯(lián)網(wǎng)實(shí)訓(xùn)是什么?工業(yè)互聯(lián)網(wǎng)實(shí)訓(xùn)包括哪些?

    工業(yè)互聯(lián)網(wǎng)實(shí)訓(xùn)是一種針對(duì)工業(yè)互聯(lián)網(wǎng)領(lǐng)域的培訓(xùn)課程,旨在幫助學(xué)員掌握工業(yè)互聯(lián)網(wǎng)的基本概念、技術(shù)、應(yīng)用和發(fā)展趨勢(shì)。通過實(shí)訓(xùn),學(xué)員可以了解工業(yè)互聯(lián)網(wǎng)的體系架構(gòu)、平臺(tái)功能、應(yīng)用場(chǎng)景和解決方案,
    的頭像 發(fā)表于 01-17 17:00 ?860次閱讀

    wifi互聯(lián)網(wǎng)連接怎么辦?解決wifi無法訪問互聯(lián)網(wǎng)怎么辦的方法

    wifi互聯(lián)網(wǎng)連接怎么辦?解決wifi無法訪問互聯(lián)網(wǎng)怎么辦的方法? 在現(xiàn)代社會(huì)中,WiFi已經(jīng)成為了我們生活中必不可少的一部分。然而,有時(shí)
    的頭像 發(fā)表于 01-17 11:17 ?3.2w次閱讀

    跨周期,創(chuàng)未來!華秋喜獲中國產(chǎn)業(yè)互聯(lián)網(wǎng)十周年-杰出企業(yè)

    互聯(lián)網(wǎng)、到移動(dòng)互聯(lián)網(wǎng),再到產(chǎn)業(yè)互聯(lián)網(wǎng),中國互聯(lián)網(wǎng)發(fā)展已經(jīng)有20多年,近十年則是產(chǎn)業(yè)互聯(lián)網(wǎng)迅猛發(fā)展的十年。近幾年,隨著中國數(shù)字經(jīng)濟(jì)的高速發(fā)展
    發(fā)表于 01-04 11:57

    AI+工業(yè)互聯(lián)網(wǎng)應(yīng)用的局限性分析

    盡管AI+工業(yè)互聯(lián)網(wǎng)模式的應(yīng)用對(duì)打破工業(yè)生產(chǎn)的效率瓶頸、進(jìn)一步激活生產(chǎn)數(shù)據(jù)要素的潛能、促進(jìn)工業(yè)智能化轉(zhuǎn)型具有重要意義,但由于工業(yè)具有細(xì)分領(lǐng)域眾多、流程環(huán)節(jié)復(fù)雜、容錯(cuò)性低、可靠性和安全性要求高等特點(diǎn),因此目前AI+工業(yè)
    的頭像 發(fā)表于 12-26 15:43 ?852次閱讀

    AI+工業(yè)互聯(lián)網(wǎng)應(yīng)用的局限性分析

    盡管AI+工業(yè)互聯(lián)網(wǎng)模式的應(yīng)用對(duì)打破工業(yè)生產(chǎn)的效率瓶頸、進(jìn)一步激活生產(chǎn)數(shù)據(jù)要素的潛能、促進(jìn)工業(yè)智能化轉(zhuǎn)型具有重要意義,但由于工業(yè)具有細(xì)分領(lǐng)域眾多、流程環(huán)節(jié)復(fù)雜、容錯(cuò)性低、可靠性和安全性要求高等特點(diǎn),因此目前AI+工業(yè)
    發(fā)表于 12-20 10:53 ?353次閱讀

    華秋榮獲億邦動(dòng)力2023產(chǎn)業(yè)互聯(lián)網(wǎng)千峰獎(jiǎng),引領(lǐng)電子產(chǎn)業(yè)數(shù)字化變革

    模式呈現(xiàn)出飛速發(fā)展態(tài)勢(shì)。 而華秋擁有傳統(tǒng)工廠生產(chǎn)制造能力和質(zhì)量管理體系,同時(shí)具備互聯(lián)網(wǎng)平臺(tái)的優(yōu)勢(shì)。我們通過深入分析大量基礎(chǔ)數(shù)據(jù),以互聯(lián)網(wǎng)方式靈活服務(wù)客戶。并且以高效集約化的生產(chǎn)效率和質(zhì)量體系,告別
    發(fā)表于 12-15 09:57

    華秋榮獲億邦動(dòng)力2023產(chǎn)業(yè)互聯(lián)網(wǎng)千峰獎(jiǎng)

    模式呈現(xiàn)出飛速發(fā)展態(tài)勢(shì)。 而華秋擁有傳統(tǒng)工廠生產(chǎn)制造能力和質(zhì)量管理體系,同時(shí)具備互聯(lián)網(wǎng)平臺(tái)的優(yōu)勢(shì)。我們通過深入分析大量基礎(chǔ)數(shù)據(jù),以互聯(lián)網(wǎng)方式靈活服務(wù)客戶。并且以高效集約化的生產(chǎn)效率和質(zhì)量體系,告別
    發(fā)表于 12-15 09:53