3.自動駕駛系統(tǒng)概覽
自動駕駛系統(tǒng)的三個層級
自動駕駛系統(tǒng)分為三個層級:感知層,決策層,執(zhí)行層。
感知層
感知層用來完成對車輛周圍環(huán)境的感知識別。自動駕駛用到了各種各樣的傳感器,包括:攝像頭、毫米波雷達、激光雷達、超聲波雷達、紅外夜視,以及用于定位和導(dǎo)航的GPS(全球定位系統(tǒng))和IMU(慣性測量單元)。還有一類技術(shù)雖然不是主動式的探測元件,但是屬于協(xié)同式的全局數(shù)據(jù)輔助,可以擴展智能車的環(huán)境感知能力,在感知層同樣扮演著不可或缺的角色,包括高精度地圖、V2X車聯(lián)網(wǎng)技術(shù)。每種類型的感知技術(shù)都有自己的優(yōu)勢和弊端,它們相互補充融合,最終使智能車達到駕駛場景下非常高的安全性要求。國內(nèi)企業(yè)在這一層做文章的非常多,后續(xù)小研會專門寫一篇文章解析自動駕駛傳感器的技術(shù)路線,欲知詳情請聽下回分解。
決策層
決策層是人工智能真正發(fā)揮威力的部分,和人類駕駛員一樣,機器在做駕駛決策時需要回答幾個問題,我在哪里?周邊環(huán)境如何?接下來會發(fā)生什么?我該做什么?決策層具體來說分為兩步,第一步認知理解,根據(jù)感知層收集的信息,對車輛自身的精確定位,對車輛周圍的環(huán)境的準確理解,第二步?jīng)Q策規(guī)劃,包含對接下來可能發(fā)生情況的準確預(yù)測,對下一步行動的準確判斷和規(guī)劃,選擇合理的路徑達到目標。
車輛定位
自動駕駛中車輛精確定位的方法主要有3種:
第一種是通過高精度的差分GPS+慣性導(dǎo)航IMU來完成,GPS定位精度高,但是刷新速度較慢,IMU刷新速度快,但是存在累積誤差,兩者配合使用剛好可以獲得快速且精確的位置信息。
第二種是通過激光雷達+高精度地圖來定位,將激光雷達掃描周圍環(huán)境所獲得的點云與高精度地圖進行比對和匹配,從而獲得位置信息。
第三種是通過攝像頭圖像數(shù)據(jù)+視覺地圖來定位,將攝像頭在行駛過程中拍攝到的圖像數(shù)據(jù),包括圖像靜態(tài)信息和圖像間的移動信息,與視覺地圖進行比對和匹配,可以獲得位置信息?;蛘邚膱D像中提取一些關(guān)鍵目標及其精確的幾何特征(如車道線、地面標記、交通標牌、紅綠燈等),將其和高精度地圖中存儲的信息進行對應(yīng)和匹配,完成定位功能。
環(huán)境理解
包括物體識別和物體追蹤,比如行人識別、車輛識別、車道識別、交通標識識別、行駛中車輛的追蹤、行動中行人的追蹤等。深度學(xué)習(xí)在這些應(yīng)用中展現(xiàn)出了比傳統(tǒng)計算機視覺技術(shù)更好的性能,從而被廣泛應(yīng)用。
行為預(yù)測
人類智能在駕駛中體現(xiàn)在可以根據(jù)動態(tài)變化的環(huán)境實時調(diào)整駕駛策略,同樣機器也需要對車輛周邊的人、車、物的行為進行預(yù)測,從而做出安全駕駛決策。
行動規(guī)劃
根據(jù)車身狀態(tài)數(shù)據(jù)、局部環(huán)境數(shù)據(jù)做出當(dāng)下最優(yōu)的行動選擇,包括加速、剎車、變換車道、轉(zhuǎn)彎等。
路徑規(guī)劃
從出行需求出發(fā),在高精度地圖的基礎(chǔ)之上,根據(jù)全局路網(wǎng)數(shù)據(jù)和宏觀交通信息,繪制一條從出發(fā)點到目標點的最優(yōu)行車路徑。
實事求是地說,國內(nèi)真正進入到?jīng)Q策層的企業(yè)不多,有做園區(qū)、機場擺渡車的馭勢科技,做高速公路貨運的圖森互聯(lián),還有做園區(qū)無人車和干預(yù)輔助類高級ADAS系統(tǒng)的智行者。你們聽說過的那些單目、雙目、環(huán)視視覺ADAS公司實現(xiàn)的大多是預(yù)警提示類功能,如碰撞預(yù)警、盲點監(jiān)測等,只是停留在感知層面,沒有涉及到?jīng)Q策。相比之下國外在決策層探索的企業(yè)就很多了,Drive.ai,Comma.ai,nuTonomy,zoox,F(xiàn)araday,Cruise,Otto,Navya等等。國內(nèi)的路況確實比國外復(fù)雜得多,再加上中國政府還不允許自動駕駛車輛上路路測,這些都制約著國內(nèi)企業(yè)在決策層發(fā)力。
識別算法業(yè)內(nèi)有KITTI(用于評測目標檢測、目標跟蹤、語義分割等)和Cityscapes(用于評測像素級場景分割和實例標注等)等公開數(shù)據(jù)集進行評測,但是對決策質(zhì)量和規(guī)劃能力的好壞還沒有統(tǒng)一評價標準,因而無從判斷各家技術(shù)能力的強弱,只能從公布的Demo中窺測一二。
執(zhí)行層
自動駕駛的執(zhí)行層離不開和車載控制系統(tǒng)的深度集成,可惜車廠和Tier1出于自我保護,不愿意對外開放車輛控制總線,一些創(chuàng)企無法對原車做改動,不得已只能另外附加一套電機裝置,通過電機拉動鋼絲繩,鋼絲繩再拉動油門、制動、轉(zhuǎn)向等裝置完成執(zhí)行動作。這種做好確實非常笨拙,操控性和可靠性很差,根本無法體現(xiàn)自動駕駛的優(yōu)勢。真正的自動駕駛必須要將決策控制信息與車輛底層控制系統(tǒng)深度集成,通過線控技術(shù)完成執(zhí)行機構(gòu)的電控化,達到電子制動、電子驅(qū)動和電子轉(zhuǎn)向。
歸根結(jié)底,自動駕駛的落腳點在“駕駛”不在“自動”,“大腦”再發(fā)達也要靠“雙腳”來行走。不把人工智能算法落地到車輛的控制執(zhí)行,你永遠不知道有多少dirty work要做。例如車的轉(zhuǎn)向、制動、加速,你究竟要把方向盤打多大何時回輪、剎車踩多大、驅(qū)動給多少,人類司機是憑經(jīng)驗來執(zhí)行的,但是對自動駕駛系統(tǒng)來說,需要很多汽車動力學(xué)的knowhow才能完成。如果你只是單純地在計算機上跑幾個Demo,沒有實打?qū)嵉厣宪嚶窚y過,哪家車廠敢用你的算法?真上路還不得撞得人仰馬翻?那些單靠幾個博士弄個算法跑個測試集刷刷榜就想出來融資的初創(chuàng)都是耍流氓。業(yè)內(nèi)人打趣說,做自動駕駛只要撞死個人,公司就可以直接倒閉了,融的那點錢還不夠賠償費呢!大家所熟知的國內(nèi)計算機視覺領(lǐng)域四大獨角獸,都未染指自動駕駛(商湯只是聲稱可以提供算法支持,和真正做自動駕駛還差得遠呢),視覺算法在人臉識別、安防監(jiān)控領(lǐng)域落地相對比較容易,但是在自動駕駛領(lǐng)域要實實在在做車的話還是有很多坑的,這就是為什么國內(nèi)涉及決策層和控制層的企業(yè)這么少的原因。
中國人要想碰執(zhí)行層確實非常難,國內(nèi)在線控技術(shù)上仍處在研發(fā)初始階段,技術(shù)底子薄,積累時間不足。國外車廠和Tier1壟斷了自動駕駛控制執(zhí)行部分,同時它們在感知和決策部分也在不遺余力地投入研發(fā),憑借多年積累的工程能力、產(chǎn)品化能力和汽車經(jīng)驗,已有符合車規(guī)的產(chǎn)品成熟量產(chǎn),對國內(nèi)企業(yè)來說確實是不小的壓力。創(chuàng)業(yè)企業(yè)可以通過和國產(chǎn)車廠、國產(chǎn)供應(yīng)商合作研發(fā),共同抵制國外廠商,也可以和深諳執(zhí)行器改裝的團隊合作,介入執(zhí)行層,總之未來的競爭不會是單個企業(yè)實力的比拼,而是生態(tài)聯(lián)盟間的合縱連橫。
自動駕駛的基本技術(shù)架構(gòu)
車載部分
感知層各種類型的傳感器采集、接收的數(shù)據(jù),通過總線進行集成,再通過數(shù)據(jù)的融合和智能化處理,輸出自動駕駛所需的環(huán)境感知信息。車載傳感器的優(yōu)化配置,可以在保證精度和安全性的基礎(chǔ)上,降低整體成本。
主控系統(tǒng)由硬件部分高性能車載集成計算平臺和軟件部分智能車載操作系統(tǒng)組成。計算平臺融合了傳感器、高精度地圖、V2X的感知信息進行認知和決策計算,硬件處理器可以有GPU、FPGA、ASIC等多種選擇,它們各自的優(yōu)缺點可以參見小研以前的分析文章《AI時代,我的中國“芯”》。智能車載操作系統(tǒng)融合了車內(nèi)人機交互、運營服務(wù)商、內(nèi)容服務(wù)商的數(shù)據(jù),為乘客提供個性化服務(wù),真正把智能車變成下一個“互聯(lián)網(wǎng)入口”,目前的主流操作系統(tǒng)包括Android、Linux、Windows、QNX、YunOS(阿里云提供)等。
最后,決策的信息進入車輛總線控制系統(tǒng),完成執(zhí)行動作。
云端部分
自動駕駛車輛是一個移動系統(tǒng),需要云平臺來提供支持。云端主要完成四個功能:
1. 數(shù)據(jù)存儲:智能車路測中實采的數(shù)據(jù)量非常大,需要傳輸?shù)皆贫诉M行分布式存儲。
2. 仿真測試:開發(fā)的新算法在部署到車上之前會在云端的模擬器上進行測試。
3. 高精度地圖生成:地圖的生成采用眾包形式,把每輛在路上行駛的智能車實時采集到的激光點云或視覺數(shù)據(jù)上傳至云端,實現(xiàn)高精度地圖的完善和更新。
4. 深度學(xué)習(xí)模型訓(xùn)練:自動駕駛的決策層使用了多種不同的深度學(xué)習(xí)模型,在《透析深度學(xué)習(xí),其實它沒那么神秘》這篇文章中小研提到了深度學(xué)習(xí)算法存在“長尾”問題,對于沒見過的情況它處理不了,因此需要持續(xù)不斷地通過新數(shù)據(jù)進行模型訓(xùn)練,來提升算法的處理能力。由于訓(xùn)練的數(shù)據(jù)量非常大,所以要在云端完成。
自動駕駛領(lǐng)域未來的重大機遇
通過上文的梳理,小研認為自動駕駛領(lǐng)域未來三到五年重要的早期創(chuàng)業(yè)和投資機會在以下幾個方面:
1. 傳感器的選擇和優(yōu)化配置
不同傳感器有各自的優(yōu)缺點,沒有一種傳感器可以適用于任何使用環(huán)境。把各類傳感器的數(shù)據(jù)進行融合,達到寬適用范圍、高感知精度的同時,減少冗余配置,降低整體成本,提供傳感器集成方案。融合架構(gòu)的搭建,多種數(shù)據(jù)類型的處理,融合算法的探索,都是非常有挑戰(zhàn)的工作,但是做好會有非常大的價值。
2. 高性能計算平臺
自動駕駛汽車產(chǎn)生的海量數(shù)據(jù),需要車載人工智能大腦——高性能硬件計算平臺來處理,國內(nèi)余凱博士領(lǐng)導(dǎo)的地平線機器人是這方面探索的先驅(qū),小研在之前的文章《AI時代,我的中國“芯”》中介紹過。
3. 車聯(lián)網(wǎng)
近幾年國內(nèi)后裝車聯(lián)網(wǎng)發(fā)展很快,形成了包含導(dǎo)航、娛樂、金融、交互、服務(wù)等功能的生態(tài)圈,未來會逐步向以智能車載操作系統(tǒng)為核心的前裝業(yè)務(wù)演變。國內(nèi)LTE-V車聯(lián)網(wǎng)專用通信標準將于今年出臺,可利用現(xiàn)有蜂窩網(wǎng)絡(luò)基礎(chǔ)設(shè)施,成為自動駕駛感知機構(gòu)的延伸。
4. 運營服務(wù)
汽車智能化以后會成為下一個移動終端,未來會有越來越多的運營服務(wù)商涌現(xiàn),也會有更多基于內(nèi)容資源、平臺服務(wù)、共享經(jīng)濟的新商業(yè)模式衍生出來。
5. 車載集成系統(tǒng)
面向自動駕駛的車載集成系統(tǒng),需將感知、決策層的技術(shù)架構(gòu)和車輛總線控制系統(tǒng)結(jié)合起來重新設(shè)計,將卓越的算法落地到安全、魯棒的執(zhí)行中。
6. 云端
做支持自動駕駛的云平臺的公司同樣值得關(guān)注,包括數(shù)據(jù)集成、眾包地圖、模擬器、模型再訓(xùn)練平臺等。
4.自動駕駛的商業(yè)化之路
自動駕駛的商業(yè)化應(yīng)用有貨運和客運兩大塊。貨運的需求方比較明朗,有礦山和港口運營公司、物流公司、電商、出行服務(wù)運營商等,貨運的工況主要是高速公路、礦區(qū)、港口等相對單一封閉的區(qū)域,實現(xiàn)起來更容易一些??瓦\在開放道路上運營還是非常困難的,目前能夠落地的應(yīng)用場景主要是園區(qū)低速自動駕駛,未來可能會探索給滴滴、UBER這樣的運營商提供固定區(qū)域內(nèi)的自動駕駛運營服務(wù),等各類駕駛場景都驗證成熟以后才會推向開放區(qū)域,最后才是賣給個人,這條路還是很漫長的。
前段時間百度無人車開源了阿波羅平臺,就有好事之徒寫了“百度無人車扔下原子彈,炸掉行業(yè)百億美金投資”的軟文,大有誤導(dǎo)公眾之嫌。其實自動駕駛產(chǎn)業(yè)剛剛起步,行業(yè)標準和技術(shù)架構(gòu)都沒完善,未來還需要持續(xù)探索,百度開源算法對推動整個行業(yè)的進步絕對是好事情。
汽車是個很大的產(chǎn)業(yè),產(chǎn)業(yè)鏈上各個環(huán)節(jié)都有活得很好的公司,自動駕駛由于信息技術(shù)和人工智能的加持,擁有比傳統(tǒng)汽車產(chǎn)業(yè)更大的市場空間,更何況電動化、智能化大潮的到來使中國企業(yè)擺脫了“歷史包袱”,和國外企業(yè)站在同一起跑線上,彎道超車的機會大大的有,你且看所有一線基金在自動駕駛領(lǐng)域都有投資布局就能明白它到底有多被看好。
從全文的梳理可以看出,自動駕駛領(lǐng)域有些方向的timing已經(jīng)到了,而有些方向還沒到。當(dāng)下我們更應(yīng)該保持耐心,隨著技術(shù)和產(chǎn)業(yè)的逐漸成熟,這些機會的啟動點會一個個到來,自動駕駛是一波大的浪潮,未來十年都值得我們持續(xù)關(guān)注。
評論
查看更多