大家好!我演講的題目叫做“探索中國式的自動(dòng)駕駛之路”。非常榮幸能夠來到這么一個(gè)論壇,其實(shí)這也是我作為一個(gè)傳統(tǒng)的IT人第一次參加汽車產(chǎn)業(yè)這塊的論壇。我們這家公司確實(shí)是比較新,叫馭勢(shì)科技。
我們是視覺感知,自動(dòng)駕駛規(guī)劃和控制,以及做復(fù)雜系統(tǒng)方面非常好的三支團(tuán)隊(duì)整合起來的一家新的公司。為什么在這個(gè)時(shí)候進(jìn)入到自動(dòng)駕駛這個(gè)領(lǐng)域?我們既然叫馭勢(shì),我們要判斷這個(gè)勢(shì)是怎么形成的,我們覺得現(xiàn)在是三個(gè)潮流匯一的時(shí)間點(diǎn)。一個(gè)是從互聯(lián)網(wǎng)到物聯(lián)網(wǎng)、再到大數(shù)據(jù)一路發(fā)展起來的信息流,信息自由的流動(dòng),產(chǎn)生實(shí)時(shí)的洞察。第二個(gè)就是能量流,現(xiàn)在新能源汽車勢(shì)已經(jīng)起來了,分布式能源互聯(lián)網(wǎng)正在呼之欲出,能量流變革一觸即發(fā)。最后就是交通流,從新能源車到汽車共享的新商業(yè)模式,到駕駛智能化,最后網(wǎng)聯(lián)化,尤其是以LTE-V以及5G為代表發(fā)展起來的V2X,所有這些技術(shù)的累積效應(yīng)預(yù)示我們自動(dòng)駕駛成熟期即將來臨。
當(dāng)然,我們認(rèn)為它不是一蹴而就的,前途是光明的道路也是曲折的,我們必須得探索一條獨(dú)特的發(fā)展之路。我們認(rèn)為兩個(gè)時(shí)間段有不同的價(jià)值主張。第一個(gè)時(shí)間段以五年為限,它的價(jià)值主張是服務(wù)好駕駛員,給駕駛員帶來額外的安全和舒適。它是一個(gè)什么樣的形態(tài)呢?一開始是主動(dòng)安全,慢慢加入半自動(dòng)駕駛,多種功能融合的形態(tài),在通向第四級(jí)全自動(dòng)駕駛的過程當(dāng)中慢慢逼近高度自動(dòng)駕駛。高度自動(dòng)駕駛中人完全放手,所以對(duì)機(jī)器建立信任需要時(shí)間。因此,我們認(rèn)為在半自動(dòng)駕駛和高度自動(dòng)駕駛中間可以引入一個(gè)新的形態(tài)叫“增強(qiáng)駕駛”,它是一種人機(jī)共駕,人在開機(jī)器也在開,機(jī)器不斷學(xué)習(xí)人的行為,改進(jìn)自己的算法,并且給駕駛員能夠帶來更多的安全和舒適。這是五年內(nèi)以駕駛員為主張的一個(gè)主要的發(fā)展之路。
但是我們認(rèn)為同時(shí)無人駕駛也在發(fā)展,剛才老余說“無人駕駛”這個(gè)詞虛無縹渺,所以我們要給它加上限制,五年內(nèi)限定場(chǎng)景的無人駕駛會(huì)大有發(fā)展?jié)摿?。什么是限定?chǎng)景?可能在一個(gè)私有的園區(qū)里,在專用的道路上,固定的路線,中低速行駛,還可以有環(huán)境增強(qiáng),在路上可以刷一些特殊的標(biāo)志,可以針對(duì)這個(gè)區(qū)域加一個(gè)專門的差分基站,可以在紅綠燈上面裝一些射頻裝置,跟我們的車進(jìn)行聯(lián)系。這種方向?qū)嶋H上跟前面的輔助駕駛方向它是可以融合的。比如說現(xiàn)在我們做分時(shí)租賃,分時(shí)租賃的車主體是輔助駕駛,但它的一個(gè)痛點(diǎn)是取車和還車要花很多的時(shí)間,如果車在停車場(chǎng)的范圍內(nèi)能夠?qū)崿F(xiàn)無人駕駛,就能夠很好的去解決這樣一個(gè)問題,所以這些東西都會(huì)在五年發(fā)生。
5-10年的時(shí)間之內(nèi)我們的技術(shù)會(huì)慢慢的從以駕駛員為中心演進(jìn)到以出行者為中心。這個(gè)時(shí)候價(jià)值主張變成如何給出行者提供更便捷、更廉價(jià)的工具和服務(wù),能夠使得他們把出行時(shí)間轉(zhuǎn)化為生產(chǎn)力。這時(shí)候我們認(rèn)為無人駕駛會(huì)得到更大的發(fā)展,尤其是在城區(qū),urban area,也就是谷歌現(xiàn)在做的這樣一個(gè)無人駕駛,我們認(rèn)為在五年的時(shí)間段可能會(huì)實(shí)現(xiàn)。當(dāng)然它的實(shí)現(xiàn)也將通過一定的過程,比如最早是在最后五公里實(shí)現(xiàn)無人駕駛,你的家跟地鐵站之間,現(xiàn)在可能是你靠自行車的分時(shí)租賃或者是靠摩的或者是靠小區(qū)和地鐵站的班車來完成,所有這些可能被無人駕駛的班車和小型出租車取代。
城區(qū)的無人駕駛實(shí)現(xiàn)以后下一步就要去實(shí)現(xiàn)全天候全區(qū)域的無人駕駛,這個(gè)我認(rèn)為確實(shí)可能需要很長的時(shí)間。但是我想跟大家說明一點(diǎn),未來的車跟現(xiàn)在的車不一樣,未來很多車的形態(tài)并不是為全天候全區(qū)域設(shè)計(jì)的,城市區(qū)域的出租車完全不需要達(dá)到這樣一個(gè)目標(biāo)。這也使得我們無人駕駛的實(shí)現(xiàn)之路能夠更快。當(dāng)然一旦針對(duì)人的無人駕駛實(shí)現(xiàn)了,那么一整個(gè)跟人和物交通相關(guān)的產(chǎn)業(yè)鏈都會(huì)被重新定義,包括物流,包括停車,包括保險(xiǎn)業(yè)甚至是服務(wù)業(yè),我們認(rèn)為這樣一種城區(qū)的無人駕駛車是在家和辦公室之間的第三空間,它是一個(gè)移動(dòng)的商業(yè)地產(chǎn),會(huì)重新定義服務(wù)業(yè),這是我們能夠看到這么一個(gè)自動(dòng)駕駛發(fā)展之路。
我今天想要說五個(gè)觀點(diǎn)。
第一個(gè)觀點(diǎn)國外的技術(shù)發(fā)展路線和功能選擇跟國內(nèi)的未必是一致。大家知道現(xiàn)在谷歌或者是百度他們基本上都是高舉高打,三大件,激光雷達(dá)可能是70萬人民幣,一個(gè)GPS-RTK加一個(gè)高精度的激光陀螺或者是光纖陀螺也需要好幾十萬,這三個(gè)加起來確實(shí)能夠給你帶來更好的感知能力,但是它適不適合中國?也許更適合美國。這種車一輛20-30萬美金,在美國一個(gè)出租車司機(jī)的收入可能是7萬美金,意味著幾年能夠回本。但是在中國一輛車200萬人民幣,一個(gè)出租車司機(jī)的人力成本可能6、7萬,這樣一種方式就并不適合,這樣一條技術(shù)路線并不適合咱們中國。
當(dāng)然另外一條路線可能是視覺為主,雷達(dá)的這樣一種技術(shù)路線,這條路線確實(shí)是更適合中國,但是也得考慮功能選擇上兩個(gè)地方得有差異,其實(shí)我個(gè)人在特斯拉車主當(dāng)中做了一些調(diào)研,在美國他們對(duì)于像高速的ACC、車道保持這樣的功能他們是非常愿意使用的,雖然谷歌無人駕駛車的創(chuàng)始人Sebastian Thrun嘗試了特斯拉的ACC+車道保持的功能,抱怨說it almost killed me for ten times。在中國什么樣的功能好用?比如在北京這種地方經(jīng)常就是開開停停,traffic jam assist這樣一種功能可能對(duì)中國人非常有用。剛才說的停車場(chǎng)的無人駕駛功能也是非常好的,你去新光天地下到停車場(chǎng)花十分鐘的時(shí)間找停車位,你可以讓它自己去找地方停,走的時(shí)候一鍵召回。剛才也講到中國交通特別復(fù)雜的問題,我倒是覺得防碰撞這件事情,也就是行人檢測(cè)這件事情倒并不是特別困難,因?yàn)槟悴⒉恢灰蕾囉?a href="http://srfitnesspt.com/v/" target="_blank">視頻,還有雷達(dá)這樣一些工具,但是問題是,在中國如果說你的自動(dòng)駕駛策略調(diào)的不夠好的話是不行的,太過保守的話可能總是被人加塞,無法獲得路權(quán)。谷歌也試圖在調(diào)整他的駕駛策略,從以安全為第一目的,到慢慢的加入人的一些競爭的因素進(jìn)去,結(jié)果就撞上大巴了,所以這需要一個(gè)發(fā)展的過程。在中國尤其要多考慮我們的自動(dòng)駕駛策略,既能夠保證安全,又可以獲得路權(quán)。我們的路線和功能選擇很重要。
2,低成本路線必須做加法,而不是做減法。其實(shí)谷歌也要降低成本,這也是為什么從去年下半年開始自己招人去做激光雷達(dá),但是他的這種做法是做減法。本來高,慢慢的往下降,我們中國人有句老話叫做由奢入簡難,我們的方法不一樣,我們從最低成本的傳感器開始,慢慢的做加法,以視覺、雷達(dá)和商業(yè)化的GPS、慣導(dǎo)為主要手段。我們的自動(dòng)駕駛策略就必須有一個(gè)簡單的假設(shè),就是我每一個(gè)傳感器都是不可靠的,都是不夠精確的。GPS是10米誤差,慣導(dǎo)有它的誤差,雙目測(cè)深度和視覺算法有誤差,幾個(gè)融合起來能不能做到穩(wěn)定可靠的橫向10厘米、縱向10厘米定位,這是我們需要考慮的。我們做加法,基礎(chǔ)就是低成本的感知+高性能的計(jì)算,低成本感知我們希望能夠做到500美金,然后用高性能的計(jì)算來解決感知不夠完美的問題。如果谷歌認(rèn)為有2.0的視力才能做無人駕駛,我們現(xiàn)在考慮用1.0的視力,做好多數(shù)情況下的自動(dòng)駕駛。我們?nèi)擞?.0的視力就能夠開車,意味著這條路我們也能走得通,但是要比人多得多的計(jì)算。要是真有老余講的200塊錢人民幣的計(jì)算,我做夢(mèng)都要笑了,現(xiàn)在還不可能?,F(xiàn)在我們要一兩千美金的計(jì)算成本,因?yàn)槟悴恢皇强紤]到能不能算的問題,你也要考慮它的穩(wěn)定可靠性,要有足夠的冗余。不但是同構(gòu)的冗余,還要異構(gòu)的冗余,你有GPU和FPGA,甚至有一些嵌入式的視覺芯片,你有深度學(xué)習(xí)和非深度學(xué)習(xí),這樣才能保證足夠的可靠。最近兩年我認(rèn)為一兩千美金是一個(gè)合理的價(jià)格區(qū)間,但是我相信計(jì)算發(fā)展的速度和成本下降的速度是非常快的。
大家可以看到在我們這個(gè)信息世界里有三條曲線,一條是半導(dǎo)體、電子成本的曲線。摩爾定律大家知道,每兩年成本下降一半,所以把你的寶押在計(jì)算上應(yīng)該問題不是特別大。機(jī)械部件和激光部件成本下降比較慢,像谷歌用的Velodyne 64線激光雷達(dá)既是機(jī)械又是激光的,所以不能期望它在未來幾年明顯降低成本。當(dāng)然現(xiàn)在新的激光雷達(dá)可能是基于相控陣,或MEMS振鏡,可能成本能夠更快下來。在2018年、2019年的時(shí)間段,當(dāng)它們降到500美金以下,我們的加法思維也能夠把這樣的東西加進(jìn)去。
是我們的實(shí)驗(yàn)樣車,有雙目攝像頭,有商用GPS、慣導(dǎo)和雷達(dá)。我說一下雙目,雙目在智能駕駛的場(chǎng)景里面用的并不多,只有斯巴魯?shù)囊豢钴囉昧巳樟⒌碾p目,雙目做起來不容易,首先結(jié)構(gòu)設(shè)計(jì)要保證它在風(fēng)吹日曬之下是不是能夠保證形變最小,有了些微形變后能不能做自我的校準(zhǔn),這些都是很大的難點(diǎn),我們基本上都解決了。其次是雙目的算法能不能做到低誤差和實(shí)時(shí)性,我們的雙目攝像頭最遠(yuǎn)看到160米,在10米左右誤差能夠達(dá)到幾厘米,高清,30幀每秒。
雙目有很多好處,這是一個(gè)路面的場(chǎng)景,我們這里機(jī)器學(xué)習(xí)只用了路面可行駛區(qū)域的檢測(cè),沒有用到深度學(xué)習(xí),但是路面的各種車輛和障礙物我們都通過雙目形成深度信息。這里的一團(tuán)高速移動(dòng)的點(diǎn)云可以比較容易的判斷是車,而那邊不動(dòng)的密集點(diǎn)云是路邊的障礙物。請(qǐng)大家注意到一點(diǎn),我們即使是用深度學(xué)習(xí),在有些車輛只露出一點(diǎn)點(diǎn)的情況下還是檢測(cè)不出來,我們自己的深度學(xué)習(xí)要求露出30%的時(shí)候能夠檢測(cè)出來,但是在旁邊車道很近的車只露出一點(diǎn)點(diǎn)的時(shí)候是最危險(xiǎn)的時(shí)候,這個(gè)用不要深度學(xué)習(xí)的雙目攝像頭就可以做到。因此,基于這個(gè)雙目可以形成非常廉價(jià)的視覺防碰撞方案。
這個(gè)是我們用純視覺形成的一個(gè)車機(jī)解決方案,這里面除了傳統(tǒng)的車道線檢測(cè)、道路目標(biāo)的檢測(cè)之外,我們展示了非常精確的深度判斷。雖然說很多單目方案號(hào)稱可以用Structure from Motion的算法實(shí)現(xiàn)立體視覺,但可能只適用于像AEB緊急剎車、FCW防碰撞,對(duì)于高精度的視覺定位準(zhǔn)確度是達(dá)不到的。
這邊的弧線是視覺里程計(jì)。它能顯示車輛行駛的軌跡,跟基于輪式里程計(jì)或MEMS的IMU可以互補(bǔ),這樣一種基于雙目的視覺里程計(jì)能夠達(dá)到的精度要比單目的視覺里程計(jì)的算法要高很多。
我們不是只固執(zhí)于視覺算法,加法的理念是,當(dāng)DGPS/RTK比較便宜以后,或者在特定的環(huán)境里面做無人駕駛DGPS/RTK的成本可以接受,我們就把它加進(jìn)去。同樣,激光雷達(dá)足夠便宜和成熟的時(shí)候,也加進(jìn)去,我們現(xiàn)在在做激光這塊的布局。另外一個(gè)就是地圖,現(xiàn)在基于視覺已經(jīng)有了一個(gè)很好的地圖建構(gòu)和視覺定位的解決方案,未來我們是希望通過眾包的方式,能夠把更廣區(qū)域的地圖建立起來。
3,ADAS技術(shù)路線演進(jìn)很難滿足自動(dòng)駕駛需求。這里面一個(gè)根本原因就是ADAS它是人駕駛為主機(jī)器輔助,而自動(dòng)駕駛它是機(jī)器駕駛為主人輔助。這對(duì)于技術(shù)來說有不同的要求,傳統(tǒng)ADAS人駕駛為主,所以它是做出一些離散的警示,車道線偏離了給你一個(gè)警告,這個(gè)檢測(cè)算法到底是70%還是80%,其實(shí)問題并不大,因?yàn)檎嬲膹?fù)雜決策和控制是人來做的。而自動(dòng)駕駛要求算法連續(xù)準(zhǔn)確可靠地輸出,而且常常是以機(jī)器駕駛為主,一旦出錯(cuò)是不得了的事情。傳統(tǒng)的ADAS最煩的一個(gè)就是誤報(bào),有時(shí)候你算法要做一個(gè)折中,為了減少誤報(bào)可能會(huì)同時(shí)損失精度,而在自動(dòng)駕駛的時(shí)候不能犧牲精度。
傳統(tǒng)的ADAS成本非常重要,可能要做到100美金以下,而輔助駕駛或者是自動(dòng)駕駛它對(duì)于成本不是那么敏感,而性能、準(zhǔn)確性是最重要的。這樣意味著我們?cè)谝恍〥EMO視頻里面顯示出來的準(zhǔn)確性就不夠,需要在真實(shí)交通當(dāng)中的工作能力。在北京大家開的時(shí)候,發(fā)現(xiàn)光照不好的時(shí)候,地面上的車道線人都很難去分辨,這個(gè)自動(dòng)駕駛怎么解決?
我們一直說希望達(dá)到99.999%,這是一個(gè)很難的目標(biāo),我們現(xiàn)在基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí),包括深度學(xué)習(xí),無法窮盡樣本空間,意味著無法保證100%,只能通過更多的數(shù)據(jù)去驅(qū)動(dòng),甚至需要在線的學(xué)習(xí),這是逼近99.999%的一條途徑。第二不能從一個(gè)視覺傳感器的角度出發(fā)點(diǎn),必須多傳感器融合,傳統(tǒng)的ADAS解決了防撞、車道線的功能,但是真正的自動(dòng)駕駛需要多種傳感器進(jìn)行融合,包括雷達(dá),GPS,IMU,甚至未來激光雷達(dá)和V2X。
除此之外還要解決地圖建構(gòu)和定位的問題。剛才老余也講了需要高精地圖,常?;诩す饫走_(dá)、高精度GPS和IMU,現(xiàn)在谷歌在做,HERE、TomTom也在做,四維圖新也在做,究竟什么樣的地圖是自動(dòng)駕駛需要的,還是個(gè)沒有定論的問題。目前來說,高精地圖實(shí)際上是一種束縛,因?yàn)槟悴]有很多區(qū)域的高精地圖,那是不是就不能開了?我們采取了一種非常實(shí)用的方式,能夠解決自動(dòng)駕駛定位和地圖構(gòu)建的問題。
做完定位和地圖還不夠,還要解決規(guī)劃和控制的問題,控制是必須得是實(shí)時(shí)的,幾十毫秒級(jí)的,決策可能是秒級(jí)的,規(guī)劃可能是10秒級(jí)的,這些規(guī)劃和控制怎么能夠做到足夠的準(zhǔn)確?我們做自動(dòng)駕駛的時(shí)候要有一個(gè)基本的假設(shè),就是第一我們是必須得假設(shè)各個(gè)傳感器進(jìn)來的數(shù)據(jù)是不一定可靠的,第二必須得考慮當(dāng)所有傳感器都失效的時(shí)候車應(yīng)該怎么辦,這里面需要很多經(jīng)驗(yàn)的部分也需要機(jī)器學(xué)習(xí)的部分。剛才兩位講到應(yīng)用深度學(xué)習(xí)、應(yīng)用增強(qiáng)學(xué)習(xí)解決規(guī)劃問題,這個(gè)是現(xiàn)在非常熱的一個(gè)問題,深度學(xué)習(xí)可能是包括了像卷積神經(jīng)網(wǎng)絡(luò),也保證了遞歸神經(jīng)網(wǎng)絡(luò)。目前來說,在控制中增強(qiáng)學(xué)習(xí)是更現(xiàn)實(shí)的,AlphaGo正是使用這個(gè)來實(shí)現(xiàn)自我對(duì)弈、形成估值網(wǎng)絡(luò)的過程。
4,自動(dòng)駕駛是一個(gè)超級(jí)復(fù)雜的系統(tǒng)工程。我們剛才說的感知、規(guī)劃和控制,是浮在表面上的事情,還要解決駕駛員行為、偏好的分析,現(xiàn)在有個(gè)夫妻吵架的重要原因,比如我太太開車,我坐在副駕駛座上感到特別別扭,我們不希望自動(dòng)駕駛讓我們乘客坐得不舒服。還有人機(jī)接口非常重要,人機(jī)接口不只是光、聲,不只是顯示,還有方向盤的振動(dòng),方向盤的助力等,這些都是人機(jī)接口。狀態(tài)監(jiān)控非常重要,要在車?yán)锩娣湃胍粋€(gè)像飛機(jī)黑匣子這樣的東西,這樣未來自動(dòng)駕駛出問題的時(shí)候要能夠發(fā)現(xiàn)問題在哪里,厘清是誰的責(zé)任。
實(shí)時(shí)高可靠高安全的系統(tǒng)軟件架構(gòu)非常重要。實(shí)時(shí)肯定是很重要的,100公里每小時(shí)開時(shí),相當(dāng)于1秒28米,常常處理要達(dá)到30幀每秒。
怎么做到高可靠?軟件必須按照流程,模塊級(jí)別要有壓力測(cè)試,也要有方案的集成測(cè)試,大量地去路測(cè)。
怎么做到高安全?只要用的是開放的操作系統(tǒng),只要聯(lián)網(wǎng)就可能有car hacking,所以你需要一套新的安全設(shè)計(jì)的方法論。第一怎么能夠保證你的規(guī)范是正確的,do the right system,第二要保證你的實(shí)現(xiàn)是準(zhǔn)確的,do the system right,第三你在運(yùn)行的時(shí)候怎么保證系統(tǒng)是足夠安全的,黑客不能侵入。第四,一旦出問題以后有沒有一種最好的方式馬上能夠取得控制。
最后就是要做到小型化、高性能、高可靠的硬件架構(gòu),為了實(shí)現(xiàn)這個(gè)東西不能去犧牲成本,必須得引入足夠的計(jì)算力,保證算法最優(yōu)化運(yùn)行,也要采用符合車規(guī)的部件,引入足夠的冗余,保證高溫度范圍、防塵防震。這方面我們從英特爾出來的工程師很有經(jīng)驗(yàn)。
5,無人駕駛的關(guān)鍵是復(fù)雜狀況的處理能力,而輔助駕駛很重要的一點(diǎn)就是人的舒適性,駕乘感受。怎么能夠做到這一點(diǎn)?給大家看一個(gè)視頻,這是我們的合伙人之一姜巖做的一個(gè)工作,大家可以看到他在車上路之前,在車頂上面放了打火機(jī)、硬幣,接著繞三環(huán)48公里開了一圈,這里面實(shí)現(xiàn)了各種各樣的功能,包括緊急剎車、自適應(yīng)巡航、車道保持、換道,唯一在這里面沒有展示的就是自動(dòng)泊車。一圈開下來大家可以看到硬幣、打火機(jī)在車頂上還是穩(wěn)穩(wěn)的放著,這反映了以舒適性為主要設(shè)計(jì)元素的自動(dòng)駕駛規(guī)劃和控制技術(shù)。
總結(jié),第一,我們要走不同的發(fā)展之路。第二,從ADAS到自動(dòng)駕駛不是漸進(jìn)的演化,而是變革式的飛躍。第三,協(xié)同創(chuàng)新是突破的必要途徑。我們是做技術(shù)的一家新公司,我們一家不可能把自動(dòng)駕駛的事業(yè)包攬下來,這里需要協(xié)作和分工。我們希望協(xié)同創(chuàng)新,與上下游,比如上游的英偉達(dá),下游的一級(jí)供應(yīng)商和車廠,一起把自動(dòng)駕駛這個(gè)事業(yè)做大,真正深刻地改變這個(gè)世界。謝謝大家!
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
6772瀏覽量
88655 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
782文章
13563瀏覽量
165783 -
ADAS系統(tǒng)
+關(guān)注
關(guān)注
4文章
226瀏覽量
25651
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論