無(wú)人車即將落地,但可能不是你想的那樣 | 專訪Professor X
?Professor X 的研究甚至影響到谷歌的無(wú)人駕駛團(tuán)隊(duì)。圖片來(lái)源:Flickr
撰文 | 邸利會(huì)(《《知識(shí)分子》》主筆)
責(zé)編 | 李曉明
● ● ●
Professor X,中文名肖健雄。他擅長(zhǎng)黑科技,其名卻難以用英文發(fā)音,同事和學(xué)生們干脆以X稱呼之。X也象征著未知,確實(shí),他所從事的領(lǐng)域,無(wú)人駕駛,很長(zhǎng)時(shí)間里也是一個(gè)待解的難題。不過(guò),目前來(lái)說(shuō),X已經(jīng)部分可解,部分場(chǎng)景下的應(yīng)用即將落地。
看起來(lái)很年輕,還像一位研究生的肖健雄,其實(shí)已經(jīng)是無(wú)人駕駛領(lǐng)域的老兵。早在十幾年前,還是本科生的他就跟隨香港科技大學(xué)權(quán)龍教授做計(jì)算機(jī)視覺,并發(fā)表了計(jì)算機(jī)視覺頂級(jí)會(huì)議(ICCV)的論文。在香港科技大學(xué)的本碩連讀完成后,肖健雄赴麻省理工學(xué)院(MIT),跟隨Antonio Torralba教授在計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室繼續(xù)其研究,之后成為普林斯頓助理教授、普林斯頓計(jì)算機(jī)視覺和機(jī)器人實(shí)驗(yàn)室創(chuàng)始主任,學(xué)有淵源且成績(jī)卓著。他在2017年被《MIT技術(shù)評(píng)論》選為35歲以下的創(chuàng)新者。他的研究還影響到谷歌的無(wú)人駕駛團(tuán)隊(duì)。
因?yàn)榭释芯磕馨l(fā)生“看得見”的效用,肖健雄在2016年創(chuàng)立自動(dòng)駕駛公司AutoX并擔(dān)任CEO,其意愿是將自動(dòng)駕駛平民化,讓每個(gè)人都能從單調(diào)乏味的駕駛中解放出來(lái)。在剛剛結(jié)束的深圳CCF-GAIR大會(huì)上,肖健雄介紹了AutoX的最新進(jìn)展并分享了自動(dòng)駕駛的見解。會(huì)后,他接受了《知識(shí)分子》的獨(dú)家專訪,談了談這幾年他走過(guò)的研究道路以及對(duì)于自動(dòng)駕駛技術(shù)落地的看法。
?Professor X 肖健雄
1開創(chuàng)三維深度學(xué)習(xí)學(xué)術(shù)領(lǐng)域
《知識(shí)分子》:你從什么時(shí)候開始對(duì)機(jī)器人和計(jì)算機(jī)視覺產(chǎn)生興趣的?
肖健雄:說(shuō)實(shí)話研究了十幾年,挺久的了。我從本科的時(shí)候就開始在研究計(jì)算機(jī)視覺,當(dāng)初讀的是香港科技大學(xué),我那時(shí)候在考慮要不要讀研究生,就仔細(xì)學(xué)習(xí)了系里老師的各種研究,其中權(quán)龍老師的研究,做三維重建技術(shù),特別吸引人。我在上大學(xué)之前也是搞計(jì)算機(jī)的,包括我高考是計(jì)算機(jī)保送的,所以也是研究計(jì)算機(jī)各個(gè)方向很多年。我覺得最吸引我的還是人工智能這個(gè)領(lǐng)域。
人工智能也有很多方面,有醫(yī)療、自然語(yǔ)言處理,但是最吸引我的是視覺,所見即所得,更直觀一點(diǎn),結(jié)果好不好立竿見影。所以我在本科的時(shí)候選擇了跟權(quán)龍老師一起做研究,我是他職業(yè)生涯里帶的少數(shù)的幾個(gè)本科生之一。跟他一起做研究,第一個(gè)項(xiàng)目就成功發(fā)表了ICCV論文。權(quán)老師的要求很嚴(yán)格,只有這樣他才會(huì)收我做他的研究生。我們當(dāng)時(shí)做的是谷歌的街景分析。像語(yǔ)義分析、三維場(chǎng)景分析,這些已經(jīng)很成熟、最起碼比較流行的技術(shù),但在當(dāng)初是很少人研究的。
權(quán)老師研究非語(yǔ)義的三維重建,我加入他的組里做研究的時(shí)候,希望有進(jìn)一步的突破,所以我提出把語(yǔ)義跟三維結(jié)合起來(lái),那個(gè)時(shí)候也發(fā)表了ICCV的另外一篇文章,專門做三維語(yǔ)義的街景分析,可以直接應(yīng)用在自動(dòng)駕駛上。在馬路上看三維場(chǎng)景,做語(yǔ)義分析,這是樹,這是人,這是汽車。所以那個(gè)時(shí)候已經(jīng)開始研究這個(gè),其實(shí)也是谷歌資助的研究項(xiàng)目,數(shù)據(jù)是谷歌給的,連我們的研究經(jīng)費(fèi)也是谷歌贊助權(quán)老師實(shí)驗(yàn)室,所以很多成果被用進(jìn)了谷歌地圖。后來(lái)谷歌地圖那個(gè)團(tuán)隊(duì)又變成了谷歌無(wú)人車的組,我們給他們貢獻(xiàn)了一些的最早期的那個(gè)版本的技術(shù)。
《知識(shí)分子》:原來(lái)是這樣的故事,你和權(quán)老師的研究還是不一樣?
肖健雄:那個(gè)時(shí)候本科讀完,剛上研究生。當(dāng)然權(quán)老師主要強(qiáng)項(xiàng)是做三維的,圖形學(xué)應(yīng)用方面。我在三維的基礎(chǔ)上再擴(kuò)展了語(yǔ)義,所以真正有了人工智能,不是純?nèi)S而已。我覺得圖形學(xué)應(yīng)用挺好的,卡通和視頻看起來(lái)很酷炫,但是沒(méi)什么實(shí)際用處,所以我更偏向是那種能夠真正跟物理世界發(fā)生交互的研究,所以我們那個(gè)時(shí)候就自己采集了大量的數(shù)據(jù),當(dāng)然更多的數(shù)據(jù)都是谷歌提供的。
《知識(shí)分子》:那個(gè)時(shí)候你們已經(jīng)有車?
肖健雄:谷歌有車,我們沒(méi)車。他們用他們的車抓數(shù)據(jù)給我們。因?yàn)閿?shù)據(jù)量很大,谷歌就寄了整個(gè)硬盤過(guò)來(lái)。我還記得當(dāng)初很開心,第一次見到有這么多數(shù)據(jù)。當(dāng)初整個(gè)硬盤很大,網(wǎng)絡(luò)還是很慢的,傳不過(guò)來(lái),所以從美國(guó)寄到香港。用大量的數(shù)據(jù)做大量的分析。
《知識(shí)分子》:那個(gè)時(shí)候已經(jīng)在做無(wú)人車了嗎?
肖健雄:那個(gè)時(shí)候還沒(méi)徹底地弄一個(gè)車在路上跑,我們合作的是谷歌街景地圖團(tuán)隊(duì),也就是后來(lái)的谷歌無(wú)人車的團(tuán)隊(duì)。但是這些技術(shù)都是相通的,我之后在MIT讀博士早期的時(shí)候還去谷歌實(shí)習(xí)了一段,也是在谷歌地圖組,所以也是挺有淵源的。后來(lái)我主要在學(xué)術(shù)圈做,他們自己在公司內(nèi)部做。他們一開始從學(xué)術(shù)圈借鑒這些算法,再把它工程化,所以其實(shí)大家本質(zhì)上殊途同歸。
《知識(shí)分子》:后來(lái)你去了MIT做博士主要做了哪些研究?
肖健雄:我在MIT師從Antonio Torralba,他是做語(yǔ)義分析的一個(gè)教授,特別擅長(zhǎng)大數(shù)據(jù)分析。像ImageNet也是最近的事情,ImageNet的前身有一個(gè)LabelMe的數(shù)據(jù)集,是我的導(dǎo)師做的(按:作者是Bryan C. Russell,Antonio Torralba);SUN Database是我和導(dǎo)師一起做的,都是比較老的歷史。那時(shí)候我們開始做大數(shù)據(jù)分析,語(yǔ)義切割、語(yǔ)義分析,深度學(xué)習(xí)還沒(méi)火起來(lái),但是我們?cè)趯?shí)驗(yàn)室得到的結(jié)論是大量的數(shù)據(jù)非常有用。后來(lái)深度學(xué)習(xí)出來(lái)了,那是一種很好的使用大數(shù)據(jù)的用法。我在MIT實(shí)驗(yàn)室最后一年,在導(dǎo)師的基礎(chǔ)上再跨越一步,擴(kuò)展到三維的,用三維深度學(xué)習(xí)開始做物體的檢測(cè)、跟蹤,像車輛的三維檢測(cè)?,F(xiàn)在每個(gè)人都在說(shuō)融合,前融合、后融合,那時(shí)候在MIT讀博士的后期,這些技術(shù)我們已經(jīng)發(fā)明了。
《知識(shí)分子》:什么時(shí)候開始把深度學(xué)習(xí)的方法引進(jìn)去?
肖健雄:那個(gè)是2012年就開始做的,我還發(fā)表了一篇文章,第一次用深度學(xué)習(xí),把顏色、攝像頭跟深度的信息融合起來(lái),用三維深度學(xué)習(xí)做前融合,其實(shí)這個(gè)工作開創(chuàng)了整個(gè)三維深度學(xué)習(xí)學(xué)術(shù)領(lǐng)域。現(xiàn)在這個(gè)領(lǐng)域很火,如果去CVPR(注:IEEE國(guó)際計(jì)算機(jī)視覺與模式識(shí)別會(huì)議)這種會(huì)議,里面有幾百篇論文都在討論這個(gè),但是當(dāng)初沒(méi)人做的,我們是第一個(gè)做這個(gè)。因?yàn)槲疫€記得剛開始做這個(gè)的時(shí)候,我博士導(dǎo)師還覺得不可能做出來(lái),我就暗自給自己打氣,我一定要做出來(lái)給你看,就憋一口氣。后來(lái)在普林斯頓大學(xué),我的實(shí)驗(yàn)室已經(jīng)在做無(wú)人駕駛了,用仿真器做各種試驗(yàn)。真實(shí)路測(cè)方面我們沒(méi)有正常的汽車,但是我們有移動(dòng)的機(jī)器人。也蠻大的,開30公里每小時(shí)的機(jī)器人,其實(shí)就是自動(dòng)駕駛的車,跟我們現(xiàn)在的送貨小車蠻像的,但是沒(méi)方向盤。
《知識(shí)分子》:在普林斯頓的時(shí)候,也做機(jī)器人吧?
肖健雄:對(duì),除了無(wú)人駕駛,我們也做機(jī)械手抓取東西,就是先物體檢測(cè),檢測(cè)出來(lái)要抓。我?guī)ьI(lǐng)團(tuán)隊(duì)跟MIT合作,用機(jī)械手參加Amazon Picking Challenge的比賽,就是機(jī)械手的物體識(shí)別、抓取、放下,拿了全世界第三、第四名。
《知識(shí)分子》:這都是很難的任務(wù)。
肖健雄:對(duì)的。這個(gè)技術(shù)跟無(wú)人車非常相關(guān),也是用三維深度學(xué)習(xí)的方法,認(rèn)出這個(gè)物體在哪兒,大小多少,朝向是什么,這些都得做得很好。
2“希望整個(gè)行業(yè)不要吹到太火”
《知識(shí)分子》:但是大家感覺到還是不能完全實(shí)現(xiàn)自動(dòng)駕駛,假設(shè)別的條件都沒(méi)問(wèn)題,單純技術(shù)是可以達(dá)到的嗎?
肖健雄:我覺得這個(gè)技術(shù)現(xiàn)階段好到能演示,這個(gè)肯定沒(méi)問(wèn)題,問(wèn)題是能不能真正運(yùn)營(yíng),因?yàn)檠菔局恍桕P(guān)心正常情況下會(huì)發(fā)生什么,但是運(yùn)營(yíng)的時(shí)候要想的是最糟糕情況下會(huì)發(fā)生什么。我覺得現(xiàn)階段很多地方還沒(méi)辦法做無(wú)人駕駛的運(yùn)營(yíng),特別是中國(guó)的路況特別復(fù)雜。我覺得中國(guó)路況演示也可以,但是敢真的無(wú)人嗎?這是問(wèn)題。
我覺得在一些限定場(chǎng)景,像園區(qū)或者速度稍慢可以做,但是那些在大馬路上完全無(wú)人駕駛技術(shù)還不成熟。距離完全無(wú)人、完全不出任何事故,我覺得還得一定的年份,沒(méi)那么快。包括谷歌的無(wú)人車團(tuán)隊(duì)做了這么多年,現(xiàn)在在美國(guó)也不是挑紐約這種大城市,而是挑比較簡(jiǎn)單的路,人比較少,地廣人稀的地方開始運(yùn)營(yíng)。所以我覺得任何公司號(hào)稱兩年后在北上廣深大規(guī)模運(yùn)營(yíng)(無(wú)人車),要么就是在打擦邊球,要么就是在吹牛。
《知識(shí)分子》:所以你覺得目前整個(gè)行業(yè)的技術(shù)還沒(méi)達(dá)到那個(gè)高度么?
肖健雄:對(duì),因?yàn)槲沂亲鰧W(xué)術(shù)和技術(shù)出身的,喜歡實(shí)事求是,我也希望整個(gè)行業(yè)不要吹到太火,到時(shí)候沒(méi)法實(shí)現(xiàn),出現(xiàn)AI冬天。技術(shù)有所能,有所不能。在大暴雨天里無(wú)人駕駛,我們公司在一年半前早就做了演示,但是真敢在大暴雨天沒(méi)有安全司機(jī),開那么快,還能確保萬(wàn)無(wú)一失嗎?這個(gè)要求是完全不一樣的。運(yùn)營(yíng)的時(shí)候要考慮的是最糟糕的情況下,性能也要夠安全。
《知識(shí)分子》:尤其要做成一個(gè)大眾都使用的產(chǎn)品,這個(gè)難度就相當(dāng)高了。
肖健雄:對(duì),千奇百怪的事情都可能發(fā)生。
《知識(shí)分子》:無(wú)人駕駛的歷史是很久很久了,德國(guó)很早,包括美國(guó)DARPA Grand Challenge,伯克利的智能交通,到現(xiàn)在谷歌等,我們有沒(méi)有可能最后完全在一個(gè)限定的場(chǎng)景,比如說(shuō)改造整個(gè)交通系統(tǒng),用智能交通的概念來(lái)做?
肖健雄:這個(gè)肯定可以。但是這個(gè)在純市場(chǎng)經(jīng)濟(jì)情況下很難達(dá)到這種水平,除非是政府計(jì)劃就是這么搞。純市場(chǎng)經(jīng)濟(jì)很難進(jìn)化到那一步。這包括車子、人的智能化等。但總不能強(qiáng)迫路上每個(gè)人都裝個(gè)傳感器,這不可能,就像大家會(huì)忘了戴手表,除非把全世界人民注入一個(gè)芯片在體內(nèi),一出生就打進(jìn)去,要不然沒(méi)辦法。也看城市規(guī)劃怎么設(shè)計(jì),要全規(guī)劃成有一層根本沒(méi)有人可以走,只有車,就像地鐵一樣,那么沒(méi)有問(wèn)題,地鐵早就可以無(wú)人駕駛了。
《知識(shí)分子》:你覺得某一個(gè)階段人和車是混在一起的?
肖健雄:對(duì)的,人和車混在一起肯定是可以,但是來(lái)得沒(méi)那么快,我覺得肯定在一些比較特殊的場(chǎng)景,一開始肯定不會(huì)就是無(wú)人出租車。我覺得一開始是物流的小車,或類似的這種非常接近的應(yīng)用,這些場(chǎng)景已經(jīng)到臨界點(diǎn)了。
《知識(shí)分子》:現(xiàn)在來(lái)說(shuō)AutoX關(guān)注的產(chǎn)品都是能落地的?
肖健雄:我們特別擅長(zhǎng)研究,要研究什么特別酷炫的,我們向來(lái)干這行的,但是光研究酷炫的沒(méi)什么用。我們所有的發(fā)明創(chuàng)造都是為了產(chǎn)品服務(wù)的。我們是以產(chǎn)品為導(dǎo)向的公司,如果產(chǎn)品需要我們研究發(fā)明這些,如果產(chǎn)品不需要,我們不研究發(fā)明這些。
《知識(shí)分子》:你現(xiàn)在覺得哪些現(xiàn)在可以落實(shí)成產(chǎn)品?
肖健雄:我覺得我們的三款產(chǎn)品中,小車是最容易落地的。因?yàn)樗拓浉腿瞬灰粯樱热缯f(shuō)從A到B,如果送人,因?yàn)槿俗谏厦媸且笞叩糜挚煊质娣隙ㄒ疃搪愤^(guò)去,假設(shè)有個(gè)路口特別難走,還是得走,要不然繞一大圈,雖然也到達(dá)目的地,但是乘客不開心,舒適度很差。
送貨就沒(méi)這個(gè)問(wèn)題,稍微繞一點(diǎn),可以挑一些簡(jiǎn)單的路徑開過(guò)去,這樣的話也能達(dá)到目的地,慢一分鐘沒(méi)問(wèn)題,只要按時(shí)到就好,那么快也不一定特別有作用,所以我覺得這是最可能讓我們這個(gè)技術(shù)更早落地,我們不會(huì)專門鉆牛角尖。載人車不是我們不做,技術(shù)一直在開發(fā),在改進(jìn),數(shù)據(jù)一直在積累,有一天就可以進(jìn)化到走那種復(fù)雜的路,但是在沒(méi)那么成熟的情況下,我們也可以用在貨運(yùn)上,而不是一定要等到有一天突然覺得技術(shù)特別成熟了才可以開始用起來(lái)。我覺得小車送貨,是先落地的,行業(yè)也逐漸意識(shí)到這一點(diǎn)。
《知識(shí)分子》:運(yùn)貨的車是不是可以只靠視覺?
肖健雄:我們是以視覺為主,但是多傳感器,里面有激光雷達(dá)、毫米波雷達(dá)、GPS還有超聲波雷達(dá),這些都有。
《知識(shí)分子》:這些是為了更安全一些?
肖健雄:對(duì)的,多層冗余確保萬(wàn)無(wú)一失。我們第一層是靠攝像頭,單靠攝像頭就可以走了,完全可以,沒(méi)問(wèn)題。但是萬(wàn)一出事呢?所以加了一個(gè)激光雷達(dá),但是也不夠。萬(wàn)一激光雷達(dá)也出錯(cuò)了呢?我們就用超聲波雷達(dá)和毫米波雷達(dá),多層冗余。做一個(gè)安全性要求高的產(chǎn)品的心態(tài)是考慮最糟糕情況下行不行,而不只是能演示。所以現(xiàn)階段這種多層冗余是必須的。以后隨著技術(shù)越來(lái)越好,可能越來(lái)越精簡(jiǎn),比如說(shuō)我們大量運(yùn)營(yíng)的數(shù)據(jù)證明這個(gè)超聲波雷達(dá)從來(lái)沒(méi)被用到,再跑三年,也沒(méi)被用到,那我們下一款就省了超聲波雷達(dá)。一開始上來(lái)肯定是要過(guò)分的小心。安全第一,寧可過(guò)分的小心,確保萬(wàn)無(wú)一失。
《知識(shí)分子》:送貨包括在公路上送貨?
肖健雄:對(duì),但我們不做城際間的無(wú)人駕駛,因?yàn)槌请H間的無(wú)人駕駛更遙遠(yuǎn),落地會(huì)更遠(yuǎn)。因?yàn)槌请H間大家會(huì)用大卡車,大卡車有兩個(gè)重大問(wèn)題,一是特別重,一旦重慣性就大,一旦慣性大剎車距離就遠(yuǎn),也就是你要看很遠(yuǎn),精確判斷,要不然太近,反應(yīng)過(guò)來(lái)的時(shí)候已經(jīng)剎不住了;二是大卡車一旦出事就是大事,災(zāi)難性后果,比如在加州到現(xiàn)在還不讓無(wú)人駕駛的大卡車測(cè)試,法律也會(huì)有巨大的障礙。
《知識(shí)分子》:但有的公司專注大卡車送貨?
肖健雄:有,我覺得這個(gè)肯定早晚會(huì)做得通,問(wèn)題是做多少年才能通。我認(rèn)為短期內(nèi)港口可以,但是真上大馬路、高速公路上,很難有一個(gè)全無(wú)人駕駛的大卡車。我自己開車,看到一個(gè)有人駕駛的大卡車都要趕緊躲遠(yuǎn)遠(yuǎn)的,你搞個(gè)無(wú)人的,壓力更大。我覺得這個(gè)肯定是比較遠(yuǎn)的未來(lái)。
3無(wú)人送貨車會(huì)來(lái)得更快更猛烈些
《知識(shí)分子》:初創(chuàng)公司無(wú)論在任何技術(shù)潮流當(dāng)中要戰(zhàn)勝大的公司必然有一些特別的優(yōu)勢(shì),你覺得AutoX主要的優(yōu)勢(shì)在哪里?
肖健雄:我覺得我們選了一條不會(huì)有很大巨頭的路。你看中美市場(chǎng),我覺得中國(guó)市場(chǎng)的無(wú)人駕駛會(huì)比美國(guó)慢很多,為什么呢?中國(guó)路復(fù)雜,這個(gè)沒(méi)辦法,AI要求更高,對(duì)技術(shù)要求更高。大家肯定會(huì)努力,無(wú)數(shù)個(gè)公司,包括我們公司肯定都會(huì)努力。但是人類的科學(xué)水平就是這么高,沒(méi)辦法,不可能要求在此時(shí)此刻就突然有了重大突破。第二,中國(guó)的人力成本非常便宜,無(wú)人駕駛需要使用傳感器、電腦和線控系統(tǒng),算半天比人還貴,大家就不想用。美國(guó)沒(méi)這兩個(gè)問(wèn)題,美國(guó)有很多地方的路都是非常簡(jiǎn)單,地廣人稀。美國(guó)的人特別貴,工資高,傳感器不用降到太便宜,已經(jīng)比人便宜了。所以,我覺得無(wú)人駕駛的爆發(fā)點(diǎn)肯定會(huì)在美國(guó)先開始,再在中國(guó)開始。中國(guó)北上廣深這種路太復(fù)雜了,而且有大量的二三線城市和農(nóng)村人口進(jìn)入這些大城市去當(dāng)司機(jī),這個(gè)成本實(shí)在是很難算過(guò)來(lái)。但是中國(guó)市場(chǎng)非常大,未來(lái)的前景是非常好的。所以除了美國(guó)市場(chǎng)的布局以外,我們也在中國(guó)設(shè)立了辦公室,準(zhǔn)備長(zhǎng)期深耕打硬仗,做好一切準(zhǔn)備就緒只欠東風(fēng),等到最后中國(guó)爆發(fā)點(diǎn)的到來(lái)。
《知識(shí)分子》:主要的賽道是怎樣的?
肖健雄:有一些偏小眾的賽道,特殊應(yīng)用場(chǎng)景,像掃地機(jī)、港口這些都可以做,但是這個(gè)市場(chǎng)很小,成為小公司可以,但是很難成為大公司。大的市場(chǎng)主要有三條賽道,一個(gè)是載人出租車,一個(gè)是我們這種本地送貨車,另外一個(gè)是長(zhǎng)途無(wú)人大卡車。無(wú)人大卡車技術(shù)最難,在美國(guó)方面也是最慢的。
除了技術(shù)不成熟,載人出租車的另一個(gè)壞處就是巨頭眾多,有Waymo、Cruise、Uber,跟他們PK,就是螞蟻戰(zhàn)大象:大象跑著跑著,還沒(méi)看到螞蟻宣戰(zhàn),螞蟻就被大象不小心給踩死了。巨頭的優(yōu)勢(shì)還不僅僅是技術(shù),還包括資金、生態(tài)、人力、品牌一系列的。我覺得這些都是很難克服的,所以我們公司是比較巧妙地選擇不跟他們正面競(jìng)爭(zhēng)的一條道路。這也有一個(gè)好處,因?yàn)樗麄冊(cè)诖蛴舱坦タ藷o(wú)人出租車的過(guò)程中,留給了我們一個(gè)時(shí)間窗口,比如說(shuō)他們用十年時(shí)間終于攻克技術(shù)和商業(yè),整個(gè)美國(guó)都全部有了無(wú)人駕駛出租車,那我們就有十年時(shí)間。無(wú)人出租車這個(gè)問(wèn)題本身很難,會(huì)消耗他們大量精力,所以他們沒(méi)空來(lái)?yè)屛覀兊牡乇P。我們有十年的時(shí)間可以讓自己成長(zhǎng)的很強(qiáng)大,十年后他們肯定會(huì)看中我們這塊地盤,我們也會(huì)打他們那塊地盤。載人出租車我們也做,不是不做,我們通過(guò)送貨車,積累大量的數(shù)據(jù),通過(guò)自己的業(yè)務(wù)賺到大量的資金和建立自己的品牌,然后再回到無(wú)人出租車上跟巨頭們一決高低。
《知識(shí)分子》:你們跟一些車企合作或者一些芯片公司合作嗎?
肖健雄:我們跟這些公司都合作。我們公司是有所為,有所不為。你看我們做很多東西,但其實(shí)我們不是沒(méi)事干自己偏要做那么多東西,而是什么東西買不到我們做什么,買得到就通通拿來(lái)主義,又快又好。我們做整體系統(tǒng)的集成,如果別人有一個(gè)激光雷達(dá),我們就用它的激光雷達(dá),別人有攝像頭就用它的攝像頭,別人有芯片我們用它的芯片,我們跟這些公司都保持著非常良好的關(guān)系。別人的公司有個(gè)車很好用,我們也用。但是有時(shí)候反而是他們沒(méi)辦法提供給我們一些我們需要的東西,包括我們公司自己開發(fā)我們的載貨車線控系統(tǒng)也是這樣。無(wú)人駕駛需要線控系統(tǒng)能用電腦控制方向盤,油門剎車,但是很多汽車廠沒(méi)這個(gè)能力,我們只能自己開發(fā)這個(gè)能力,跟他們合作把這個(gè)車做出來(lái)。
《知識(shí)分子》:你覺得在自動(dòng)駕駛?cè)瞬胚@方面有沒(méi)有缺口?
肖健雄:我們不只是有某個(gè)單一方面的人才,我們有一系列的人才。我們有感知的人才,有規(guī)劃、決策、系統(tǒng)人才,有軟硬件的人才,硬件包括機(jī)械工程師、電子工程師,因?yàn)槲覀冏霎a(chǎn)品化已經(jīng)很成熟了,所以我們最基本的鏈條已經(jīng)形成閉環(huán)。所以我們公司人雖然多,但是每個(gè)人都會(huì)有所側(cè)重,都是公司重要的一份子。
《知識(shí)分子》:有點(diǎn)不可想象,因?yàn)槟銈兂闪r(shí)間也不太長(zhǎng)。
肖健雄:對(duì)的。但是我們非常專注,所以跑得很快,我們是奔著做一款真的產(chǎn)品出來(lái)的,來(lái)進(jìn)行統(tǒng)籌規(guī)劃。我們做大量的技術(shù)研發(fā),所以我們也有大量的算法人員,發(fā)揮我們的強(qiáng)項(xiàng),在算法上突破;我們也有大量工程能力特別強(qiáng)的工程師,來(lái)自谷歌、蘋果、臉書和車廠等等做過(guò)大型系統(tǒng)的,做好軟件和硬件架構(gòu)設(shè)計(jì)。出于保護(hù)原創(chuàng)技術(shù),我們不是經(jīng)常出來(lái)說(shuō)我們的技術(shù),但是向一些同行在技術(shù)上做了一些宣傳,適當(dāng)?shù)赝嘎兑恍┪覀兛梢酝嘎兜募夹g(shù),包括我剛才在演講中,也首次披露了我們的三維仿真器。當(dāng)然我們還有很多不可以透露的,比較機(jī)密的技術(shù)。
《知識(shí)分子》:你們現(xiàn)在可以披露的獨(dú)特技術(shù)有哪些?
肖健雄:第一是攝像頭的感知,這方面之前有很多媒體的報(bào)道,因?yàn)槲揖褪亲鲞@個(gè)出身的,所以做了大量的研發(fā),包括雙目攝像頭、目標(biāo)檢測(cè)、實(shí)時(shí)分割、從圖片就可以估計(jì)出物體三維的框,這些都是可以的。
第二項(xiàng)是大規(guī)模地圖的建立。我們給大家看的視頻里面都是區(qū)狀的,每個(gè)區(qū)域里面的大街小巷都有,全部掃描起來(lái),這是多傳感器融合,融合了攝像頭、激光雷達(dá)、GPS、IMU,還有車的速度這些全部集成在一起做出這個(gè)大規(guī)模的地圖,這是一個(gè)很強(qiáng)的能力。這個(gè)是很多公司沒(méi)有的能力,因?yàn)槲覀儸F(xiàn)在要運(yùn)營(yíng)的都是區(qū)狀的任何兩點(diǎn)的自動(dòng)駕駛運(yùn)營(yíng),所以我們需要這種技術(shù),這是我們比較領(lǐng)先、領(lǐng)跑的。
我覺得世界上擁有這個(gè)技術(shù)的公司不是很多。Waymo和Cruise是肯定有的,其它公司都是只有一兩條線,百度稍微有小片區(qū)域。很多初創(chuàng)公司還是一個(gè)圈的地圖而已,只能跑一個(gè)圈。我們還融合激光雷達(dá)和攝像頭,所以我們的高清地圖都是有顏色,很多公司的高清地圖都是純激光雷達(dá)的,沒(méi)有攝像頭,所以你看它的地圖沒(méi)有顏色的,只有反射率,是黑白的。
第三是三維仿真器,這也是比較重大的一個(gè)開發(fā),這已經(jīng)突破了谷歌跟百度的水平。我們從零開始搭建,自研了一個(gè)三維仿真器,跟我們的自動(dòng)駕駛系統(tǒng)大量集成,這也是非常重要的。市面上有些公司可能在賣三維仿真器,其實(shí)沒(méi)法用,因?yàn)樗鼜膩?lái)沒(méi)有真的和自動(dòng)駕駛系統(tǒng)連在一起用,當(dāng)然開發(fā)三維仿真器的人員也不知道自動(dòng)駕駛公司需要什么,所以做的也不是特別好。我們?cè)诜抡嫫骼锩媸嵌鄠鞲衅骺梢苑抡娉鲕囋陂_的時(shí)候攝像頭能看到什么,可以仿真出激光雷達(dá)能看到什么。我們一系列全部測(cè)試都可以在三維仿真里面進(jìn)行,就在車上路之前就已經(jīng)知道這個(gè)版本做的多好,多安全。可以在仿真器里做大量的測(cè)試。
第四是軟硬件一體化設(shè)計(jì)的能力,包括計(jì)算平臺(tái)的冗余設(shè)計(jì)和線控系統(tǒng)。
《知識(shí)分子》:你們也在路測(cè)?
肖健雄:當(dāng)然,我們有大量的車在實(shí)際路測(cè),我們路測(cè)比誰(shuí)都勤快,比很多其它初創(chuàng)公司車多,我們?cè)诿绹?guó)比百度車還多。
《知識(shí)分子》:大部分人,還是很關(guān)心怎么樣從天天開車當(dāng)中解脫出來(lái),即使美國(guó)在什么時(shí)間點(diǎn)有可能會(huì)看到大量的運(yùn)營(yíng)?
肖健雄:在美國(guó)一些小區(qū)域?qū)崿F(xiàn)無(wú)人出租車的落地,在2021年可能Waymo可以達(dá)到。不是全部城市,少數(shù)一兩個(gè)城市,可以真的無(wú)人駕駛。我覺得某些廠商說(shuō)可以做得比這個(gè)快的,我覺得都是不科學(xué)的,除非是特定場(chǎng)景。在中國(guó),可能需要更長(zhǎng)的時(shí)間,但是勢(shì)不可擋。無(wú)人車即將落地,但是最先的,可能不是大家想的那樣做無(wú)人出租車,反而是無(wú)人送貨車會(huì)來(lái)得更快更猛烈些。
制版編輯 | 楊梟