解密特斯拉自動駕駛晶片背後的一號人物

文:國仁

在自動駕駛領域,AI晶片其實並非新奇玩意。Mobileye的EyeQ系列晶片,就是較早應用於自動駕駛的AI晶片之一。

而在這個月早些時候,矽谷鋼鐵俠馬斯克,還宣佈了特斯拉正在研發用於自動駕駛的AI晶片,回顧馬斯克對自動駕駛晶片的各種動作,我們發現近來各種跳票“不靠譜”的他,其實對技術發展的趨勢,遠比看上去更理解。

馬斯克對特斯拉自行研發自動駕駛晶片的佈局,從兩年前就開始了。

一、從Mobileye到英偉達特斯拉的自動駕駛焦慮症

2014年,特斯拉找上Mobileye,用上了它家的新一代輔助駕駛晶片EyeQ3,來武裝自家的獨門絕技——自動駕駛系統Autopilot。

在這個時間點,EyeQ3無疑是最好的選擇。它的計算性能達到300Gflops(每秒3000億次浮點運算),並且內部封裝了先進的ADAS演算法,廣泛用於各家車廠的的ADAS系統中。

圖中圈內為EyeQ3

但對特斯拉來說,Mobileye的EyeQ3成在這一點,敗也敗在這一點。去年特斯拉Model S撞卡車事件發生後,特斯拉與Mobileye開始分道揚鑣。當時人們普遍認為是這場事故導致了雙方的信任破裂——對特斯拉來說,Mobileye並不保證自動駕駛足夠安全,而Mobileye也很冤,因為當時還只定位於ADAS而已,特斯拉車主違規操作不僅害死了自己還讓Mobileye的名聲遭受了打擊。

不過,這件事雖然看上去是特斯拉與Mobileye蜜月結束的導火索,但背後的原因仍然是,特斯拉的計算力焦慮。

馬斯克一再宣稱要將全自動駕駛短期內帶上特斯拉的Model系列,但從未實現過。一個重要的原因就是,Mobileye的EyeQ3這塊晶片,在計算力上並不能滿足需求,它只是為ADAS設計的。

而在2016年初,英偉達推出了Drive PX 2,理論計算性能最高達到10Tflops,比EyeQ3的性能來得要粗暴得多。並且,希望在自動駕駛領域建立起自家GPU計算生態的英偉達,給需求較大的特斯拉還開出了優惠的價格。此時急於對自動駕駛功能進行升級的特斯拉,選擇再度回歸英偉達的擁抱,到也顯得合情合理。

以Model 3為例,其為自動駕駛功能和環視配置了8枚攝像頭與12枚超聲波雷達以及一枚毫米波雷達,大量的視頻圖像資料處理以及在其之上運行圖像識別演算法,將會消耗巨量的計算資源,這顯然是算力只有300G的EyeQ3力所不及的。

相對於EyeQ3只是一塊ADAS晶片,Drive PX 2實質上是一台車載電腦,是更加完整的解決方案。

上圖為Drive PX 2 AutoCruise,下圖為Autochauffeur

在配置了Drive PX 2過後,特斯拉在度過車禍事件的一陣低調過後,確實也對自動駕駛功能進行了更新。車東西不久前曾體驗過特斯拉新的AutoPilot,發現開啟後維持在一條車道上撒手不管也沒問題,不過特斯拉依然做了限制,時間太長系統會發出警報。

但Drive PX 2就能解決馬斯克的焦慮了嗎?顯然也不能。因為Drive PX 2實質上有多個版本,其中算力較高的是Autochauffeur,算力較低的是Drive PX 2 AutoCruise,其上只搭載了一個Nvidia Parker Soc。

有國外車主拆解過特斯拉ModelS上配置的Drive PX 2,它長這樣:

英偉達為特斯拉定制的Drive PX 2車載電腦

可以看到,特斯拉所用的DrivePX 2並沒有像Autochauffeur版本那樣使用了兩枚Soc+兩塊額外的GPU,而是只有一個ParkerSoc+一塊獨立GPU。因此特斯阿拉所用的,更像是英偉達為其定制的AutoCruise版本。對於Drive PX 2,英偉達自身都明明白白地說過,要經過多塊(多塊Autochauffeur)疊加,才能滿足L4級自動駕駛的算力需求。所以對於特斯拉上面的DrivePX 2,我們也可以明確其算力支持,不會超過L3水準。

並且,GPU為主的計算架構,一直有著功耗高的問題。為了給這塊Drive PX 2散熱,特斯拉使用了兩枚風扇,也說明Drive PX 2的熱設計功耗,至少是在50W~100W區間(英偉達硬體工程師曾向車東西表示,雙Soc+雙獨立Pascal顯卡的Autochauffeur功耗在150W)。

高成本、高功耗,算力還無法完全滿足需求,即使是號稱超級車載電腦的DrivePX 2,依舊有著這三個問題。而這些,對自動駕駛量產車來說,都是致命的。於是英偉達也拿出了下一代的Xavier作為應對,功耗/性能比大幅升級,但它的裝車量產要到2019年。

馬斯克早已等不及了。

一生好運,智勇雙全,有如神助

百戰不殆,金融圈商界年底送禮首選

二、攬來大牛沉寂兩年?只因在憋大招

馬斯克是個聰明人,不會吊死在一棵樹上,這一點,從特斯拉的計算晶片先使用MobileyeEyeQ3再轉入Drive PX 2就能看出來。

如果別人的樹上結不出果子,那麼自己種一顆也不是不行。

2016年1月,特斯拉的硬體工程部門迎來了新的副總裁,一名做晶片架構設計的工程師,名叫吉姆·凱勒,跟他一起來到特斯拉的,還有曾經在他工作過的AMD、P.A Semi、蘋果公司中任職過的數十名晶片行業的人才。

吉姆·凱勒

跟馬斯克一樣,吉姆·凱勒也是個不甘寂寞的人。吉姆·凱勒早年間在AMD任職,深度參與了x86-64架構的定制工作,讓曾經只支持32位的X86升級到了64位。這也是吉姆·凱勒可能作出的最大貢獻——眼下各位內置了英代爾、AMD處理器的64位PC,都有吉姆·凱勒的功勞。

吉姆·凱勒也幫助AMD拿出了K7、K8架構,使得AMD在與英代爾的CPU競爭中用速龍壓制了奔騰(雖然並未維持多久)。

隨後,吉姆·凱勒從AMD離職,後來又加入半導體設計公司P.Asemi出任副總裁,專事設計低功耗處理器。2008年,蘋果收購了P.A。於是吉姆·凱勒又成為了蘋果A4、A5處理器的設計領頭人。

在兩家著名公司中領導晶片專案,並且最終產品造福了以億計的人們,吉姆·凱勒可以說是功成名就了,但他的故事還將繼續。

2012年,吉姆·凱勒重返AMD,出任晶片首席架構師。此時的AMD已經在CPU市場上被英代爾打得滿地找牙,“i3默秒全”早已成為圈內的笑談。吉姆在AMD待了三年,在2015年9月離職。他做了啥?幫AMD打造了新的處理器架構“Zen”。今年,當基於Zen架構打造的AMD銳龍處理器誕生時,當年AMD速龍對決英代爾的輝煌再度上演,升級緩慢的英代爾大幅提高了下代處理器的性能作為應對。

因此,吉姆·凱勒其實是充當了AMD的“救世主”,而且是在兩年前救的,而且是救完就走,不留下一片雲彩。

AMD銳龍處理器

起2016年加入特斯拉的消息表明,救完AMD過後,吉姆·凱勒又拯救陷入“自動駕駛謊言”中的特斯拉去了。

事實上,馬斯克在2015年就感受到了特斯拉可能會面臨的自動駕駛危機,當年主動發推文,先行大力招募自動駕駛的軟體人才,而後對AMD、英代爾、蘋果等公司的硬體人才挖角行動也沒有停過。

獲得吉姆·凱勒之後,特斯拉與晶片製造商/代工商的接觸開始變多。去年9月,消息一度傳出,三星將幫助特斯拉打造車載晶片,後來消息不了了之。今年早些時候,CNBC曾報導AMD將與特斯拉合作打造晶片,聽上去可信度很高——吉姆·凱勒來自AMD,而特斯拉方面也曾經表示,他們在自動駕駛晶片上的選擇很靈活。

今年9月,AMD的拆分子公司、晶片代工方格羅方德在對外演示中無意走漏風聲,稱正在與特斯拉合作。後來格羅方德闢謠稱與特斯拉並沒有直接合作(也等於間接指出特斯拉在於AMD合作)。一時間特斯拉自研晶片的消息再度沸沸揚揚,AMD還因為這個利好消息股價小漲一波。

直到12月,面對不斷下行的股價壓力,馬斯克把這個消息當做利好放了出來。

如果從吉姆·凱勒加入開始算起,到這個時候,特斯拉的自研晶片計畫其實已經潛行了快兩年。兩年時間,對外零成果,這完全不符合特斯拉的風格。為何一向求快的特斯拉,此時卻穩了起來?

因為特斯拉要研發的,正是面向自動駕駛的ASIC(馬斯克原話是“developing specialized AI hardware”)。

ASIC,ApplicationSpecific Integrated Circuit,專用積體電路,意思就是面向專門計算用途打造的晶片。其特點是在某一特定領域的計算上能夠以更低的功耗獲得更高的性能。另一個特點則是,研發週期長,時間通常超過一年。

對於特斯拉來說,在應用了高功耗的DrivePX 2仍然無法實現高級自動駕駛過後,研發出自己掌握的、2~3年的時間是值得等待的。特別是,當這個晶片專案是由吉姆·凱勒主導時。

吉姆·凱勒在輾轉AMD與蘋果的過程中,曾經開發過基於MIPS架構的網路晶片,還開發過基於ARM V8架構的伺服器晶片(MIPS、ARM V8都是RSIC精簡指令集架構,一般來說在功耗上具有優勢) 擁有了豐富的低功耗晶片設計經驗,結合其此前在高性能晶片上的設計能力,他為特斯拉帶來的將是功耗/性能表現更加優越、高度適配自動駕駛軟體演算法的專用晶片。

在馬斯克放出特斯拉將自研晶片消息時,他如此形容這款晶片的優勢——“Thiscan give 10x power at a tenth the cost”。什麼意思?能以十分之一的功耗,實現十倍的性能。吉姆·凱勒也稱,現在的AI技術在進行應用時,功耗是一個常被忽視的元素。

從特斯拉眾人的一席話中可以看出,他們研發的這款自動駕駛晶片,將在功耗/性能比上下更多功夫。

特斯拉晶片最大可能的代工方格羅方德,也擁有專門面向低功耗的晶片工藝——FD-SOI。近年格羅方德剛剛實現了FD-SOI的22納米制程升級,宣稱功耗比28nm降低了70%,該工藝相較於我們較為熟悉的FinFET而言,更適合需要低功耗晶片的移動計算等場景。

當然,低功耗並不代表低性能。以特斯拉的舊愛Mobileye為例,其明年將要量產的EyeQ4系列晶片,採用MIPS架構搭建,能夠以3W的功耗,實現2.5Tflops的計算性能。

而同時玩過X86、MIPS、ARM v8架構的吉姆·凱勒,玩晶片性能跑得上得去,做功耗優化也降得下來。

三、特斯拉自研背後:自動駕駛晶片正在轉向

特斯拉自研自動駕駛晶片,其實反映了隨著自動駕駛行業成長、需求明確,其計算的需求由通用轉向了專用,運行的由訓練走向了落地(Inference,推斷),隨著自動駕駛向量產推進,自動駕駛系統所需要的晶片,由原本不計代價、不懼高功耗追求絕對算力的GPU,走向低成本(前提是大規模量產攤薄成本)、低功耗、高性能的ASIC。

曾有整車廠出身的自動駕駛創業者向車東西吐槽,業內許多創業者完全沒有考慮過自動駕駛的量產問題,其中一個顯著表現就是大量堆砌高功耗的計算核心,“將數塊GPU拼在一起”,放在車輛的後備箱中。而現在對於要量產的自動駕駛車來說,其計算核心必須是嵌入式的,不僅要滿足計算性能,同時要滿足低功耗需求,同時成本要可接受,此時ASIC是看上去最可行的方案。

儘管ASIC開發的週期不短,需要的資金也十分驚人(制程較先進時僅是單次流片可能就需要數百萬美元),但一旦投入量產、規模鋪開,晶片產業的邊際效用會立即發揮,將單枚晶片成本壓低。

對於特斯拉來說,儘管自研自動駕駛晶片的風險巨大,初始成本高昂,但一旦投入使用,帶來的各種收益將是顯著的。除了降成本、降功耗,另一點就是頻頻被提及的自主性:全世界的科技企業都從蘋果的成功中學習到一點——軟硬體一體的威力。

自研晶片的特斯拉,不僅能夠為Autopilot提供定制化的硬體支援,同時也可以將大量自動駕駛演算法直接封裝到晶片內。構建起這樣的能力,將成為特斯拉在自動駕駛競賽中的核心優勢。

除了特斯拉之外,還有其他公司已經走上了這條道路。

上周,國內自動駕駛晶片初創公司地平線,推出了兩款AI晶片,其中一枚,正是面向自動駕駛的ASIC“征程”。在參數上,征程能夠以1.5W的功耗,實現1Tflops的算力,每秒處理30幀4K視頻,對圖像中超過200個物體進行識別。

性能功耗比可以直接反映出在自動駕駛領域,ASIC面對GPU時所展現出來的優勢——征程每瓦特功耗實現了0.666T的計算力,而英偉達此前推出的Drive PX 2 ,以150W的高功耗,實現的是不到24T的算力。若如此計算,“征程”的性能功耗比達到Drive PX 2的3倍還多。

並且,由於ASIC不是GPU類的通用計算,內部直接封裝了演算法,資料交換只是底層I/O,因此其計算的時延也會比GPU更低。也是因為這個原因,儘管“征程”這枚ASIC在絕對算力上要比Drive PX 2 Autochauffeur 低上不少,但地平線也稱其能夠滿足L3的計算需求。

而有吉姆·凱勒坐鎮、財力也更雄厚的特斯拉,在自動駕駛ASIC上做得更好,只是必然。

當然,與特斯拉分手的英偉達自己也非常清楚GPU路徑的優勢與不足,在下一代的計算核心Xaiver中,將採用CPU+GPU+ASIC的異構計算方案,Xiaver在提供給不同的合作夥伴時可以採用定制方案。

英偉達未選擇轉入ASIC的路徑,是因為畢竟還要做生態,拋棄GPU就沒法玩了。不過生態也是英偉達最好的武器,除了底層的cuDNN和Tensor RT等,英偉達還提供在雲端強大的訓練能力,以及大量的自動駕駛通用演算法,包括提供車輛、行人、紅綠燈識別能力和可行駛區域檢測能力的DriveWorks。這極大地降低了自動駕駛開發的上手難度,對於不像特斯拉那樣追求極致的後來者們,生態完整的英偉達仍然是良好選擇。

結語:自動駕駛晶片或成特斯拉下一輪救星

儘管馬斯克聲稱,特斯拉正在打造的AI專用晶片“將是世界上最好的AI晶片”,但並未透露它什麼時候會誕生。而馬斯克已經再一次“誇下海口”,要在2019年實現完全的自動駕駛。有吉姆·凱勒這樣的大神助陣,馬斯克這一次的承諾跳票可能性看上去小了那麼一丟丟。不過,按照人們對特斯拉的期望值來看,只要它能夠實現高度自動駕駛,即使稍微晚來了幾年,也沒有關係。

只是問題在於,無論是地平線這樣的初創公司,還是Mobileye這樣的老牌,都在自動駕駛ASIC這條道路上越走越遠。在短暫引領自動駕駛(實質仍是輔助駕駛)風騷過後,特斯拉的優勢已經不再明顯。

但馬斯克常常能化不可能為可能,無論是造出一輛續航超過500公里的電動車,還是實現運載火箭的回收。這一次,有晶片大神吉姆·凱勒的坐鎮,特斯拉在自動駕駛晶片上可能實現的成就,不可小覷。一旦問世,它或許就會成為“不思進取”的AutoPilot的救星。

在特斯拉的不斷跳票與被拯救中,自動駕駛正在悄悄走向量產。

作者:國仁;來源:虎嗅網,點擊本頁左下角可以繼續“閱讀原文”。

一生好運,智勇雙全,有如神助

百戰不殆,金融圈商界送禮獨一無二

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171229B101A600?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券