特斯拉將于本月22日舉行一次自動駕駛投資者日活動,希望它能夠在這次活動上提供一些自己在自動駕駛研發工作方面的細節;
完全自動駕駛的實現具有巨大的財務影響,這使得某些技術問題變得尤為重要;
對于投資者而言,當前的關鍵問題是,特斯拉是否能夠利用它在現實物理世界中訓練大規模數據的優勢實現比競爭對手更好的自動駕駛。
近日,特斯拉發布公告稱,將于本月22日舉行自動駕駛投資者日,以下是其公告內容:
“未來幾周和幾個月內特斯拉將要出現一系列令人興奮的進展,我們迫不及待地想跟您分享這些成果。特斯拉將在位于帕洛阿爾托的總部舉行投資者日,屆時,我們將會幫助大家深入了解本公司的自動駕駛技術和路線圖。
我們給投資者提供了試駕環節,投資者可以親身體驗我們最新的自動駕駛軟件,包括一些目前正在積極開發中的特性和功能。同時,埃隆馬斯克、工程副總裁Stuart Bowers、硬件工程副總裁Pete Bannon和人工智能高級主管Andrej Karpathy都將蒞臨現場并發言。”
以下是我希望投資者們在自動駕駛投資者日上向特斯拉提出的五個問題:
1、很明顯特斯拉正在使用深度監督學習來執行計算機視覺任務。但是對于實際的駕駛任務-路線規劃和駕駛策略(使用特斯拉自己給出的術語),特斯拉使用的是模仿學習還是強化學習,還是兩者兼而有之?在模仿學習中,神經網絡通過觀察人類駕駛行為,并通過將感知信息和駕駛員行為產生關聯來學習駕駛,在強化學習中,則是通過反復試驗(通常是進行模擬)進行學習。
2、無論特斯拉在駕駛任務(和計算機視覺任務相對)上使用的是哪種方案,在谷歌Waymo這樣的公司還在苦苦的掙扎之中的時候,特斯拉為什么認為自己選擇的方案有效呢?為什么特斯拉在實施這種方案時具有自己獨特的優勢?比方說,如果特斯拉選擇了模擬學習方案,那么,它之所以具有獨特優勢是因為它所售出的汽車數量相對比較龐大,那么我們希望特斯拉能給我們提供一個證明,證明為什么模仿學習會起作用。以及為什么單獨地只在模擬中進行純粹的強化學習的方案走不通。
3、特斯拉在解決必要的計算機視覺任務上完成到什么程度了?特斯拉如何設定一個標準,來衡量這個任務完成了?是不是剩下的工作只是在訓練集中添加更多的標記數據了?
4、特斯拉的傳感器套件在獲取周圍物體的深度信息方面的精確度到底如何?激光雷達有時會吹噓在深度繪圖上的優勢,和激光雷達相比,特斯拉的傳感器套件優勢和劣勢在哪里?
5、特斯拉是否發現了端到端學習方面的潛力?還是目前還遠遠沒有走到端到端學習的實用階段?如何將端到端學習和無監督的表示學習結合在一起?在端到端學習中,通過模仿學習或者強化學習來訓練神經網絡,基于原始傳感器的輸入產生動作,無需要在這個過程的任何階段使用人類標記。在無監督學習中,神經網絡從過去的數據中學習預測未來的數據,無需任何人工標簽。
目前,我們幾乎對特斯拉的技術戰略一無所知。我們當然可以根據現在已經掌握的一些證據來推測它的技術戰略,但是我們并不確定特斯拉在幕后到底在做什么事情。特斯拉這次有可能只是舉辦一次普通的自動駕駛投資者日,對上面我所列出的技術問題遮遮掩掩諱莫如深,但是我更希望的是,它能夠利用這次活動開誠布公地向投資者詳細解釋特斯拉現在正在做什么,并且談論一下為什么它所執行的技術戰略是正確的選擇。
根據ARK Invest發布的財務模型,如果特斯拉能夠在未來五年內推出完全自主駕駛的汽車,它的股價就會在當前的基礎上增加大約8到14倍。盡管不同的分析公司對特斯拉有不同的財務預測模型,但是很多公司都認為自動駕駛的潛在長期價值大大超過了特斯拉目前的市值。如果有公司可以成功部署完全自動駕駛技術,那么蒙著眼投資它就是一個再簡單粗暴不過的邏輯了。但是現在的問題是,從技術可行性上來看,是否可以實現完全自動駕駛,如果可以,是哪家公司實現它。這就是投資者為什么需要理解特斯拉的自動駕駛技術戰略的重要原因所在。
現在,特斯拉的投資者面臨的關鍵問題就是,如何從以上五個問題的答案得到一個結論,即特斯拉能否真正利用它已經售出的45萬輛汽車的龐大訓練數據來實現比其它公司更為出色的自動駕駛性能。讓特斯拉變得與眾不同的是它那龐大的訓練數據。但是,只有在勝出的技術方案需要大量的訓練數據,而且這些數據不需要昂貴且緩慢的人類標簽的瓶頸的時候,這種資源才能夠決定特斯拉的競爭優勢。模仿學習和端到端學習就是這樣的技術方案。與之相對的方案則是使用手工編碼的規則來告訴自動駕駛汽車應該做什么,這種方案使用不到任何實車駕駛中的訓練數據。還有一種相對的方案就是純粹的強化學習,它使用計算機在模擬世界中生成訓練數據,而不是使用來自真實世界的數據。
因此,特斯拉有沒有強大的競爭力取決于它那些龐大的來自現實世界的訓練數據是否是最終勝出方案的決定性資源。特斯拉那些來自真實世界的數據是否是決定性的資源又取決于勝出的正確方案是數據密集型的(就像模仿學習或者端到端學習那樣),還是數據無關緊要的(就像手工編碼或者模擬世界中的純粹強化學習)。
換句話說,特斯拉的競爭力實際上取決于兩個方面。第一,特斯拉目前正在執行的技術路線是什么?第二,它選擇的技術方案是否正確。那么,投資者需要從特斯拉得到的相應信息就是,第一,對目前技術路線的解釋,第二,論證所選擇技術方案的正確性。
根據一系列調查報告,我認為特斯拉正在使用“模擬學習方案”來推動自動駕駛任務。我對這種方案持樂觀態度,主要有兩個方面的原因。首先,DeepMind的AlphaStar項目引人注目地證明了純粹模仿學習和使用模擬學習增強強化學習效果的實力。其二,來自Waymo和Uber ATG的專家也公開強調模仿學習是一種非常有前途的自動駕駛任務解決方案。
此外,我對手工編碼方案持懷疑態度,因為,到目前為止,它幾乎沒有成功的案例,因為人類
有的時候很難將復雜的任務形式化為一套既定的規則,所以我對此持觀望態度。另外,我對在模擬中使用純粹的強化學習也持懷疑態度,因為在我看來,要進行模擬必須有一個真實的人類駕駛行為模型,以便神經網絡學習如何在復雜的情況下和其它駕駛者互動。而要想創建出真實的人類駕駛行為模型就等同于打造出一款全自動駕駛汽車來了,所以這里有一個先有雞還是先有蛋的問題。
如果我們能夠在特斯拉的自動駕駛投資者日上得到足夠的信息來證明模仿學習方案的優勢,以及特斯拉會證明為什么它的方案有效而其它方案沒有用,那么,這次活動將會是一次非常重要的大事件,就我個人而言,我覺得這比特斯拉公布它最新季度的收益或者交付了多少車輛重要多了。