英特爾公司副總裁兼無人駕駛事業部總經理。她于2016年從Delphi加入英特爾公司。在Delphi,她曾成功實現首次全面無人駕駛汽車的跨國之旅。
如果3000人同時講話,
你還能聽清每個人在講什么嗎?
作為一名工程師,我熱衷解決問題并使用“數學語言”——或是數字——來理解我們的世界。數字,不止是數值,它能用文字無法實現的方式為故事增色添彩。大的數字很有意思,因為它們的含義通常比數值本身更加復雜,4TB更是如此,想到這一數字對無人駕駛行業的意義,我就感到非常興奮。
首先,為什么是這個數字?一輛無人駕駛汽車預計在一個半小時內就會產生4TB的數據量,而每個人平均每天在車內的時間就是一個半小時。到2020年,3000個互聯網用戶每天也將產生這么多數據。現在,你可能還無法直觀感受這么大的數據量。那我們換個角度,多少人在Facebook上有3000個好友?想像一下,你每天都在關注、接收這些好友發布的新動態。
無人駕駛汽車各傳感器每秒產生的數據量
如果一輛無人駕駛汽車產生數據的亮點僅僅是4TB的話,可能并不會令人興奮。讓數據成為無人駕駛“新石油”以及真正帶來挑戰的地方在于,我們需要利用這些數據,把它們變成可執行的洞察,從而讓汽車在無人干預的情況下思考、學習和行駛。在未來,數據驅動的駕駛有望減少90%人為錯誤造成的事故。
英特爾是一家數據公司。我們深諳如何去創建、移動、存儲、處理、分析并管理大規模數據。而且,我們正在把這種專業知識應用到無人駕駛行業。根據經驗,我們知道,要想解決無人駕駛所面臨的數據挑戰,最快的方式就是行業協作。若想在2021年全面實現無人駕駛,還有很多工作要做,但我相信,我們可以與行業及合作伙伴一起實現這個目標。
無人駕駛數據包括三種基本的類型:技術數據、眾包數據和個人數據。技術數據最為明顯。這些數據來自一套傳感器,它幫汽車“看見”的四周環境。這些數據幫助汽車識別人或消防栓,“注意”道路坑洼,或者計算出旁邊汽車駛來的速度。此外,技術數據有助于捕捉新的駕駛場景,并把它傳至云端,以便進行學習和改進控制駕駛行為的軟件。當技術數據傳輸到云端后,它可以惠及所有連接在這一云端的車輛。
眾包數據是本地汽車從周邊收到的數據,例如交通狀況和路況變化。你可以想象很多應用都能用到這類數據,例如,尋找附近的停車場或規避交通擁堵點。最后是個人數據,包括你想聽的廣播電臺、喜歡的咖啡廳、首選的路線等等。此類數據有助于在你的無人駕駛汽車中創造更加精彩的個性化體驗。
隨著行業全面邁向無人駕駛汽車,數據為全球行業帶來了諸多挑戰。第一個挑戰就是上面所說的4TB。數據量正呈指數增長,這需要龐大的計算能力來進行組織、處理、分析、理解、分享和存儲。想象一下數據中心服務器的計算能力,而不是PC。
盡快訓練無人駕駛汽車是另外一個挑戰。當識別到新的駕駛響應或情況時,機器學習、模擬和算法改進必須立即發生——而不是幾個星期或幾個月之后,并且更新的駕駛模式必須在可用后立即推送給汽車。何時、何地、如何發生這些因素對現在十分重要,對未來,當無人駕駛成為常態時,就更是如此。
除此之外,數據保護以及消費者對無人駕駛的信任也值得關注。我常常被問到:如何安全地存儲和分享數據?我們對此極為嚴肅,存儲哪些數據?丟棄哪些數據?分享哪些數據?我們如何保護這些數據?這些問題都需要行業合作,需要我們的頂級專家予以解決。
最后,數據的挑戰并非恒定不變。在無人駕駛汽車從少量發展到幾億輛的過程里,數據挑戰也會隨之增多。只有能夠處理日益龐大的數據,才能應對這一挑戰。隨著超級計算機及其背后的云日趨完善,真正的系統可擴展性對于汽車內部——回到4TB數據——以及外部的大規模數據中心都至關重要。
沒有任何公司可以獨立解決這些數據挑戰。英特爾認為,解決無人駕駛面臨的數據挑戰的最佳方式就是行業合作,共同開發安全的頂級平臺并分享安全相關的信息。我們的共同目標是沒有事故并方便所有人的出行,行業合作將加快該目標的實現。能在英特爾團隊中與合作伙伴一道應對4TB的挑戰,讓我感到異常興奮,因為,我知道,解決這個問題將讓道路更加安全,讓出行更加美好。