3月11日,美國底特律市,特斯拉Model Y又雙叒叕撞上白色大貨車,車頂被削,現場十分慘烈。
看國內,近一個月,有記者采訪全國各地近20位經歷嚴重車禍的特斯拉車主,發現事故大多相似:突然加速,剎車失靈,車主重傷,不撞上強大障礙物不停車,更有的狂奔8公里之遙。特斯拉的回應不想也知:駕駛員一直踩加速踏板,并未剎車。這么先進的車,“黑匣子”數據一公開不就結了?要么在那里扯皮,要么數據消失。一次兩次也就算了,卻是一而再再而三。
這些應該是“3.15”是事,我們管不了。倒是前不久一則“特斯拉5nm自動駕駛(AV)芯片將與三星合作開發”的消息讓人發問:不要說自動駕駛,現在用14nm“正常”行駛都這樣了!5nm難道就是救命稻草?不是挑戰更大嗎?
看看半導體行業一些頭部公司高管對芯片和封裝、系統和數據、可靠與安全、ADAS和自動駕駛,特別是現場驗證的討論,或許可以幫助我們悟出點什么。
5nm是一個未知的世界
國內關于特斯拉與三星的報道似乎有誤:“為其自動駕駛汽車的車載信息娛樂(IVI)或媒體控制單元(MCU)開發一種5nm半導體。”
業界正在試圖開發5nm汽車AI芯片,工藝變化、電遷移、電磁干擾、電力傳輸問題和檢測的挑戰比比皆是。我們過去從來沒有把一個先進節點芯片放到汽車這樣極端的環境中,是否真的了解前方“路況”以及如何應對呢?
PDF Solutions先進解決方案副總裁Dennis Ciplickas說:“5nm芯片是一個全新的世界,我們從未去過。獲取、吸收和連接所有數據都面臨著挑戰。先進技術的關鍵實際上是要了解丟失了哪些數據。例如,5nm的中間工序(MOL)有三維的電相互作用,你根本看不到物理檢測。這是我們一直追求內聯‘檢測設計’的一個主要原因,為的是獲得泄漏的敏感測量值,進而發現有可能轉化為實際缺陷的潛在缺陷。要正確響應,首先必須知道缺陷的存在,這意味著必須創建新的數據。僅僅將數據作為制造過程的工件來表示是不夠的,需要區分數據。”
對汽車應用來說,先進封裝也是新的東西。雖然多芯片模塊已經存在了幾十年,但其封裝并不像我們看到的傳感器融合或一些7/5nm芯片那樣。封裝對可靠性也有影響,這是必須處理的另一層復雜性。
yieldHUB業務開發經理Andre van de Geijn認為:“這取決于芯片用在汽車的哪個部分。如果用在娛樂系統,可以使用與數百萬部手機相同的組件,你可以信任這些組件。如果你的手機故障率很高,可以換一個。許多公司說,這只是一個組件,我可以取出模塊,放入一個新的模塊來替換。這與汽車管理系統中的封裝完全不同。制造座椅前后移動按鈕的公司會開發出全新的技術,在這些按鈕失效時可以更換。但如果是汽車管理單元,那就完全不同了。”
proteanTecs汽車部門總經理Gal Carmel說:“先進封裝增加了另一層復雜性,因為它缺乏可見性,并且依賴于高密度架構,從而限制了冗余退路(fallback),而汽車系統需要冗余。此外,芯片的人工智能(AI)部分正在增長。它不僅涉及到封裝和先進節點,而且芯片架構是AI驅動的,并使用現場推理和訓練來不斷改進硬件架構。使用這個反饋回路,就可以減少硬件冗余并優化復雜性。”
OptimalPlus汽車業務部門副總裁兼總經理Uzi Baruch表示:“封裝確實增加了層次結構和組裝組件的復雜性,需要在三個維度相互關聯。這本身就引入了數據的語義概念。它有多個向量,其中一個也是層次元素。它確實增加了復雜性,因為一個組件不能看作一個單獨的單元,必須考慮組件的層次結構。如果你不這么做,你從分析中得到的東西就會非常有限。然而,如果你做的對,就可以精確定位問題所在。”
Ciplickas說:“由于組件間的相互作用,封裝中的系統或3D集成將帶來新的失效模式。芯片到芯片的通信不同于芯片到板的通信,并且電熱/機械交互作用也不同。一家汽車制造商說過,在應力下,SRAM的失效方式是可預測的,但他們實際上是在儀器上測量的。這導致了如何在ECU外殼中構建掛載點(mount point)的PCB設計規則。挑戰在于,將3D或2.5D集成封裝放入惡劣環境后果會怎樣。所以不僅僅是芯片間的通信。這些封裝的熱分布和你想象的不同,會改變其膨脹和應力,然后會改變性能,因為我們知道應力會改變器件的行為。了解單個芯片在晶圓分類測試中的行為,然后了解封裝中的內容——進行封裝級評估,并將所有這些放在一起——是一個巨大的挑戰。在汽車中使用先進的2.5D集成是一個全新的嘗試,尤其是在安全關鍵的系統中。”
軟件可能會產生意想不到的后果
現在,整個行業都在探討軟件定義汽車,先進一點的汽車(如特斯拉)都用軟件來控制某些功能,還有OTA(空中下載技術)。如果你更新了一個復雜軟件系統的一部分,就有可能影響到這個系統中的所有東西。如果你添加了大量軟件,在硬件不支持的情況下,車輛性能就會下降,甚至會影響到路上的其他車輛。
Ciplickas說:“軟件很有挑戰性,因為它不遵循任何物理規則。硬件聽起來很難,但它實際上遵循一些邊界條件。有了軟件,你可以改變一切,這可能會產生很多意想不到的后果。”是什么后果呢?
Carmel認為:“利用深度數據,我們可以將硬件虛擬化,更好地感知軟件操作的影響。通過這些虛擬化,你可以轉向一種自適應軟件模型,該模型針對車輛的ECU性能和現場退化進行定制。人工智能(AI)應用增加了芯片上AI的比例,以滿足軟件的需求。這將有助于減少冗余并確保優化功能。此外,實地推斷和訓練將不斷改進硬件和軟件之間的相互作用。”車輛中各系統,特別是傳感器、雷達等的冗余對于安全至關重要,怎么優化的確是個逆坂走丸的事情。
最大挑戰是安全性
在設計方面,可靠性和安全性密不可分。最大的挑戰是如何在這些系統中建立安全機制?
Ciplickas認為:“安全性有很多方面,但一些用于優化可靠性的技術和測試可以提供提升安全性的工具。例如,調試監視器或漂移和移位監視器可以檢測某些類型的攻擊,無論是在t = 0時檢測到的,還是在現場檢測到的異常行為或漂移。這些監視器已經被用于系統運行和優化,兩者之間有相關的基礎設施,盡管它們的應用方式非常不同。”
Carmel說:“這是一個使用數據的機會,因為你提供的數據越有價值,芯片的簽名就越好。最終,這些數據會幫助你理解是否有異常。這對關閉有問題的車輛可能更為緊迫。使用深度數據,你可以創建24/7車隊可見性,并在問題發生時立即確定問題。”
現在,汽車系統中移動的數據量非常巨大,是否真的能夠檢測到一個非常輕微的異常呢?
Carmel接著說:“基于通用芯片遙測的深層數據有助于深入了解實際芯片和系統的操作、性能、可靠性裕度和性能退化。這種真實世界的數據并不依賴于觸點的轉移,而是依賴于實地操作的輸出。”
Ciplickas介紹說:“關于信號和噪聲,業界已開發出可以找到信號的技術。如果在加工晶圓或引線鍵合時觀察設備上的傳感器數據,就能得到的各種各樣的信號。在這些信號中發現的異常有時是微小的光點。利用機器學習技術,在原本‘好’的噪聲海洋中可以找到那些微小的斑點。與其把它看作是一種制造晶圓的設備,不如把它看作是一個在現場運行的系統,了解這些微小的光點是有可能的。”
KLA戰略合作先進總監Jay Rathert認為:“最大的挑戰不是看到缺陷本身,而是理解哪些缺陷是相關的,哪些可能成為潛在缺陷。將設計和改進測試聯系起來才價值。兩者結合越緊密,并擁有一個迭代或協作、對齊的數據集,就越能更好地理解芯片上需要發生什么樣的輸入和輸出。我們需要架起設計與測試的橋梁,消除產品生命周期中存在的各種問題。”
使用上游數據理解下游信號是一種非常強大的技術,它有助于預測潛在的問題。
Baruch說:“人們往往傾向于研究預測模型,但是他們忽略了這樣一個事實:功能集——實際上對預測事物的能力有很大貢獻。它可以過濾噪聲、發現什么重要什么不重要,以及任何問題的根本原因是什么。我們經常使用左移(shift-left)模式(把位于傳統軟件開發流程中最后階段的測試往前提)。為避免大海撈針,好的模型可以幫助你發現什么是優先權問題,只要你決定從哪個角度來看即可。建立了這些模型,你就會預測一些東西,你也需要一些人來修復那些模型中錯誤的屬性。”
遠未到制造全自動駕駛汽車的時候
ADAS和自動駕駛似乎并不是一回事。進入完全自動駕駛,必須開始思考系統之系統(SoS)的協作。如果汽車使用不同代的芯片和軟件,會發生什么呢?
Carmel說:“從ADAS到AV的基本意義是了解它們經歷了什么樣的失敗。最終,需要定義性能范圍。每輛車都有自己的性能范圍,因為它有不同的硬件,不同的軟件,不同的級別。當你確切地知道如何定義這個性能范圍,并在可靠性和安全性之間建立平衡時,你就可以控制車隊了。使用深層數據,我們可以定義每個模型和每個單元的獨立功能,并勾勒出一個自動駕駛層次結構。”