【導讀】隨著(zhù)汽車(chē)行業(yè)在“新四化”領(lǐng)域內迅猛地進(jìn)步,汽車(chē)電子電氣架構正在發(fā)生顯著(zhù)的變化。智能化的深入促使汽車(chē)計算架構逐步由傳統的以分域來(lái)進(jìn)行風(fēng)險控制的分布式架構,轉向以強調高性能計算同時(shí)減少冗余硬件和系統復雜性,從而提高系統效率和可靠性的中央計算架構。與此同時(shí),一些新興的功能在新車(chē)中的滲透率也在不斷提升,例如在汽車(chē)座艙內人機界面(HMI)領(lǐng)域,諸如車(chē)內屏幕顯示交互及后排娛樂(lè )屏幕等,其年度增長(cháng)率大致維持在8%左右;而在高級駕駛輔助系統(ADAS)方面,增長(cháng)率基本達到10%,部分研究機構所報告的增長(cháng)率數據甚至更高。在此背景下,汽車(chē)對GPU算力的需求呈現出爆發(fā)增長(cháng)的趨勢。
隨著(zhù)汽車(chē)行業(yè)在“新四化”領(lǐng)域內迅猛地進(jìn)步,汽車(chē)電子電氣架構正在發(fā)生顯著(zhù)的變化。智能化的深入促使汽車(chē)計算架構逐步由傳統的以分域來(lái)進(jìn)行風(fēng)險控制的分布式架構,轉向以強調高性能計算同時(shí)減少冗余硬件和系統復雜性,從而提高系統效率和可靠性的中央計算架構。與此同時(shí),一些新興的功能在新車(chē)中的滲透率也在不斷提升,例如在汽車(chē)座艙內人機界面(HMI)領(lǐng)域,諸如車(chē)內屏幕顯示交互及后排娛樂(lè )屏幕等,其年度增長(cháng)率大致維持在8%左右;而在高級駕駛輔助系統(ADAS)方面,增長(cháng)率基本達到10%,部分研究機構所報告的增長(cháng)率數據甚至更高。在此背景下,汽車(chē)對GPU算力的需求呈現出爆發(fā)增長(cháng)的趨勢。
汽車(chē)應用需要更高GPU算力和硬件虛擬化
隨著(zhù)先進(jìn)駕駛輔助系統(ADAS)和各種級別的自動(dòng)駕駛(AD)被廣泛引入到汽車(chē)應用中,以及新一代汽車(chē)更加注重人車(chē)互動(dòng)和車(chē)與環(huán)境交互功能,汽車(chē)對車(chē)載計算單元的算力需求大幅提高。智能化汽車(chē)中的各種傳感器在短時(shí)間內就會(huì )生成大量數據,即使在較低級別的自動(dòng)駕駛系統中,每小時(shí)也能生成 25GB 數據。面對如此龐大的數據量,市場(chǎng)需要能夠高效處理大量信息的硬件來(lái)完成計算任務(wù)。由于CPU采用流水線(xiàn)處理架構,因此不能夠高效地完成集中處理這些數據的任務(wù)。
面對這些巨量的數據,行業(yè)的解決辦法是采用NPU和GPU 來(lái)執行不同的并行計算,這是因為這兩類(lèi)架構都具有大規模并行處理單元。在某些情況下,相比于以前的GPU,NPU的運算速度可能更高,但是因為NPU是一種基于特定加速器的并行計算單元,因此面對新的應用、功能和算法,其靈活性、適應性和產(chǎn)品生命周期遠不如GPU。因此,在目前ADAS和AD還不是每輛車(chē)的標配,以及性能需求不斷演進(jìn)變化的情況下,市場(chǎng)上完全采用NPU架構的智駕芯片和解決方案提供商很難盈利,這些智駕芯片廠(chǎng)商總是在不斷地開(kāi)發(fā)新的硬件(特定加速器)和流片,同時(shí)也使主機廠(chǎng)和tier-1總是不斷花費巨大的人力物力來(lái)適配他們的新芯片。
鑒于性能上的顯著(zhù)差異, GPU已成為同時(shí)支持智能駕駛、開(kāi)發(fā)新一代座艙和支持AI功能的不二之選。GPU具備眾多計算核心,不僅能夠同時(shí)執行大量計算任務(wù)并展現出卓越的并行計算能力,而且還能夠通過(guò)軟件編程的方式,在一顆基于GPU汽車(chē)主控芯片上就能完成多樣化的圖形圖像數據處理、基于渲染的人車(chē)交互和人工智能推理等各種任務(wù),因此比采用NPU架構的智駕芯片具有更高的靈活性和可擴展性。在實(shí)際的汽車(chē)應用場(chǎng)景中,這種基于GPU的汽車(chē)主控芯片可以針對不同主機廠(chǎng)、不同車(chē)系和不同車(chē)型的需求定制自動(dòng)駕駛功能、信息娛樂(lè )系統和V2X方案,可以通過(guò)模組化軟件配置來(lái)大大降低主機廠(chǎng)及tier-1的開(kāi)發(fā)難度和成本。
當然,要完美地實(shí)現以上功能和利用GPU架構的靈活性和適應性來(lái)幫助整個(gè)智駕產(chǎn)業(yè)鏈條上的玩家降難度和減成本,就需要GPU一方面要具有足夠的算力,另一方面還要具有能夠實(shí)現硬件完全隔離的虛擬化能力和可擴展的多核心能力。除此以外,在日益普及的CPU+GPU+NPU架構中,高算力的GPU還可以支持NPU(AI加速器)發(fā)揮人工智能的推理能力,確保車(chē)輛在行駛過(guò)程中能夠迅速做出決策,提高了系統的響應速度和安全性,這種架構中GPU的靈活性與AI加速器的高性能相得益彰,可共同推動(dòng)智能化汽車(chē)不斷邁向新的發(fā)展階段。
目前,市場(chǎng)上已經(jīng)出現了能夠同時(shí)滿(mǎn)足上述三種要求的GPU IP產(chǎn)品,為新一代基于GPU或者GPU+NPU的智駕芯片的開(kāi)發(fā)提供了大力支持。Imagination Technologies公司在不久前推出的DXS GPU是業(yè)內首款可以同時(shí)提供高算力、硬件虛擬化、多核心、支持RISC-V架構的 GPU IP產(chǎn)品,非常適合中國智駕芯片開(kāi)發(fā)商從純粹的NPU架構轉向開(kāi)發(fā)基于GPU架構的智駕芯片,除了其DXS GPU的高算力和多核能力,而且還可以提供獨一無(wú)二的HyperLane硬件虛擬化技術(shù),幫助主機廠(chǎng)和tier-1用一顆主控芯片實(shí)現多樣化的功能及配置。
Imagination 是享譽(yù)全球的GPU IP提供商。1992年,該公司推出了創(chuàng )新的PowerVR GPU架構,采用該架構的GPU IP不僅在桌面應用、移動(dòng)平臺、消費電子和游戲設備等多個(gè)領(lǐng)域產(chǎn)生了廣泛影響并持續至今,而且在汽車(chē)領(lǐng)域也被諸多領(lǐng)先的芯片企業(yè)采用,全球已有高達130億臺電子設備和汽車(chē)采用了該公司的GPU IP。Imagination 在車(chē)載領(lǐng)域擁有超過(guò)二十年的技術(shù)積累,其GPU IP被用在駕駛、座艙與信息娛樂(lè )系統等領(lǐng)域的芯片中;作為汽車(chē)GPU IP的領(lǐng)先供應商,具有領(lǐng)先同儕的市場(chǎng)占有率。其DXS GPU的問(wèn)世,不僅滿(mǎn)足了現代汽車(chē)對中央處理單元的高性能需求,還通過(guò)創(chuàng )新的分布式安全機制,解決了功能安全與性能、芯片尺寸之間的沖突,為汽車(chē)智能化進(jìn)程注入了強勁動(dòng)力。
Imagination DXS GPU 的性能優(yōu)勢
相較于上一代GPU產(chǎn)品,Imagination在設計DXS GPU時(shí)新增了一個(gè)SPU單元,從而使得DXS GPU的整體硬件性能提升了50%。得益于全新的設計,最新發(fā)布的DXS GPU所采用的工藝節點(diǎn)為5納米,這使得其系統運行頻率相較于上一代產(chǎn)品有了顯著(zhù)提升。如需進(jìn)一步拓展,還可將其配置為四核,在主頻達到1.5GHz的條件下,DXS GPU將能夠實(shí)現9TFLOPS FP32的性能以及32TOPS的int8性能。
Imagination汽車(chē)產(chǎn)品總監章政表示:“GPU在圖形處理方面具有顯著(zhù)優(yōu)勢,特別是具有并行處理能力,使得GPU能夠高效地進(jìn)行大規模計算,從而提升圖形性能。我們最新推出的DXS GPU解決方案算力可從0.25 TFLOPS拓展到1.5 TFLOPS,這一可擴展、靈活的特性可以滿(mǎn)足汽車(chē)中不同等級自動(dòng)駕駛對圖形處理性能和計算的需求?!?/p>
在以填充率為中心的圖形工作負載上,性能相比競爭對手最高可提升28%,在安全關(guān)鍵型工作負載上更是能達到成倍的性能提升。相比IMG BXS GPU,優(yōu)化過(guò)硬件架構DXS GPU在結合雙重速率FP16加上額外的SPU,能為FP16工作負載提供3倍性能。DXS GPU還支持FP16/FP32/INT8/DOT8等行業(yè)標準數字格式,此外,該GPU相比前代提供更大片上內存用于加速計算。
DXS GPU提供單、雙、三、四核靈活配置,可作為多個(gè)獨立GPU核心運行,也可作為單個(gè)大型GPU跨多個(gè)核心調度任務(wù),支持通過(guò)低帶寬總線(xiàn)在核心間分配工作,并支持跨Chiplet橋接,進(jìn)一步增強了核心之間的通信和協(xié)作能力,使得整個(gè)系統在處理復雜任務(wù)時(shí)更加高效和靈活。
此外,Imagination也深知軟硬件協(xié)同優(yōu)化的重要性。因此,在DXS GPU中,Imagination特別增加了片上存儲,以減少帶寬瓶頸,同時(shí)增強了算術(shù)邏輯單元(ALU)計算能力。這些優(yōu)化措施使得DXS GPU在處理圖形任務(wù)時(shí)更加高效。同時(shí),Imagination還提供了強大的軟件支持,包括針對特定工作負載優(yōu)化的軟件庫和工具,幫助開(kāi)發(fā)者充分發(fā)揮GPU的潛力,實(shí)現最佳的圖形性能。
車(chē)用GPU與移動(dòng)平臺所用GPU的不同:FuSa
在11月12日,Imagination宣布其DXS GPU IP正式通過(guò)SGS-TüV Saar(SGS旗下,世界領(lǐng)先的測試、檢驗和認證機構)的全面審核與評估,獲得了ISO 26262標準的ASIL-B級別認證。這一成就標志著(zhù)DXS GPU所采用的獨特的分布式功能安全機制(FuSa)已經(jīng)獲得了行業(yè)內的認可。特別是在汽車(chē)應用領(lǐng)域,GPU對于FuSa有著(zhù)嚴格的要求,這包括了冗余設計以及在某些功能失效時(shí)的應對策略。鑒于汽車(chē)電子系統的故障可能引發(fā)嚴重的交通事故,因此功能安全顯得尤為關(guān)鍵。
Imagination 的 GPU 采用獲得專(zhuān)利的分布式安全機制(DSM)和其HyperLane硬件虛擬化技術(shù)一樣,都是針對汽車(chē)等GPU應用開(kāi)發(fā)的高價(jià)值創(chuàng )新,可以以極小的芯片面積代價(jià)去滿(mǎn)足汽車(chē)應用特定的需求。DSM通過(guò)在多個(gè)子模塊中分散部署安全檢測邏輯,實(shí)現對功能安全的全面覆蓋。具體包括安全對、空閑周期占用、測試向量生成與執行、分布式故障檢測與報告等創(chuàng )新點(diǎn),在僅增加約 10% 的面積開(kāi)銷(xiāo)的情況下,能有效檢測到超過(guò) 90% 的單點(diǎn)故障,符合 ASIL - B 的要求并獲得了認證。
隨著(zhù)汽車(chē)新四化(電動(dòng)化、智能化、網(wǎng)聯(lián)化、共享化)的不斷推進(jìn),汽車(chē)中的芯片數量將快速增加。除了關(guān)注這些芯片的算力和連接帶寬等性能之外,同樣重要的是打造和推出全新的功能安全解決方案。Imagination結合GPU這種處理器的架構特點(diǎn),在提供業(yè)內領(lǐng)先的算力之外,還利用GPU的運行特點(diǎn)來(lái)打造了創(chuàng )新的分布式功能安全機制,消除了以前的鎖步等其他功能安全方案實(shí)現機制帶來(lái)的性能降低以及成倍片芯面積,為電子行業(yè)在相關(guān)領(lǐng)域內的創(chuàng )新提供了一種全新的模式和思路。
(作者:翔煜 陳嬌 商瑞 北京華興萬(wàn)邦管理咨詢(xún)有限公司)
免責聲明:本文為轉載文章,轉載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問(wèn)題,請聯(lián)系小編進(jìn)行處理。
推薦閱讀:
貿澤電子與Analog Devices和Bourns聯(lián)手發(fā)布全新電子書(shū)
【“源”察秋毫系列】纖維器件及其陣列電學(xué)測試方案詳解
借助支持邊緣 AI 的 MCU 優(yōu)化實(shí)時(shí)控制系統中的系統故障檢測
優(yōu)化簡(jiǎn)易PCB電路板的大規模測試,提高生產(chǎn)效率