【導讀】7月6日,2023世界人工智能大會(huì )——芯片主題論壇在上海舉辦。會(huì )上,高通全球副總裁兼高通AI研究負責人侯紀磊博士做了題為《全棧AI優(yōu)化 打造領(lǐng)先的邊緣AI性能》的演講,介紹了終端AI的重要性和優(yōu)勢,高通在終端AI方面特別是生成AI方面的進(jìn)展,以及對于混合AI在高效推動(dòng)AI規?;涞氐确矫娴目捶?。
全棧式AI優(yōu)化 打造高效能AI
如今,盡管大量AI的訓練和推理仍在云端進(jìn)行,但終端側的人工智能正變得越來(lái)越至關(guān)重要。通過(guò)在最靠近數據源頭之處處理數據,并同云端形成互補,往往能夠帶來(lái)在隱私、可靠性、低時(shí)延、成本、能耗、個(gè)性化等方面的顯著(zhù)優(yōu)勢。
“比如在成本方面,生成式AI通常參數體量巨大,如果在端側部署,能夠推動(dòng)成本的顯著(zhù)降低。而在A(yíng)I數字助手方面,手機、駕艙、PC等使用場(chǎng)景,端側AI則能夠很好地滿(mǎn)足私密性、個(gè)性化的需求?!焙罴o磊說(shuō)。
據侯紀磊介紹,早在十幾年前,高通便開(kāi)始了AI方面的研發(fā),其中一個(gè)重要研究方向就是高效能AI,在包括硬件、算法和軟件等層面進(jìn)行了大量的研發(fā)創(chuàng )新。
在高效硬件方面,通過(guò)對高通移動(dòng)平臺中CPU、GPU、NPU等不同單元進(jìn)行優(yōu)化,最終使得針對不同任務(wù),能夠選擇合適的計算模塊運行,侯紀磊認為這是高通端側AI非常顯著(zhù)的特點(diǎn)。在算法層面,高通具有一支頂尖的深度神經(jīng)網(wǎng)絡(luò )算法團隊,有很多原創(chuàng )性的研究成果。在軟件方面,在面向深度學(xué)習的軟件加速runtime以及SDK/開(kāi)發(fā)框架方面,高通對于客戶(hù)以及開(kāi)發(fā)者都做出了很好的支持。
“因此,高通AI研究的一個(gè)非常重要的原則,就是全棧式的AI創(chuàng )新和優(yōu)化。通過(guò)跨層的模型、硬件和軟件創(chuàng )新加速AI應用,這種早期研發(fā)和技術(shù)發(fā)明對于引領(lǐng)生態(tài)系統發(fā)展至關(guān)重要,而最終將技術(shù)提供給商業(yè)團隊,并通過(guò)部署過(guò)程中的收獲來(lái)影響未來(lái)的研究,形成正向循環(huán)?!焙罴o磊說(shuō)。
量化研究處于行業(yè)最前沿
據侯紀磊介紹,高通在高效能AI研發(fā)中,一個(gè)重要的部分是整體模型效率研究,目的是在多個(gè)方向縮減AI模型,使其在硬件上高效運行。
比如在量化方面,學(xué)習在保持所需精度的同時(shí)降低比特精度;在條件計算方面,學(xué)習僅基于輸入執行大模型圖例模型部分組件;在神經(jīng)網(wǎng)絡(luò )架構搜索方面,學(xué)習設計更小的神經(jīng)網(wǎng)絡(luò ),能夠在真實(shí)硬件上媲美或超過(guò)人工設計架構;在編譯方面,學(xué)習編譯AI模型以實(shí)現高效的硬件執行等。
“在量化方面,高通一直在業(yè)界進(jìn)行無(wú)論是從學(xué)術(shù)研究還是落地層面的推動(dòng)。包括Stable Diffusion和ChatGPT等最終要在端側實(shí)現,量化一定是非常重要的手段。在高效能的推理方面,整數的點(diǎn)運算是非常重要的方向。在這方面,高通在積極推動(dòng)相關(guān)學(xué)術(shù)研究,包括在頂級學(xué)術(shù)會(huì )議上的發(fā)布一些論文的同時(shí),也會(huì )定期放到開(kāi)源的工具包AIMET中。通過(guò)領(lǐng)先的AI研究和快速商業(yè)化,推動(dòng)行業(yè)向整數推理和高能效AI方向發(fā)展?!焙罴o磊說(shuō)。
侯紀磊還重點(diǎn)提及了高通在2020年的一項研究成果——AdaRound量化研究算法,包括很多先進(jìn)的理念和技術(shù)。
“高通能夠將Stable Diffusion引入端側,AdaRound就是其中一個(gè)非常重要的量化手段。此外,在大語(yǔ)言模型來(lái)到4bit時(shí),包括GPTQ等主流技術(shù),實(shí)際上也是基于A(yíng)daRound演進(jìn)的簡(jiǎn)化。所以在量化方面,不管是學(xué)界還是業(yè)界,高通都處于非常前沿的位置?!焙蚣o磊說(shuō)。
廣泛賦能眾多類(lèi)型終端
在今日開(kāi)幕的2023 世界人工智能大會(huì )(WAIC)上,第二代驍龍8移動(dòng)平臺的高通AI引擎榮獲此次大會(huì )的頂級獎項:SAIL獎——卓越人工智能引領(lǐng)者獎。
第二代驍龍8憑借面向整個(gè)平臺的開(kāi)創(chuàng )性AI智能設計賦能了非凡用戶(hù)體驗,樹(shù)立了網(wǎng)聯(lián)計算的新標桿。其搭載高通技術(shù)公司處理速度最快、最先進(jìn)的高通 AI 引擎,通過(guò)軟硬件的一系列創(chuàng )新,相較上一代帶來(lái)4.35倍的AI性能提升和60%的能效提升,從而為越來(lái)越多的創(chuàng )新型AI用例和AI增強的用戶(hù)體驗提供強大的性能基礎。
高通 AI 引擎由多個(gè)硬件和軟件組件組成,用于在驍龍移動(dòng)平臺上為終端側 AI 推理加速。它采用異構計算架構,包括高通 Hexagon 處理器、Adreno GPU、Kryo CPU 和傳感器中樞,共同支持在終端上快速而有效的運行 AI 應用程序。其關(guān)鍵核心 Hexagon 處理器擁有一系列創(chuàng )新,如提供專(zhuān)用供電系統、支持微切片推理、INT4精度、Transformer 網(wǎng)絡(luò )加速等,可結合高通 AI 軟件棧和 AI Studio 提供全棧 AI 能力和優(yōu)化手段,在行業(yè)內率先在終端側支持 Stable Diffusion、ControlNet 等生成式 AI 用例,并可與云端協(xié)同打造適應大模型時(shí)代的混合 AI 處理框架,從而助力AI體驗創(chuàng )新和生態(tài)繁榮。
此外,侯紀磊介紹了AI在5G方面的應用。在今年的世界移動(dòng)通信大會(huì )(MWC)上,高通發(fā)布了驍龍X75調制解調器及射頻系統,引入了第二代高通5G AI套件,包括專(zhuān)用張量加速器。同時(shí),據侯紀磊介紹,高通AI團隊也與無(wú)線(xiàn)團隊一直保持非常緊密的深入合作,從而能夠保證將研究成果更快推向商用。比如通過(guò)AI技術(shù)進(jìn)行毫米波波束管理,擴毫米波通信的覆蓋范圍;通過(guò)AI輔助GPS定位,提升定位的精準度等。
“目前,高通已經(jīng)形成了在邊緣側的布局和規?;膬?yōu)勢。搭載驍龍和高通平臺的用戶(hù)終端數量已經(jīng)達到數十億臺。每年有數億臺搭載驍龍和高通平臺的終端進(jìn)入市場(chǎng)。我們的AI能力賦能一系列廣泛的產(chǎn)品,包括手機、汽車(chē)、XR、PC和物聯(lián)網(wǎng)設備?!焙罴o磊說(shuō)。
持續推進(jìn)支持百億參數大模型
去年年底,由ChatGPT引發(fā)的生成式AI浪潮席卷全球,而在生成式AI方面,高通于數年前便開(kāi)始著(zhù)手布局。
侯紀磊認為,生成式AI將影響各類(lèi)終端上的應用場(chǎng)景。比如XR方面,基于簡(jiǎn)單提示,創(chuàng )造沉浸式的3D虛擬世界;汽車(chē)方面,擁有先進(jìn)駕駛輔助系統/自動(dòng)駕駛,通過(guò)預測不同行為主體的軌跡和行為,幫助改進(jìn)駕駛策略;在手機方面,成為真正的數字助手;在PC端,通過(guò)撰寫(xiě)電子郵件,創(chuàng )建演示文稿和編寫(xiě)代碼,變革生產(chǎn)力;在物聯(lián)網(wǎng)方面,有助于提升顧客和員工體驗,比如提供庫存和商店貨架排列推薦等。
今年的MWC上,高通的第二代驍龍8移動(dòng)平臺已經(jīng)可以支持參數超過(guò)10億的AI模型運行,并進(jìn)行了全球首次端側運行超過(guò)10億參數模型的演示。對于端側能夠有效支持的模型規模,侯紀磊認為,在廣泛的用例中有很多基于10億參數為單位,從10億到100億便能夠涵蓋相當多數的生成式AI,并能夠提供非常好的效果。據侯紀磊介紹,未來(lái)幾個(gè)月內,高通有望支持參數超過(guò) 100 億的模型在終端側運行,明年將能夠支持參數超過(guò)200億的模型。此外通過(guò)全棧式的AI優(yōu)化,未來(lái)也將進(jìn)一步縮短大模型的推理時(shí)間。
侯紀磊指出,云經(jīng)濟難以支持生成式AI的規?;l(fā)展。如基于傳統方法和生成式AI的網(wǎng)絡(luò )搜索,單次查詢(xún)成本將是傳統的10倍,如果再疊加眾多的生成式AI應用以及數十億的用戶(hù)基數,這將在云端帶來(lái)顯著(zhù)的負擔。因此,推動(dòng)端側和云端互補的混合AI,將是未來(lái)推動(dòng)生成式AI落地的顯著(zhù)趨勢。
“未來(lái)場(chǎng)景中有中心云、邊緣云、有終端側,AI處理中心在一定程度上可以向邊緣發(fā)展,因此混合AI是未來(lái)能夠支持生成式AI、大語(yǔ)言模型等實(shí)現全球化、規?;l(fā)展的重要手段。這個(gè)過(guò)程中,在包括無(wú)線(xiàn)連接、高效計算、分布式AI等方面,高通都能夠通過(guò)與業(yè)界的合作帶來(lái)更多創(chuàng )新?!焙罴o磊說(shuō)。
侯紀磊指出,對于混合AI的部署,當終端側具備強大生成式AI能力的時(shí)候,可以作為一個(gè)“錨點(diǎn)”。比如幫助工程師生成代碼,高通的愿景是未來(lái)一兩年內,在100-200億參數的范圍內,能夠使得大量工程師在端側進(jìn)行代碼撰寫(xiě)。端側AI作為智能“錨點(diǎn)”發(fā)揮指揮或協(xié)調的作用,可以將合格的代碼交給開(kāi)發(fā)者,不理想的生成代碼指令再交給云端進(jìn)一步處理,從而帶給用戶(hù)無(wú)縫體驗。
“終端側AI具有諸多優(yōu)勢,是讓AI無(wú)處不在的關(guān)鍵?;旌螦I是AI的未來(lái),而我們的終端側AI領(lǐng)導力將支持生成式AI規?;瘮U展?!焙罴o磊最后強調。
作者:集微網(wǎng),來(lái)源:雪球
免責聲明:本文為轉載文章,轉載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問(wèn)題,請聯(lián)系小編進(jìn)行處理。
推薦閱讀: