【導讀】中國信通院《數據中心白皮書(shū)2022》報告顯示,2021年全球數據中心市場(chǎng)規模超過(guò)679億美元,較2020年增長(cháng)9.8%。隨著(zhù)數據視頻化趨勢加強,以及遠程辦公普及程度提高,數據中心市場(chǎng)呈現出穩健增長(cháng)的趨勢。但這也帶來(lái)聯(lián)網(wǎng)數據的爆炸式增長(cháng),對數據中心的數據處理能力提出巨大挑戰。各種加速方案因而成為數據中心不可或缺的應用。
數據中心加速解決方案
中國信通院《數據中心白皮書(shū)2022》報告顯示,2021年全球數據中心市場(chǎng)規模超過(guò)679億美元,較2020年增長(cháng)9.8%。隨著(zhù)數據視頻化趨勢加強,以及遠程辦公普及程度提高,數據中心市場(chǎng)呈現出穩健增長(cháng)的趨勢。但這也帶來(lái)聯(lián)網(wǎng)數據的爆炸式增長(cháng),對數據中心的數據處理能力提出巨大挑戰。各種加速方案因而成為數據中心不可或缺的應用。
在數據中心里,加速芯片主要應用于三個(gè)方面:計算、存儲和網(wǎng)絡(luò )。其中,傳統的GPU芯片,以及新興的DPU、APU等加速芯片能夠解決一部分需求,剩下很大一部分加速需求都是基于FPGA來(lái)解決。
根據Semico Research在2019年提出的預測,2018年-2023年全球數據中心加速卡市場(chǎng)規模將從28.4億美元增長(cháng)至211.9億美元,年復合增長(cháng)率高達49.47%,FPGA是其中增速最快的細分產(chǎn)品,需求主要來(lái)自企業(yè)級工作負載加速應用。
本文我們就來(lái)具體看一下,為什么FPGA能夠在數據中心加速領(lǐng)域領(lǐng)跑?具體的優(yōu)勢有哪些?并為大家推薦貿澤電子官網(wǎng)在售的可用于數據中心加速的FPGA產(chǎn)品。
為何FPGA適合數據中心加速
在傳統數據中心部署方案中,計算和數據處理都是由CPU完成,存儲和網(wǎng)絡(luò )資源也是圍繞CPU進(jìn)行部署。然而,由于人工智能和物聯(lián)網(wǎng)市場(chǎng)的爆發(fā),云端數據量呈指數級增長(cháng),CPU便成為系統規模和效率提升的瓶頸,GPU、FPGA、ASIC等高性能芯片開(kāi)始涌入數據中心市場(chǎng),其中FPGA的典型產(chǎn)品形態(tài)就是加速卡。
不過(guò),對于FPGA產(chǎn)品而言,數據中心算是一個(gè)比較新的應用領(lǐng)域。比如,已經(jīng)被AMD收購的賽靈思在2018年伊始才正式宣布“數據中心優(yōu)先”的發(fā)展戰略。但是,憑借著(zhù)高吞吐和低延遲的天然優(yōu)勢,再加上部署靈活,FPGA在數據中心一經(jīng)采用便迅速成為主流加速方案。
在數據中心應用里,FPGA能夠全面減輕CPU的任務(wù)負擔,包括計算、存儲和網(wǎng)絡(luò )。傳統數據中心的模型是基于CPU集群構建,寶貴的CPU內核被消耗殆盡,圍繞CPU配備的網(wǎng)絡(luò )接口控制器(NIC)等初步緩解資源也無(wú)法解決根本問(wèn)題?;贔PGA的異構計算體系此時(shí)開(kāi)始顯現出優(yōu)勢,根據微軟Catapult項目公布的數據,通過(guò)FPGA對應用于必應搜索引擎文件排名運算的服務(wù)器做加速,獲得了95%的吞吐量提升,處理必應的自定義算法速度提高了40倍,加速效果顯著(zhù)。
圖1:FPGA加速必應的搜索排序過(guò)程
(圖源:微軟技術(shù)白皮書(shū))
剖析微軟Catapult項目能夠發(fā)現,數據中心的硬件加速器需要滿(mǎn)足幾個(gè)條件:
一、需要具備靈活性和可擴展性,以云計算為主要服務(wù)方式的數據中心,其需要處理的任務(wù)是不固定的,面向不同的任務(wù),加速器要全部能夠自如地應對;
二、需要具備硬件資源虛擬化的能力,以完成和現有數據中心的同構并行,而不需要對現有架構進(jìn)行大刀闊斧的修改;
三、需要具備分析推理的能力,提升較大應用模型部署的容錯率。
方案商在評估各種硬件加速器之后發(fā)現,FPGA相較于其他硬件,可以提供更高的性能,更好的實(shí)時(shí)性,以及足夠的靈活性,可以根據未來(lái)算法與需求變更及時(shí)做調整。并且,FPGA虛擬化的軟件架構和接口資源大幅提升了和現有運算體系的同構屬性,在方案升級時(shí)具備明顯的成本優(yōu)勢。
我們再看一個(gè)具有代表性的例子——亞馬遜AWS F1,基于FPGA對公有云進(jìn)行加速服務(wù)。AWS F1實(shí)例進(jìn)一步優(yōu)化了FPGA在云服務(wù)加速方面的軟硬件功能,主要原因是公有云的用戶(hù)并不像私有云用戶(hù)一樣,具備強大的技術(shù)研發(fā)實(shí)力,并能夠得到FPGA廠(chǎng)商的一定支持。因此,在A(yíng)WS F1項目里,亞馬遜將底層FPGA的邏輯資源抽象化,使得用戶(hù)不需要去擔心接口資源和IP部署等細節問(wèn)題,同時(shí)以完整的FPGA開(kāi)發(fā)配套工具幫助用戶(hù)實(shí)現對應用方案的加速。
亞馬遜AWS F1更好地體現了FPGA的高度定制化,這其實(shí)也是FPGA的天然優(yōu)勢,這種可編輯的特性也就是上面提到的靈活性,單個(gè)FPGA可以根據各種不用的應用重新配置,無(wú)需將特定的硬件變成ASIC,用戶(hù)可以在機器學(xué)習、網(wǎng)絡(luò )、安全等各個(gè)關(guān)鍵環(huán)節使用FPGA。
除了國際廠(chǎng)商,在中國云服務(wù)市場(chǎng),FPGA也廣受歡迎。目前,阿里云、騰訊云、百度云等國內云服務(wù)公司都已經(jīng)在硬件加速方面選用FPGA。比如,我們看到騰訊于2017年就曾推出國內首款高性能異構計算基礎設施FPGA云服務(wù)器,這款采用異構計算架構的云服務(wù)器相較于傳統CPU服務(wù)器,性能提升在30倍以上。和亞馬遜的理念類(lèi)似,通過(guò)這種FPGA云服務(wù)器,騰訊將只有大公司才能夠長(cháng)期部署的FPGA帶入到大眾市場(chǎng)。目前,在騰訊云的硬件基礎設施里,FPGA已經(jīng)在計算、網(wǎng)絡(luò )、存儲三大重要節點(diǎn)充當加速器角色。
主流云服務(wù)大廠(chǎng)對FPGA的支持使得FPGA在國內數據中心市場(chǎng)快速崛起。
根據Frost&Sullivan數據,2020年中國應用于數據中心領(lǐng)域的FPGA芯片市場(chǎng)規模約 16.1億元,占中國FPGA芯片市場(chǎng)份額的10.7%,預計2021年-2025年的年均復合增速將達到16.6%。能夠看到,隨著(zhù)FPGA的加速性能在數據中心獲得認可,未來(lái)該領(lǐng)域的市場(chǎng)增速非???。
當然,必須要說(shuō)明的是,在數據中心市場(chǎng),FPGA以及其他所有硬件加速器都不是CPU的“革命者”,而是協(xié)作者。未來(lái)隨著(zhù)數據中心計算體量和復雜度提升,CPU的精力會(huì )越來(lái)越多集中在復雜任務(wù)的調度和處理上,重復性和局部性的任務(wù)將更大規模地從CPU上轉移。而FPGA憑借上述提到的可編程、高吞吐、低延遲的特性,將承擔更多的加速任務(wù),為機器學(xué)習等典型的人工智能應用賦能。
與FPGA靈活性類(lèi)似的是,貿澤電子也為工程師提供了靈活多樣的檢索與支付方式,幫助工程師更快地購置好產(chǎn)品開(kāi)發(fā)所需的元器件,從而提升研發(fā)效率。接下來(lái),我們?yōu)榇蠹彝扑]幾款貿澤電子平臺在售的FPGA產(chǎn)品,它們都是硬件加速方面的好手。
業(yè)界首款FPGA加速卡支持軟件定義硬件
在數據中心領(lǐng)域,FPGA加速卡是一種典型的產(chǎn)品形態(tài),實(shí)現了基于FPGA的系統集成。和傳統的FPGA開(kāi)發(fā)板不同,FPGA加速卡是更加完整的系統級方案。我們?yōu)榇蠹規?lái)的第一款產(chǎn)品就是來(lái)自制造商AMD的Alveo? SN1000 SmartNIC加速卡,貿澤電子官網(wǎng)上,該器件的料號為A-SN1022-P4E-PQ。
圖2:SN1022-P4E-PQ
(圖源:貿澤電子)
Alveo? SN1000 SmartNIC加速度卡是一款提供軟件定義硬件加速的SmartNIC,在單一解決方案中集成有網(wǎng)絡(luò )連接、計算和存儲加速功能,實(shí)現面向數據中心領(lǐng)域的任務(wù)負擔轉移。并且,由于FPGA的可編程特性,這款加速卡支持各種廣泛的定制卸載,包括支持客戶(hù)構建和第三方卸載。
Alveo? SN1000加速卡提供的硬件資源包括:
● PCIe Gen 4 x8或Gen 3 x16
● 100G QSFP28 DA銅纜或光纖收發(fā)器
● 基于XCU26(XCU26-L2VSVA1365E)FPGA,采用Xilinx 16nm UltraScale+架構
● 板載CPU:16個(gè)64位Arm Cortex-A72內核,頻率為2.0GHz,具有8MB緩存
● 1個(gè)4GB x 72 DDR4-2666(處理器)
● 2個(gè)4GB x 72 DDR4-2666(FPGA)
● 總智能卡負載:75W
● 70W熱設計功耗(TDP)
● 被動(dòng)散熱
在可編程方面,Alveo? SN1000加速卡支持全面協(xié)議級卸載加速定制、專(zhuān)用數據路徑以及便捷的P4高級語(yǔ)言編程,并提供P4工具套件Vitis Networks,可讓客戶(hù)自定義卸載和調整現有卸載,以處理新協(xié)議和應用,而無(wú)需更換硬件。這些定制性的硬件加速包括:開(kāi)放式vSwitch和虛擬化加速(Virtio.net)的網(wǎng)絡(luò )加速;IPsec、kTLS和SSL/TLS安全加速;Virtio.blk、基于TCP的NVMe?、Ceph、壓縮和加密服務(wù)類(lèi)型的存儲加速。通過(guò)這些加速功能,Alveo? SN1000加速卡幫助數據中心更好地應對機器學(xué)習、數據分析、視頻轉碼、視頻和圖像處理、基因組學(xué)、安全、金融計算等方面的加速需求。
高性能和高效率的Alveo? U50加速卡
第二款推薦產(chǎn)品同樣是一款來(lái)自AMD的FPGA加速卡——Alveo? U50加速卡,貿澤電子官網(wǎng)上該器件的料號為A-U50-P00G-LV-G。
圖3:A-U50-P00G-LV-G
(圖源:貿澤電子)
Alveo? U50數據中心加速器卡基于UltraScale+? 架構打造,率先使用半高半長(cháng)的外形尺寸和低于75W的低包絡(luò )功耗。該加速卡的產(chǎn)品規格如下:
● UltraScale+架構
● 半高、半長(cháng)、單插槽薄型外形尺寸
● 查找表數量:872,000
● HBM2內存:8GB
● HBM2帶寬:316GB/s1
● 網(wǎng)絡(luò )接口:1個(gè)QSFP28(100GbE)
● 時(shí)鐘精度:IEEE 1588
● PCI express:PCIe Gen3 x 16、雙PCIe;Gen4 x 8、CCIX
● 被動(dòng)散熱解決方案
● 功耗(TDP):75W
Alveo? U50加速卡擁有三大典型的產(chǎn)品優(yōu)勢:
● 首先是高性能和高效率,8GB HBM2、100GbE網(wǎng)絡(luò )和PCI Express 4.0為這款加速卡帶來(lái)了高速度,并通過(guò)支持4x10GbE、4x 25GbE或1x 40GbE、1x 100GbE的100G網(wǎng)絡(luò ),實(shí)現了低時(shí)延網(wǎng)絡(luò )功能;
● 其次是靈活應變,可全面應對計算、存儲和網(wǎng)絡(luò )方面的任務(wù)負載,隨著(zhù)工作負載和算法通過(guò)可重新配置的架構(與固定架構不同)不斷發(fā)展,能夠以更大幅度地提高應用性能;
● 最后是方便易用,Alveo? U50加速卡經(jīng)過(guò)精心構建,可為在云端或本地部署(可互換)的解決方案擴展架構。
借助這三大典型的產(chǎn)品優(yōu)勢,Alveo? U50加速卡可為金融計算、機器學(xué)習、計算存儲以及數據搜索和分析領(lǐng)域的任務(wù)負載提供加速支持。
可用于10G至100G網(wǎng)絡(luò )的Virtex?-7 FPGA
隨著(zhù)流量的不斷激增,各大數據中心如何經(jīng)濟、平滑地提升網(wǎng)絡(luò )帶寬性能,成為產(chǎn)業(yè)關(guān)注的熱門(mén)話(huà)題,以求在路由、交換、安全等方面實(shí)現全面調優(yōu)。接下來(lái),我們?yōu)榇蠹彝扑]一款可用于10G至100G網(wǎng)絡(luò )的Virtex?-7 FPGA,同樣是來(lái)自制造商AMD,貿澤電子官網(wǎng)上該器件的料號為XC7VX485T-1FFG1761C。
Virtex?-7 FPGA是AMD 7系列FPGA中的一個(gè)系列,基于低功耗(HPL)、28nm、高K金屬柵極(HKMG)工藝技術(shù)打造,提供高達2M邏輯單元,具有出色的功耗性能比架構、DSP性能以及I/O帶寬。Virtex?-7 FPGA提供超高端連接帶寬,總串行帶寬高達2.8TB/s,最多支持96 x 13.1G GT、16 x 28.05G GT、5,335 GMAC、68Mb BRAM、DDR3-1866。
表1:AMD 7系列FPGA產(chǎn)品參數表
(圖源:AMD)
Virtex?-7 FPGA適合小尺寸、成本敏感、大容量應用,比如100GE線(xiàn)路卡。
幫助數據中心應對復雜多變的新場(chǎng)景
隨著(zhù)數據中心里面的數據體量越來(lái)越大,并且行業(yè)應用對于低時(shí)延的要求越來(lái)越苛刻,FPGA通過(guò)對數據中心計算效能的提升,對通信網(wǎng)絡(luò )的持續優(yōu)化,推動(dòng)了數據中心的智能化升級,并幫助其應對愈加復雜的新場(chǎng)景、新AI模型,最終幫助社會(huì )各行業(yè)實(shí)現更深層的數字化運營(yíng)。在貿澤電子官網(wǎng)上,無(wú)論是FPGA產(chǎn)品還是基于FPGA實(shí)現的加速卡,都有豐富的產(chǎn)品選擇,借助這些高性能器件,開(kāi)發(fā)人員可以為數據中心加速再加速。
來(lái)源:Mouser
免責聲明:本文為轉載文章,轉載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問(wèn)題,請聯(lián)系小編進(jìn)行處理。
推薦閱讀:
電感飽和與開(kāi)關(guān)電源之間的密切關(guān)系(中)