欧美牲交a欧美牲交aⅴ免费_GDDR6給FPGA帶來(lái)的大帶寬存儲優(yōu)勢以及性能測試-互連技術(shù)-電子元件技術(shù)網(wǎng)

<s id="eoqoe"><xmp id="eoqoe">

<button id="eoqoe"><strong id="eoqoe"></strong></button>

<s id="eoqoe"><xmp id="eoqoe">

<button id="eoqoe"><strong id="eoqoe"></strong></button>

<wbr id="eoqoe"><strong id="eoqoe"></strong></wbr>

<wbr id="eoqoe"><strong id="eoqoe"></strong></wbr>

<wbr id="eoqoe"><strong id="eoqoe"></strong></wbr>

<wbr id="eoqoe"><label id="eoqoe"></label></wbr>

你的位置：首頁(yè) > 互連技術(shù) > 正文

GDDR6給FPGA帶來(lái)的大帶寬存儲優(yōu)勢以及性能測試

發(fā)布時(shí)間：2021-12-02 來(lái)源：黃侖，Achronix高級應用工程師責任編輯：wenwei

【導讀】隨著(zhù)互聯(lián)網(wǎng)時(shí)代的到來(lái)，人類(lèi)所產(chǎn)生的數據發(fā)生了前所未有的、爆炸性的增長(cháng)。IDC預測，全球數據總量將從2019年的45ZB增長(cháng)到2025年的175ZB[1]。同時(shí)，全球數據中近30%將需要實(shí)時(shí)處理，因而帶來(lái)了對FPGA等硬件數據處理加速器的需求。如圖1所示。

1. 概述

隨著(zhù)互聯(lián)網(wǎng)時(shí)代的到來(lái)，人類(lèi)所產(chǎn)生的數據發(fā)生了前所未有的、爆炸性的增長(cháng)。IDC預測，全球數據總量將從2019年的45ZB增長(cháng)到2025年的175ZB[1]。同時(shí)，全球數據中近30%將需要實(shí)時(shí)處理，因而帶來(lái)了對FPGA等硬件數據處理加速器的需求。如圖1所示。

圖1 全球數據增長(cháng)預測

在這樣的數據高速增長(cháng)的情況下，用于傳輸數據的網(wǎng)絡(luò )帶寬和處理數據所需要的算力也必須急速增長(cháng)。傳統的CPU已經(jīng)越來(lái)越不堪重負，所以用硬件加速來(lái)減輕CPU的負擔是滿(mǎn)足未來(lái)性能需求的重要發(fā)展方向。未來(lái)的硬件發(fā)展需求對于用于加速的硬件平臺提出了越來(lái)越高的要求，可以概括為三個(gè)方面：算力、數據傳輸帶寬和存儲器帶寬。

Achronix的新一代采用臺積電7nm工藝的Speedster 7t FPGA芯片根據未來(lái)硬件加速和網(wǎng)絡(luò )加速的需求，在這三個(gè)方面都做了優(yōu)化，消除了傳統FPGA的瓶頸。下面我們重點(diǎn)說(shuō)一說(shuō)為了提高存儲器帶寬，Achronix通過(guò)采用硬核GDDR6控制器所帶來(lái)的優(yōu)勢。

2. GDDR6的發(fā)展

在GDDR的設計之初，其定位是針對圖形顯示卡所特別優(yōu)化的一種DDR內存。因為2000年后電腦游戲特別是3D游戲的發(fā)展和火爆，使運行電腦游戲的顯卡需要有大量的高速圖像數據交互需求，GDDR在這種情況下應運而生。第一個(gè)GDDR標準是基于DDR的GDDR2，隨后發(fā)展到了基于DDR3的GDDR5，在一段時(shí)間中非常流行。

2016年，GDDR5X正式發(fā)布，它引入了具有16n預取的四倍數據速率模式，但代價(jià)是訪(fǎng)問(wèn)粒度從GDDR5的32Byte提高到了64Byte。2018年，GDDR6發(fā)布，數據速率達到了16Gbps，帶寬幾乎是GDDR5X的兩倍，同時(shí)采用了雙通道設計，訪(fǎng)問(wèn)粒度和GDDR5一樣是32Byte。

3. GDDR6 和 DDR4/5的比較

GDDR一直以來(lái)是針對圖形顯示卡所優(yōu)化的一種DDR內存。因為顯卡處理圖像數據，特別是3D圖像數據對顯存帶寬的要求更高，GPU和GDDR之間的數據交換非常頻繁。而DDR內存專(zhuān)注于與CPU進(jìn)行數據交換的效率，因此對于整體存取性能、低延遲更為看重，所以在CPU和傳統的FPGA中基本都是用DDR4。

隨著(zhù)硬件加速需求對于存儲器的帶寬提出了越來(lái)越高的要求，傳統的DDR4帶寬顯然已經(jīng)無(wú)法滿(mǎn)足要求，Achronix看重了GDDR6在數據存儲中的帶寬優(yōu)勢，創(chuàng )新地將GDDR6引入到了FPGA，徹底解決了傳統FPGA存儲帶寬不夠的瓶頸。

2020年7月15日，JEDEC存儲協(xié)會(huì )正式發(fā)布了DDR5 SDRAM的標準（JESD79-5），內存的頻率相對DDR4的標準頻率有了大幅的提升，總傳輸帶寬也提升了38%，但是還是和GDDR6的帶寬有一定的差距。如圖2所示[2]，GDDR6和DDR4/5的帶寬對比。

圖2 GDDR與DDR帶寬發(fā)展對比

如果實(shí)現同一個(gè)大帶寬存儲的應用，在提供相同的存儲器帶寬的情況下，無(wú)論在設計復雜度，PCB占用面積，還是在功耗方面，與DDR4相比，GDDR6的性能都有很大的提高，如圖3所示[2]。

圖3 GDDR6和DDR4性能對比

4. GDDR6 和 HBM2的比較

HBM全稱(chēng)High Bandwidth Memory，最初的標準是由JEDEC在2013年發(fā)布。2016年1月，HBM的第二代HBM2正式成為工業(yè)標準。HBM的出現也是為了解決存儲器帶寬問(wèn)題。與GDDR6不同的是，HBM內存一般是由4個(gè)或者8個(gè)HBM的Die堆疊形成，我們稱(chēng)之為一個(gè)Stack。如圖4所示[4]。

圖4 HBM Die的堆疊

我們以市面上帶有HBM2的高端 FPGA為例，這個(gè)系列的FPGA集成了1~2個(gè)這樣的HBM2 Stack。兩個(gè)Stack之間是相互獨立的，各自有自己的地址空間。每個(gè)Die都有獨立的兩個(gè)128bit的Channel，所以4個(gè)Die 8個(gè)通道就是1024bit的位寬，HBM2的頻率是900MHz，按DDR的方式訪(fǎng)問(wèn)，一個(gè)Stack總共帶寬是 900（MHz）x 2（DDR）x 1024（位寬）/8 = 230GB/s，兩個(gè)Stack最高可以到460GB/s的帶寬。

Achronix的Speedster 7t FPGA集成了8個(gè)GDDR6的硬核，每個(gè)GDDR6的硬核支持雙通道?？偟膸捠?16Gbps x 16（位寬）x 2（通道）x 8（控制器）/8 = 512 GB/s，略高于帶HBM2的FPGA存儲器帶寬。

從成本上來(lái)看，目前GDDR6與HBM2相比有著(zhù)很大的優(yōu)勢，HBM2技術(shù)工藝要求高，目前芯片的良率和產(chǎn)量都會(huì )受到很大的影響。同時(shí)GDDR6使用起來(lái)更靈活，使用片外的DRAM，可以根據應用要求，選擇不同速率，不同容量的GDDR6顆粒。HBM2的優(yōu)勢在于集成度高，不占用PCB板的面積。圖5是DDR4、GDDR6和HBM2在成本上的一個(gè)綜合比較。

圖5 DDR4 vs GDDR6 vs HBM2

5. GDDR6 技術(shù)細節以及Clamshell模式

GDDR6結構如圖6所示[3]。它是采用16n Prefetch結構，一次寫(xiě)操作或者讀操作的數據是16n。每個(gè)GDDR6顆粒有兩個(gè)獨立的通道，每個(gè)獨立的通道訪(fǎng)問(wèn)獨立的內存空間。對于每個(gè)通道，讀或者寫(xiě)的位寬是256bit或者32Byte。P-to-S converter是一個(gè)并變串的轉換器，把每個(gè)256bit位寬的數據轉換成16位總線(xiàn)，每位總線(xiàn)上傳輸16bit的數據。這樣GDDR6每個(gè)通道最小的訪(fǎng)問(wèn)粒度是256bit或者32Byte。

根據GDDR6這樣16n 預取結構，內部存儲陣列如果訪(fǎng)問(wèn)周期是1ns，則I/O上的數據率則是16Gbps。

圖6 GDDR6顆粒結構

一個(gè)GDDR6控制器支持兩個(gè)獨立通道，一個(gè)GDDR6顆粒也是兩個(gè)獨立的通道，所以在通常模式下，一個(gè)GDDR6控制器對應一個(gè)GDDR6的顆粒，用x16模式，實(shí)現最高512Gb/s的帶寬。

因為目前市面上GDDR6顆粒的最大容量是16Gb，在有些應用中如果對容量有一定的要求，可以使用一種叫Clamshell的連接方式，如圖7[5]所示，每個(gè)GDDR6控制器連接兩個(gè)GDDR6顆粒，每個(gè)GDDR6的顆粒用x8模式，這樣在這種Clamshell模式下，帶寬不變，但是支持的GDDR6的容量翻倍了。

圖7 GDDR6的Clamshell模式

6. GDDR6 在7t1500上的讀寫(xiě)效率

最后，我們測試一下7t1500上GDDR6控制器的讀寫(xiě)效率，所有的測試結果基于仿真數據。測試環(huán)境如圖8所示。因為7t1500包含了片上網(wǎng)絡(luò )（NoC），并且NoC已經(jīng)實(shí)現了仲裁，時(shí)鐘域轉換的邏輯，我們用三個(gè)用戶(hù)邏輯通過(guò)NoC去訪(fǎng)問(wèn)同一個(gè)GDDR6 Channel，得到的綜合讀寫(xiě)效率更能反映用戶(hù)實(shí)際運用中的場(chǎng)景。

圖8 GDDR6讀寫(xiě)效率測試架構

在不同的突發(fā)長(cháng)度和不同的地址訪(fǎng)問(wèn)方式下的測試結果如圖9所示。

圖9 GDDR6讀寫(xiě)效率

后面我們會(huì )繼續深入了解Speedster 7t FPGA芯片上的一些特性，以及這些特性如何運用在數據加速和網(wǎng)絡(luò )加速中，敬請期待。如需更多信息或者有任何疑問(wèn)您可以通過(guò)Achronix公眾號里的聯(lián)系方式聯(lián)系我們，也可訪(fǎng)問(wèn)Achronix公司官方網(wǎng)站 http://www.achronix.com

如果需要進(jìn)一步聯(lián)絡(luò )Achronix中國區技術(shù)和產(chǎn)品應用團隊，請發(fā)送郵件到：dawson.guo@achronix.com

參考文獻：

1.The Digitization of the World From Edge to Core 2018

2.Extending the Benefits of GDDR Beyond Graphics by Micron

3.TN-ED-03: GDDR6: The Next-Generation Graphics DRAM Memory Array Prefetch and Access Granularity

4.Samsung網(wǎng)站：www.samsung.com

5.Micron網(wǎng)站：www.micron.com

6.Achronix網(wǎng)站：www.achronix.com

免責聲明：本文為轉載文章，轉載此文目的在于傳遞更多信息，版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問(wèn)題，請聯(lián)系小編進(jìn)行處理。

推薦閱讀：

使用氮化鎵(GaN)提高電源效率

I2C通信協(xié)議：了解I2C Primer、 PMBus和SMBus

為應用選擇合適的射頻放大器指南

ADALM2000實(shí)驗：放大器輸出級

通過(guò)之前的模塊構建運算放大器

上一篇：連接SPI接口器件 - 第二部分

下一篇：穩壓管的4種應用電路

特別推薦

技術(shù)文章更多>>

技術(shù)白皮書(shū)下載更多>>

熱門(mén)搜索

友情鏈接(QQ：317243736)

我愛(ài)方案網(wǎng) ICGOO元器件商城創(chuàng )芯在線(xiàn)檢測芯片查詢(xún) 天天IC網(wǎng) 電子產(chǎn)品世界無(wú)線(xiàn)通信模塊控制工程網(wǎng) 電子開(kāi)發(fā)網(wǎng) 電子技術(shù)應用與非網(wǎng) 世紀電源網(wǎng) 21ic電子技術(shù)資料下載電源網(wǎng) 電子發(fā)燒友網(wǎng) 中電網(wǎng) 中國工業(yè)電器網(wǎng) 連接器礦山設備網(wǎng) 工博士智慧農業(yè) 工業(yè)路由器天工網(wǎng) 乾坤芯電子元器件采購網(wǎng) 亞馬遜KOL 聚合物鋰電池工業(yè)自動(dòng)化設備企業(yè)查詢(xún) 工業(yè)路由器元器件商城連接器 USB中文網(wǎng) 今日招標網(wǎng) 塑料機械網(wǎng) 農業(yè)機械中國IT產(chǎn)經(jīng)新聞網(wǎng) 高低溫試驗箱

?

關(guān)閉

?

關(guān)閉

久久无码人妻精品一区二区三区_精品少妇人妻av无码中文字幕_98精品国产高清在线看入口_92精品国产自产在线观看481页

<s id="eoqoe"><xmp id="eoqoe">

<button id="eoqoe"><strong id="eoqoe"></strong></button>

<s id="eoqoe"><xmp id="eoqoe">

<button id="eoqoe"><strong id="eoqoe"></strong></button>

<wbr id="eoqoe"><strong id="eoqoe"></strong></wbr>

<wbr id="eoqoe"><strong id="eoqoe"></strong></wbr>

<wbr id="eoqoe"><strong id="eoqoe"></strong></wbr>

<wbr id="eoqoe"><label id="eoqoe"></label></wbr>