天天觀察:焱融科技 YRCloudFile 率先支持 NVIDIA GPUDirect Storage(GDS)
2020 年 GPT-3 模型的參數(shù)量首次突破千億大關(guān),達(dá)到了 1750 億,堪稱“大力出奇跡”。今日凌晨,萬眾矚目的大型多模態(tài)模型 GPT-4 正式發(fā)布!GPT-4 是多模態(tài)的,同時(shí)支持文本和圖像輸入功能。該版本“更強(qiáng)大”,模型精度隨著模型尺寸及訓(xùn)練數(shù)據(jù)的增加而顯著提升。
訓(xùn)練巨量模型需要巨大的算力,但隨著數(shù)據(jù)集和模型規(guī)模不斷增加,應(yīng)用程序載入數(shù)據(jù)所花費(fèi)的時(shí)間變得越長,進(jìn)而影響了應(yīng)用程序的性能,緩慢的 I/O 嚴(yán)重拖累GPU 的強(qiáng)大算力。如何大幅提升GPU載入大型數(shù)據(jù)集的速度將是計(jì)算和存儲(chǔ)系統(tǒng)共同面臨的最大挑戰(zhàn)。為更加完美地滿足大規(guī)模計(jì)算集群對(duì)于存儲(chǔ)系統(tǒng)的數(shù)據(jù)訪問需求,進(jìn)一步發(fā)揮強(qiáng)大的 GPU 計(jì)算能力,將性能發(fā)揮到極致,焱融技術(shù)團(tuán)隊(duì)歷時(shí)6個(gè)月的時(shí)間完成對(duì)NVIDIA GPUDirect Storage(GDS)的適配開發(fā),實(shí)現(xiàn)以直接內(nèi)存的存取方式,將數(shù)據(jù)傳輸至GPU內(nèi)存上,顯著降低I/O延遲,提升數(shù)據(jù)帶寬。
(資料圖)
GDS簡述
現(xiàn)代 AI 和數(shù)據(jù)科學(xué)工作是由大量數(shù)據(jù)驅(qū)動(dòng)的,隨著人工智能以及高性能運(yùn)算的數(shù)據(jù)集規(guī)模不斷增加,GPU 計(jì)算和數(shù)據(jù)中心存儲(chǔ)系統(tǒng)之間的快速通信變得至關(guān)重要。數(shù)據(jù)從 NVMe 磁盤傳輸?shù)?GPU 內(nèi)存的標(biāo)準(zhǔn)路徑,傳統(tǒng)的方式是由 CPU 控制的,使用系統(tǒng)內(nèi)存中的回彈緩存(Bounce Buffer)做數(shù)據(jù)的中轉(zhuǎn)。這種操作過程會(huì)產(chǎn)生額外的數(shù)據(jù)拷貝工作,造成很大的系統(tǒng)開銷。當(dāng)數(shù)據(jù)集的規(guī)模不斷增加,應(yīng)用程序載入數(shù)據(jù)花費(fèi)的時(shí)間會(huì)變得越來越長,進(jìn)而影響了應(yīng)用運(yùn)行的性能。
NVIDIA GPUDirect Storage(GDS) 技術(shù)通過 DMA 引擎將硬盤數(shù)據(jù)直接寫入 GPU 顯存,這種以直接內(nèi)存的存取方式,避免了內(nèi)存 bounce buffers 所帶來的額外數(shù)據(jù)拷貝,從而實(shí)現(xiàn) CPU 和主存的 IO 旁路,使 IO 吞吐能力不再受限于系統(tǒng)總線的帶寬壓力。近來,由于高速 RDMA 網(wǎng)絡(luò)的普及,GPUDirect storage 可以高效地直接訪問遠(yuǎn)端存儲(chǔ)設(shè)備,諸如一些 NVMe的 target 方案和一些企業(yè)級(jí)分布式存儲(chǔ)產(chǎn)品,它能有效減輕 CPU I/O 瓶頸,提升數(shù)據(jù)傳輸?shù)?I/O 帶寬的同時(shí),降低I/O延遲。
支持GPUDirect技術(shù)的性能收益
英偉達(dá)開發(fā)的 GPUDirect Storage 技術(shù),大幅提升 GPU 載入大型數(shù)據(jù)集的速度。GDS 通過更快、更直接的數(shù)據(jù)路徑提高了存儲(chǔ)和 GPU 之間數(shù)據(jù)移動(dòng)的效率。數(shù)據(jù)直接從主機(jī)上的網(wǎng)卡(NIC)傳輸?shù)?GPU,而不需要經(jīng)過系統(tǒng)內(nèi)存和 CPU。這種方式消除了系統(tǒng)架構(gòu)中 IO 路徑瓶頸,減少了不必要的數(shù)據(jù)復(fù)制,降低了延遲,同時(shí),釋放出來的計(jì)算資源還可用于深度學(xué)習(xí)中諸如圖形處理等其他業(yè)務(wù)。NVIDIA 表示通過支持 GPUDirect 技術(shù)能夠帶來多方面的性能收益:
? GDS 在存儲(chǔ)和 GPU 之間提升 2~8 倍的數(shù)據(jù)傳輸帶寬。
? 避免了 CPU 在內(nèi)存中的 bounce buffers 拷貝,在某些場(chǎng)景下端到端傳輸?shù)难舆t能夠?qū)崿F(xiàn) 3.8x 的降低。
? 當(dāng) GPU 并發(fā)度增加時(shí),GDS 仍然保持穩(wěn)定的低延遲輸出。
? GPU 不僅作為實(shí)現(xiàn)最高帶寬的計(jì)算引擎,同時(shí)也作為實(shí)現(xiàn)最高 IOPS 的計(jì)算引擎。
? 在某些場(chǎng)景的實(shí)測(cè)數(shù)據(jù)表明,如果單純使用 CPU,吞吐率僅能達(dá)到 50GB/s;而在使用 GPU 之后,吞吐率可達(dá)到 215 GB/s。因此,能支持GDS的存儲(chǔ)系統(tǒng)更能充分匹配前端的異構(gòu)計(jì)算能力。
GPUDirect Storage 架構(gòu)圖
焱融分布式文件存儲(chǔ)系統(tǒng) YRCloudFile 支持 GDS 的大體流程:
YRCloudFile 客戶端向 nvidia-fs 注冊(cè)后,cuFile 打開一個(gè) YRCloudFile 集群文件,會(huì)將 nvidia-fs 和 YRCloudFile 的特定接口進(jìn)行綁定,當(dāng) io 下發(fā)到 client 中,client 檢測(cè)該 IO 是否是 GDS 的請(qǐng)求,如果是,則回調(diào) nvidia-fs 的 map 接口,獲得 sglist 請(qǐng)求的 dma 地址,借助底層驅(qū)動(dòng)能力,實(shí)現(xiàn)數(shù)據(jù)的RMDA 傳輸。
NVIDIA?Magnum IO GPUDirect? 技術(shù),能夠顯著降低 GPU 服務(wù)器內(nèi)的 CPU 占用率,增加存儲(chǔ)帶寬并減少延遲。焱融科技是國內(nèi)支持 GPUDirect? 功能的首家分布式文件存儲(chǔ)廠商,能夠更好地管理數(shù)據(jù)路徑。焱融文件存儲(chǔ)系統(tǒng)與 GDS 的組合使得數(shù)據(jù)在應(yīng)用程序和存儲(chǔ)之間通過更短、更有效的路徑傳輸,實(shí)現(xiàn) 1+1>2 的功能效果。從而使支持 GDS 的應(yīng)用程序能夠充分釋放 GPU 計(jì)算能力,為人工智能和機(jī)器學(xué)習(xí)(AI/ML)以及數(shù)據(jù)分析等業(yè)務(wù)加速。
2022 年,焱融追光全閃文件一體機(jī)單存儲(chǔ)節(jié)點(diǎn)達(dá)到 40GB/s+ 帶寬和 200萬+ IOPS 性能,并應(yīng)用于人工智能、智能汽車、智能制造、教育等行業(yè)生產(chǎn)環(huán)境中,為企業(yè)用戶成功構(gòu)建高性能存儲(chǔ)平臺(tái)。在服務(wù)全球 500 強(qiáng)制造業(yè)的客戶中,完成國內(nèi)首個(gè)雙 200Gb 網(wǎng)絡(luò)聚合分布式文件存儲(chǔ)集群部署,實(shí)現(xiàn) AI 計(jì)算平臺(tái)破千萬 IOPS 性能實(shí)踐。
關(guān)鍵詞:
2023-03-17 12:53:06
2023-03-17 12:45:52
2023-03-17 12:39:06
2023-03-17 12:34:36
2023-03-17 12:34:06
2023-03-17 11:39:00
2023-03-17 11:05:31
2023-03-17 10:42:23
2023-03-17 10:34:57
2023-03-17 09:57:58
2023-03-17 09:45:08
2023-03-17 09:41:56
2023-03-17 09:38:38
2023-03-17 09:38:28
2023-03-17 09:38:07
2023-03-17 09:38:05
2023-03-17 09:36:50
2023-03-17 09:36:32
2023-03-17 09:36:29
2023-03-17 09:36:29
2023-03-17 09:36:26
2023-03-17 09:36:14
2023-03-17 09:36:07
2023-03-17 09:35:32
2023-03-17 09:34:14
2023-03-17 09:33:36
2023-03-17 09:33:21
2023-03-17 09:31:52
2023-03-17 09:30:23
2023-03-17 09:30:23
2023-03-17 09:29:45
2023-03-17 09:29:38
2023-03-17 09:28:52
2023-03-17 09:26:45
2023-03-17 09:26:13
2023-03-17 09:25:26
2023-03-17 09:23:58
2023-03-17 09:23:07
2023-03-17 09:22:21
2023-03-17 09:21:39
2023-03-17 09:17:51
2023-03-17 09:17:10
2023-03-17 08:58:09
2023-03-17 08:57:15
2023-03-17 08:57:14
2023-03-17 08:53:41
2023-03-17 08:52:01
2023-03-17 08:48:49
2023-03-17 08:45:56
2023-03-17 08:44:52
2023-03-17 08:43:09
2023-03-17 08:43:02
2023-03-17 08:34:01
2023-03-17 07:41:02
2023-03-17 06:57:47
2023-03-17 06:45:28
2023-03-17 06:44:56
2023-03-17 06:44:11
2023-03-17 06:36:13
2023-03-17 02:57:42
2023-03-16 22:57:53
2023-03-16 21:49:00
2023-03-16 19:55:57
2023-03-16 19:44:52
2023-03-16 19:44:28
2023-03-16 18:54:14
2023-03-16 18:51:03
2023-03-16 18:36:59
2023-03-16 17:55:12
2023-03-16 17:49:57
2023-03-16 17:44:54
2023-03-16 17:41:14
2023-03-16 17:38:55
2023-03-16 17:37:51
2023-03-16 17:36:00
2023-03-16 17:23:30
2023-03-16 16:57:31
2023-03-16 16:52:22
2023-03-16 16:46:43
2023-03-16 16:40:24
2023-03-16 16:35:46
2023-03-16 15:55:49
2023-03-16 15:55:15
2023-03-16 15:54:09
2023-03-16 15:52:48
2023-03-16 15:52:46
2023-03-16 15:52:14
2023-03-16 15:51:52
2023-03-16 15:51:44
2023-03-16 15:51:19
2023-03-16 15:51:13
2023-03-16 15:51:09
2023-03-16 15:49:49
2023-03-16 15:49:11
2023-03-16 15:49:05
2023-03-16 15:46:24
2023-03-16 15:45:59
2023-03-16 15:45:44
2023-03-16 15:44:02
2023-03-16 15:41:32
相關(guān)新聞