《電子技術應用》
您所在的位置:首頁 > 電子元件 > 業界動態 > 透過DeepSeek,聊聊存儲是如何給AI加速的

透過DeepSeek,聊聊存儲是如何給AI加速的

2025-02-28
來源:鎧俠
關鍵詞: 鎧俠 Deepseek AI

  從AI服務器到AI PC,如何快速的用上DeepSeek成為熱門問題。無論DeepSeek Janus-Pro把多模態提升到了一個新層次,還是媲美主流的DeepSeek-V3,或者應用于本地的DeepSeek-V3,對存儲都提出了新的需求。以完整未蒸餾的DeepSeek R1模型為例,這是一個擁有6710億參數的混合專家(MoE)模型,未量化版本的文件體積高達720GB,而動態量化版本也達到150GB到400GB之間。

  DeepSeek讓GPU算力一下子得到了空前的釋放,允許廠商將更多的資源集中到其它關鍵硬件中,比如更強大的并行能力,以及更優秀的存儲方案。很顯然,常規的存儲方案已經不能很好的解決效率和存儲的問題,在企業級和數據中心級SSD為AI提供存儲支持時,以QLC和CXL為例的新技術也正在協助AI以更低成本和更高的效率運行。

136.JPG

  QLC與CXL:為AI鋪路

  由于DeepSeek不僅降低了計算成本,多模態處理能力、說是知識圖譜和推理能力的優秀表現,使得廠商擁有足夠的資源調用更多的數據。這使得原本大量的冷數據變成了溫數據。溫數據對存儲有著更高的要求,需要相對HDD更快的傳輸速率,并且存儲數據可能每年以EB級增長。這導致SSD的需求往大容量和低成本的方向發展。

  其中QLC能夠更好的在單位空間內提升存儲容量,第八代BiCS FLASH? 2Tb QLC的位密度比鎧俠目前所采用的第五代BiCS FLASH?的QLC產品提高了約2.3倍,寫入能效比提高了約70%。不僅如此,全新的QLC產品架構可在單個存儲器封裝中堆疊16個芯片,為業界提供領先的4TB容量,并采用更為緊湊的封裝設計,尺寸僅為11.5 x 13.5 mm,高度為1.5 mm。

  這意味著,未來采用第八代BiCS FLASH QLC的存儲產品在存儲空間擁有質的飛躍,可以輕松將企業級SSD和數據中心級SSD容量提升至120TB以上。

135.JPG

  密集的DeepSeek計算也意味著對內存有著海量的要求,但動輒數百GB的訓練模型全部存儲在內存中也意味著高昂的成本,如何利用BiCS FLASH?降低成本也是未來的思考方向。例如利用相變存儲原理,基于BiCS FLASH?結構打造的XL-FLASH存儲級內存(Storage Class Memory, SCM)與CXL相結合,開發相較內存功耗更低、位密度更高,相較閃存讀取速度更快的存儲器。這不僅會提高存儲器利用效率,還有助于節能。

134.JPG

  CXL技術本身通常也意味著更先進的PCIe版本支持,鎧俠則是積極響應PCIe升級的存儲制造商之一。例如,鎧俠率先推出支持PCIe? 5.0的企業級固態硬盤CM7系列。PCIe? 5.0 SSD與傳統存儲設備(如PCIe? 4.0 SSD)的對比測試,結果顯示, CM7系列SSD在多個GPU并行訪問時,能夠提供91%的I/O吞吐量提升,此外,它的讀取延遲比傳統SSD低57%。同時,PCIe? 5.0 SSD能機器學習訓練時間能夠得到顯著減少。以16個GPU并行處理為例,使用PCIe? 5.0 SSD可以減少32到44天的訓練時間。

  特別是在PCIe? 5.0與NVMe?規范下實現可靠的RAID兼容性和互操作性能。特別是生成式AI與檢索增強生成(RAG) 系統的重要性更勝以往,關系數據庫PostgreSQL和向量數據庫需求變得格外重要。例如通過Xinnor的RAID 解決方案的兼容性和互操作性測試,與采用相同硬件配置的軟件 RAID 解決方案相比,在數據降級模式下執行PostgreSQL,效能更提升達25倍。

133.JPG

  搶先布局

  任何前沿技術不可能一蹴而就,AI技術的積累更是如此。流暢體驗的AI服務對數據傳輸速度有著很高的要求。在多年前,鎧俠已經開始對AI展開布局,并致力于為人工智能的發展提供高性能的存儲解決方案。

  為了推動檢索增強生成(RAG)擴展獲得更好的性能支持,并進一步降低成本。鎧俠在近期宣布開源AiSAQ?技術,這是一項專為SSD優化的新型“近似最近鄰”搜索(ANNS)算法,跳過將索引數據載入內存(DRAM)的步驟,直接在SSD上執行檢索操作,幫助企業/應用針對特定數據優化,從而實現幫助大語言模型(LLM)訓練節省成本。

132.JPG

  利用高性能存儲特性,鎧俠在AI前沿進行了諸多嘗試。包括通過Memory-Centric AI技術解決企業級SSD中圖像分類任務中災難性丟失問題,在神經網絡不通過調整的前提下,在深度學習中快速獲得圖像特征辨別和標簽添加。并在數年前與NVIDIA展開深度合作,從加速StyleGAN、NeRF等算法,到協助NVIDIA搭建Omniverse平臺,包括搭建最新的物理AI開發平臺NVIDIA Cosmos,為LLM訓練整理自定義數據集的NVIDIA NeMo Curator。

131.JPG

  針對前瞻性存儲,鎧俠在近期還正式發布了全新XD8系列PCIe? 5.0 EDSFF(企業和數據中心標準型)E1.S固態硬盤。它是鎧俠第三代E1.S固態硬盤,符合PCIe? 5.0(32 GT/s x 4)和NVMe? 2.0規范,并支持開放計算項目(OCP)數據中心NVMe SSD v2.5規范。

  鎧俠XD8系列專為云和超大規模環境設計,滿足數據中心對高性能、高效率和高可擴展性的日益增長的需求。通過這款新的固態硬盤,云服務提供商和超大規模企業能夠優化基礎設施,在保持運營效率的同時提供卓越的性能。

130.JPG

  讓AI移動起來

  DeepSeek另一個實現領域則是在移動平臺。即便是春節假期,多個版本針對AI PC本地化AI部署的DeepSeek R1已經成型,例如蒸餾版本的7B和14B參數模型在筆記本和消費級臺式機電腦上,可利用NPU和GPU實現離線運作,進一步確保了私有信息的安全。

  對于AI PC而言,除了提供獨立GPU或者NPU進行AI加速,大容量NVMe SSD也同等重要,另外還要考慮到有限的AI PC內部空間,固態硬盤需要同時兼顧性能與散熱。以鎧俠BG6系列為例,鎧俠 BG6 系列在AI PC上能夠展現卓越的性能和靈活性。采用 PCIe? 4.0 和 NVMe 1.4c 規范,搭載高達2,048GB存儲空間。順序讀取速度最高可達 6,000 MB/s,隨機讀取速度更是高達 900,000 IOPS。這使得BG6系列成為緊湊型固態硬盤中的佼佼者,為用戶提供了更快速、更高效的數據處理體驗。

129.JPG

  另外BG6 系列提供了多種容量選擇,包括 256GB、512GB、1,024GB 和 2,048GB,適用于不同用戶需求。其采用 M.2 Type 2230 和 Type 2280 模組封裝,可靈活應用于各類薄型設備,如超薄筆記本電腦、嵌入式設備。也給不同形態的AI PC部署本地AI提供了豐富的解決方案。

  從數據中心、服務器,到個人計算機,鎧俠為AI計算提供了豐富、高效的存儲方案,并與合作伙伴展開深度合作,從軟件和硬件層面入手,利用高性能固態硬盤的特性,為AI計算提供可靠的存儲后盾,共同探索更多AI的可能性,充分利用AI與數據,創造更多價值。




更多精彩內容歡迎點擊==>>電子技術應用-AET<<

3952966954c9c6c308355d1d28d750b.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 欧美 亚洲 激情 | 亚洲免费在线视频播放 | 特一级黄色大片 | 亚洲黄色在线观看视频 | 一个人看的www网站 一个人看的www在线 | 黄色一级片免费看 | 亚洲区精选网址 | 国产桃色在线成免费视频 | 亚洲一区二区三区高清视频 | 天天射天天操天天色 | 六月丁香激情 | 亚洲综合网美国十次 | 国产成人免费观看 | 久久久91精品国产一区二区三区 | 91桃色视频在线观看 | 欧美三级超在线视频 | 日韩精品视频在线免费观看 | a级在线观看 | 日韩精品午夜 | 在线观看深夜观看网站免费 | 免费乱理伦片奇优影院 | 在线欧美成人 | 成人性生交大片免费看午夜a | 日韩激情中文字幕 | 日本在线一区二区三区 | 亚洲伊人久久综合一区二区 | 亚洲欧美一区二区久久 | 欧美日韩亚洲一区二区 | 性刺激的欧美三级视频 | 午夜视频一区 | 黄色三级在线观看 | 日本一区二区三区在线 观看网站 | 欧美午夜视频 | 一级爱一级做a性视频 | 日本xxxⅹ69xxxx护士 | 亚洲国产片 | 午夜欧美精品久久久久久久久 | 中文字幕视频免费 | 成人国产一区二区三区精品 | 北条麻妃初尝试黑人在线观看 | 中国一级毛片免费看视频 |