《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > NVIDIA推出四款推理平臺

NVIDIA推出四款推理平臺

用于大型語言模型和生成式AI工作負載的推理平臺
2023-03-22
來源:英偉達
關鍵詞: NVIDIA AI 大語言模型

  2023年3月21日 - NVIDIA于今日推出四款推理平臺。這些平臺針對各種快速興起的生成式AI應用進行了優化,能夠幫助開發人員快速構建用于提供新服務和洞察的AI驅動的專業應用。

  這些平臺將NVIDIA的全棧推理軟件與最新的NVIDIA Ada、Hopper和Grace Hopper處理器相結合,包括今天推出的NVIDIA L4 Tensor Core GPU 。各平臺針對AI視頻、圖像生成、大型語言模型部署、推薦系統推理等需求激增的工作負載進行了優化。

  NVIDIA創始人兼首席執行官黃仁勛表示:“生成式AI的興起需要更加強大的推理計算平臺。生成式AI應用的數量是無限的,它唯一的限制就是人類的想象力。為開發人員提供最強大、靈活的推理計算平臺將加快新服務的創造速度,這些新服務將以前所未有的方式改善我們的生活。”

  加速生成式AI的各種推理工作負載集

  每個平臺都包含一個為特定生成式AI推理工作負載而優化的NVIDIA GPU和專用的軟件:

  適用于AI視頻的NVIDIA L4可提供比CPU高出120倍的AI視頻性能,同時能效提高了99%。這款適用于幾乎所有工作負載的通用GPU提供更加強大的視頻解碼和轉碼能力、視頻流式傳輸、增強現實、生成式AI視頻等。

  適用于圖像生成的NVIDIA L40針對圖形以及AI支持的2D、視頻和3D圖像生成進行了優化。L40平臺是NVIDIA Omniverse?(一個用于在數據中心構建和運行元宇宙應用的平臺)的引擎,與上一代產品相比,其Stable Diffusion推理性能提高了7倍,Omniverse性能提高了12倍。

  適用于大型語言模型部署的NVIDIA H100 NVL是規模化部署像ChatGPT這樣的大型語言模型(LLMs)的理想平臺。這款新的H100 NVL擁有94GB內存和Transformer引擎加速,在數據中心規模,與上一代A100相比,GPT-3上的推理性能提高了多達12倍。

  適用于推薦模型的NVIDIA Grace Hopper是圖形推薦模型、矢量數據庫和圖神經網絡的理想平臺。通過NVLink-C2C以900 GB/s 的速度連接CPU和GPU,Grace Hopper的數據傳輸和查詢速度比PCIe 5.0快了7倍。

  這些平臺的軟件層采用NVIDIA AI Enterprise軟件 套件,包括用于高性能深度學習推理的軟件開發套件NVIDIA TensorRT?,以及幫助實現模型部署標準化的開源推理服務軟件NVIDIA Triton Inference Server ?。

  早期采用者與支持

  谷歌云是NVIDIA推理平臺的重要云合作伙伴和早期客戶。該公司正在將L4平臺整合到其機器學習平臺Vertex AI中,并且是第一家提供L4實例的云服務提供商,其G2虛擬機的私人預覽版已于今天推出。

  NVIDIA和谷歌今天分別宣布了首批在谷歌云上使用L4的兩家機構--Descript和WOMBO,前者使用生成式AI幫助創作者制作視頻和播客,后者提供“Dream”這一AI驅動的文本-數字藝術轉換應用程序。

  另一個早期采用者快手提供了一個短視頻應用程序,利用GPU對傳入的實時流媒體視頻進行解碼、捕捉關鍵幀并優化音視頻。然后,它使用一個基于Transformer的大型模型理解多模態內容,從而提高全球數億用戶的點擊率。

  快手高級副總裁于越表示:“快手推薦系統所服務的社區每天的用戶人數超過3.6億,他們每天貢獻3000萬條UGC視頻。在相同的總體擁有成本下,相較于CPU,NVIDIA GPU將系統的端到端吞吐量提高了11倍,將延遲降低了20%。”

  領先的生成式AI技術平臺D-ID,通過使用NVIDIA L40 GPU從文本中生成逼真的數字人,支持任何內容來生成人臉,不僅幫助專業人士改進視頻內容,同時減少了大規模視頻制作的成本和麻煩。

  D-ID研發副總裁Or Gorodissky表示:“L40的性能十分驚人。有了它,我們將推理速度提高了一倍。D-ID十分高興能夠將這個新硬件作為我們產品的一部分,以前所未有的性能和分辨率實現AI人的實時流傳輸,并降低我們的計算成本。”

  領先的AI制作工作室Seyhan Lee使用生成式AI為電影、廣播和娛樂行業開發沉浸式體驗和迷人的創意內容。

  Seyhan Lee聯合創始人Pinar Demirdag表示:“L40 GPU為我們的生成式AI應用帶來了驚人的性能提升。憑借L40的推理能力和內存容量,我們可以部署非常先進的模型,并以驚人的速度和精度向客戶提供創新的服務。”

  語言AI領域的先鋒Cohere所運行的平臺使得開發人員能夠在保護數據隱私和安全的情況下,構建自然語言模型。

  Cohere首席執行官Aidan Gomez表示:“憑借NVIDIA的全新高性能H100推理平臺,我們可以使用先進的生成式模型為客戶提供更加優質、高效的服務,推動對話式AI、多語言企業搜索、信息提取等各種NLP應用的發展。”

  供應情況

  NVIDIA L4 GPU私人預覽版現已通過谷歌云平臺以及30多家計算機制造商所組成的全球網絡提供。

  NVIDIA L40 GPU現已通過全球領先的系統提供商提供,并且合作伙伴平臺的數量將在今年持續增加。

  Grace Hopper超級芯片已開始樣品供貨,預計下半年將全面投產。H100 NVL GPU也將于下半年面市。



本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 精品久久久久久中文字幕欧美 | 亚洲伦理在线 | 日韩精品1区 | 欧美日韩免费一区二区在线观看 | 人与动人与物xxxxxr | 黄色网址在线看 | 精品欧美一区二区在线看片 | 青草草在线视频 | 欧美精品亚洲精品日韩专区 | 亚洲黄色一级大片 | 视频一区二区不卡 | 亚洲第一色网 | 日韩欧美在线观看一区 | 国产精品久久久久久久久免费hd | 免费a视频 | 男人把女人下面桶爽的视频 | 在线观看黄色一级片 | 亚洲欧美韩日 | 丝袜国产 | 日本黄三级 | 1000部羞羞视频在线看视频 | 性刺激欧美三级在线现看中文 | 黄网站免费在线观看 | 国产大片中文字幕 | 国产观看精品一区二区三区 | 中文字幕一区二区在线观看 | 黄色永久网站 | 国产在线a不卡免费视频 | 黑人最猛性free护士hd | 国产欧美一区视频在线观看 | 国产一卡二卡 | 欧美色欧美亚洲高清图片 | 天天综合在线视频 | 男人把女人狂躁的免费视频 | 久久音影| 干干干日日日 | 国产h在线播放 | 成人午夜在线播放 | 日韩午夜小视频 | 欧美日韩动漫 | 久久久国产精品免费 |