0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云端機(jī)器學(xué)習(xí)平臺PAI最新的創(chuàng)新實踐

NVIDIA英偉達(dá) ? 來源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-06-09 09:52 ? 次閱讀

在今年 3 月的 GTC 2022 大會上,阿里云帶來了推理優(yōu)化/部署、深度學(xué)習(xí)編譯器、大模型部署、訓(xùn)練優(yōu)化等主題的內(nèi)容,分享云端機(jī)器學(xué)習(xí)平臺 PAI (Machine Learning Platform for AI) 最新的創(chuàng)新實踐,并已在【阿里靈杰】知乎號陸續(xù)發(fā)布三篇演講內(nèi)容深度回顧。同時阿里云也分享了其設(shè)計研發(fā)的高性能云手游解決方案——彈性云手機(jī)

專家?guī)憬庾x,免費(fèi)學(xué)習(xí)不間斷

阿里云的精彩分享均已在 NVIDIA On-Demand 上線。

云端 Triton 生產(chǎn)實踐

NVIDIA Triton 推理服務(wù)器是一款功能全面、可擴(kuò)展且功能強(qiáng)大的推理解決方案,在邊緣設(shè)備和云上皆可部署。在云上將 Triton 部署到生產(chǎn)環(huán)境中時,應(yīng)考慮效率、可擴(kuò)展性以及與 Triton 自身外的云上基礎(chǔ)設(shè)施的集成。本演講將介紹阿里云中通過 PAI-EAS 提供 Triton 作為云服務(wù)的關(guān)鍵見解:

1) 一鍵部署 Triton 集群

2) 根據(jù)請求吞吐量擴(kuò)展 Triton 集群

3) 與 OSS(對象存儲服務(wù))原生集成

4) Triton 和 GPU 共享調(diào)度。

通過 PAI-Blade 更易用、更可靠地使用 TensorRT

TensorRT 是由 NVIDIA 推出的業(yè)界領(lǐng)先的推理加速器,在深度學(xué)習(xí)推理場景應(yīng)用廣泛,但是通過 TensorRT 來優(yōu)化深度學(xué)習(xí)模型仍有一定門檻。首先,通過 TensorRT 解析模型時會遇到轉(zhuǎn)換失敗或表現(xiàn)不理想的情況。其次,從零開始搭建網(wǎng)絡(luò)比較耗時且難以擴(kuò)展。此外,在生產(chǎn)環(huán)境里增加新的推理框架需要嚴(yán)謹(jǐn)?shù)脑u估。本次演講將介紹如何通過一站式 AI 加速器 PAI-Blade 解決上述問題。PAI-Blade 能夠?qū)崿F(xiàn) TensorRT 后端上的自動圈圖和自動化運(yùn)行。同時還可以與 TensorRT Plugin 協(xié)同工作,以實現(xiàn)更好的性能。目前 PAI-Blade 提供對 TensorFlow 和 PyTorch 的產(chǎn)品化支持。

PaiSparse:面向深度學(xué)習(xí)的稀疏加速庫

隨著超大語言模型的流行, 如何部署超大模型正在成為迫切需要解決的問題。非結(jié)構(gòu)化剪枝可以將模型規(guī)??s小 99%,讓超大語言模型在單卡上部署成為可能。然而超大模型稀疏后會呈現(xiàn)不同的非零分布,而這些分布會直接影響硬件的計算量并影響最終的執(zhí)行時間。同時與傳統(tǒng)的 HPC 任務(wù)不同的是,基于訓(xùn)練后的稀疏矩陣分布的 tuning 在深度學(xué)習(xí)推理中是可以進(jìn)行的。因此我們提出一個面向深度學(xué)習(xí)的稀疏加速庫:PaiSparse,可以自動生成更高效的稀疏算子。實驗表明,與 cuSparse 相比, PaiSparse 可以提速 1.5~5 倍。

PTXC:使用 XLA 編譯器通過云 GPU 擴(kuò)展 PyTorch 訓(xùn)練

工業(yè)界實踐中,模型訓(xùn)練和部署的效率、規(guī)模和適配性關(guān)系到最終的應(yīng)用效果。為滿足 PyTorch eager-first 的 GPU 編譯流程, Lazy Tensor 架構(gòu)被提出來。通過采用實踐驗證過的產(chǎn)品化 XLA 編譯器和分布式引擎, PTXC 能在阿里云 GPU 集群中以基于編譯優(yōu)化的方式一鍵快速搭建易用、彈性且高效的 PyTorch 模型訓(xùn)練系統(tǒng)。

阿里云基于 AI 編譯器的通用透明性能解決方案

本次演講將從云服務(wù)廠商的視角,分享在云端和機(jī)器學(xué)習(xí)平臺上大規(guī)模部署 AI 編譯器的實戰(zhàn)經(jīng)驗。我們將詳細(xì)介紹近期剛剛開源的動態(tài) shape 深度學(xué)習(xí)編譯器 BladeDISC,包括它的背景和主要特性,具體設(shè)計架構(gòu)和實現(xiàn)細(xì)節(jié),動態(tài) shape 語義下的性能優(yōu)化經(jīng)驗,未來計劃以及在 NVIDIA 設(shè)備上的應(yīng)用等。

未來游戲趨勢:通過阿里云彈性云手機(jī)解決方案打造云游戲

基于 NVIDIA GPU 及原生的 ARM 平臺,阿里云設(shè)計研發(fā)了高性能的云手游解決方案——彈性云手機(jī),可實現(xiàn)虛擬化渲染及顯存隔離,在確保隔離的情況下充分發(fā)揮 GPU 性能。此外,彈性云手機(jī)無縫對接阿里巴巴云游戲流媒體平臺,該平臺兼容多種流媒體協(xié)議,并具備完整的“渲染-編碼-串流”云手游架構(gòu)。

原文標(biāo)題:NVIDIA On-Demand 觀看阿里云機(jī)器學(xué)習(xí)平臺 PAI 的精彩演講

文章出處:【微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4816

    瀏覽量

    102632
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8321

    瀏覽量

    132165
  • 阿里云
    +關(guān)注

    關(guān)注

    3

    文章

    928

    瀏覽量

    42875

原文標(biāo)題:NVIDIA On-Demand 觀看阿里云機(jī)器學(xué)習(xí)平臺 PAI 的精彩演講

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    周末收到一本新書,非常高興,也非常感謝平臺提供閱讀機(jī)會。 這是一本挺好的書,包裝精美,內(nèi)容詳實,干活滿滿。 《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》這本書的第一章,作為整個著作的開篇
    發(fā)表于 10-14 09:12

    AI引擎機(jī)器學(xué)習(xí)陣列指南

    云端動態(tài)工作負(fù)載以及超高帶寬網(wǎng)絡(luò),同時還可提供高級安全性功能。AI 和數(shù)據(jù)科學(xué)家以及軟硬件開發(fā)者均可充分利用高計算密度的優(yōu)勢來加速提升任何應(yīng)用的性能。AI 引擎機(jī)器學(xué)習(xí)擁有先進(jìn)的張量計算能力,非常適合用于高度優(yōu)化的 AI 和 M
    的頭像 發(fā)表于 09-18 09:16 ?238次閱讀
    AI引擎<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>陣列指南

    【「時間序列與機(jī)器學(xué)習(xí)」閱讀體驗】+ 鳥瞰這本書

    清晰,從時間序列分析的基礎(chǔ)理論出發(fā),逐步深入到機(jī)器學(xué)習(xí)算法在時間序列預(yù)測中的應(yīng)用,內(nèi)容全面,循序漸進(jìn)。每一章都經(jīng)過精心設(shè)計,對理論知識進(jìn)行了詳細(xì)的闡述,對實際案例進(jìn)行了生動的展示,使讀者在理論與實踐
    發(fā)表于 08-12 11:28

    【「時間序列與機(jī)器學(xué)習(xí)」閱讀體驗】+ 簡單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實地構(gòu)建了時間序列分析的基礎(chǔ)知識,更巧妙地展示了機(jī)器學(xué)習(xí)如何在這一領(lǐng)域發(fā)揮巨
    發(fā)表于 08-12 11:21

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無疑是兩大核心驅(qū)動力。它們各自以其獨(dú)特的方式推動著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來了革命性的變化。然而,盡管它們都屬于機(jī)器
    的頭像 發(fā)表于 07-01 11:40 ?934次閱讀

    大語言模型:原理與工程實踐+初識2

    前言 深度學(xué)習(xí)機(jī)器學(xué)習(xí)的分支,而大語言模型是深度學(xué)習(xí)的分支。機(jī)器學(xué)習(xí)的核心是讓計算機(jī)系統(tǒng)通過對
    發(fā)表于 05-13 00:09

    恩智浦云實驗室正式啟動人工智能創(chuàng)新實踐平臺

    兩年后,創(chuàng)新中心二期——人工智能創(chuàng)新實踐平臺也隨之啟動,這個總面積達(dá)1200平米的實踐場所融合了教育實訓(xùn)、技術(shù)交流、頭腦風(fēng)暴以及虛擬實驗等多
    的頭像 發(fā)表于 04-24 15:59 ?487次閱讀

    廣和通發(fā)布機(jī)器人開發(fā)平臺

    廣和通近日隆重發(fā)布了其全新研發(fā)的具身智能機(jī)器人開發(fā)平臺——Fibot。該平臺旨在滿足客戶在驗證Mobile ALOHA協(xié)同學(xué)習(xí)與簡單示教操作數(shù)據(jù)方面的需求,通過深度
    的頭像 發(fā)表于 03-29 09:34 ?514次閱讀

    NVIDIA Isaac機(jī)器人平臺升級,加速AI機(jī)器人技術(shù)革新

    NVIDIA Isaac機(jī)器人平臺近期實現(xiàn)重大升級,通過引入最新的生成式AI技術(shù)和先進(jìn)的仿真技術(shù),顯著加速了AI機(jī)器人技術(shù)的發(fā)展步伐。該平臺正不斷擴(kuò)展其基礎(chǔ)模型、機(jī)器人學(xué)習(xí)框架、AI工
    的頭像 發(fā)表于 03-27 10:36 ?565次閱讀

    榮湃半導(dǎo)體發(fā)布全新Pai8265xx系列柵極驅(qū)動器

    榮湃半導(dǎo)體近日宣布推出其最新研發(fā)的Pai8265xx系列柵極驅(qū)動器,該系列驅(qū)動器基于電容隔離技術(shù),集成了多種保護(hù)功能,專為驅(qū)動SiC、IGBT和MOSFET等功率管而設(shè)計。這款產(chǎn)品的推出,標(biāo)志著榮湃半導(dǎo)體在功率半導(dǎo)體領(lǐng)域的技術(shù)創(chuàng)新再次取得突破。
    的頭像 發(fā)表于 03-12 11:11 ?880次閱讀

    WiFi模塊助力少兒編程:創(chuàng)新學(xué)習(xí)實踐體驗

    隨著科技的飛速發(fā)展,少兒編程已經(jīng)成為培養(yǎng)孩子們創(chuàng)造力和問題解決能力的重要途徑之一。在這個過程中,WiFi模塊的應(yīng)用為少兒編程領(lǐng)域注入了新的活力,使得學(xué)習(xí)編程不再是單一的代碼教學(xué),而是一個充滿創(chuàng)新
    的頭像 發(fā)表于 03-08 16:35 ?316次閱讀

    人工智能和機(jī)器學(xué)習(xí)的頂級開發(fā)板有哪些?

    機(jī)器學(xué)習(xí)(ML)和人工智能(AI)不再局限于高端服務(wù)器或云平臺。得益于集成電路(IC)和軟件技術(shù)的新發(fā)展,在微型控制器和微型計算機(jī)上實現(xiàn)機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 02-29 18:59 ?657次閱讀
    人工智能和<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的頂級開發(fā)板有哪些?

    是德科技推出AI數(shù)據(jù)中心測試平臺旨在加速AI/ML網(wǎng)絡(luò)驗證和優(yōu)化的創(chuàng)新

    2024年2月29日,是德科技(Keysight Technologies,Inc.)宣布,針對人工智能(AI)和機(jī)器學(xué)習(xí)(ML)基礎(chǔ)設(shè)施生態(tài)系統(tǒng),推出了 AI數(shù)據(jù)中心測試平臺,旨在加速AI / ML網(wǎng)絡(luò)驗證和優(yōu)化的
    的頭像 發(fā)表于 02-29 09:32 ?541次閱讀
    是德科技推出AI數(shù)據(jù)中心測試<b class='flag-5'>平臺</b>旨在加速AI/ML網(wǎng)絡(luò)驗證和優(yōu)化的<b class='flag-5'>創(chuàng)新</b>

    物聯(lián)網(wǎng)與機(jī)器學(xué)習(xí)如何創(chuàng)造智能未來

    物聯(lián)網(wǎng)設(shè)備能產(chǎn)生大量數(shù)據(jù),機(jī)器學(xué)習(xí)算法可以評估分析這些數(shù)據(jù),兩者搭配相得益彰。機(jī)器學(xué)習(xí)作為人工智能的一部分,專門分析和解釋數(shù)據(jù)的模式及結(jié)構(gòu),以獲得見解并推動
    的頭像 發(fā)表于 11-11 08:23 ?862次閱讀
    物聯(lián)網(wǎng)與<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>如何創(chuàng)造智能未來

    深度學(xué)習(xí)算法和傳統(tǒng)機(jī)器視覺助力工業(yè)外觀檢測

    在很多人眼里,深度學(xué)習(xí)是一個非常神奇的技術(shù),是人工智能的未來,是機(jī)器學(xué)習(xí)的圣杯。今天深視創(chuàng)新帶您一起揭開他神秘的面紗,了解什么才是深度學(xué)習(xí)。
    的頭像 發(fā)表于 11-09 10:58 ?595次閱讀
    深度<b class='flag-5'>學(xué)習(xí)</b>算法和傳統(tǒng)<b class='flag-5'>機(jī)器</b>視覺助力工業(yè)外觀檢測