0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

SOK將HugeCTR中的高級(jí)特性進(jìn)行包裝使用

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:HugeCTR ? 2022-04-07 16:02 ? 次閱讀

1. Introduction

HugeCTR 能夠高效地利用 GPU 來(lái)進(jìn)行推薦系統(tǒng)的訓(xùn)練,為了使它還能直接被其他 DL 用戶,比如 TensorFlow 所直接使用,我們開(kāi)發(fā)了 SparseOperationKit (SOK),來(lái)將 HugeCTR 中的高級(jí)特性封裝為 TensorFlow 可直接調(diào)用的形式,從而幫助用戶在 TensorFlow 中直接使用 HugeCTR 中的高級(jí)特性來(lái)加速他們的推薦系統(tǒng)。

pYYBAGJOmyGAEKlZAACdxZaXMq8920.png

圖 1. SOK embedding 工作流程

SOK 以數(shù)據(jù)并行的方式接收輸入數(shù)據(jù),然后在 SOK 內(nèi)部做黑盒式地模型轉(zhuǎn)換,最后將計(jì)算結(jié)果以數(shù)據(jù)并行的方式傳遞給初始 GPU。這種方式可以盡可能少地修改用戶已有的代碼,以更方便、快捷地在多個(gè) GPU 上進(jìn)行擴(kuò)展。

SOK 不僅僅是加速了 TensorFlow 中的算子,而是根據(jù)業(yè)界中的實(shí)際需求提供了對(duì)應(yīng)的新解決方案,比如說(shuō) GPU HashTable。SOK 可以與 TensorFlow 1.15 和 TensorFlow 2.x 兼容使用;既可以使用 TensorFlow 自帶的通信工具,也可以使用 Horovod 等第三方插件來(lái)作為 embedding parameters 以為參數(shù)的通信工具。

2. TF2 Comparison/Performance

使用 MLPerf 的標(biāo)準(zhǔn)模型 DLRM 來(lái)對(duì) SOK 的性能進(jìn)行測(cè)試。

poYBAGJOmyiAeiA8AADnMNf4awU433.png

圖 2. SOK性能測(cè)試數(shù)據(jù)

相比于 NVIDIA 的 DeepLearning Examples,使用 SOK 可以獲得更快的訓(xùn)練速度以及更高的吞吐量。

3. API

SOK 提供了簡(jiǎn)潔的、類 TensorFlow 的 API;使用 SOK 的方式非常簡(jiǎn)單、直接;讓用戶通過(guò)修改幾行代碼就可以使用 SOK。

定義模型結(jié)構(gòu)

poYBAGJOmy2ARBajAADRQdPyK68016.png

左側(cè)是使用 TensorFlow 的 API 來(lái)搭建模型,右側(cè)是使用 SOK 的 API 來(lái)搭建相同的模型。使用 SOK 來(lái)搭建模型的時(shí)候,只需要將 TensorFlow 中的 Embedding Layer 替換為 SOK 對(duì)應(yīng)的 API 即可。

使用 Horovod 來(lái)定義 training loop

pYYBAGJOmziAPRIaAAEf6YbWwDc794.png

同樣的,左側(cè)是使用 TensorFlow 來(lái)定義 training loop,右側(cè)是使用 SOK 時(shí),training loop 的定義方式??梢钥吹?,使用 SOK 時(shí),只需要對(duì) Embedding Variables 和 Dense Variables 進(jìn)行分別處理即可。其中,Embedding Variables 部分由 SOK 管理,Dense Variables 由 TensorFlow 管理。

使用 tf.distribute.MirroredStrategy 來(lái)定義 training loop

poYBAGJOm0WAXaRPAAFOJm89KHA665.png

類似的,還可以使用 TensorFlow 自帶的通信工具來(lái)定義 training loop。

開(kāi)始訓(xùn)練

pYYBAGJOm02AGDvJAACSvcfi_CM767.png

在開(kāi)始訓(xùn)練過(guò)程時(shí),使用 SOK 與使用 TensorFlow 時(shí)所用代碼完全一致。

4. 結(jié)語(yǔ)

SOK 將 HugeCTR 中的高級(jí)特性包裝為 TensorFlow 可以直接使用的模塊,通過(guò)修改少數(shù)幾行代碼即可在已有模型代碼中利用上 HugeCTR 的的先進(jìn)設(shè)計(jì)。

關(guān)于作者

NVIDIA GPU 計(jì)算專家研發(fā)團(tuán)隊(duì)成立于2020年7月,主要面向全球用戶開(kāi)發(fā)基于英偉達(dá)通用計(jì)算產(chǎn)品的軟件解決方案。 目前團(tuán)隊(duì)致力于推薦系統(tǒng)訓(xùn)練框架 Merlin HugeCTR的開(kāi)發(fā)。作為Merlin 系統(tǒng)三大核心軟件之一,Merlin HugeCTR 是一套針對(duì)于推薦系統(tǒng)設(shè)計(jì)的模型訓(xùn)練框架。項(xiàng)目啟動(dòng)于2018年,目前產(chǎn)品應(yīng)用于多家國(guó)際互聯(lián)網(wǎng)公司,自2020年以來(lái),HugeCTR持續(xù)參與并推動(dòng)國(guó)際性競(jìng)賽MLPerf DLRM訓(xùn)練項(xiàng)目,從而實(shí)現(xiàn)了業(yè)界領(lǐng)先的優(yōu)化性能。 NVIDIA GPU 計(jì)算專家研發(fā)團(tuán)隊(duì)是一個(gè)小型國(guó)際化工程團(tuán)隊(duì),核心成員來(lái)自于多個(gè)國(guó)家(中國(guó),韓國(guó),荷蘭,德國(guó)),客戶分布于世界各地。日常工作使用英語(yǔ)溝通。 團(tuán)隊(duì)主要工作圍繞軟件產(chǎn)品開(kāi)發(fā)展開(kāi),涉及產(chǎn)品維護(hù)、文檔、測(cè)試、發(fā)布、部署,日常工作中與各國(guó)硬件、產(chǎn)品、工程、客戶支持團(tuán)隊(duì)有著緊密的合作。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4818

    瀏覽量

    102655
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4640

    瀏覽量

    128487
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    明達(dá)IO——搭建包裝產(chǎn)線新方案

    包裝行業(yè)在商品銷售扮演著至關(guān)重要的角色,其可以按照多種方式進(jìn)行分類,如按包裝容器、包裝材料、包裝
    的頭像 發(fā)表于 10-15 11:04 ?119次閱讀
    明達(dá)IO——搭建<b class='flag-5'>包裝</b>產(chǎn)線新方案

    利用新型ePWM特性進(jìn)行多相控制

    電子發(fā)燒友網(wǎng)站提供《利用新型ePWM特性進(jìn)行多相控制.pdf》資料免費(fèi)下載
    發(fā)表于 09-24 11:25 ?0次下載
    利用新型ePWM<b class='flag-5'>特性</b><b class='flag-5'>進(jìn)行</b>多相控制

    MT6835 磁編碼 IC 技術(shù)在全自動(dòng)紙包裝機(jī)的應(yīng)用

    一、引言 在現(xiàn)代包裝行業(yè),效率和精度是衡量生產(chǎn)設(shè)備性能的關(guān)鍵指標(biāo)。全自動(dòng)紙包裝機(jī)作為包裝生產(chǎn)線的重要設(shè)備,其性能的優(yōu)劣直接影響到產(chǎn)品的
    的頭像 發(fā)表于 08-15 16:34 ?218次閱讀
    MT6835 磁編碼 IC 技術(shù)在全自動(dòng)紙<b class='flag-5'>包裝</b>機(jī)<b class='flag-5'>中</b>的應(yīng)用

    宏工科技發(fā)力包裝領(lǐng)域,解決超細(xì)粉料包裝難點(diǎn)

    宏工科技不斷在物料處理鏈條上加大研發(fā)力度,攻克了一系列“卡脖子”技術(shù)難題,以技術(shù)創(chuàng)新鑄就宏工的“品牌力”。以包裝領(lǐng)域?yàn)槔?,針?duì)不同的包裝需求,宏工科技目前在工業(yè)包裝領(lǐng)域已推出了噸袋包裝
    的頭像 發(fā)表于 08-15 14:54 ?244次閱讀
    宏工科技發(fā)力<b class='flag-5'>包裝</b>領(lǐng)域,解決超細(xì)粉料<b class='flag-5'>包裝</b>難點(diǎn)

    熱收縮膜包裝機(jī)的主要作用

    熱收縮膜包裝機(jī)又稱熱收縮包裝機(jī)(也稱為收縮包裝機(jī)、熱收縮機(jī)、收縮機(jī)、膜包機(jī)等),主要作用是產(chǎn)品用熱收縮薄膜裹包后再進(jìn)行加熱,使薄膜收縮后
    的頭像 發(fā)表于 08-15 11:43 ?411次閱讀

    SOK在手機(jī)行業(yè)的應(yīng)用案例

    通過(guò)封裝 NVIDIA Merlin HugeCTR,Sparse Operation Kit(以下簡(jiǎn)稱 SOK)使得 TensorFlow 用戶可以借助 HugeCTR 的一些相關(guān)特性
    的頭像 發(fā)表于 07-25 10:01 ?258次閱讀
    <b class='flag-5'>SOK</b>在手機(jī)行業(yè)的應(yīng)用案例

    元器件的包裝方式及常見(jiàn)的四種方式

    四種元件包裝方式在實(shí)際生產(chǎn)和使用中廣泛應(yīng)用,不同的包裝方式適用于不同類型和規(guī)格的元件,并且可以根據(jù)具體要求進(jìn)行定制化的包裝設(shè)計(jì)。不同的包裝
    的頭像 發(fā)表于 06-27 12:58 ?1045次閱讀

    機(jī)器視覺(jué)檢測(cè):薯愿外包裝檢測(cè)

    食品及包裝行業(yè)中常常需要對(duì)產(chǎn)品的包裝盒、包裝袋表面進(jìn)行缺陷檢測(cè),其檢測(cè)內(nèi)容包括產(chǎn)品混料、外包裝破損、臟污等,機(jī)器視覺(jué)技術(shù)能夠通過(guò)拍照或掃描取
    的頭像 發(fā)表于 05-08 13:36 ?382次閱讀
    機(jī)器視覺(jué)檢測(cè):薯愿外<b class='flag-5'>包裝</b>檢測(cè)

    激光打標(biāo)機(jī)在食品包裝行業(yè)的應(yīng)用與優(yōu)勢(shì)

    激光打標(biāo)機(jī)在食品包裝行業(yè)的應(yīng)用與優(yōu)勢(shì)如下:應(yīng)用:1.激光打標(biāo)機(jī)可以用于食品包裝袋、瓶蓋、罐頭等包裝材料的打標(biāo)和雕刻,打印生產(chǎn)日期、保質(zhì)期、批次號(hào)、二維碼等信息。2.激光打標(biāo)機(jī)還可以用
    的頭像 發(fā)表于 02-27 18:05 ?442次閱讀
    激光打標(biāo)機(jī)在食品<b class='flag-5'>包裝</b>行業(yè)<b class='flag-5'>中</b>的應(yīng)用與優(yōu)勢(shì)

    自動(dòng)稱重包裝機(jī)如何數(shù)據(jù)采集到云平臺(tái)進(jìn)行監(jiān)控管理

    企業(yè)的生產(chǎn)管理,數(shù)據(jù)采集和監(jiān)控管理起著至關(guān)重要的作用。 云平臺(tái)是一種基于互聯(lián)網(wǎng)的計(jì)算方式,可以提供彈性計(jì)算、存儲(chǔ)和應(yīng)用服務(wù)。將自動(dòng)稱重包裝機(jī)的數(shù)據(jù)采集到云平臺(tái),可以實(shí)現(xiàn)對(duì)生產(chǎn)數(shù)據(jù)的實(shí)時(shí)監(jiān)控、遠(yuǎn)程管理和智能
    的頭像 發(fā)表于 02-20 15:42 ?390次閱讀
    自動(dòng)稱重<b class='flag-5'>包裝</b>機(jī)如何數(shù)據(jù)采集到云平臺(tái)<b class='flag-5'>進(jìn)行</b>監(jiān)控管理

    熱收縮膜包裝機(jī)數(shù)據(jù)采集遠(yuǎn)程監(jiān)控系統(tǒng)如何實(shí)現(xiàn)

    熱收縮膜包裝機(jī)是一種使用熱收縮膜對(duì)產(chǎn)品進(jìn)行包裝的設(shè)備。它的工作原理是先將熱收縮膜加熱至軟化狀態(tài)并緊緊地包裹在產(chǎn)品上,最后通過(guò)快速冷卻使膜收縮并固化,從而緊緊地貼合在產(chǎn)品表面,形成緊密、透明的包裝效果
    的頭像 發(fā)表于 01-23 17:15 ?337次閱讀
    熱收縮膜<b class='flag-5'>包裝</b>機(jī)數(shù)據(jù)采集遠(yuǎn)程監(jiān)控系統(tǒng)如何實(shí)現(xiàn)

    modbus TCP轉(zhuǎn)CAN連接良好的包裝機(jī),快速實(shí)施,無(wú)需編程使命必達(dá)。

    任何工業(yè)設(shè)備集成到其包裝機(jī),并與其控制系統(tǒng)進(jìn)行通信。此外,我們還為客戶提供技術(shù)支持安全遠(yuǎn)程訪問(wèn)以進(jìn)行故障排除,滿足客戶自由選擇他們的設(shè)備
    的頭像 發(fā)表于 01-10 10:59 ?386次閱讀

    漲知識(shí)了!元器件包裝標(biāo)簽的“e”代碼,原來(lái)是這個(gè)含義……

    漲知識(shí)了!元器件包裝標(biāo)簽的“e”代碼,原來(lái)是這個(gè)含義……
    的頭像 發(fā)表于 12-06 15:43 ?1060次閱讀

    電源適配器的包裝和運(yùn)輸過(guò)程需要注意哪些事項(xiàng)?

    電源適配器的包裝和運(yùn)輸過(guò)程需要注意哪些事項(xiàng)? 電源適配器是電子產(chǎn)品必不可少的一部分,而包裝和運(yùn)輸對(duì)于保證產(chǎn)品的完好還原以及減少損壞都有著至關(guān)重要的作用。所以,在電源適配器的
    的頭像 發(fā)表于 11-23 14:38 ?1052次閱讀

    真空充氮包裝機(jī)遠(yuǎn)程監(jiān)控運(yùn)維平臺(tái)解決方案

    物品的保質(zhì)期,并提高它們的保存質(zhì)量。真空充氮包裝機(jī)集制氮?dú)狻⒊檎婵?、充氮?dú)?、熱封多種功能為一體的設(shè)備,過(guò)程涉及真空度、工作壓力、氮?dú)鉂舛取?b class='flag-5'>包裝速度、重量、產(chǎn)量及電機(jī)電壓電流等參數(shù)等,需要實(shí)時(shí)監(jiān)控并
    的頭像 發(fā)表于 11-02 14:36 ?674次閱讀
    真空充氮<b class='flag-5'>包裝</b>機(jī)遠(yuǎn)程監(jiān)控運(yùn)維平臺(tái)解決方案