0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Merlin HugeCTR V3.4.1版本新增內(nèi)容介紹

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-03-10 10:15 ? 次閱讀

Merlin HugeCTR(以下簡稱 HugeCTR)是 GPU 加速的推薦程序框架,旨在在多個(gè) GPU 和節(jié)點(diǎn)之間分配訓(xùn)練并估計(jì)點(diǎn)擊率(Click-through rate)。

此次v3.4更新涉及的模塊主要為:

HugeCTR 分級(jí)參數(shù)服務(wù)器

HugeCTR Python API

相關(guān)介紹:

HugeCTR 分級(jí)參數(shù)服務(wù)器介紹

V3.4.1 版本新增內(nèi)容

調(diào)整了整個(gè)代碼庫中日志消息的日志級(jí)別。

現(xiàn)已支持對(duì)具有多個(gè)標(biāo)簽的數(shù)據(jù)集進(jìn)行推理:

“Softmax” 層現(xiàn)在已支持 FP16,并且支持混合精度以進(jìn)行多標(biāo)簽推理。

支持多 GPU 離線推理:

我們通過 Python 接口支持多 GPU 離線推理,它可以利用Hierarchical Parameter Server并在多個(gè)設(shè)備上實(shí)現(xiàn)并發(fā)執(zhí)行。更多信息請(qǐng)參考推理 API和多 GPU 離線推理筆記本。

HPS 已構(gòu)建為獨(dú)立庫:

我們重構(gòu)了代碼庫并將分層參數(shù)服務(wù)器構(gòu)建為一個(gè)獨(dú)立的庫,以后會(huì)進(jìn)一步封裝。

metadata.json 簡介:

添加了有關(guān) Parquet data 中 _metadata.json 的詳細(xì)信息。

增加了用于估計(jì)每個(gè) GPU 的詞匯量大小的文檔和工具:

我們添加了一個(gè)工具來計(jì)算每個(gè) GPU 的不同嵌入類型的詞匯量大小,在此基礎(chǔ)上,workspace_size_per_gpu_in_mb 可以根據(jù)嵌入向量大小和優(yōu)化器類型評(píng)估更多信息請(qǐng)參考腳本。

訓(xùn)練中支持 HDFS :

a. 現(xiàn)在支持從 HDFS 加載和存儲(chǔ)模型和優(yōu)化器狀態(tài)。

b. 增加了編譯選項(xiàng)使 HDFS 的支持更加靈活。

c. 添加了一個(gè)筆記本來展示如何將 HugeCTR 與 HDFS 一起使用:

增加了一個(gè)演示如何分析模型文件的 Python 腳本和筆記本

錯(cuò)誤修復(fù):

修復(fù)了SOK 中的鏡像策略錯(cuò)誤

修復(fù)了無法在nvcr.io/nvidia/merlin/merlin-tensorflow-training:22.02中導(dǎo)入稀疏操作工具包的問題。

HugeCTR 參數(shù)服務(wù)器:修復(fù)了在未配置 RocksDB 時(shí),可能會(huì)在初始化期間發(fā)生的訪問沖突問題。

已知問題

HugeCTR 使用 NCCL 在 rank 之間共享數(shù)據(jù),并且 NCCL 可能需要共享系統(tǒng)內(nèi)存用于 IPC 和固定(頁面鎖定)系統(tǒng)內(nèi)存資源。在容器內(nèi)使用 NCCL 時(shí),建議您通過發(fā)出以下命令(-shm-size=1g -ulimit memlock=-1) 來增加這些資源。

另見 NCCL 的 已知問題

還有 GitHub 問題

目前即使目標(biāo) Kafka broker 無響應(yīng),KafkaProducers 啟動(dòng)也會(huì)成功。為了避免與來自 Kafka 的流模型更新相關(guān)的數(shù)據(jù)丟失,您必須確保有足夠數(shù)量的 Kafka brokers 啟動(dòng)、正常工作并且可以從運(yùn)行 HugeCTR 的節(jié)點(diǎn)訪問。

文件列表中的數(shù)據(jù)文件數(shù)量應(yīng)不小于數(shù)據(jù)讀取器的數(shù)量。否則,不同的 worker 將被映射到同一個(gè)文件,從而導(dǎo)致數(shù)據(jù)加載不會(huì)按預(yù)期進(jìn)行。

正則化器暫不支持聯(lián)合損失訓(xùn)練。

原文標(biāo)題:Merlin HugeCTR v3.4.1 發(fā)布說明

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4638

    瀏覽量

    128464
  • 節(jié)點(diǎn)
    +關(guān)注

    關(guān)注

    0

    文章

    216

    瀏覽量

    24337
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    8872

    瀏覽量

    84968

原文標(biāo)題:Merlin HugeCTR v3.4.1 發(fā)布說明

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    實(shí)時(shí)網(wǎng)絡(luò)的仿真和配置工具RTaW Pegase v4.6版本更新

    隨著嵌入式系統(tǒng)日益復(fù)雜,高效可靠的設(shè)計(jì)工具變得愈發(fā)重要。RTaW公司的仿真工具RTaW-Pegase最新發(fā)布的4.6版本,為用戶帶來了一系列重要更新和功能增強(qiáng)。本文將詳細(xì)介紹
    的頭像 發(fā)表于 09-26 08:07 ?173次閱讀
    實(shí)時(shí)網(wǎng)絡(luò)的仿真和配置工具RTaW Pegase <b class='flag-5'>v</b>4.6<b class='flag-5'>版本</b>更新

    NVIDIA Parabricks v4.3.1版本的新功能

    會(huì)(ESHG)上發(fā)布,其加入了新的體細(xì)胞數(shù)據(jù)變異檢測(cè)功能,并將業(yè)內(nèi)領(lǐng)先的工具升級(jí)到最新版本。這個(gè)版本是繼在 NVIDIA GTC 2024 大會(huì)上發(fā)布 Parabricks v4.3 之后推出的新
    的頭像 發(fā)表于 09-10 10:22 ?276次閱讀
    NVIDIA Parabricks <b class='flag-5'>v</b>4.3.1<b class='flag-5'>版本</b>的新功能

    SOK在手機(jī)行業(yè)的應(yīng)用案例

    通過封裝 NVIDIA Merlin HugeCTR,Sparse Operation Kit(以下簡稱 SOK)使得 TensorFlow 用戶可以借助 HugeCTR 的一些相關(guān)特性和優(yōu)化加速 GPU 上的分布式 Embed
    的頭像 發(fā)表于 07-25 10:01 ?253次閱讀
    SOK在手機(jī)行業(yè)的應(yīng)用案例

    微軟發(fā)布智能辦公工具OfficePLUS V 3.0版本

    近日,微軟發(fā)布了智能辦公工具 OfficePLUS V 3.0 版本。全新升級(jí)的 OfficePLUS V 3.0 新增了 Excel 插件,繼已發(fā)布的 PPT/Word 插件之后,
    的頭像 發(fā)表于 06-27 09:26 ?596次閱讀

    ENV-Windows v2.0.0版本發(fā)布

    ENV-Windows v2.0.0版本發(fā)布
    的頭像 發(fā)表于 06-26 08:35 ?488次閱讀
    ENV-Windows <b class='flag-5'>v</b>2.0.0<b class='flag-5'>版本</b>發(fā)布

    chrome插件新版本v3版本)中的熱更新,即加載更新遠(yuǎn)程js的方法探索

    1 主流方案及嘗試 現(xiàn)在瀏覽器插件中,大多采用直接調(diào)用遠(yuǎn)程代碼的方式進(jìn)行熱更新,由于安全策略逐步增強(qiáng),越來越不支持熱更新了;chrome在新v3版本插件中直接給禁止了;對(duì)于v2版本則即
    的頭像 發(fā)表于 06-14 10:19 ?658次閱讀
    chrome插件新<b class='flag-5'>版本</b>(<b class='flag-5'>v</b>3<b class='flag-5'>版本</b>)中的熱更新,即加載更新遠(yuǎn)程js的方法探索

    LwIP v2.0版本更換為v2.1.2版本后接收不到數(shù)據(jù)了怎么解決?

    請(qǐng)教下,吧 LwIP v2.0 版本更換為 v2.1.2 版本后接收不到數(shù)據(jù)了,是怎么回事啊 ?? 之前使用 v2.0
    發(fā)表于 04-23 08:20

    美國Merlin公司加速自主飛行模擬器開發(fā)

    美國Merlin公司正全力加速自主飛行模擬器的開發(fā)進(jìn)程,以推動(dòng)航空領(lǐng)域的創(chuàng)新與發(fā)展。這一舉措不僅體現(xiàn)了Merlin公司在技術(shù)研發(fā)方面的雄厚實(shí)力,也預(yù)示著自主飛行技術(shù)即將迎來新的突破。
    的頭像 發(fā)表于 04-22 11:30 ?519次閱讀

    達(dá)實(shí)智能正式發(fā)布AIoT智能物聯(lián)網(wǎng)管控平臺(tái)V6版本

    近日,在達(dá)實(shí)智能成立29周年慶典上,公司正式發(fā)布AIoT智能物聯(lián)網(wǎng)管控平臺(tái)V6版本。
    的頭像 發(fā)表于 03-20 16:42 ?1319次閱讀
    達(dá)實(shí)智能正式發(fā)布AIoT智能物聯(lián)網(wǎng)管控平臺(tái)<b class='flag-5'>V</b>6<b class='flag-5'>版本</b>

    機(jī)智云“智家”APP V4.4.22版本發(fā)布

    新功能上線版本更新親愛的機(jī)友們,迎來了機(jī)智云智家APP全新版本V4.4.22的發(fā)布!此次更新,我們?yōu)槟鷰砹艘幌盗袑?shí)用的功能優(yōu)化和全新的體驗(yàn),讓智能生活更加便捷、智慧!更新內(nèi)容一覽01
    的頭像 發(fā)表于 03-16 08:09 ?344次閱讀
    機(jī)智云“智家”APP <b class='flag-5'>V</b>4.4.22<b class='flag-5'>版本</b>發(fā)布

    Embedded office發(fā)布安全插件V1.1版本!

    Embedded office很高興地宣布安全插件V1.1版本的發(fā)布了!現(xiàn)在通過外部設(shè)備或不同核心架構(gòu)的專門通道支持端到端受保護(hù)的安全通信。
    的頭像 發(fā)表于 02-20 11:12 ?523次閱讀

    AtomGit教程 | v0.8.0版本震撼升級(jí),11大功能搶先看!

    協(xié)作的安全保障,并顯著提升使用便捷性。 代碼倉加密 為了進(jìn)一步保護(hù)您的代碼倉庫,v0.8.0版本新增了代碼倉的加密功能。AtomGit代碼倉加密是通過在云端對(duì)托管在AtomGit的代碼庫進(jìn)行落盤加密,可以有效避免數(shù)據(jù)擁有者之外的
    的頭像 發(fā)表于 01-04 19:55 ?1431次閱讀
    AtomGit教程 | <b class='flag-5'>v</b>0.8.0<b class='flag-5'>版本</b>震撼升級(jí),11大功能搶先看!

    Vivado 2023.2版本新增功能

    Vivado在前一段時(shí)間更新了2023.2版本,經(jīng)過一段時(shí)間的使用這個(gè)版本還是很絲滑的,用起來挺舒服。
    的頭像 發(fā)表于 01-02 09:39 ?2619次閱讀
    Vivado 2023.2<b class='flag-5'>版本</b>的<b class='flag-5'>新增</b>功能

    OpenHarmony 4.0 Release版本發(fā)布,新增4000+ API

    近日,OpenHarmony 4.0 Release版本如期發(fā)布,開發(fā)套件同步升級(jí)到API 10。相比3.2 Release版本,OpenHarmony 4.0 Release版本新增
    的頭像 發(fā)表于 11-13 11:31 ?766次閱讀

    Moku 3.1版本升級(jí)!Moku:Lab、Moku:Pro新增支持邏輯分析儀

    Moku:Lab、Moku:Pro新增支持邏輯分析儀多儀器并行模式支持同時(shí)多窗口界面交互!LiquidInstruments宣布發(fā)布Moku3.1版本重要升級(jí)。此次更新對(duì)Moku:Pro、Moku
    的頭像 發(fā)表于 11-03 08:16 ?398次閱讀
    Moku 3.1<b class='flag-5'>版本</b>升級(jí)!Moku:Lab、Moku:Pro<b class='flag-5'>新增</b>支持邏輯分析儀