0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾四大層面,提升DeepRec訓(xùn)練和推理能力

英特爾中國(guó) ? 來(lái)源:英特爾中國(guó) ? 作者:英特爾中國(guó) ? 2022-07-10 10:56 ? 次閱讀

從淘寶到天貓應(yīng)用,從搜索、推薦到廣告等場(chǎng)景,對(duì)井噴式的數(shù)據(jù)進(jìn)行超大規(guī)模訓(xùn)練推理的應(yīng)用,已經(jīng)在我們身邊落地開花。阿里巴巴集團(tuán)的開源推薦引擎 DeepRec (PAI-TF) 主要用于稀疏模型訓(xùn)練和預(yù)測(cè),可支撐千億特征、萬(wàn)億樣本的超大規(guī)模稀疏訓(xùn)練。

從2019 年開始,英特爾就與阿里巴巴PAI團(tuán)隊(duì)緊密合作,將英特爾 AI 技術(shù)應(yīng)用到 DeepRec 中。特別是英特爾處理器內(nèi)置的英特爾DL Boost (英特爾深度學(xué)習(xí)加速),為 DeepRec 實(shí)現(xiàn)了四個(gè)層面上的優(yōu)化:框架優(yōu)化、算子優(yōu)化、子圖優(yōu)化和模型優(yōu)化。

四大層面,提升DeepRec 訓(xùn)練和推理能力

自英特爾 至強(qiáng) 可擴(kuò)展處理器問(wèn)世以來(lái),通過(guò)從 AVX-256 升級(jí)到 AVX-512,英特爾將 AVX 的能力提高了一倍,極大地提升了深度學(xué)習(xí)訓(xùn)練和推理能力。第三代英特爾 至強(qiáng) 可擴(kuò)展處理器之后,英特爾推出支持 BFloat16 (BF16) 數(shù)據(jù)類型的指令集,也應(yīng)用到 DeepRec 的優(yōu)化中。

框架優(yōu)化:DeepRec 集成了英特爾開源的跨平臺(tái)深度學(xué)習(xí)性能加速庫(kù)oneDNN (oneAPI Deep Neural Network Library),該程序庫(kù)已經(jīng)針對(duì)大量主流算子實(shí)現(xiàn)了性能優(yōu)化。與搭載 BF16 指令的第三代英特爾至強(qiáng)可擴(kuò)展處理器同時(shí)使用,可顯著提高模型訓(xùn)練和推理性能。

算子優(yōu)化:搜索廣告推薦模型中存在著大量稀疏算子,調(diào)用 AVX-512 指令加以優(yōu)化后,大幅提升了數(shù)據(jù)讀寫效率和性能。

子圖優(yōu)化:圖優(yōu)化是 AI 性能優(yōu)化的主要有效手段之一。在大規(guī)模稀疏場(chǎng)景下,DeepRec 加入多種子圖融合功能,減少大量冗余操作,配合英特爾 AVX-512 指令加速,實(shí)現(xiàn)了子圖性能的明顯提升。

模型優(yōu)化:基于CPU 平臺(tái),英特爾在 DeepRec 構(gòu)建了涵蓋多個(gè)主流模型的獨(dú)有推薦模型集合,涉及召回、排序、多目標(biāo)等多種常見場(chǎng)景;并針對(duì)硬件平臺(tái)進(jìn)行性能優(yōu)化,相較于其他框架在 CPU 平臺(tái)上帶來(lái)跨越式性能提升。

阿里巴巴 PAI 團(tuán)隊(duì)的測(cè)試結(jié)果證明:基于 Criteo 數(shù)據(jù)集,使用BF16優(yōu)化后,模型WDL精度或AUC可以逼近FP32,并且BF16模型的訓(xùn)練性能提升達(dá)1.4倍,效果顯著。

未來(lái),英特爾還會(huì)從優(yōu)化器算子、attention 子圖、添加多目標(biāo)模型等多個(gè)角度進(jìn)一步實(shí)施優(yōu)化,更大程度地發(fā)揮 CPU 平臺(tái)硬件優(yōu)勢(shì)、尤其是新硬件特征的效果最大化,從而為稀疏場(chǎng)景打造更高性能的 CPU 解決方案。

當(dāng)然,英特爾為 DeepRec 的優(yōu)化并不僅限于 CPU 層面。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    60

    文章

    9822

    瀏覽量

    171133
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10778

    瀏覽量

    210483

原文標(biāo)題:發(fā)揮CPU平臺(tái)硬件優(yōu)勢(shì),英特爾助力DeepRec優(yōu)化超大規(guī)模稀疏訓(xùn)練

文章出處:【微信號(hào):英特爾中國(guó),微信公眾號(hào):英特爾中國(guó)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    英特爾AI PC無(wú)所不能的實(shí)力

    百業(yè)的最后一公里問(wèn)題。而客戶端的AI能力也在不斷提升,最終將解決個(gè)人AI的數(shù)據(jù)隱私和個(gè)性化問(wèn)題??梢?,AI非常適合云邊端三級(jí)架構(gòu),按照用戶場(chǎng)景進(jìn)行針對(duì)性部署。英特爾為云邊端都提供了強(qiáng)大的AI解決方案。
    的頭像 發(fā)表于 10-12 10:26 ?304次閱讀

    四大核心展區(qū),英特爾在工博會(huì)展現(xiàn)AI與制造深度融合

    2024年9月25日,上?!??在第24屆中國(guó)國(guó)際工業(yè)博覽會(huì)(CIIF)上,英特爾攜手多家生態(tài)合作伙伴亮相展會(huì),通過(guò)精心布局的 “機(jī)器視覺”、“負(fù)載整合”、“工業(yè)控制”、及“工業(yè)AI與大模型”四大
    的頭像 發(fā)表于 09-27 09:30 ?205次閱讀
    <b class='flag-5'>四大</b>核心展區(qū),<b class='flag-5'>英特爾</b>在工博會(huì)展現(xiàn)AI與制造深度融合

    開箱即用,AISBench測(cè)試展示英特爾至強(qiáng)處理器的卓越推理性能

    近期,第五代英特爾?至強(qiáng)?可擴(kuò)展處理器通過(guò)了中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院組織的人工智能服務(wù)器系統(tǒng)性能測(cè)試(AISBench)。英特爾成為首批通過(guò)AISBench大語(yǔ)言模型(LLM)推理性能測(cè)試的企業(yè)
    的頭像 發(fā)表于 09-06 15:33 ?227次閱讀
    開箱即用,AISBench測(cè)試展示<b class='flag-5'>英特爾</b>至強(qiáng)處理器的卓越<b class='flag-5'>推理</b>性能

    英特爾CEO:AI時(shí)代英特爾動(dòng)力不減

    英特爾CEO帕特·基辛格堅(jiān)信,在AI技術(shù)的飛速發(fā)展之下,英特爾的處理器仍能保持其核心地位?;粮窆_表示,摩爾定律仍然有效,而英特爾在處理器和芯片技術(shù)上的創(chuàng)新能力將持續(xù)驅(qū)動(dòng)公司前進(jìn)。
    的頭像 發(fā)表于 06-06 10:04 ?337次閱讀

    英特爾助力京東云用CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈

    英特爾助力京東云用CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈
    的頭像 發(fā)表于 05-27 11:50 ?444次閱讀
    <b class='flag-5'>英特爾</b>助力京東云用CPU加速AI<b class='flag-5'>推理</b>,以大模型構(gòu)建數(shù)智化供應(yīng)鏈

    英特爾Gaudi 3 AI芯片:5nm工藝設(shè)計(jì),訓(xùn)練推理皆強(qiáng)

    此外,英特爾在發(fā)布會(huì)上還宣布更改旗下數(shù)據(jù)中心CPU產(chǎn)品名稱:原“Granite Rapids”和“Sierra Forest”將更名為“Xeon 6”系列。新品預(yù)計(jì)今年發(fā)售,并支持性能提升后的標(biāo)準(zhǔn)化 MXFP4 數(shù)據(jù)格式。
    的頭像 發(fā)表于 04-10 11:10 ?552次閱讀

    浪潮信息與英特爾合作推出一種大模型效率工具“YuanChat”

    3月26日,浪潮信息與英特爾正式宣布,浪潮信息“源2.0系列基礎(chǔ)大模型”已和最新的英特爾? 酷睿? Ultra處理器平臺(tái)完成適配,本地推理速度提升100%。
    的頭像 發(fā)表于 03-27 13:50 ?535次閱讀
    浪潮信息與<b class='flag-5'>英特爾</b>合作推出一種大模型效率工具“YuanChat”

    借助英特爾? QAT從而顯著提升網(wǎng)絡(luò)和存儲(chǔ)應(yīng)用的性能

    全新第代和第五代英特爾? 至強(qiáng)? 可擴(kuò)展處理器內(nèi)置英特爾? 數(shù)據(jù)保護(hù)與壓縮加速技術(shù)(英特爾? QAT),可通過(guò)卸載計(jì)算密集型工作負(fù)載來(lái)降低 CPU 占用率,從而顯著
    的頭像 發(fā)表于 03-18 16:25 ?802次閱讀
    借助<b class='flag-5'>英特爾</b>? QAT從而顯著<b class='flag-5'>提升</b>網(wǎng)絡(luò)和存儲(chǔ)應(yīng)用的性能

    借助英特爾DLB技術(shù)優(yōu)化網(wǎng)絡(luò)性能

    英特爾? DLB技術(shù)的出現(xiàn),無(wú)疑為數(shù)據(jù)處理和網(wǎng)絡(luò)傳輸領(lǐng)域帶來(lái)了一場(chǎng)革命性的變革。通過(guò)其獨(dú)特的負(fù)載均衡、數(shù)據(jù)包調(diào)度優(yōu)先排序以及降低網(wǎng)絡(luò)流量時(shí)延的能力,英特爾? DLB顯著提升了高數(shù)據(jù)包速
    的頭像 發(fā)表于 03-11 09:52 ?526次閱讀

    英特爾1nm投產(chǎn)時(shí)間曝光!領(lǐng)先于臺(tái)積電

    英特爾行業(yè)芯事
    深圳市浮思特科技有限公司
    發(fā)布于 :2024年02月28日 16:28:32

    英特爾登頂2023年全球半導(dǎo)體榜單之首

    英特爾行業(yè)芯事
    深圳市浮思特科技有限公司
    發(fā)布于 :2024年02月01日 11:55:16

    CPU也可以完美運(yùn)行大模型 英特爾第五代至強(qiáng)重磅發(fā)布

    大語(yǔ)言模型(LLM)已經(jīng)在多個(gè)領(lǐng)域展示出了卓越的性能和巨大的潛力,然而,要想真正發(fā)揮出這些模型的強(qiáng)大能力,需要強(qiáng)大的算力基礎(chǔ)設(shè)施,而芯片是關(guān)鍵。 千呼萬(wàn)喚始出來(lái),第五代英特爾?? 至強(qiáng)?? 可擴(kuò)展
    的頭像 發(fā)表于 12-22 11:52 ?561次閱讀
    CPU也可以完美運(yùn)行大模型 <b class='flag-5'>英特爾</b>第五代至強(qiáng)重磅發(fā)布

    英特爾:讓我們一起消滅CUDA

    基爾辛格認(rèn)為:"由于推理的發(fā)生,一旦你訓(xùn)練了模型......就不會(huì)依賴CUDA。"關(guān)鍵在于,你能否很好地運(yùn)行該模型?他表示,英特爾將利用今日首次在舞臺(tái)上展示的 Gaudi3 迎接挑戰(zhàn),并利用至強(qiáng)和邊緣PC實(shí)現(xiàn)這一目標(biāo)
    的頭像 發(fā)表于 12-15 17:12 ?932次閱讀

    英特爾:玻璃基板將推動(dòng)算力提升

    的應(yīng)用的算力需求。 ? ? ? ?雖然玻璃基板對(duì)整個(gè)半導(dǎo)體行業(yè)而言并不陌生,但憑借龐大的制造規(guī)模和優(yōu)秀的技術(shù)人才,英特爾將其提升到了一個(gè)新的水平。近日,英特爾封裝測(cè)試技術(shù)開發(fā)(Assembly Test Technology D
    的頭像 發(fā)表于 12-06 09:31 ?392次閱讀

    #高通 #英特爾 #Elite 高通X Elite芯片或終結(jié)蘋果、英特爾的芯片王朝

    高通英特爾蘋果
    深圳市浮思特科技有限公司
    發(fā)布于 :2023年10月27日 16:46:07