0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

奇虎360團(tuán)隊(duì)與人工智能研究院聯(lián)合開(kāi)發(fā)了深度學(xué)習(xí)調(diào)度平臺(tái)XLearning

8g3K_AI_Thinker ? 2018-01-02 15:24 ? 次閱讀

近兩年人工智能技術(shù)發(fā)展迅速,以Google開(kāi)源的TensorFlow為代表的各種深度學(xué)習(xí)框架層出不窮。為了方便算法工程師使用各類(lèi)深度學(xué)習(xí)技術(shù),減少繁雜的諸如運(yùn)行環(huán)境部署運(yùn)維等工作,提升GPU硬件資源利用率,節(jié)省硬件投入成本,奇虎360系統(tǒng)部大數(shù)據(jù)團(tuán)隊(duì)與人工智能研究院聯(lián)合開(kāi)發(fā)了深度學(xué)習(xí)調(diào)度平臺(tái)——XLearning。

XLearning平臺(tái)將大數(shù)據(jù)與深度學(xué)習(xí)相融合,基于Hadoop Yarn完成了對(duì)TensorFlow、MXNet、Caffe、Theano、PyTorch、Keras、XGBoost等常用深度學(xué)習(xí)框架的集成,是典型的“AI on Hadoop”的實(shí)現(xiàn)。XLearning從今年(2017)4月份正式開(kāi)發(fā)上線運(yùn)行,經(jīng)多次版本迭代更新,為各學(xué)習(xí)框架的使用者提供了統(tǒng)一、穩(wěn)定的調(diào)度平臺(tái),實(shí)現(xiàn)了資源共享,極大的提高了資源利用率,并且具有良好的擴(kuò)展性和兼容性。目前已經(jīng)在公司搜索、人工智能研究院、商業(yè)化、數(shù)據(jù)中心等業(yè)務(wù)部門(mén)廣泛使用。

XLearning架構(gòu)

奇虎360團(tuán)隊(duì)與人工智能研究院聯(lián)合開(kāi)發(fā)了深度學(xué)習(xí)調(diào)度平臺(tái)XLearning

Client:XLearning客戶端,負(fù)責(zé)啟動(dòng)作業(yè)及獲取作業(yè)執(zhí)行狀態(tài);

ApplicationMaster(AM):負(fù)責(zé)輸入數(shù)據(jù)分片、啟動(dòng)及管理Container、執(zhí)行日志保存等;

Container:作業(yè)的實(shí)際執(zhí)行者,負(fù)責(zé)啟動(dòng)Worker或PS(Parameter Server)進(jìn)程,監(jiān)控并向AM匯報(bào)進(jìn)程狀態(tài),上傳作業(yè)的輸出等。對(duì)于TensorFlow類(lèi)型作業(yè),還負(fù)責(zé)啟動(dòng)TensorBoard服務(wù)。

XLearning功能特性

XLearning雖然架構(gòu)簡(jiǎn)潔,但具有豐富的功能方便用戶進(jìn)行模型訓(xùn)練,并依托于Yarn提供有作業(yè)資源的統(tǒng)一管理。

支持多種深度學(xué)習(xí)框架

XLearning支持TensorFlow、MXNet分布式和單機(jī)模式,支持所有的單機(jī)模式的深度學(xué)習(xí)框架,如Caffe、Theano、PyTorch等。對(duì)于同一個(gè)深度學(xué)習(xí)框架支持多版本和自定義版本,滿足用戶個(gè)性化需求,不受限于集群機(jī)器上各學(xué)習(xí)框架的安裝版本。

基于HDFS的統(tǒng)一數(shù)據(jù)管理

XLearning提供多種模式用于數(shù)據(jù)的輸入、輸出,包括數(shù)據(jù)的流式讀寫(xiě)、直接HDFS讀寫(xiě)等,可根據(jù)作業(yè)處理的數(shù)據(jù)量與集群機(jī)器硬盤(pán)容量,視情況決定所采用的讀寫(xiě)方式。

可視化界面

為方便用戶查看作業(yè)信息,XLearning提供可視化界面用于展示作業(yè)執(zhí)行進(jìn)度和輸出日志等內(nèi)容。作業(yè)執(zhí)行完畢后,亦可查看日志內(nèi)容,便于分析訓(xùn)練過(guò)程進(jìn)展。對(duì)于TensorFlow類(lèi)型作業(yè),支持TensorBoard服務(wù)。作業(yè)運(yùn)行界面大致分為三部分(如下圖所示):

All Containers:顯示當(dāng)前作業(yè)所含Container列表及各Container對(duì)應(yīng)信息,如Contianer ID、所在機(jī)器(Container Host)、所屬類(lèi)型(Container Role)、當(dāng)前執(zhí)行狀態(tài)(Container Status)、開(kāi)始時(shí)間(Start Time)、結(jié)束時(shí)間(Finish Time)、執(zhí)行進(jìn)度(Reporter Progress);

View TensorBoard:當(dāng)作業(yè)類(lèi)型為T(mén)ensorFlow時(shí),可點(diǎn)擊該鏈接直接跳轉(zhuǎn)至TensorBoard頁(yè)面;

Save Model:用戶可在作業(yè)執(zhí)行過(guò)程中,可以將當(dāng)前訓(xùn)練模型的輸出結(jié)果上傳至HDFS,并顯示目前已上傳的模型列表。

奇虎360團(tuán)隊(duì)與人工智能研究院聯(lián)合開(kāi)發(fā)了深度學(xué)習(xí)調(diào)度平臺(tái)XLearning

原生代碼兼容

XLearning支持TensorFlow分布式模式的ClusterSpec自動(dòng)分配構(gòu)建,單機(jī)模式和其他深度學(xué)習(xí)框架代碼不用做任何修改即可遷移到XLearning上,便于用戶快速使用。

Checkpoint功能

利用深度學(xué)習(xí)框架本身的Checkpoint機(jī)制和直接讀寫(xiě)HDFS數(shù)據(jù)功能,XLearning方便用戶實(shí)現(xiàn)訓(xùn)練恢復(fù)繼續(xù)執(zhí)行。

XLearning開(kāi)源版本環(huán)境依賴簡(jiǎn)單,可直接運(yùn)行于社區(qū)Hadoop版本,使用方便,入門(mén)學(xué)習(xí)成本極低。公司的Yarn版本是我們?cè)谏鐓^(qū)版本上做了不少增強(qiáng),比如支持GPU的資源調(diào)度、GPU通信親和性的感知、DockerContainer支持等。依賴于這些特性公司在用的版本多出了GPU資源調(diào)度支持、作業(yè)Docker化、臨時(shí)GPU虛擬機(jī)、Container Metrics可視化圖表展示等功能。這些功能我們后續(xù)會(huì)通過(guò)提供Yarn Patch或者開(kāi)源自用Yarn版本來(lái)分享給大家,也歡迎大家隨時(shí)跟我們溝通。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46348

    瀏覽量

    236506
  • 奇虎360
    +關(guān)注

    關(guān)注

    0

    文章

    12

    瀏覽量

    8099
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5437

    瀏覽量

    120791

原文標(biāo)題:奇虎360開(kāi)源深度學(xué)習(xí)調(diào)度平臺(tái)XLearning

文章出處:【微信號(hào):AI_Thinker,微信公眾號(hào):人工智能頭條】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    天津大學(xué)與中科視拓共建“人工智能聯(lián)合實(shí)驗(yàn)室”

    大數(shù)據(jù)平臺(tái)人工智能教學(xué)科研實(shí)驗(yàn)平臺(tái)開(kāi)發(fā)等方面展開(kāi)深度合作,共同推動(dòng)天津大學(xué)人工智能高層次人才的
    發(fā)表于 05-25 10:19

    百度深度學(xué)習(xí)研究院科學(xué)家深度講解人工智能

    的研發(fā)經(jīng)驗(yàn)。在過(guò)去的工作中,他發(fā)表過(guò)論文十余篇,申請(qǐng)中國(guó)專利超過(guò)100項(xiàng),其中已經(jīng)授權(quán)的有95項(xiàng)。他曾任職百度深度學(xué)習(xí)研究院,負(fù)責(zé)人臉識(shí)別方向,曾經(jīng)多次帶領(lǐng)團(tuán)隊(duì)在主流的人臉檢測(cè)、人臉識(shí)
    發(fā)表于 07-19 10:01

    前百度深度學(xué)習(xí)研究院科學(xué)家分享:機(jī)器視覺(jué)開(kāi)發(fā)實(shí)戰(zhàn)經(jīng)驗(yàn)

    其實(shí)就是計(jì)算機(jī)科學(xué)的一個(gè)分支,將來(lái)也是會(huì)成為人類(lèi)社會(huì)基礎(chǔ)設(shè)施的一部分?,F(xiàn)在我們邀請(qǐng)來(lái)百度深度學(xué)習(xí)研究院科學(xué)家,為大家分享人工智能視覺(jué)開(kāi)發(fā)的經(jīng)
    發(fā)表于 07-20 11:06

    【免費(fèi)名額30個(gè)】手把手教你快速學(xué)習(xí)和應(yīng)用人工智能技術(shù)

    專業(yè)領(lǐng)域研究方向和產(chǎn)品化設(shè)計(jì),將暫時(shí)不對(duì)在校學(xué)生開(kāi)放技術(shù)亮點(diǎn):MATLAB 與人工智能面向工程實(shí)現(xiàn)的 MATLAB 深度學(xué)習(xí)開(kāi)發(fā)流程使用 M
    發(fā)表于 09-12 11:21

    人工智能醫(yī)生未來(lái)或上線,人工智能醫(yī)療市場(chǎng)規(guī)模持續(xù)增長(zhǎng)

    +醫(yī)療市場(chǎng)規(guī)模持續(xù)增長(zhǎng)   由廣州市婦女兒童醫(yī)療中心教授夏慧敏、加州大學(xué)圣地亞哥分校教授張康等專家領(lǐng)銜的醫(yī)療數(shù)據(jù)智能化應(yīng)用團(tuán)隊(duì)聯(lián)合人工智能研究
    發(fā)表于 02-24 09:29

    人工智能、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)深度學(xué)習(xí)的關(guān)系

    人工智能、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)深度學(xué)習(xí)之間,主要有什么關(guān)系?
    發(fā)表于 03-16 11:35

    RPA與人工智能的相連

    RPA與人工智能
    發(fā)表于 04-13 09:23

    嵌入式與人工智能關(guān)系是什么

    嵌入式與人工智能關(guān)系_嵌入式人工智能的發(fā)展趨勢(shì)  所謂嵌入式人工智能,就是設(shè)備無(wú)須聯(lián)網(wǎng)通過(guò)云端數(shù)據(jù)中心進(jìn)行大規(guī)模計(jì)算去實(shí)現(xiàn)人工智能,而是在本地計(jì)算,在不聯(lián)網(wǎng)的情況下就可以做實(shí)時(shí)的環(huán)境感
    發(fā)表于 10-27 07:41

    什么叫嵌入式,以及與人工智能的關(guān)系

    以下均采集于網(wǎng)上資料和個(gè)人總結(jié)綱要一、什么叫嵌入式,以及與人工智能的關(guān)系?二、嵌入式崗位三、淺談嵌入式開(kāi)發(fā)優(yōu)缺點(diǎn)四、與互聯(lián)網(wǎng)(CS相關(guān)的,如平臺(tái)服務(wù)器,前端/APP/軟件)對(duì)比五、能力要求和薪資
    發(fā)表于 11-08 08:49

    基于RK3399ProD的人工智能開(kāi)發(fā)深度學(xué)習(xí)課程分享

    基于RK3399ProD的人工智能開(kāi)發(fā)深度學(xué)習(xí)課程分享
    發(fā)表于 02-11 08:54

    什么是人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和自然語(yǔ)言處理?

    領(lǐng)域,包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)挖掘、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理和其他幾個(gè)學(xué)科。首先,人工智能涉及使計(jì)算機(jī)具有自我意識(shí),利用計(jì)算機(jī)視覺(jué)、自然語(yǔ)言理解和模仿其他感官。其次,
    發(fā)表于 03-22 11:19

    廣州國(guó)際人工智能產(chǎn)業(yè)研究院掛牌 主要開(kāi)展人工智能前沿技術(shù)的研究

    近日,廣州國(guó)際人工智能產(chǎn)業(yè)研究院在廣州南沙自貿(mào)區(qū)掛牌。該研究院由亞信集團(tuán)建設(shè),主要開(kāi)展人工智能、大數(shù)據(jù)等前沿技術(shù)的研究、產(chǎn)品
    的頭像 發(fā)表于 01-03 15:32 ?2849次閱讀

    前百度深度學(xué)習(xí)研究院科學(xué)家分享:機(jī)器視覺(jué)開(kāi)發(fā)實(shí)戰(zhàn)!

    具有16年的計(jì)算機(jī)視覺(jué)和人工智能方向的研發(fā)經(jīng)驗(yàn),在過(guò)去的工作中,他發(fā)表過(guò)論文十余篇,申請(qǐng)中國(guó)專利超過(guò)100項(xiàng),其中已經(jīng)授權(quán)的有95項(xiàng)。他曾任職百度深度學(xué)習(xí)研究院,負(fù)責(zé)人臉識(shí)別方向,曾經(jīng)
    的頭像 發(fā)表于 07-19 15:43 ?336次閱讀

    虛擬現(xiàn)實(shí)與人工智能研究院在長(zhǎng)江三角洲建成

    2019年1月5日,由西北工業(yè)大學(xué)太倉(cāng)長(zhǎng)三角研究院和域圓科技共同成立的虛擬現(xiàn)實(shí)與人工智能研究院正式投用。該研究院依托西工大的人才優(yōu)勢(shì)和技術(shù)優(yōu)勢(shì),瞄準(zhǔn)高端
    發(fā)表于 03-07 17:45 ?621次閱讀

    針對(duì)人工智能法國(guó)設(shè)立4所研究院

    和創(chuàng)新機(jī)構(gòu)參與人工智能跨學(xué)科研究院項(xiàng)目的候選,經(jīng)過(guò)國(guó)際評(píng)審團(tuán)的審查和評(píng)估,這4處研究中心正式被冠名“人工智能跨學(xué)科
    發(fā)表于 07-03 15:48 ?359次閱讀