0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

華裔女博士提出:Facebook提出用于超參數(shù)調(diào)整的自我監(jiān)督學(xué)習(xí)框架

人工智能與大數(shù)據(jù)技術(shù) ? 來源:新智元 ? 作者:新智元 ? 2021-04-26 09:45 ? 次閱讀

來源:Facebook

【導(dǎo)讀】Facebook的研究人員近日提出了一種用于超參數(shù)調(diào)整的自我監(jiān)督學(xué)習(xí)框架。這個新模型實現(xiàn)了準(zhǔn)確預(yù)測的結(jié)果,估計超參數(shù)的速度快了6到20倍。

近日,F(xiàn)acebook的研究人員提出了一種新的用于模型選擇(SSL-MS) 和超參數(shù)調(diào)整(SSL-HPT)的自監(jiān)督學(xué)習(xí)框架,該框架以較少的計算時間和資源提供準(zhǔn)確的預(yù)測。

與基于基線搜索的算法相比,SSL-HPT 算法估計超參數(shù)的速度快了6-20倍,同時在各種應(yīng)用中產(chǎn)生了比較準(zhǔn)確的預(yù)測結(jié)果。

SSL:估算超參數(shù)速度快6-20倍

在時間序列分析(用于發(fā)現(xiàn)趨勢或預(yù)測未來值)中,超參數(shù)的細(xì)微差別可能導(dǎo)致給定模型的非常不同的預(yù)測結(jié)果。

因此,選擇最優(yōu)的超參數(shù)值顯得尤為重要。

大多數(shù)現(xiàn)有的超參數(shù)調(diào)整方法,如網(wǎng)格搜索、隨機(jī)搜索和貝葉斯最優(yōu)搜索,都是基于一個關(guān)鍵組件: 搜索。

因此,它們計算代價非常昂貴,不能應(yīng)用于快速、可擴(kuò)展的時間序列超參數(shù)調(diào)整。

研究人員提出的框架 SSL-HPT 使用時間序列特征作為輸入(不犧牲精確度的情況下),在較短的時間內(nèi)產(chǎn)生最佳的超參數(shù)。

那么,它們是如何工作的呢?

研究人員開發(fā)的自監(jiān)督學(xué)習(xí)框架在預(yù)測時的兩個主要任務(wù): SSL-MS 和 SSL-HPT。

SSL-MS: SSL-MS 的自我監(jiān)督學(xué)習(xí)框架包括三個步驟,如下所示:

1eef003a-a610-11eb-aece-12bb97331649.png

1 離線訓(xùn)練數(shù)據(jù)準(zhǔn)備: 獲得每個時間序列的時間序列特征和每個時間序列的最佳性能模型通過離線超參數(shù)調(diào)整。

2 離線訓(xùn)練: 利用步驟1中的數(shù)據(jù)訓(xùn)練分類器(自我監(jiān)督學(xué)習(xí)者) ,其中輸入特征(預(yù)測器)是時間序列特征,標(biāo)記是步驟1中性能最好的模型。

3 線模型預(yù)測: 在線服務(wù)中,對于新的時間序列數(shù)據(jù),提取特征,然后使用預(yù)先訓(xùn)練的分類器進(jìn)行推理,例如隨機(jī)森林模型。

SSL-MS 的工作流程可以自然地擴(kuò)展到 SSL-HPT。

如下圖所示,給定一個模型,探索每個時間序列在預(yù)定義參數(shù)空間內(nèi)的所有超參數(shù)設(shè)置。

對于輸入 x,研究者在這里使用的時間序列特征與 SSL-MS 相同。

自監(jiān)督學(xué)習(xí)器一經(jīng)訓(xùn)練,就可以直接對超參數(shù)進(jìn)行預(yù)測,并針對任何新的時間序列數(shù)據(jù)產(chǎn)生預(yù)測結(jié)果。

1f1286c2-a610-11eb-aece-12bb97331649.png

最終,研究人員通過在內(nèi)部和外部數(shù)據(jù)集上對新型算法進(jìn)行了實證評估,并得到了相似的結(jié)論。

SSL 框架可以極大地提高模型選擇和超參數(shù)調(diào)整的效率,以可比的預(yù)測精度減少6-20倍的運(yùn)行時間。

預(yù)測為什么重要?

預(yù)測是 Facebook 的核心數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)任務(wù)之一,因此提供快速、可靠、準(zhǔn)確的預(yù)測結(jié)果和大量的時間序列數(shù)據(jù)對自身的業(yè)務(wù)非常重要。

這個框架的應(yīng)用包括容量規(guī)劃和管理、需求預(yù)測、能源預(yù)測和異常檢測。

計算技術(shù)的迅速發(fā)展使企業(yè)能夠跟蹤大量的時間序列數(shù)據(jù)集。因此,定期預(yù)測數(shù)百萬個時間序列的需求正變得越來越普遍。

但是,要獲得大量時間序列的快速且準(zhǔn)確的預(yù)測仍然具有挑戰(zhàn)性。

Facebook新提出的 SSL 框架提供了一個高效的解決方案,以低計算成本和短運(yùn)行時間提供高質(zhì)量的預(yù)測結(jié)果。

這種方法獨(dú)立于特定的預(yù)測模型和算法,因此享有單個預(yù)測技術(shù)的優(yōu)勢,例如 Prophet 模型的可解釋性。

初步分析表明, SSL框架可以擴(kuò)展到模型推薦,并在Facebook內(nèi)部 AX 庫中增強(qiáng)貝葉斯優(yōu)化算法。

論文一作:普渡大學(xué)華人學(xué)者

這篇論文一作是普渡大學(xué)大學(xué)的研究員Peiyi Zhang。

Peiyi Zhang本科畢業(yè)于浙江大學(xué),并在康奈爾大學(xué)獲得了碩士學(xué)位,普渡大學(xué)獲得了博士學(xué)位。

去年6月,她還在Facebook進(jìn)行了兩個月的實習(xí)。

Peiyi Zhang曾獲得洛杉磯市數(shù)據(jù)分析項目榮譽(yù)獎、浙江大學(xué)學(xué)生科研訓(xùn)練計劃優(yōu)秀獎、大學(xué)生數(shù)學(xué)建模競賽優(yōu)秀獎。

Xiaodong Jiang是本片論文的第二作者,他目前在Facebook工作,擔(dān)任基礎(chǔ)設(shè)施研究數(shù)據(jù)科學(xué)家,開發(fā)通用時間序列分析工具。

他在佐治亞大學(xué)獲得了碩士和博士學(xué)位。

參考資料

https://ai.facebook.com/blog/large-scale-forecasting-self-supervised-learning-framework-for-hyper-parameter-tuning/

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SSL
    SSL
    +關(guān)注

    關(guān)注

    0

    文章

    122

    瀏覽量

    25699
  • 分類器
    +關(guān)注

    關(guān)注

    0

    文章

    152

    瀏覽量

    13158

原文標(biāo)題:華裔女博士生一作:Facebook提出用于超參數(shù)調(diào)整的自我監(jiān)督學(xué)習(xí)框架

文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    哈爾濱工業(yè)大學(xué)在分辨顯微成像技術(shù)領(lǐng)域取得突破性進(jìn)展

    近日,哈爾濱工業(yè)大學(xué)儀器學(xué)院先進(jìn)光電成像技術(shù)研究室(IPIC)李浩宇教授團(tuán)隊在生物醫(yī)學(xué)分辨顯微成像技術(shù)領(lǐng)域取得突破性進(jìn)展。針對目前活體細(xì)胞分辨成像領(lǐng)域中光子效率不足的難題,團(tuán)隊提出一種基于無
    的頭像 發(fā)表于 09-27 06:33 ?131次閱讀
    哈爾濱工業(yè)大學(xué)在<b class='flag-5'>超</b>分辨顯微成像技術(shù)領(lǐng)域取得突破性進(jìn)展

    Linux操作系統(tǒng)運(yùn)行參數(shù)自動調(diào)整技術(shù)

    Linux操作系統(tǒng)運(yùn)行參數(shù)的自動調(diào)整是一個復(fù)雜而關(guān)鍵的技術(shù),它可以顯著提高系統(tǒng)性能、穩(wěn)定性和資源利用率。通過使用自適應(yīng)算法特別是內(nèi)核態(tài)的機(jī)器學(xué)習(xí)框架、性能監(jiān)控工具和配置管理工具,能夠在
    的頭像 發(fā)表于 08-22 09:53 ?207次閱讀
    Linux操作系統(tǒng)運(yùn)行<b class='flag-5'>參數(shù)</b>自動<b class='flag-5'>調(diào)整</b>技術(shù)

    【《大語言模型應(yīng)用指南》閱讀體驗】+ 基礎(chǔ)知識學(xué)習(xí)

    收集海量的文本數(shù)據(jù)作為訓(xùn)練材料。這些數(shù)據(jù)集不僅包括語法結(jié)構(gòu)的學(xué)習(xí),還包括對語言的深層次理解,如文化背景、語境含義和情感色彩等。 自監(jiān)督學(xué)習(xí):模型采用自監(jiān)督學(xué)習(xí)策略,在大量無標(biāo)簽文本數(shù)據(jù)上學(xué)習(xí)
    發(fā)表于 08-02 11:03

    NVIDIA推出全新深度學(xué)習(xí)框架fVDB

    在 SIGGRAPH 上推出的全新深度學(xué)習(xí)框架用于打造自動駕駛汽車、氣候科學(xué)和智慧城市的 AI 就緒型虛擬表示。
    的頭像 發(fā)表于 08-01 14:31 ?462次閱讀

    【《大語言模型應(yīng)用指南》閱讀體驗】+ 基礎(chǔ)篇

    講解,包括偏置、權(quán)重、激活函數(shù);三要素包括網(wǎng)絡(luò)結(jié)構(gòu)、損失函數(shù)和優(yōu)化方法。章節(jié)最后總結(jié)了神經(jīng)網(wǎng)絡(luò)參數(shù)學(xué)習(xí)的關(guān)鍵步驟。 1.4章節(jié)描述了自然語言處理的相關(guān)知識點(diǎn),包括什么是自然語言處理、文本的向量化和自監(jiān)督學(xué)習(xí)
    發(fā)表于 07-25 14:33

    神經(jīng)網(wǎng)絡(luò)如何用無監(jiān)督算法訓(xùn)練

    神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的重要組成部分,其訓(xùn)練方式多樣,其中無監(jiān)督學(xué)習(xí)是一種重要的訓(xùn)練策略。無監(jiān)督學(xué)習(xí)旨在從未標(biāo)記的數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)內(nèi)在的結(jié)構(gòu)、模式或規(guī)律,從而提取有用的特征表示。這種訓(xùn)練方式對于大規(guī)模未
    的頭像 發(fā)表于 07-09 18:06 ?632次閱讀

    深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法綜述

    應(yīng)用中往往難以實現(xiàn)。因此,無監(jiān)督學(xué)習(xí)在深度學(xué)習(xí)中扮演著越來越重要的角色。本文旨在綜述深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法,包括自編碼器、生成對抗網(wǎng)絡(luò)、聚類算法等,并分析它們的原理、應(yīng)用場景以及優(yōu)
    的頭像 發(fā)表于 07-09 10:50 ?277次閱讀

    谷歌提出大規(guī)模ICL方法

    谷歌DeepMind團(tuán)隊近日取得了一項突破性的研究成果。他們提出了強(qiáng)化和無監(jiān)督兩種新型的ICL(In-Context Learning)學(xué)習(xí)方法,這一創(chuàng)新技術(shù)能夠在多個領(lǐng)域顯著提升模型的性能。
    的頭像 發(fā)表于 05-14 14:17 ?289次閱讀

    阿里達(dá)摩院提出“知識鏈”框架,降低大模型幻覺

    近日,阿里巴巴達(dá)摩院(湖畔實驗室)攜手新加坡南洋理工大學(xué)等研究機(jī)構(gòu),共同推出了大模型知識鏈(CoK)框架。該框架不僅可實時檢索異構(gòu)知識源,還能逐步糾正推理錯誤,有效提高了大模型在回答知識型問題時的準(zhǔn)確率,并顯著降低了所謂的“幻覺現(xiàn)象”。
    的頭像 發(fā)表于 05-10 11:46 ?616次閱讀

    機(jī)器學(xué)習(xí)8大調(diào)參技巧

    今天給大家一篇關(guān)于機(jī)器學(xué)習(xí)調(diào)參技巧的文章。參數(shù)調(diào)優(yōu)是機(jī)器學(xué)習(xí)例程中的基本步驟之一。該方法也稱為參數(shù)
    的頭像 發(fā)表于 03-23 08:26 ?518次閱讀
    機(jī)器<b class='flag-5'>學(xué)習(xí)</b>8大調(diào)參技巧

    谷歌模型框架是什么軟件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌開發(fā)的用于機(jī)器學(xué)習(xí)和人工智能的軟件框架,其中最著名的是TensorFlow。TensorFlow是一個開源的機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 03-01 16:25 ?722次閱讀

    谷歌發(fā)布ASPIRE訓(xùn)練框架,提升AI選擇性預(yù)測能力

    框架分為三步驟:“特定任務(wù)調(diào)整”、“答案采樣”以及“自我評估學(xué)習(xí)”。首先,“特定任務(wù)調(diào)整”階段針對基本訓(xùn)練的大型語言模型進(jìn)一步深化訓(xùn)練,重
    的頭像 發(fā)表于 01-23 11:19 ?465次閱讀

    基于transformer和自監(jiān)督學(xué)習(xí)的路面異常檢測方法分享

    鋪設(shè)異常檢測可以幫助減少數(shù)據(jù)存儲、傳輸、標(biāo)記和處理的壓力。本論文描述了一種基于Transformer和自監(jiān)督學(xué)習(xí)的新方法,有助于定位異常區(qū)域。
    的頭像 發(fā)表于 12-06 14:57 ?1328次閱讀
    基于transformer和自<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>的路面異常檢測方法分享

    香港大學(xué)最新提出!實現(xiàn)超現(xiàn)實的人類圖像生成:HyperHuman

    最后,為了進(jìn)一步提高視覺質(zhì)量,我們提出了一種結(jié)構(gòu)引導(dǎo)細(xì)化器來組合預(yù)測條件,以更詳細(xì)地生成更高分辨率。大量的實驗表明,我們的框架具有最先進(jìn)的性能,可以在不同的場景下生成逼真的人類圖像。
    的頭像 發(fā)表于 11-27 16:03 ?678次閱讀
    香港大學(xué)最新<b class='flag-5'>提出</b>!實現(xiàn)超現(xiàn)實的人類圖像生成:HyperHuman

    一種利用幾何信息的自監(jiān)督單目深度估計框架

    本文方法是一種自監(jiān)督的單目深度估計框架,名為GasMono,專門設(shè)計用于室內(nèi)場景。本方法通過應(yīng)用多視圖幾何的方式解決了室內(nèi)場景中幀間大旋轉(zhuǎn)和低紋理導(dǎo)致自監(jiān)督深度估計困難的挑戰(zhàn)。
    發(fā)表于 11-06 11:47 ?360次閱讀
    一種利用幾何信息的自<b class='flag-5'>監(jiān)督</b>單目深度估計<b class='flag-5'>框架</b>