電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>PyTorch教程19.4之多保真超參數(shù)優(yōu)化

PyTorch教程19.4之多保真超參數(shù)優(yōu)化

2023-06-05 | pdf | 1.29 MB | 次下載 | 免費

資料介紹

即使在中等規(guī)模的數(shù)據(jù)集上,訓練神經(jīng)網(wǎng)絡也可能很昂貴。根據(jù)配置空間(第 19.1.1.2 節(jié)),超參數(shù)優(yōu)化需要數(shù)十到數(shù)百次函數(shù)評估才能找到性能良好的超參數(shù)配置。正如我們在19.3 節(jié)中看到的 ,我們可以通過利用并行資源顯著加快 HPO 的整體時鐘時間,但這并不會減少所需的總計算量。

在本節(jié)中,我們將展示如何加速超參數(shù)配置的評估。隨機搜索等方法為每個超參數(shù)評估分配相同數(shù)量的資源(例如,epoch 數(shù)、訓練數(shù)據(jù)點)。圖 19.4.1 描繪了一組使用不同超參數(shù)配置訓練的神經(jīng)網(wǎng)絡的學習曲線。經(jīng)過幾個 epoch 之后,我們已經(jīng)能夠在視覺上區(qū)分性能良好和次優(yōu)的配置。然而,學習曲線是嘈雜的,我們可能仍然需要全部 100 個 epoch 來確定表現(xiàn)最好的一個。

https://file.elecfans.com/web2/M00/AA/48/pYYBAGR9PYOAF8kfAAxEY-DeiWg543.svg

圖 19.4.1隨機超參數(shù)配置的學習曲線

多保真超參數(shù)優(yōu)化將更多資源分配給有前途的配置,并盡早停止對性能不佳的配置的評估。這加快了優(yōu)化過程,因為我們可以為相同的資源總量嘗試更多的配置。

更正式地說,我們擴展了第 19.1.1 節(jié)中的定義 ,這樣我們的目標函數(shù) f(x,r)獲得額外的輸入 r∈[rmin,rmax], 指定我們愿意為配置評估花費的資源量x. 我們假設錯誤 f(x,r)隨著r,而計算成本c(x,r)增加。通常, r表示訓練神經(jīng)網(wǎng)絡的時期數(shù),但它也可以是訓練子集大小或交叉驗證折疊數(shù)。

from collections import defaultdict
import numpy as np
from scipy import stats
from d2l import torch as d2l

d2l.set_figsize()

19.4.1。連續(xù)減半

使隨機搜索適應多保真度設置的最簡單方法之一是連續(xù)減半 Jamieson 和 Talwalkar,2016 年,Karnin等人,2013 年。基本思想是從N配置,例如從配置空間隨機采樣,并訓練它們中的每一個 rmin只有時代。然后,我們丟棄一部分表現(xiàn)最差的試驗,并對其余試驗進行更長時間的訓練。重復這個過程,更少的試驗運行更長時間,直到至少有一個試驗達到rmax時代。

更正式地說,考慮最低預算rmin(例如 1 個 epoch),最大預算rmax,例如 max_epochs在我們之前的例子中,還有一個減半常數(shù) η∈{2,3,…}. 為簡單起見,假設 rmax=rminηK, 和K∈I. 那么初始配置的數(shù)量是N=ηK. 讓我們定義一組梯級 R={rmin,rminη,rminη2,…,rmax}.

一輪連續(xù)減半的過程如下。我們從跑步開始N試驗到第一梯級rmin. 對驗證錯誤進行排序,我們保持頂部1/η分數(shù)(相當于ηK?1配置)并丟棄所有其余的。幸存的試驗被訓練用于下一個梯級(rminηepochs),然后重復該過程。在每個梯級,一個1/η部分試驗存活下來,他們的訓練繼續(xù)進行η倍大的預算。有了這個特別的選擇N, 只有一個試驗將被訓練到全部預算rmax. 一旦這樣一輪連續(xù)的減半完成,我們就會用一組新的初始配置開始下一輪,迭代直到總預算用完。

https://file.elecfans.com/web2/M00/A9/CE/poYBAGR9PYmAFbkqAAozwWvrwco526.svg

圖 19.4.2隨機超參數(shù)配置的學習曲線。

我們將第 19.2 節(jié)HPOScheduler的基類子類化 ,以實現(xiàn)連續(xù)減半,允許通用 對象對配置進行采樣(在我們下面的示例中,它將是 a )。此外,用戶必須通過最少的資源HPOSearcherRandomSearcherrmin, 最大資源 rmaxη作為輸入。在我們的調(diào)度程序中,我們維護一個配置隊列,這些配置仍需要針對當前梯級進行評估ri. 每次我們跳到下一個梯級時,我們都會更新隊列。

class SuccessiveHalvingScheduler(d2l.HPOScheduler): #@save
  def __init__(self, searcher, eta, r_min, r_max, prefact=1):
    self.save_hyperparameters()
    # Compute K, which is later used to determine the number of configurations
    self
下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1山景DSP芯片AP8248A2數(shù)據(jù)手冊
  2. 1.06 MB  |  532次下載  |  免費
  3. 2RK3399完整板原理圖(支持平板,盒子VR)
  4. 3.28 MB  |  339次下載  |  免費
  5. 3TC358743XBG評估板參考手冊
  6. 1.36 MB  |  330次下載  |  免費
  7. 4DFM軟件使用教程
  8. 0.84 MB  |  295次下載  |  免費
  9. 5元宇宙深度解析—未來的未來-風口還是泡沫
  10. 6.40 MB  |  227次下載  |  免費
  11. 6迪文DGUS開發(fā)指南
  12. 31.67 MB  |  194次下載  |  免費
  13. 7元宇宙底層硬件系列報告
  14. 13.42 MB  |  182次下載  |  免費
  15. 8FP5207XR-G1中文應用手冊
  16. 1.09 MB  |  178次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費
  3. 2555集成電路應用800例(新編版)
  4. 0.00 MB  |  33566次下載  |  免費
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費
  7. 4開關電源設計實例指南
  8. 未知  |  21549次下載  |  免費
  9. 5電氣工程師手冊免費下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費
  11. 6數(shù)字電路基礎pdf(下載)
  12. 未知  |  13750次下載  |  免費
  13. 7電子制作實例集錦 下載
  14. 未知  |  8113次下載  |  免費
  15. 8《LED驅(qū)動電路設計》 溫德爾著
  16. 0.00 MB  |  6656次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
  4. 78.1 MB  |  537798次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420027次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191187次下載  |  免費
  13. 7十天學會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183279次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138040次下載  |  免費