電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>PyTorch教程12.6之勢(shì)頭

PyTorch教程12.6之勢(shì)頭

2023-06-05 | pdf | 0.73 MB | 次下載 | 免費(fèi)

資料介紹

第 12.4 節(jié)中,我們回顧了在執(zhí)行隨機(jī)梯度下降時(shí)會(huì)發(fā)生什么,即,在只有梯度的噪聲變體可用的情況下執(zhí)行優(yōu)化時(shí)。特別是,我們注意到對(duì)于噪聲梯度,我們?cè)谶x擇面對(duì)噪聲的學(xué)習(xí)率時(shí)需要格外謹(jǐn)慎。如果我們將它降低得太快,收斂就會(huì)停滯。如果我們過(guò)于寬容,我們將無(wú)法收斂到一個(gè)足夠好的解決方案,因?yàn)樵肼晻?huì)不斷驅(qū)使我們遠(yuǎn)離最優(yōu)解。

12.6.1。基本

在本節(jié)中,我們將探索更有效的優(yōu)化算法,尤其是針對(duì)實(shí)踐中常見(jiàn)的某些類型的優(yōu)化問(wèn)題。

12.6.1.1。漏平均值

在上一節(jié)中,我們討論了小批量 SGD 作為加速計(jì)算的一種方法。它還有一個(gè)很好的副作用,即平均梯度減少了方差量。小批量隨機(jī)梯度下降可以通過(guò)以下方式計(jì)算:

(12.6.1)gt,t?1=?w1|Bt|∑i∈Btf(xi,wt?1)=1|Bt|∑i∈Bthi,t?1.

為了保持符號(hào)簡(jiǎn)單,我們?cè)谶@里使用 hi,t?1=?wf(xi,wt?1) 作為樣本的隨機(jī)梯度下降i使用及時(shí)更新的權(quán)重t?1. 如果我們能夠從方差減少的效果中受益,甚至超越小批量的平均梯度,那就太好了。完成此任務(wù)的一個(gè)選擇是用“l(fā)eaky average”代替梯度計(jì)算:

(12.6.2)vt=βvt?1+gt,t?1

對(duì)于一些β∈(0,1). 這有效地將瞬時(shí)梯度替換為對(duì)多個(gè)過(guò)去梯度進(jìn)行平均的梯度 。v稱為速度。它積累了過(guò)去的梯度,類似于一個(gè)重球從目標(biāo)函數(shù)景觀上滾下來(lái)如何對(duì)過(guò)去的力進(jìn)行積分。為了更詳細(xì)地了解發(fā)生了什么,讓我們展開(kāi)vt遞歸地進(jìn)入

(12.6.3)vt=β2vt?2+βgt?1,t?2+gt,t?1=…,=∑τ=0t?1βτgt?τ,t?τ?1.

大的β相當(dāng)于長(zhǎng)期平均水平,而小 β僅相當(dāng)于相對(duì)于梯度法的輕微修正。新的梯度替換不再指向特定實(shí)例上最速下降的方向,而是指向過(guò)去梯度的加權(quán)平均值的方向。這使我們能夠?qū)崿F(xiàn)批量平均的大部分好處,而無(wú)需實(shí)際計(jì)算其梯度的成本。稍后我們將更詳細(xì)地重新討論這個(gè)平均過(guò)程。

上述推理構(gòu)成了現(xiàn)在所謂的 加速梯度方法的基礎(chǔ),例如動(dòng)量梯度。他們享有額外的好處,即在優(yōu)化問(wèn)題是病態(tài)的情況下更有效(即,在某些方向上進(jìn)展比其他方向慢得多,類似于狹窄的峽谷)。此外,它們?cè)试S我們對(duì)后續(xù)梯度進(jìn)行平均以獲得更穩(wěn)定的下降方向。事實(shí)上,即使對(duì)于無(wú)噪聲凸問(wèn)題,加速方面也是動(dòng)量起作用的關(guān)鍵原因之一。

正如人們所預(yù)料的那樣,由于其功效,勢(shì)頭是深度學(xué)習(xí)及其他領(lǐng)域優(yōu)化的一個(gè)深入研究的課題。例如,請(qǐng)參閱Goh(2017 年撰寫的 精美說(shuō)明文章,以獲取深入分析和交互式動(dòng)畫。它是由Polyak ( 1964 )提出的。Nesterov(2018在凸優(yōu)化的背景下進(jìn)行了詳細(xì)的理論討論。長(zhǎng)期以來(lái),眾所周知,深度學(xué)習(xí)的勢(shì)頭是有益的。參見(jiàn)例如Sutskever等人的討論 。( 2013 )了解詳情。

12.6.1.2。病態(tài)問(wèn)題

為了更好地理解動(dòng)量法的幾何特性,我們重新審視了梯度下降法,盡管它的目標(biāo)函數(shù)明顯不太令人滿意。回想一下我們?cè)?/font>12.3 節(jié)中使用的f(x)=x12+2x22,即適度扭曲的橢球物鏡。我們通過(guò)在x1方向通過(guò)

(12.6.4)f(x)=0.1x12+2x22.

像之前一樣

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評(píng)論

查看更多

下載排行

本周

  1. 1山景DSP芯片AP8248A2數(shù)據(jù)手冊(cè)
  2. 1.06 MB  |  532次下載  |  免費(fèi)
  3. 2RK3399完整板原理圖(支持平板,盒子VR)
  4. 3.28 MB  |  339次下載  |  免費(fèi)
  5. 3TC358743XBG評(píng)估板參考手冊(cè)
  6. 1.36 MB  |  330次下載  |  免費(fèi)
  7. 4DFM軟件使用教程
  8. 0.84 MB  |  295次下載  |  免費(fèi)
  9. 5元宇宙深度解析—未來(lái)的未來(lái)-風(fēng)口還是泡沫
  10. 6.40 MB  |  227次下載  |  免費(fèi)
  11. 6迪文DGUS開(kāi)發(fā)指南
  12. 31.67 MB  |  194次下載  |  免費(fèi)
  13. 7元宇宙底層硬件系列報(bào)告
  14. 13.42 MB  |  182次下載  |  免費(fèi)
  15. 8FP5207XR-G1中文應(yīng)用手冊(cè)
  16. 1.09 MB  |  178次下載  |  免費(fèi)

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費(fèi)
  3. 2555集成電路應(yīng)用800例(新編版)
  4. 0.00 MB  |  33566次下載  |  免費(fèi)
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費(fèi)
  7. 4開(kāi)關(guān)電源設(shè)計(jì)實(shí)例指南
  8. 未知  |  21549次下載  |  免費(fèi)
  9. 5電氣工程師手冊(cè)免費(fèi)下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費(fèi)
  11. 6數(shù)字電路基礎(chǔ)pdf(下載)
  12. 未知  |  13750次下載  |  免費(fèi)
  13. 7電子制作實(shí)例集錦 下載
  14. 未知  |  8113次下載  |  免費(fèi)
  15. 8《LED驅(qū)動(dòng)電路設(shè)計(jì)》 溫德?tīng)栔?/a>
  16. 0.00 MB  |  6656次下載  |  免費(fèi)

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費(fèi)
  3. 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
  4. 78.1 MB  |  537798次下載  |  免費(fèi)
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420027次下載  |  免費(fèi)
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費(fèi)
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費(fèi)
  11. 6電路仿真軟件multisim 10.0免費(fèi)下載
  12. 340992  |  191187次下載  |  免費(fèi)
  13. 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
  14. 158M  |  183279次下載  |  免費(fèi)
  15. 8proe5.0野火版下載(中文版免費(fèi)下載)
  16. 未知  |  138040次下載  |  免費(fèi)