?级毛片内射免费视频,欧美成人三级在观看线h级,91香蕉在线观看

分類(lèi)是機(jī)器學(xué)習(xí)最常見(jiàn)的應(yīng)用之一。分類(lèi)技術(shù)可預(yù)測(cè)離散的響應(yīng) — 例如，電子郵件是不是垃圾郵件，腫瘤是惡性還是良性的。分類(lèi)模型可將輸入數(shù)據(jù)劃分成不同類(lèi)別。典型的應(yīng)用包括醫(yī)學(xué)成像、語(yǔ)音識(shí)別和信用評(píng)估。

選擇最合適的分類(lèi)模型，診斷和糾正過(guò)擬合是機(jī)器學(xué)習(xí)的基本技能。那什么是過(guò)擬合? 我們又可以如何防止和避免過(guò)擬合呢?

什么是過(guò)擬合?

過(guò)擬合指當(dāng)模型與訓(xùn)練數(shù)據(jù)過(guò)于接近貼合，以至于不知道如何對(duì)新數(shù)據(jù)做出響應(yīng)時(shí)發(fā)生的一種機(jī)器學(xué)習(xí)行為。過(guò)擬合的原因可能是：

機(jī)器學(xué)習(xí)模型太過(guò)復(fù)雜; 它記憶了訓(xùn)練數(shù)據(jù)中非常微妙的的模式，而這些模式無(wú)法很好地泛化。

訓(xùn)練數(shù)據(jù)的規(guī)模對(duì)于模型復(fù)雜度來(lái)說(shuō)太小，和/或者包含大量不相關(guān)的信息。

您可以通過(guò)管理模型復(fù)雜度和改進(jìn)訓(xùn)練數(shù)據(jù)集來(lái)防止過(guò)擬合。

過(guò)擬合與欠擬合

欠擬合與過(guò)擬合正相反。欠擬合指模型不能很好地與訓(xùn)練數(shù)據(jù)貼合，也無(wú)法很好地泛化到新數(shù)據(jù)。在分類(lèi)模型和回歸模型中都可能出現(xiàn)過(guò)擬合和欠擬合。下圖說(shuō)明了過(guò)擬合的模型的分類(lèi)決策邊界和回歸線如何過(guò)于緊密地跟隨訓(xùn)練數(shù)據(jù)，而欠擬合的模型的分類(lèi)決策邊界和回歸線又如何不夠緊密地跟隨訓(xùn)練數(shù)據(jù)。

與正確擬合的模型相比，過(guò)擬合的分類(lèi)模型和回歸模型對(duì)訓(xùn)練數(shù)據(jù)的記憶太好。

當(dāng)只針對(duì)訓(xùn)練數(shù)據(jù)查看機(jī)器學(xué)習(xí)模型的計(jì)算誤差時(shí)，過(guò)擬合比欠擬合更難檢測(cè)。因此，為了避免過(guò)擬合，在對(duì)測(cè)試數(shù)據(jù)使用機(jī)器學(xué)習(xí)模型之前對(duì)其進(jìn)行驗(yàn)證就很重要。

針對(duì)訓(xùn)練數(shù)據(jù)，過(guò)擬合模型的計(jì)算誤差低，而測(cè)試數(shù)據(jù)的誤差高。

將 MATLAB 與 Statistics and Machine Learning Toolbox 和 Deep Learning Toolbox 結(jié)合使用，可以防止機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型的過(guò)擬合。 MATLAB 提供了專(zhuān)為避免模型過(guò)擬合而設(shè)計(jì)的函數(shù)和方法。您可以在訓(xùn)練或調(diào)整模型時(shí)使用這些工具來(lái)防止過(guò)擬合。

如何通過(guò)降低模型復(fù)雜度來(lái)避免過(guò)擬合

使用 MATLAB，您可以從頭開(kāi)始訓(xùn)練機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型(如 CNN)，或利用預(yù)訓(xùn)練的深度學(xué)習(xí)模型。為了防止過(guò)擬合，請(qǐng)執(zhí)行模型驗(yàn)證，以確保為數(shù)據(jù)選擇具有合適復(fù)雜程度的模型，或使用正則化來(lái)降低模型的復(fù)雜度。

模型驗(yàn)證

當(dāng)對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行計(jì)算時(shí)，過(guò)擬合模型的誤差較低。因此，在引入新數(shù)據(jù)之前，最好在單獨(dú)的數(shù)據(jù)集(即驗(yàn)證數(shù)據(jù)集)上驗(yàn)證您的模型。對(duì)于 MATLAB 機(jī)器學(xué)習(xí)模型，您可以使用 cvpartition 函數(shù)將數(shù)據(jù)集隨機(jī)劃分為訓(xùn)練集和驗(yàn)證集。對(duì)于深度學(xué)習(xí)模型，您可以在訓(xùn)練過(guò)程中監(jiān)控驗(yàn)證準(zhǔn)確度。通過(guò)模型選擇和超參數(shù)調(diào)整來(lái)提高經(jīng)過(guò)正確驗(yàn)證的模型準(zhǔn)確度度量應(yīng)該能夠提高模型處理新數(shù)據(jù)的準(zhǔn)確度。

交叉驗(yàn)證是一種模型評(píng)估方法，用于評(píng)估機(jī)器學(xué)習(xí)算法對(duì)新數(shù)據(jù)集執(zhí)行預(yù)測(cè)的性能。交叉驗(yàn)證可以幫助您避免選擇過(guò)于復(fù)雜而導(dǎo)致過(guò)擬合的算法。使用 crossval 函數(shù)，通過(guò)使用常見(jiàn)的交叉驗(yàn)證方法來(lái)計(jì)算機(jī)器學(xué)習(xí)模型的交叉驗(yàn)證誤差估計(jì)值。這些常見(jiàn)方法包括如 k 折法(將數(shù)據(jù)劃分為 k 個(gè)隨機(jī)選擇的大小大致相等的子集)和留出法(將數(shù)據(jù)按照指定比率隨機(jī)劃分為兩個(gè)子集)等。

正則化

正則化是一種用于防止機(jī)器學(xué)習(xí)模型中的統(tǒng)計(jì)過(guò)擬合的方法。正則化算法通常通過(guò)對(duì)復(fù)雜度或粗糙度應(yīng)用罰分來(lái)實(shí)現(xiàn)。通過(guò)向模型中引入更多信息，正則化算法可以使模型更加簡(jiǎn)約和準(zhǔn)確，從而處理多重共線性和冗余預(yù)測(cè)變量。

對(duì)于機(jī)器學(xué)習(xí)，您可以在三種流行的正則化方法之間進(jìn)行選擇：lasso(L1 范數(shù))、脊(L2 范數(shù))和彈性網(wǎng)，以用于幾種類(lèi)型的線性機(jī)器學(xué)習(xí)模型。對(duì)于深度學(xué)習(xí)，您可以在指定的訓(xùn)練選項(xiàng)中增大 L2 正則化因子，或在您的網(wǎng)絡(luò)中使用丟棄層來(lái)避免過(guò)擬合。

示例和操作方法

正則化

深度學(xué)習(xí)提示和竅門(mén)

如何通過(guò)增強(qiáng)訓(xùn)練數(shù)據(jù)集來(lái)避免過(guò)擬合

交叉驗(yàn)證和正則化通過(guò)管理模型復(fù)雜度來(lái)防止過(guò)擬合。另一種方法是改進(jìn)數(shù)據(jù)集。深度學(xué)習(xí)模型比其他機(jī)器學(xué)習(xí)模型更需要大量的數(shù)據(jù)來(lái)避免過(guò)擬合。

數(shù)據(jù)增強(qiáng)

當(dāng)數(shù)據(jù)可用性受限時(shí)，可使用數(shù)據(jù)增強(qiáng)方法來(lái)向數(shù)據(jù)集添加現(xiàn)有數(shù)據(jù)的隨機(jī)版本從而人為擴(kuò)展訓(xùn)練數(shù)據(jù)集的數(shù)據(jù)點(diǎn)。使用 MATLAB，您可以增強(qiáng)圖像、音頻和其他類(lèi)型的數(shù)據(jù)。例如，通過(guò)隨機(jī)化現(xiàn)有圖像的縮放比例和旋轉(zhuǎn)來(lái)增強(qiáng)圖像數(shù)據(jù)。

數(shù)據(jù)生成

合成數(shù)據(jù)生成是擴(kuò)展數(shù)據(jù)集的另一種方法。使用 MATLAB，您可以使用生成對(duì)抗網(wǎng)絡(luò) (GAN) 或數(shù)字孿生(通過(guò)仿真生成數(shù)據(jù))來(lái)生成合成數(shù)據(jù)。

數(shù)據(jù)清洗

數(shù)據(jù)噪聲會(huì)導(dǎo)致過(guò)擬合。減少不想要的數(shù)據(jù)點(diǎn)的一種常見(jiàn)方法是使用 rmoutliers 函數(shù)從數(shù)據(jù)中刪除離群值。

示例和操作方法

使用增強(qiáng)的圖像訓(xùn)練網(wǎng)絡(luò)

增強(qiáng)深度學(xué)習(xí)的點(diǎn)云數(shù)據(jù)

使用條款 GAN 生成的合成信號(hào)

設(shè)置參數(shù)并訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

matlab

matlab

+關(guān)注

關(guān)注
180

文章
2952

瀏覽量
229857
語(yǔ)音識(shí)別

語(yǔ)音識(shí)別

+關(guān)注

關(guān)注
38

文章
1703

瀏覽量
112420
模型

模型

+關(guān)注

關(guān)注
1

文章
3058

瀏覽量
48573
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8320

瀏覽量
132165
數(shù)字孿生

數(shù)字孿生

+關(guān)注

關(guān)注
4

文章
1225

瀏覽量
12112

原文標(biāo)題：機(jī)器學(xué)習(xí)挑戰(zhàn)：如何避免機(jī)器學(xué)習(xí)模型過(guò)擬合？

文章出處：【微信號(hào)：MATLAB，微信公眾號(hào)：MATLAB】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

機(jī)器學(xué)習(xí)基礎(chǔ)知識(shí) 包括評(píng)估問(wèn)題，理解過(guò)擬合、欠擬合以及解決問(wèn)題的技巧

本章涵蓋了以下主題： · 分類(lèi)和回歸之外的其他類(lèi)型的問(wèn)題； · 評(píng)估問(wèn)題，理解過(guò)擬合、欠擬合，以及解決這些問(wèn)題的技巧； · 為深度學(xué)習(xí)準(zhǔn)備數(shù)據(jù)。請(qǐng)記住，在本章中討論的大多數(shù)技術(shù)都是

發(fā)表于 07-12 09:28 ?892次閱讀

<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>基礎(chǔ)知識(shí) 包括評(píng)估問(wèn)題，理解<b class='flag-5'>過(guò)</b><b class='flag-5'>擬合</b>、欠<b class='flag-5'>擬合</b>以及解決問(wèn)題的技巧

機(jī)器學(xué)習(xí)模型評(píng)估指標(biāo)

機(jī)器學(xué)習(xí)模型指標(biāo)在機(jī)器學(xué)習(xí)建模過(guò)程中，針對(duì)不同的問(wèn)題，需采用不同的模型評(píng)估指標(biāo)。

發(fā)表于 09-06 12:51 ?962次閱讀

<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>模型</b>評(píng)估指標(biāo)

過(guò)擬合和欠擬合(1)#機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

未來(lái)加油dz

發(fā)布于 :2023年07月14日 17:15:38

【下載】《機(jī)器學(xué)習(xí)》+《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》

　　312索引　　313版權(quán)聲明　　316工程師和數(shù)據(jù)科學(xué)家處理大量各種格式（如傳感器、圖像、視頻、遙測(cè)、數(shù)據(jù)庫(kù)等）的數(shù)據(jù)。他們使用機(jī)器學(xué)習(xí)來(lái)尋找數(shù)據(jù)中的模式，并建立基于歷史數(shù)據(jù)預(yù)測(cè)未來(lái)結(jié)果的模型

發(fā)表于 06-01 15:49

tensorflow機(jī)器學(xué)習(xí)日志

tensorflow學(xué)習(xí)日志(四)機(jī)器學(xué)習(xí)（泛化,過(guò)擬合, 數(shù)據(jù)集，驗(yàn)證集，測(cè)試集）

發(fā)表于 04-14 06:32

深度學(xué)習(xí)中過(guò)擬合/欠擬合的問(wèn)題及解決方案

的數(shù)據(jù)可以對(duì)未來(lái)的數(shù)據(jù)進(jìn)行推測(cè)與模擬，因此都是使用歷史數(shù)據(jù)建立模型，即使用已經(jīng)產(chǎn)生的數(shù)據(jù)去訓(xùn)練，然后使用該模型去擬合未來(lái)的數(shù)據(jù)。在我們機(jī)器學(xué)習(xí)

發(fā)表于 01-28 06:57

微型機(jī)器學(xué)習(xí)

人工智能 AI 正在加快速度從云端走向邊緣，進(jìn)入到越來(lái)越小的物聯(lián)網(wǎng)設(shè)備中。而這些物聯(lián)網(wǎng)設(shè)備往往體積很小，面臨著許多挑戰(zhàn)，例如功耗、延時(shí)以及精度等問(wèn)題，傳統(tǒng)的機(jī)器學(xué)習(xí)模型無(wú)法滿(mǎn)足要求，那

發(fā)表于 09-15 09:23

什么是機(jī)器學(xué)習(xí)? 機(jī)器學(xué)習(xí)基礎(chǔ)入門(mén)

另一方面，機(jī)器學(xué)習(xí)是向計(jì)算機(jī)提供一組輸入和輸出，并要求計(jì)算機(jī)識(shí)別“算法”(或用機(jī)器學(xué)習(xí)的說(shuō)法稱(chēng)為模型)的過(guò)程，這種算法每次都將這些輸入轉(zhuǎn)化為

發(fā)表于 06-21 11:06

部署基于嵌入的機(jī)器學(xué)習(xí)模型

1、如何在生產(chǎn)中部署基于嵌入的機(jī)器學(xué)習(xí)模型　　由于最近大量的研究，機(jī)器學(xué)習(xí)模型的性能在過(guò)去幾年里

發(fā)表于 11-02 15:09

區(qū)塊鏈分析中的過(guò)度擬合還有什么挑戰(zhàn)

當(dāng)與區(qū)塊鏈數(shù)據(jù)集一起使用時(shí)，機(jī)器學(xué)習(xí)模型往往會(huì)過(guò)擬合。

發(fā)表于 02-05 10:35 ?594次閱讀

六個(gè)構(gòu)建機(jī)器學(xué)習(xí)模型需避免的錯(cuò)誤

近年來(lái)，機(jī)器學(xué)習(xí)在學(xué)術(shù)研究領(lǐng)域和實(shí)際應(yīng)用領(lǐng)域得到越來(lái)越多的關(guān)注。但構(gòu)建機(jī)器學(xué)習(xí)模型不是一件簡(jiǎn)單的事情，它需要大量的知識(shí)和技能以及豐富的經(jīng)驗(yàn)，

發(fā)表于 05-05 16:39 ?1391次閱讀

如何評(píng)估機(jī)器學(xué)習(xí)模型的性能？機(jī)器學(xué)習(xí)的算法選擇

如何評(píng)估機(jī)器學(xué)習(xí)模型的性能？典型的回答可能是：首先，將訓(xùn)練數(shù)據(jù)饋送給學(xué)習(xí)算法以學(xué)習(xí)一個(gè)模型。第二

發(fā)表于 04-04 14:15 ?926次閱讀

精通機(jī)器學(xué)習(xí)之MATLAB分步實(shí)施指南

加載數(shù)據(jù)到部署訓(xùn)練模型的整個(gè)開(kāi)發(fā)流程。對(duì)于每個(gè)訓(xùn)練階段，我們將演示取得精確模型的關(guān)鍵技術(shù)，幫助您掌握更具挑戰(zhàn)性的訓(xùn)練任務(wù)，包括選擇算法、優(yōu)化模型參數(shù)和

發(fā)表于 05-29 09:14 ?0次下載

機(jī)器學(xué)習(xí)算法匯總 機(jī)器學(xué)習(xí)算法分類(lèi) 機(jī)器學(xué)習(xí)算法模型

機(jī)器學(xué)習(xí)算法匯總 機(jī)器學(xué)習(xí)算法分類(lèi) 機(jī)器學(xué)習(xí)算法模型

發(fā)表于 08-17 16:11 ?1004次閱讀

深度學(xué)習(xí)模型中的過(guò)擬合與正則化

在深度學(xué)習(xí)的廣闊領(lǐng)域中，模型訓(xùn)練的核心目標(biāo)之一是實(shí)現(xiàn)對(duì)未知數(shù)據(jù)的準(zhǔn)確預(yù)測(cè)。然而，在實(shí)際應(yīng)用中，我們經(jīng)常會(huì)遇到一個(gè)問(wèn)題——過(guò)擬合（Overfitting）。

發(fā)表于 07-09 15:56 ?562次閱讀

搜索歷史

機(jī)器學(xué)習(xí)挑戰(zhàn)：如何避免機(jī)器學(xué)習(xí)模型過(guò)擬合？

評(píng)論

機(jī)器學(xué)習(xí)基礎(chǔ)知識(shí) 包括評(píng)估問(wèn)題，理解過(guò)擬合、欠擬合以及解決問(wèn)題的技巧

機(jī)器學(xué)習(xí)模型評(píng)估指標(biāo)

過(guò)擬合和欠擬合(1)#機(jī)器學(xué)習(xí)

【下載】《機(jī)器學(xué)習(xí)》+《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》

tensorflow機(jī)器學(xué)習(xí)日志

深度學(xué)習(xí)中過(guò)擬合/欠擬合的問(wèn)題及解決方案

微型機(jī)器學(xué)習(xí)

什么是機(jī)器學(xué)習(xí)? 機(jī)器學(xué)習(xí)基礎(chǔ)入門(mén)

部署基于嵌入的機(jī)器學(xué)習(xí)模型

區(qū)塊鏈分析中的過(guò)度擬合還有什么挑戰(zhàn)

六個(gè)構(gòu)建機(jī)器學(xué)習(xí)模型需避免的錯(cuò)誤

如何評(píng)估機(jī)器學(xué)習(xí)模型的性能？機(jī)器學(xué)習(xí)的算法選擇

精通機(jī)器學(xué)習(xí)之MATLAB分步實(shí)施指南

機(jī)器學(xué)習(xí)算法匯總機(jī)器學(xué)習(xí)算法分類(lèi) 機(jī)器學(xué)習(xí)算法模型

深度學(xué)習(xí)模型中的過(guò)擬合與正則化

搜索歷史

機(jī)器學(xué)習(xí)挑戰(zhàn)：如何避免機(jī)器學(xué)習(xí)模型過(guò)擬合？

評(píng)論

機(jī)器學(xué)習(xí)挑戰(zhàn)：如何避免機(jī)器學(xué)習(xí)模型過(guò)擬合？