国产在线国偷精品免费看,日韩第一页在线观看

本文為有志于成為數(shù)據(jù)科學(xué)家或?qū)Υ烁信d趣的讀者們介紹最流行的機(jī)器學(xué)習(xí)算法。

機(jī)器學(xué)習(xí)是該行業(yè)的一個(gè)創(chuàng)新且重要的領(lǐng)域。我們?yōu)闄C(jī)器學(xué)習(xí)程序選擇的算法類型，取決于我們想要實(shí)現(xiàn)的目標(biāo)。

現(xiàn)在，機(jī)器學(xué)習(xí)有很多算法。因此，如此多的算法，可能對于初學(xué)者來說，是相當(dāng)不堪重負(fù)的。今天，我們將簡要介紹 10 種最流行的機(jī)器學(xué)習(xí)算法，這樣你就可以適應(yīng)這個(gè)激動(dòng)人心的機(jī)器學(xué)習(xí)世界了！

讓我們言歸正傳！

1. 線性回歸

線性回歸（Linear Regression）可能是最流行的機(jī)器學(xué)習(xí)算法。線性回歸就是要找一條直線，并且讓這條直線盡可能地?cái)M合散點(diǎn)圖中的數(shù)據(jù)點(diǎn)。它試圖通過將直線方程與該數(shù)據(jù)擬合來表示自變量（x 值）和數(shù)值結(jié)果（y 值）。然后就可以用這條線來預(yù)測未來的值！

這種算法最常用的技術(shù)是最小二乘法（Least of squares）。這個(gè)方法計(jì)算出最佳擬合線，以使得與直線上每個(gè)數(shù)據(jù)點(diǎn)的垂直距離最小?？偩嚯x是所有數(shù)據(jù)點(diǎn)的垂直距離（綠線）的平方和。其思想是通過最小化這個(gè)平方誤差或距離來擬合模型。

2. 邏輯回歸

邏輯回歸（Logistic regression）與線性回歸類似，但它是用于輸出為二進(jìn)制的情況（即，當(dāng)結(jié)果只能有兩個(gè)可能的值）。對最終輸出的預(yù)測是一個(gè)非線性的 S 型函數(shù)，稱為 logistic function, g()。

這個(gè)邏輯函數(shù)將中間結(jié)果值映射到結(jié)果變量 Y，其值范圍從 0 到 1。然后，這些值可以解釋為 Y 出現(xiàn)的概率。S 型邏輯函數(shù)的性質(zhì)使得邏輯回歸更適合用于分類任務(wù)。

3. 決策樹

決策樹（Decision Trees）可用于回歸和分類任務(wù)。

在這一算法中，訓(xùn)練模型通過學(xué)習(xí)樹表示（Tree representation）的決策規(guī)則來學(xué)習(xí)預(yù)測目標(biāo)變量的值。樹是由具有相應(yīng)屬性的節(jié)點(diǎn)組成的。

在每個(gè)節(jié)點(diǎn)上，我們根據(jù)可用的特征詢問有關(guān)數(shù)據(jù)的問題。左右分支代表可能的答案。最終節(jié)點(diǎn)（即葉節(jié)點(diǎn)）對應(yīng)于一個(gè)預(yù)測值。

每個(gè)特征的重要性是通過自頂向下方法確定的。節(jié)點(diǎn)越高，其屬性就越重要。

4. 樸素貝葉斯

樸素貝葉斯（Naive Bayes）是基于貝葉斯定理。它測量每個(gè)類的概率，每個(gè)類的條件概率給出 x 的值。這個(gè)算法用于分類問題，得到一個(gè)二進(jìn)制“是 / 非”的結(jié)果?？纯聪旅娴姆匠淌健?/p>

樸素貝葉斯分類器是一種流行的統(tǒng)計(jì)技術(shù)，可用于過濾垃圾郵件！

5. 支持向量機(jī)（SVM）

支持向量機(jī)（Support Vector Machine，SVM）是一種用于分類問題的監(jiān)督算法。支持向量機(jī)試圖在數(shù)據(jù)點(diǎn)之間繪制兩條線，它們之間的邊距最大。為此，我們將數(shù)據(jù)項(xiàng)繪制為 n 維空間中的點(diǎn)，其中，n 是輸入特征的數(shù)量。在此基礎(chǔ)上，支持向量機(jī)找到一個(gè)最優(yōu)邊界，稱為超平面（Hyperplane），它通過類標(biāo)簽將可能的輸出進(jìn)行最佳分離。

超平面與最近的類點(diǎn)之間的距離稱為邊距。最優(yōu)超平面具有最大的邊界，可以對點(diǎn)進(jìn)行分類，從而使最近的數(shù)據(jù)點(diǎn)與這兩個(gè)類之間的距離最大化。

6. K- 最近鄰算法（KNN）

K- 最近鄰算法（K-Nearest Neighbors，KNN）非常簡單。KNN 通過在整個(gè)訓(xùn)練集中搜索 K 個(gè)最相似的實(shí)例，即 K 個(gè)鄰居，并為所有這些 K 個(gè)實(shí)例分配一個(gè)公共輸出變量，來對對象進(jìn)行分類。

K 的選擇很關(guān)鍵：較小的值可能會得到大量的噪聲和不準(zhǔn)確的結(jié)果，而較大的值是不可行的。它最常用于分類，但也適用于回歸問題。

用于評估實(shí)例之間相似性的距離可以是歐幾里得距離（Euclidean distance）、曼哈頓距離（Manhattan distance）或明氏距離（Minkowski distance）。歐幾里得距離是兩點(diǎn)之間的普通直線距離。它實(shí)際上是點(diǎn)坐標(biāo)之差平方和的平方根。

7. K- 均值

K- 均值（K-means）是通過對數(shù)據(jù)集進(jìn)行分類來聚類的。例如，這個(gè)算法可用于根據(jù)購買歷史將用戶分組。它在數(shù)據(jù)集中找到 K 個(gè)聚類。K- 均值用于無監(jiān)督學(xué)習(xí)，因此，我們只需使用訓(xùn)練數(shù)據(jù) X，以及我們想要識別的聚類數(shù)量 K。

該算法根據(jù)每個(gè)數(shù)據(jù)點(diǎn)的特征，將每個(gè)數(shù)據(jù)點(diǎn)迭代地分配給 K 個(gè)組中的一個(gè)組。它為每個(gè) K- 聚類（稱為質(zhì)心）選擇 K 個(gè)點(diǎn)。基于相似度，將新的數(shù)據(jù)點(diǎn)添加到具有最近質(zhì)心的聚類中。這個(gè)過程一直持續(xù)到質(zhì)心停止變化為止。

8. 隨機(jī)森林

隨機(jī)森林（Random Forest）是一種非常流行的集成機(jī)器學(xué)習(xí)算法。這個(gè)算法的基本思想是，許多人的意見要比個(gè)人的意見更準(zhǔn)確。在隨機(jī)森林中，我們使用決策樹集成（參見決策樹）。

為了對新對象進(jìn)行分類，我們從每個(gè)決策樹中進(jìn)行投票，并結(jié)合結(jié)果，然后根據(jù)多數(shù)投票做出最終決定。

9. 降維

由于我們今天能夠捕獲的數(shù)據(jù)量之大，機(jī)器學(xué)習(xí)問題變得更加復(fù)雜。這就意味著訓(xùn)練極其緩慢，而且很難找到一個(gè)好的解決方案。這一問題，通常被稱為“維數(shù)災(zāi)難”（Curse of dimensionality）。

降維（Dimensionality reduction）試圖在不丟失最重要信息的情況下，通過將特定的特征組合成更高層次的特征來解決這個(gè)問題。主成分分析（Principal Component Analysis，PCA）是最流行的降維技術(shù)。

主成分分析通過將數(shù)據(jù)集壓縮到低維線或超平面 / 子空間來降低數(shù)據(jù)集的維數(shù)。這盡可能地保留了原始數(shù)據(jù)的顯著特征。

可以通過將所有數(shù)據(jù)點(diǎn)近似到一條直線來實(shí)現(xiàn)降維的示例。

10. 人工神經(jīng)網(wǎng)絡(luò)（ANN）

人工神經(jīng)網(wǎng)絡(luò)（Artificial Neural Networks，ANN）可以處理大型復(fù)雜的機(jī)器學(xué)習(xí)任務(wù)。神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一組帶有權(quán)值的邊和節(jié)點(diǎn)組成的相互連接的層，稱為神經(jīng)元。在輸入層和輸出層之間，我們可以插入多個(gè)隱藏層。人工神經(jīng)網(wǎng)絡(luò)使用了兩個(gè)隱藏層。除此之外，還需要處理深度學(xué)習(xí)。

人工神經(jīng)網(wǎng)絡(luò)的工作原理與大腦的結(jié)構(gòu)類似。一組神經(jīng)元被賦予一個(gè)隨機(jī)權(quán)重，以確定神經(jīng)元如何處理輸入數(shù)據(jù)。通過對輸入數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)輸入和輸出之間的關(guān)系。在訓(xùn)練階段，系統(tǒng)可以訪問正確的答案。

如果網(wǎng)絡(luò)不能準(zhǔn)確識別輸入，系統(tǒng)就會調(diào)整權(quán)重。經(jīng)過充分的訓(xùn)練后，它將始終如一地識別出正確的模式。

每個(gè)圓形節(jié)點(diǎn)表示一個(gè)人工神經(jīng)元，箭頭表示從一個(gè)人工神經(jīng)元的輸出到另一個(gè)人工神經(jīng)元的輸入的連接。

接下來是什么？現(xiàn)在，你已經(jīng)了解了最流行的機(jī)器學(xué)習(xí)算法的基礎(chǔ)介紹。你已經(jīng)準(zhǔn)備好學(xué)習(xí)更為復(fù)雜的概念，甚至可以通過深入的動(dòng)手實(shí)踐來實(shí)現(xiàn)它們。如果你想了解如何實(shí)現(xiàn)這些算法，可以參考 Educative 出品的 Grokking Data Science 課程，該課程將這些激動(dòng)人心的理論應(yīng)用于清晰、真實(shí)的應(yīng)用程序。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

算法

算法

+關(guān)注

關(guān)注
23

文章
4580

瀏覽量
92359
人工智能

人工智能

+關(guān)注

關(guān)注
1789

文章
46397

瀏覽量
236593
人工神經(jīng)網(wǎng)絡(luò)

人工神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
1

文章
119

瀏覽量
14582
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8325

瀏覽量
132196

原文標(biāo)題：人工智能10大流行算法，通俗易懂講明白

文章出處：【微信號：TheBigData1024，微信公眾號：人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

搜索歷史

人工智能10大流行算法分享

評論

人工智能是什么?

百度人工智能大神離職，人工智能的出路在哪?

分享：人工智能算法將帶領(lǐng)機(jī)器人走向何方？

人工智能就業(yè)前景

人工智能和機(jī)器學(xué)習(xí)的前世今生

全語音人工智能AI耳機(jī)，或?qū)⒁?b class='flag-5'>智能耳機(jī)市場

解讀人工智能的未來

人工智能技術(shù)及算法設(shè)計(jì)指南

人工智能醫(yī)生未來或上線，人工智能醫(yī)療市場規(guī)模持續(xù)增長

智能控制、人工智能、智能算法的發(fā)展前景怎么樣

人工智能：超越炒作

人工智能芯片是人工智能發(fā)展的

一文看懂人工智能語音芯片精選資料分享

人工智能基本概念機(jī)器學(xué)習(xí)算法

《移動(dòng)終端人工智能技術(shù)與應(yīng)用開發(fā)》人工智能的發(fā)展與AI技術(shù)的進(jìn)步