電子發(fā)燒友網(wǎng)>人工智能>機(jī)器學(xué)習(xí)中更多的數(shù)據(jù)比更好的算法好？沒有合理的方法數(shù)據(jù)會(huì)成為噪音

機(jī)器學(xué)習(xí)中更多的數(shù)據(jù)比更好的算法好？沒有合理的方法數(shù)據(jù)會(huì)成為噪音

在機(jī)器學(xué)習(xí)中，更多的數(shù)據(jù)總是比更好的算法好嗎?對(duì)于Quora上的這個(gè)問題，Netflix公司工程總監(jiān)Xavier Amatriain認(rèn)為，很多時(shí)候增加更多的樣本到訓(xùn)練集并不會(huì)提高模型的性能，而如果沒有合理的方法，數(shù)據(jù)就會(huì)成為噪音。他通過Netflix的實(shí)踐經(jīng)驗(yàn)推導(dǎo)出最終的結(jié)論：我們需要的是好的方法，來幫助我們理解如何解釋數(shù)據(jù)，模型，以及兩者的局限性，這都是為了得到最好的輸出。

在機(jī)器學(xué)習(xí)中，更多的數(shù)據(jù)總是比更好的算法好嗎?

不是這樣的。有時(shí)候更多的數(shù)據(jù)有用，有時(shí)它的作用不大。

為數(shù)據(jù)的力量辯護(hù)，也許最著名的是谷歌的研發(fā)總監(jiān)Peter Norvig，他聲稱“我們沒有更好的算法。我們僅僅擁有更多的數(shù)據(jù)”。這句話通常是鏈接到文章《The Unreasonable Effectiveness of Data》，這篇文章也是Norvig自己寫的（雖然它的來源被放在IEEE收費(fèi)專區(qū)，不過你應(yīng)該能夠在網(wǎng)上找到pdf格式的原文檔）。更好的模型蓋棺定論是Norvig的語錄“所有模型都是錯(cuò)的，無論如何你都不會(huì)需要他們的”被錯(cuò)誤地引用之時(shí)（點(diǎn)擊這里查看作者澄清他是如何被錯(cuò)誤引用的）。

Norvig等人的作用是指在他們的文章中，他們的觀點(diǎn)早在幾年前被微軟研究人員Banko和Brill在一篇著名的論文[2001]《Scaling to Very Very Large Corpora for Natural Language Disambiguation》中引用。在這篇論文中，作者給出了下圖。

機(jī)器學(xué)習(xí)中更多的數(shù)據(jù)比更好的算法好？沒有合理的方法數(shù)據(jù)會(huì)成為噪音

該圖表明，對(duì)于給定的問題，迥然不同的算法執(zhí)行結(jié)果幾乎是一樣的。然而，添加更多的樣本（單詞）到訓(xùn)練集里面，可以單調(diào)增加模型的精度。

因此，在封閉的情況下，你可能會(huì)認(rèn)為算法更重要。嗯…沒有這么快。事實(shí)是，Norvig的斷言以及Banko和Brill的論文都是正確的…在一個(gè)環(huán)境中。但是，他們現(xiàn)在再次被錯(cuò)誤地引用到一些環(huán)境中，而這些環(huán)境與最初的環(huán)境是完全不同的。但是，為了搞明白為什么，我們需要了解一些技術(shù)。（我不打算在這篇文章中給出一個(gè)完整的機(jī)器學(xué)習(xí)教程。如果你不明白我下面將要做出的解釋，請(qǐng)閱讀我對(duì)《How do I learn machine learning?》的回答？

方差還是偏差?

基本的想法是，一個(gè)模型的可能表現(xiàn)不好存在兩種可能的（而且是幾乎相反的）原因。

在第一種情況下，對(duì)于我們擁有的數(shù)據(jù)量來說，我們所用的模型太復(fù)雜了。這是一種以高方差著稱的情形，其可以導(dǎo)致模型過擬合。我們知道，當(dāng)訓(xùn)練誤差遠(yuǎn)低于測試誤差時(shí)，我們正面臨著一個(gè)高方差問題。高方差問題可以通過減少特征數(shù)量加以解決，是的，還有一種方法是通過增加數(shù)據(jù)點(diǎn)的數(shù)量。所以，什么樣的模型是Banko &Brill的觀點(diǎn)和Norvig的斷言可以處理的？是的，回答正確：高方差。在這兩種情況下，作者致力于語言模型，其中詞匯表中的大約每一個(gè)詞都具有特征。與訓(xùn)練樣本相比，這有一些模型，它們具有許多特征。因此他們很有可能過擬合。是的，在這種情況下，添加更多的樣本將帶來很多幫助。

但是，在相反的情況下，我們可能有一個(gè)模型，它太簡單了以至于無法解釋我們擁有的數(shù)據(jù)。在這種情況下，以高偏差著稱，添加更多的數(shù)據(jù)不會(huì)帶來幫助。參見下面一個(gè)真實(shí)的在Netflix運(yùn)行的系統(tǒng)的一個(gè)制表以及它的性能，同時(shí)我們添加更多的訓(xùn)練樣本到里面去。

機(jī)器學(xué)習(xí)中更多的數(shù)據(jù)比更好的算法好？沒有合理的方法數(shù)據(jù)會(huì)成為噪音

所以，更多的數(shù)據(jù)并不總是有幫助的。正如我們剛剛看到的，在許多情況下，增加更多的樣本到我們的訓(xùn)練集并不會(huì)提高模型的性能。

多特征救援

如果你一直跟著我的節(jié)奏，到目前為止，你已經(jīng)完成了理解高方差和高偏差問題的功課。你可能會(huì)認(rèn)為我故意留下了一些東西要討論。是的，高偏差模型將不會(huì)受益于更多的訓(xùn)練樣本，但是他們很可能受益于更多的特征。所以，到底這是不是都是關(guān)于增加“更多”數(shù)據(jù)的？好吧，再強(qiáng)調(diào)一次，這得視情況而定。

例如，在Netflix Prize的早期，有一個(gè)以評(píng)論額外特征的使用來解決問題的博客文章，它是由企業(yè)家和斯坦福大學(xué)教授Anand Rajaraman建立的。這個(gè)帖子解釋了一個(gè)學(xué)生團(tuán)隊(duì)如何通過從IMDB添加內(nèi)容特征來改善預(yù)測精度特性。

機(jī)器學(xué)習(xí)中更多的數(shù)據(jù)比更好的算法好？沒有合理的方法數(shù)據(jù)會(huì)成為噪音

現(xiàn)在回想起來，很容易在批評(píng)后作出針對(duì)一個(gè)單一數(shù)據(jù)點(diǎn)的粗俗的過度泛化。更有甚者，后續(xù)文章提及SVD是一個(gè)“復(fù)雜”的算法，不值得一試，因?yàn)樗拗屏藬U(kuò)大更多的特征的能力。顯然，Anand的學(xué)生沒有贏得Netflix Prize，而且他們現(xiàn)在可能意識(shí)到SVD在獲獎(jiǎng)作品中發(fā)揮著重要的作用。

事實(shí)上，許多團(tuán)隊(duì)后來顯示，添加來自IMDB的內(nèi)容特征等等到一個(gè)優(yōu)化算法上幾乎沒有改善。Gravity team的一些成員，他們是Netflix Prize的最優(yōu)秀的競爭者之一，發(fā)表了一篇詳細(xì)的論文，展示了將這些基于內(nèi)容的特征添加到高度優(yōu)化的協(xié)同過濾矩陣分解的方法沒有任何改善。這篇論文題為“Recommending New Movies: Even a Few Ratings Are More Valuable Than Metadata”。

機(jī)器學(xué)習(xí)中更多的數(shù)據(jù)比更好的算法好？沒有合理的方法數(shù)據(jù)會(huì)成為噪音

為了公平起見，論文的標(biāo)題也是一個(gè)過度泛化。基于內(nèi)容的特征（或一般的不同特征）在許多情況下可以提高精確度。但是，你明白我的意思：更多的數(shù)據(jù)并不總是有幫助的。

更好的數(shù)據(jù)!=更多的數(shù)據(jù)

在我看來，重要的是要指出，更好的數(shù)據(jù)始終更好。對(duì)此沒有反對(duì)意見。所以任何你能夠直接針對(duì)你的數(shù)據(jù)進(jìn)行“改善”的努力始終是一項(xiàng)很好的投資。問題是，更好的數(shù)據(jù)并不意味著更多的數(shù)據(jù)。事實(shí)上，有時(shí)這可能意味著少！

想想數(shù)據(jù)清理或異常值去除，就當(dāng)是我的觀點(diǎn)一個(gè)微不足道的說明。但是，還有許多其他的更微妙的例子。例如，我已經(jīng)看到人們投入大量的精力到Matrix Factorization，而真相是，他們可能通過采樣數(shù)據(jù)以及得到非常相似的結(jié)果獲得認(rèn)可。事實(shí)上，做某種形式的智能人口抽樣的正確的方式（例如使用分層抽樣）可以讓你得到比使用整個(gè)未過濾得的數(shù)據(jù)集更好的結(jié)果。

科學(xué)方法的終結(jié)?

當(dāng)然，每當(dāng)有一個(gè)關(guān)于可能的范式的變化激烈的爭論，就會(huì)有像Malcolm Gladwell 和 Chris Anderson這樣的人以此謀生甚至未曾認(rèn)真思考（不要誤會(huì)我的意思，我是他們倆的粉絲，我讀過他們的很多書）。在這種情況下，Anderson挑選了Norvig的一些評(píng)論,并錯(cuò)誤地在一篇文章中引用，該文章的標(biāo)題為：“The End of Theory: The Data Deluge Makes the Scientific Method Obsolete”。

機(jī)器學(xué)習(xí)中更多的數(shù)據(jù)比更好的算法好？沒有合理的方法數(shù)據(jù)會(huì)成為噪音

這篇文章闡述了幾個(gè)例子，它們講的是豐富的數(shù)據(jù)如何幫助人們和企業(yè)決策甚至無需理解數(shù)據(jù)本身的含義。正如Norvig在他的辯駁中自己指出的問題，Anderson有幾個(gè)觀點(diǎn)是正確的，但是很難實(shí)現(xiàn)。而且結(jié)果是一組虛假陳述，從標(biāo)題開始：海量數(shù)據(jù)并未淘汰科學(xué)方法。我認(rèn)為這恰恰相反。

數(shù)據(jù)沒有合理的方法=噪音

所以，我是在試圖制造大數(shù)據(jù)革命只是炒作的言論嗎？不可能。有更多的數(shù)據(jù)，無論是更多的例子樣本或更多的特征，都是一種幸事。數(shù)據(jù)的可用性使得更多更好的見解和應(yīng)用程序成為可能。更多的數(shù)據(jù)的確帶來了更好的方法。更重要的是，它需要更好的方法。

機(jī)器學(xué)習(xí)中更多的數(shù)據(jù)比更好的算法好？沒有合理的方法數(shù)據(jù)會(huì)成為噪音

綜上所述，我們應(yīng)該不理會(huì)過分簡單的意見，它們所宣揚(yáng)的是理論或者模型的無用性，或者數(shù)據(jù)在其他方面的成功的可能性。盡可能多的數(shù)據(jù)是必要的，所以就需要好的模型和理論來解釋它們。但是，總的來說，我們需要的是好的方法，來幫助我們理解如何解釋數(shù)據(jù)，模型，以及兩者的局限性，這都是為了得到最好的輸出。

換句話說，數(shù)據(jù)固然重要，但若沒有一個(gè)合理的的方法，數(shù)據(jù)將會(huì)成為噪音。

閱讀全文

谷歌(103102) 谷歌(103102)
人工智能(229987) 人工智能(229987)
機(jī)器學(xué)習(xí)(130423) 機(jī)器學(xué)習(xí)(130423)

評(píng)論

相關(guān)推薦

25個(gè)機(jī)器學(xué)習(xí)面試題，你都會(huì)嗎？

算法涉及到一些對(duì)矩陣的操作，例如矩陣乘法和求逆矩陣。請(qǐng)給出一個(gè)簡單的數(shù)學(xué)證明，說明為什么這種機(jī)器學(xué)習(xí)算法的 mini-batch 版本可能比在整個(gè)數(shù)據(jù)集上進(jìn)行訓(xùn)練的計(jì)算效率更高？（提示：矩陣乘法的時(shí)間

2018-09-29 09:39:54

9月份最熱門的機(jī)器學(xué)習(xí)開源項(xiàng)目TOP 5

`論文和代碼相信大家都曾為如何自己實(shí)現(xiàn)論文中的代碼而苦惱過，在互聯(lián)網(wǎng)上搜索相關(guān)的代碼可以說是非常的令人煎熬。在這個(gè) repo 中，包含了數(shù)以百計(jì)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)研究論文及其代碼。該 repo

2018-10-10 13:39:47

學(xué)習(xí)排序算法以及部分其它的數(shù)據(jù)結(jié)構(gòu)與算法到底有沒有用

這篇不是寫技術(shù)細(xì)節(jié)的，而是在之前學(xué)過的排序算法以及部分其它的數(shù)據(jù)結(jié)構(gòu)與算法之后，個(gè)人的一些感覺，主要包括兩個(gè)方面：怎么去學(xué)習(xí)這些枯燥的東西？學(xué)習(xí)這個(gè)到底有沒有用？遙想當(dāng)年，在我還年輕的時(shí)候，接觸過

2021-12-21 06:40:55

成為Python數(shù)據(jù)分析師，需要掌握哪些技能

。Python不僅是一門編程語言，而且是數(shù)據(jù)挖掘機(jī)器學(xué)習(xí)等技術(shù)的基礎(chǔ)，方便建立自動(dòng)化的工作流；Python入門不難，它對(duì)數(shù)學(xué)要求并不是太高，重要的是需要知道如何用語言表達(dá)一個(gè)算法邏輯；Python

2021-06-23 12:16:28

成為Python數(shù)據(jù)分析師，需要掌握哪些技能

2021-06-30 11:42:09

數(shù)據(jù)挖掘十大經(jīng)典算法，你都知道哪些！

的所有需求。而這三類里又包含許多經(jīng)典算法。而今天，小編就給大家介紹下數(shù)據(jù)挖掘中最經(jīng)典的十大算法，希望它對(duì)你有所幫助。一、分類決策樹算法C4.5C4.5，是機(jī)器學(xué)習(xí)算法中的一種分類決策樹算法，它是決策樹

2018-11-06 17:02:30

機(jī)器學(xué)習(xí)算法分享

機(jī)器學(xué)習(xí)算法（1）——Logistic Regression

2020-06-09 13:30:03

機(jī)器學(xué)習(xí)算法如何用于制造無人駕駛汽車？

機(jī)器學(xué)習(xí)算法如何用于制造無人駕駛汽車

2021-03-18 06:27:18

機(jī)器學(xué)習(xí)——期望最大算法

機(jī)器學(xué)習(xí) - 期望最大（EM）算法

2020-05-21 14:31:34

機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘方法和應(yīng)用

機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘方法和應(yīng)用（經(jīng)典）

2023-09-26 07:56:49

機(jī)器學(xué)習(xí)工程師必知的10大算法

`轉(zhuǎn)一篇好資料機(jī)器學(xué)習(xí)算法可以分為三大類：監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。監(jiān)督學(xué)習(xí)可用于一個(gè)特定的數(shù)據(jù)集（訓(xùn)練集）具有某一屬性（標(biāo)簽），但是其他數(shù)據(jù)沒有標(biāo)簽或者需要預(yù)測標(biāo)簽的情況。無監(jiān)督學(xué)習(xí)可用

2017-04-18 18:28:36

機(jī)器學(xué)習(xí)的算法應(yīng)用

關(guān)于機(jī)器學(xué)習(xí)的相關(guān)算法。正版資源，免費(fèi)看的。

2017-08-24 22:14:36

機(jī)器學(xué)習(xí)的未來

機(jī)器學(xué)習(xí)的未來在工業(yè)領(lǐng)域采用機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)和大數(shù)據(jù)

2021-01-27 06:02:18

機(jī)器學(xué)習(xí)簡介與經(jīng)典機(jī)器學(xué)習(xí)算法人才培養(yǎng)

經(jīng)典機(jī)器學(xué)習(xí)算法介紹章節(jié)目標(biāo)：機(jī)器學(xué)習(xí)是人工智能的重要技術(shù)之一，詳細(xì)了解機(jī)器學(xué)習(xí)的原理、機(jī)制和方法，為學(xué)習(xí)深度學(xué)習(xí)與遷移學(xué)習(xí)打下堅(jiān)實(shí)的基礎(chǔ)。二、深度學(xué)習(xí)簡介與經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)介紹神經(jīng)網(wǎng)絡(luò)簡介神經(jīng)網(wǎng)絡(luò)組件簡介

2022-04-28 18:56:07

機(jī)器學(xué)習(xí)訓(xùn)練秘籍——吳恩達(dá)

來說，提升算法性能的更加可靠的方法仍然是訓(xùn)練更大的網(wǎng)絡(luò)以及獲取更多的數(shù)據(jù)。完成 1 和 2 的過程異常復(fù)雜，本書將對(duì)其中的細(xì)節(jié)作進(jìn)一步的討論。我們將從傳統(tǒng)學(xué)習(xí)算法與神經(jīng)網(wǎng)絡(luò)中都起作用的通用策略入手，循序漸進(jìn)地講解至最前沿的構(gòu)建深度學(xué)習(xí)系統(tǒng)的策略。``

2018-11-30 16:45:03

機(jī)器算法學(xué)習(xí)比較

轉(zhuǎn)本文主要回顧下幾個(gè)常用算法的適應(yīng)場景及其優(yōu)缺點(diǎn)！機(jī)器學(xué)習(xí)算法太多了，分類、回歸、聚類、推薦、圖像識(shí)別領(lǐng)域等等，要想找到一個(gè)合適算法真的不容易，所以在實(shí)際應(yīng)用中，我們一般都是采用啟發(fā)式學(xué)習(xí)方式來實(shí)驗(yàn)

2016-09-27 10:48:01

機(jī)器視覺之ICP算法和RANSAC算法

）。而對(duì)應(yīng)點(diǎn)集配準(zhǔn)算法主要就是怎么計(jì)算出qR和qT的，知道這兩個(gè)就可以匹配點(diǎn)云了。但是對(duì)應(yīng)點(diǎn)集配準(zhǔn)算法的前提條件是計(jì)算中的點(diǎn)云數(shù)據(jù)PB和PR的元素一一對(duì)應(yīng)，這個(gè)條件在現(xiàn)實(shí)里因誤差等問題，不太可能實(shí)線

2019-06-19 08:00:00

Python機(jī)器學(xué)習(xí)常用庫

、Scikit-Learn在機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的應(yīng)用中，Scikit-Learn是一個(gè)功能強(qiáng)大的Python包，我們可以用它進(jìn)行分類、特征選擇、特征提取和聚集。二、StatsmodelsStatsmodels是另一個(gè)聚焦在

2018-03-26 16:29:41

RISC-V會(huì)成為芯片主流嗎

2021-08-27 15:21:03

[轉(zhuǎn)]物聯(lián)網(wǎng)和機(jī)器學(xué)習(xí)究竟有哪些真實(shí)應(yīng)用價(jià)值？

，機(jī)器學(xué)習(xí)需要大量數(shù)據(jù)，并產(chǎn)生對(duì)企業(yè)有幫助的洞見。這可能意味著機(jī)器學(xué)習(xí)能夠改善流程，降低成本，為用戶創(chuàng)造更好的體驗(yàn)，或開辟新的商業(yè)模式?！　∈聦?shí)是，大多數(shù)公司可以從傳統(tǒng)的數(shù)據(jù)分析中獲得足夠的好處，而

2017-04-19 11:01:42

【下載】《機(jī)器學(xué)習(xí)》+《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》

強(qiáng)化學(xué)習(xí)等.下載鏈接：[hide][/hide]2.機(jī)器學(xué)習(xí)實(shí)戰(zhàn)簡介：機(jī)器學(xué)習(xí)是人工智能研究領(lǐng)域中一個(gè)極其重要的研究方向，在現(xiàn)今的大數(shù)據(jù)時(shí)代背景下，捕獲數(shù)據(jù)并從中萃取有價(jià)值的信息或模式，成為各行業(yè)求生存

2017-06-01 15:49:24

【阿里云大學(xué)免費(fèi)精品課】機(jī)器學(xué)習(xí)入門：概念原理及常用算法

是實(shí)現(xiàn)人工智能的一個(gè)途徑，即以機(jī)器學(xué)習(xí)為手段解決人工智能中的問題。1.在維基百科中，機(jī)器學(xué)習(xí)有下面幾種定義：機(jī)器學(xué)習(xí)是一門人工智能的科學(xué)，該領(lǐng)域的主要研究對(duì)象是人工智能，特別是如何在經(jīng)驗(yàn)學(xué)習(xí)中改善具體算法

2017-06-23 13:51:15

為什么小數(shù)據(jù)比大數(shù)據(jù)更重要

就是有大量的數(shù)據(jù)，大量的數(shù)據(jù)中還有更多的數(shù)據(jù)屬性(attribute)，利用這些數(shù)據(jù)的方法就是通過這些大量的屬性來衍生可能被利用的推算。但是如此多的推算并不是每一個(gè)都可以被利用的，這么多屬性的推算很多

2017-12-27 14:54:28

人工智能、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的關(guān)系

人工智能、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)之間，主要有什么關(guān)系？

2020-03-16 11:35:54

人工智能和機(jī)器學(xué)習(xí)的前世今生

本身與統(tǒng)計(jì)學(xué)的原理密切相關(guān)，但是R作為機(jī)器學(xué)習(xí)語言可以帶來巨大的好處。如果你希望在大數(shù)據(jù)中解決模式問題，R語言是最佳選擇，它是由統(tǒng)計(jì)學(xué)家和科學(xué)家設(shè)計(jì)的，很方便地用于數(shù)據(jù)分析。機(jī)器學(xué)習(xí)算法的工作原理機(jī)器

2018-08-27 10:16:55

人工智能基本概念機(jī)器學(xué)習(xí)算法

目錄人工智能基本概念機(jī)器學(xué)習(xí)算法1. 決策樹2. KNN3. KMEANS4. SVM5. 線性回歸深度學(xué)習(xí)算法1. BP2. GANs3. CNN4. LSTM應(yīng)用人工智能基本概念數(shù)據(jù)集：訓(xùn)練集

2021-09-06 08:21:17

什么是機(jī)器學(xué)習(xí)? 機(jī)器學(xué)習(xí)基礎(chǔ)入門

的、面向任務(wù)的智能，這就是機(jī)器學(xué)習(xí)的范疇。我過去聽到的機(jī)器學(xué)習(xí)定義的最強(qiáng)大的方法之一是與傳統(tǒng)的、用于經(jīng)典計(jì)算機(jī)編程的算法方法相比較。在經(jīng)典計(jì)算中，工程師向計(jì)算機(jī)提供輸入數(shù)據(jù)ーー例如，數(shù)字2和4ーー以及將它

2022-06-21 11:06:37

什么是TinyML？微型機(jī)器學(xué)習(xí)

影響范圍，并在這一過程中開啟一個(gè)應(yīng)用的新時(shí)代，我們必須找到方法，在更小、更資源受限的設(shè)備上促進(jìn)機(jī)器學(xué)習(xí)的推理。這種追求導(dǎo)致了微型機(jī)器學(xué)習(xí)或 TinyML (TinyML 基金會(huì)的商標(biāo)名稱，已經(jīng)成為這項(xiàng)技術(shù)

2022-04-12 10:20:35

在Linux環(huán)境下有好的方法通過USB接收數(shù)據(jù)嗎？

解決方案可能不起作用。在批量傳輸失敗的情況下，我在考慮將傳輸設(shè)置為UsBuTART，只需將數(shù)據(jù)時(shí)鐘比普通UART數(shù)據(jù)速率快得多。如果我是這樣做的，在Linux環(huán)境下有沒有一種很好的方法通過USB接收數(shù)據(jù)

2019-09-18 13:58:59

基于人工智能克服數(shù)據(jù)分析限制

以色列實(shí)時(shí)分析和異常檢測的大數(shù)據(jù)創(chuàng)業(yè)公司Anodot目前正在使用先進(jìn)的機(jī)器學(xué)習(xí)算法來克服人類在數(shù)據(jù)分析方面的限制。人工智能可以通過分析所有數(shù)據(jù)提出更多的答案，而Anodot認(rèn)為沒有將機(jī)器學(xué)習(xí)整合到數(shù)據(jù)分析中的電子商務(wù)公司將會(huì)出現(xiàn)虧損。

2019-07-29 08:06:36

如何使用Arm CMSIS-DSP實(shí)現(xiàn)經(jīng)典機(jī)器學(xué)習(xí)庫

通常，當(dāng)開發(fā)人員談?wù)?b class="flag-6" style="color: red">機(jī)器學(xué)習(xí)(ML)時(shí)，他們指的是神經(jīng)網(wǎng)絡(luò)(nn)。神經(jīng)網(wǎng)絡(luò)的巨大優(yōu)勢(shì)在于，你不需要成為一個(gè)領(lǐng)域?qū)＜遥铱梢匝杆僬业揭粋€(gè)可行的解決方案。神經(jīng)網(wǎng)絡(luò)的缺點(diǎn)是它們通常需要無數(shù)的記憶

2023-08-02 07:12:59

如何在STM板上使用機(jī)器學(xué)習(xí)算法對(duì)通過工業(yè)傳感器獲取的氣體傳感器數(shù)據(jù)進(jìn)行分類？

我想在 STM 板上使用機(jī)器學(xué)習(xí)算法對(duì)通過工業(yè)傳感器獲取的氣體傳感器數(shù)據(jù)進(jìn)行分類。知道哪種 STM32 變體最適合此應(yīng)用嗎？

2023-01-10 07:10:16

如何在人工智能機(jī)器人領(lǐng)域應(yīng)用大數(shù)據(jù)？

，所以從長期來看，這些電影里面80%的內(nèi)容，是會(huì)成為現(xiàn)實(shí)的；但是短期來說，不管是技術(shù)還是產(chǎn)品方面，都還有些瓶頸，所以我覺得應(yīng)該慎談人工智能機(jī)器人。就像一個(gè)果實(shí)還沒有完全成熟的時(shí)候我們就想去摘它，或者有太高

2015-11-13 16:37:23

如何實(shí)現(xiàn)機(jī)器人的自我學(xué)習(xí)？

人可以有自我學(xué)習(xí)的技能，而機(jī)器人只能被灌輸既定的知識(shí)嗎？如何實(shí)現(xiàn)機(jī)器人的自我學(xué)習(xí)？考慮一個(gè)罐子，里面裝著橙色和綠色的彈珠。如何估計(jì)里面的橙色彈珠比例？一種方法是抽樣。如果樣本大小為N，樣本中橙色彈珠

2016-03-04 10:34:38

如何規(guī)劃出完美的機(jī)器學(xué)習(xí)入門路徑？| AI知識(shí)科普

。機(jī)器學(xué)習(xí)是一種計(jì)算機(jī)程序，可以從現(xiàn)有的經(jīng)驗(yàn)中學(xué)習(xí)如何完成·某項(xiàng)任務(wù)，并隨著經(jīng)驗(yàn)的增加，性能也會(huì)隨著提升。這里的經(jīng)驗(yàn)也就是所謂的數(shù)據(jù)，對(duì)于機(jī)器學(xué)習(xí)來說，數(shù)據(jù)庫的大小對(duì)結(jié)果起決定性作用。根據(jù)訓(xùn)練方法

2018-07-27 12:54:20

如何選擇機(jī)器學(xué)習(xí)的各種方法

的這篇博客，講述了如何選擇機(jī)器學(xué)習(xí)的各種方法。另外，Scikit-learn 也提供了一幅清晰的路線圖給大家選擇：其實(shí)機(jī)器學(xué)習(xí)的基本算法都很簡單，下面我們就利用二維數(shù)據(jù)和交互圖形來看看機(jī)器學(xué)習(xí)中的一些

2019-03-07 20:18:53

干貨 | 這些機(jī)器學(xué)習(xí)算法，你了解幾個(gè)？

！”相反，你心里通常有一個(gè)最終目標(biāo)，如利用它來預(yù)測結(jié)果或分類觀察。所以在機(jī)器學(xué)習(xí)中，有一種叫做“沒有免費(fèi)的午餐”的定理。簡而言之，它的意思就是說沒有任何一種算法可以完美地解決每個(gè)問題，這對(duì)于監(jiān)督式學(xué)習(xí)

2019-09-22 08:30:00

快速學(xué)習(xí)好嵌入式的好方法，大俠告訴你！

近日來，有一些初學(xué)嵌入式的網(wǎng)友問我有沒有特別好的學(xué)習(xí)方法，可以讓他們少走彎路?！　∑鋵?shí)也沒有什么特別好的學(xué)習(xí)方法，只是學(xué)習(xí)要抓住重點(diǎn)，要了解技術(shù)發(fā)展趨勢(shì)，抓住現(xiàn)在和將來用得著的內(nèi)容去學(xué)，再配以合適

2014-12-12 09:58:05

有沒有搞機(jī)器學(xué)習(xí)算法研究的啊？

有沒有搞機(jī)器學(xué)習(xí)、人工智能相關(guān)的算法研究的??？自己一個(gè)人搞感覺挺難的，希望找到志同道合的朋友，相互探討。

2016-02-26 09:56:00

有木有知道使用RSA算法數(shù)據(jù)加密滴？

有木有知道使用RSA算法數(shù)據(jù)加密滴？本人小小采購員一枚，工程那邊說要數(shù)據(jù)加密，采購加密芯片，還要有RSA算法。啥是RSA算法啊？有木有人用過?。?/div>

2015-11-26 13:59:11

深度學(xué)習(xí)中開發(fā)集和測試集的定義

集圖片均取自網(wǎng)站，這就導(dǎo)致了算法不能夠很好地泛化（generalize）到我們所關(guān)心的手機(jī)圖片的實(shí)際分布（actual distribution）情況上。在大數(shù)據(jù)時(shí)代來臨前，機(jī)器學(xué)習(xí)中的普遍做法

2018-11-30 16:58:52

經(jīng)典算法大全（51個(gè)C語言算法+單片機(jī)常用算法+機(jī)器學(xué)十大算法）

無監(jiān)督學(xué)習(xí)算法中，我們沒有目標(biāo)或結(jié)果變量來預(yù)測。通常用于不同群體的群體聚類。無監(jiān)督學(xué)習(xí)的例子：Apriori 算法，K-means。0.3 強(qiáng)化學(xué)習(xí) 工作原理：強(qiáng)化學(xué)習(xí)（reinforcement

2018-10-23 14:31:12

請(qǐng)教該程序?yàn)槭裁礋o法數(shù)據(jù)回放？

2015-06-21 15:28:44

阿里巴巴大數(shù)據(jù)產(chǎn)品最新特性介紹--機(jī)器學(xué)習(xí)PAI

算法工程師的實(shí)驗(yàn)構(gòu)建需求，使更多的人參與到機(jī)器學(xué)習(xí)，使用機(jī)器學(xué)習(xí)為自己的業(yè)務(wù)帶來價(jià)值。AutoLearning自動(dòng)學(xué)習(xí)功能有以下亮點(diǎn)。首先是零門檻使用，即功能開箱即用，對(duì)于小白同學(xué)特別友好。其次是最低

2019-09-18 14:57:22

FPGA技術(shù)協(xié)助嵌入式系統(tǒng)競逐于機(jī)器學(xué)習(xí)之路

機(jī)器學(xué)習(xí)技術(shù)是人工智能的一個(gè)重要科學(xué)發(fā)展，透過在經(jīng)驗(yàn)學(xué)習(xí)中改善具體算法的效能，而且用來訓(xùn)練的數(shù)據(jù)越多，所學(xué)習(xí)出來的結(jié)果越好，為了處理分析大量圖像或是語音等辨識(shí)的機(jī)器學(xué)習(xí)算法數(shù)據(jù)，需要采用GPU芯片

2017-03-27 14:58:11

1155

一文詳解機(jī)器學(xué)習(xí)工程師必知的10大算法

Netflix的算法可以根據(jù)你以前看過的電影來進(jìn)行電影推薦，而Amazon的算法則可以根據(jù)你以前買過的書來推薦書籍。所以如果你想了解更多有關(guān)機(jī)器學(xué)習(xí)的內(nèi)容，那么你該如何入門？

2018-07-08 11:05:00

1536

機(jī)器學(xué)習(xí)經(jīng)典算法-最優(yōu)化方法

機(jī)器學(xué)習(xí)算法之最優(yōu)化方法

2017-09-04 10:05:10

Spark機(jī)器學(xué)習(xí)庫的各種機(jī)器學(xué)習(xí)算法

本文將簡要介紹Spark機(jī)器學(xué)習(xí)庫（Spark MLlibs APIs）的各種機(jī)器學(xué)習(xí)算法，主要包括：統(tǒng)計(jì)算法、分類算法、聚類算法和協(xié)同過濾算法，以及各種算法的應(yīng)用。你不是一個(gè)數(shù)據(jù)科學(xué)家。根據(jù)

2017-09-28 16:44:43

基于DHP的并行化算法數(shù)據(jù)分析

是一個(gè)串行算法，不能有效處理較大規(guī)模數(shù)據(jù)。針對(duì)這一問題，提出DHP的并行化算法-HDHP。首先，對(duì)DHP算法并行化策略的可行性進(jìn)行了理論分析與證明；其次，基于Hadoop平臺(tái)，把Hash表皿的生成以及頻繁項(xiàng)集L，、L3 -k的生成方法進(jìn)行了并行實(shí)現(xiàn)，并借助Hbase數(shù)據(jù)庫生成關(guān)聯(lián)規(guī)則。仿

2017-12-11 16:02:21

面向認(rèn)知的多源數(shù)據(jù)學(xué)習(xí)理論和算法研究進(jìn)展

多源數(shù)據(jù)學(xué)習(xí)在大數(shù)據(jù)時(shí)代具有極其重要的意義，目前，多源數(shù)據(jù)學(xué)習(xí)算法研究遠(yuǎn)遠(yuǎn)超前于多源數(shù)據(jù)學(xué)習(xí)理論研究，經(jīng)典的機(jī)器學(xué)習(xí)理論難以應(yīng)用于多源數(shù)據(jù)學(xué)習(xí)。更難以提供多源數(shù)據(jù)學(xué)習(xí)算法在實(shí)際應(yīng)用中的理論保障

2017-12-26 16:10:41

機(jī)器學(xué)習(xí)算法分類

機(jī)器學(xué)習(xí)起源于人工智能，可以賦予計(jì)算機(jī)以傳統(tǒng)編程所無法實(shí)現(xiàn)的能力，比如飛行器的自動(dòng)駕駛、人臉識(shí)別、計(jì)算機(jī)視覺和數(shù)據(jù)挖掘等。機(jī)器學(xué)習(xí)的算法很多。很多時(shí)候困惑人們的是，很多算法是一類算法，而有些算法又是

2018-01-05 17:36:10

3101

機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘的關(guān)系

機(jī)器學(xué)習(xí)是一門更加偏向理論性學(xué)科，其目的是為了讓計(jì)算機(jī)不斷學(xué)習(xí)找到接近目標(biāo)函數(shù)f的假設(shè)h。而數(shù)據(jù)挖掘則是使用了包括機(jī)器學(xué)習(xí)算法在內(nèi)的眾多知識(shí)的一門應(yīng)用學(xué)科，它主要是使用一系列處理方法挖掘數(shù)據(jù)背后的信息。

2018-01-05 19:02:35

10382

人工智能之機(jī)器學(xué)習(xí)常見算法

機(jī)器學(xué)習(xí)無疑是當(dāng)前數(shù)據(jù)分析領(lǐng)域的一個(gè)熱點(diǎn)內(nèi)容。很多人在平時(shí)的工作中都或多或少會(huì)用到機(jī)器學(xué)習(xí)的算法。這里小編為您總結(jié)一下常見的機(jī)器學(xué)習(xí)算法，以供您在工作和學(xué)習(xí)中參考。

2018-02-02 17:20:46

1552

新手如何接觸機(jī)器學(xué)習(xí)的這十大算法一定不能錯(cuò)過

在神經(jīng)網(wǎng)絡(luò)的成功的帶動(dòng)下，越來越多的研究人員和開發(fā)人員都開始重新審視機(jī)器學(xué)習(xí)，開始嘗試用某些機(jī)器學(xué)習(xí)方法自動(dòng)解決可以輕松采集數(shù)據(jù)的問題。然而，在眾多的機(jī)器學(xué)習(xí)算法中，哪些是又上手快捷又功能強(qiáng)大、適合

2018-03-16 22:39:00

1048

一文看懂機(jī)器學(xué)習(xí)的相關(guān)問題

機(jī)器學(xué)習(xí)算法特別是深度學(xué)習(xí)近年來取得了極大的成功，但是你需要明白的是數(shù)據(jù)才是使機(jī)器學(xué)習(xí)成為可能的關(guān)鍵因素。你可以使用簡單的算法實(shí)現(xiàn)機(jī)器學(xué)習(xí)，但是沒有好的數(shù)據(jù)你將寸步難行。

2018-06-18 11:44:00

498

《機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘：方法和應(yīng)用》

《機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘：方法和應(yīng)用》來源：互聯(lián)網(wǎng)(轉(zhuǎn)載協(xié)議)發(fā)布日期：2011-09-16 09:56瀏覽： 7729 次專欄投稿值班編輯：QQ281688302 《機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘：方法

2018-06-27 18:38:01

639

從數(shù)據(jù)、算力、算法、教學(xué)總結(jié)機(jī)器學(xué)習(xí)的民主化

Siraj Raval從數(shù)據(jù)、算力、算法、教學(xué)四個(gè)方面總結(jié)了近年來機(jī)器學(xué)習(xí)是如何民主化的

2018-08-18 11:35:35

3310

MIT名譽(yù)校長預(yù)測：機(jī)器學(xué)習(xí)會(huì)成為被廣泛使用的工具

未來，機(jī)器學(xué)習(xí)會(huì)成為一種被更廣泛使用的工具。機(jī)器學(xué)習(xí)“會(huì)變得像使用Word、PowerPoint或者Excel一樣”，任何一個(gè)領(lǐng)域的研究人員都可以更容易地使用它。

2018-09-26 17:31:57

2675

10本讓你成為機(jī)器學(xué)習(xí)領(lǐng)域的專家的好書！

機(jī)器學(xué)習(xí)原理：預(yù)測數(shù)據(jù)分析向我們展示了基于關(guān)系和自定義算法的分析和數(shù)據(jù)選擇過程。這包括能從其他相關(guān)資源中獲取信息的更通用的信息學(xué)習(xí)。這本書還包含了復(fù)雜的基于概率的機(jī)器學(xué)習(xí)方法。

2019-01-11 16:01:02

3354

機(jī)器學(xué)習(xí)算法幫助我們做出更好的決定

機(jī)器學(xué)習(xí)算法，可以幫助我們做出更好的決策，通過將人類的偏見最小化，使用更完整的數(shù)據(jù)集，或者彌補(bǔ)我們決策軟件中已知的缺陷。

2019-08-14 16:47:57

2635

區(qū)塊鏈數(shù)據(jù)集有怎樣的機(jī)器學(xué)習(xí)方法

區(qū)塊鏈數(shù)據(jù)集提供了一個(gè)與加密貨幣資產(chǎn)行為相關(guān)的獨(dú)特的數(shù)據(jù)宇宙，因此，為機(jī)器學(xué)習(xí)方法的應(yīng)用提供了獨(dú)特的機(jī)會(huì)。

2019-11-26 09:49:14

758

如何使用機(jī)器學(xué)習(xí)來分析區(qū)塊鏈數(shù)據(jù)集

區(qū)塊鏈數(shù)據(jù)集提供了一個(gè)與加密貨幣資產(chǎn)行為相關(guān)的獨(dú)特的數(shù)據(jù)宇宙，因此，為機(jī)器學(xué)習(xí)方法的應(yīng)用提供了獨(dú)特的機(jī)會(huì)。然而，區(qū)塊鏈數(shù)據(jù)集的性質(zhì)和結(jié)構(gòu)給機(jī)器學(xué)習(xí)方法帶來了獨(dú)特的挑戰(zhàn)。

2019-11-26 11:38:52

1600

常見的機(jī)器學(xué)習(xí)錯(cuò)誤你有沒有中

沒有經(jīng)歷過任何學(xué)習(xí)的機(jī)器學(xué)習(xí)是毫無價(jià)值的。機(jī)器學(xué)習(xí)的真實(shí)用例是將算法應(yīng)用于大量的數(shù)據(jù)，并且使某些模式顯現(xiàn)出來，這些模式成了用于基于機(jī)器學(xué)習(xí)的應(yīng)用程序的培訓(xùn)。

2020-01-30 17:52:00

584

沒有大量訓(xùn)練數(shù)據(jù)時(shí)怎么生成更多的數(shù)據(jù)

成功訓(xùn)練計(jì)算機(jī)視覺任務(wù)的深層卷積神經(jīng)網(wǎng)絡(luò)需要大量數(shù)據(jù)。這是因?yàn)檫@些神經(jīng)網(wǎng)絡(luò)具有多個(gè)隱藏的處理層，并且隨著層數(shù)的增加，需要學(xué)習(xí)的樣本數(shù)也隨之增加。如果沒有足夠的訓(xùn)練數(shù)據(jù)，則該模型往往會(huì)很好地學(xué)習(xí)訓(xùn)練數(shù)據(jù)，這稱為過度擬合。如果模型過擬合，則其泛化能力很差，因此對(duì)未見的數(shù)據(jù)的表現(xiàn)很差。

2020-05-04 08:59:00

2727

機(jī)器學(xué)習(xí)算法已成為攻克醫(yī)療難疾的新救星

由劍橋大學(xué)領(lǐng)導(dǎo)的研究人員設(shè)計(jì)了一種用于藥物發(fā)現(xiàn)的機(jī)器學(xué)習(xí)算法，該算法的效率是工業(yè)標(biāo)準(zhǔn)的兩倍，可以加快開發(fā)新的疾病治療方法的進(jìn)程。

2020-05-28 09:04:51

563

中國機(jī)器學(xué)習(xí)開發(fā)平臺(tái)前景未來可期

機(jī)器學(xué)習(xí)是一種數(shù)據(jù)分析方法，通過使用迭代學(xué)習(xí)數(shù)據(jù)的算法，機(jī)器學(xué)習(xí)可以使電腦在沒有被明確編程看哪里的情況下，發(fā)現(xiàn)隱藏的領(lǐng)域。

2020-07-03 11:45:50

2646

機(jī)器學(xué)習(xí)算法使用機(jī)器來了解給定的數(shù)據(jù)集

機(jī)器學(xué)習(xí)一詞經(jīng)常與AI互換使用，盡管有明顯的區(qū)別。機(jī)器學(xué)習(xí)算法使用機(jī)器來了解給定的數(shù)據(jù)集。機(jī)器學(xué)習(xí)的一個(gè)子集包括深度學(xué)習(xí)，它在網(wǎng)絡(luò)安全領(lǐng)域顯示出了巨大的希望

2020-09-16 17:05:24

1980

干貨：遇到不同問題或項(xiàng)目應(yīng)采取的不同機(jī)器學(xué)習(xí)算法

剛開始學(xué)習(xí)數(shù)據(jù)科學(xué)時(shí)，筆者經(jīng)常面臨這樣一個(gè)問題：遇到具體問題，選擇何種算法才合適。也許你也和我一樣，搜了很多有關(guān)機(jī)器學(xué)習(xí)算法的文章，會(huì)看到許多詳細(xì)的描述，卻并沒有減少讓抉擇的難度。

2020-11-06 16:31:27

1703

機(jī)器學(xué)習(xí)新手基礎(chǔ)：十大算法導(dǎo)覽

機(jī)器學(xué)習(xí)中，有一個(gè)稱為 No Free Lunch 的定理。簡單來說，與監(jiān)督學(xué)習(xí)特別相關(guān)的這個(gè)定理，它指出沒有萬能算法，就是用一個(gè)算法能很好地解決每個(gè)問題。例如，不能說神經(jīng)網(wǎng)絡(luò)總是比決策樹更好

2020-11-27 10:00:48

2087

最實(shí)用的的五種機(jī)器學(xué)習(xí)算法

最實(shí)用的機(jī)器學(xué)習(xí)算法Top5 demi 在周一, 04/01/2019 - 10:35 提交本文將推薦五種機(jī)器學(xué)習(xí)算法，你應(yīng)該考慮是否將它們投入應(yīng)用。這五種算法覆蓋最常用于聚類、分類、數(shù)值預(yù)測

2021-03-24 16:14:31

5987

機(jī)器學(xué)習(xí)的訓(xùn)練樣本數(shù)據(jù)選擇方法綜述

機(jī)器學(xué)習(xí)作為數(shù)據(jù)挖掘中一種重要的工具，不只是對(duì)人的認(rèn)知學(xué)習(xí)過程的探索，還包括對(duì)數(shù)據(jù)的分析處理。面對(duì)大量數(shù)據(jù)的挑戰(zhàn)，目前一部分學(xué)者專注于機(jī)器學(xué)習(xí)算法的改進(jìn)和開拓，另一部分研究人員則致力于樣本數(shù)據(jù)的選擇

2021-04-26 14:45:46

基于機(jī)器學(xué)習(xí)算法的水文趨勢(shì)預(yù)測方法

針對(duì)傳統(tǒng)的利用神經(jīng)網(wǎng)絡(luò)等工具進(jìn)行水文趨勢(shì)預(yù)測得出結(jié)果不具備解釋性等不足，文中提出一種基于機(jī)器學(xué)習(xí)算法的水文趨勢(shì)預(yù)測方法，該方法旨在利用 XGBOOST機(jī)器學(xué)習(xí)算法建立參照期與水文預(yù)見期之間各水文特征

2021-04-26 15:39:30

機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的關(guān)系

簡單來說，機(jī)器學(xué)習(xí)就是針對(duì)現(xiàn)實(shí)問題，使用我們輸入的數(shù)據(jù)對(duì)算法進(jìn)行訓(xùn)練，算法在訓(xùn)練之后就會(huì)生成一個(gè)模型，這個(gè)模型就是對(duì)當(dāng)前問題通過數(shù)據(jù)捕捉規(guī)律的描述。然后我們將模型進(jìn)一步導(dǎo)入數(shù)據(jù)，或者引入新的數(shù)據(jù)

2022-06-29 10:51:08

4769

17個(gè)機(jī)器學(xué)習(xí)的常用算法

根據(jù)數(shù)據(jù)類型的不同，對(duì)一個(gè)問題的建模有不同的方式。在機(jī)器學(xué)習(xí)或者人工智能領(lǐng)域，人們首先會(huì)考慮算法的學(xué)習(xí)方式。在機(jī)器學(xué)習(xí)領(lǐng)域，有幾種主要的學(xué)習(xí)方式。將算法按照學(xué)習(xí)方式分類是一個(gè)不錯(cuò)的想法，這樣可以讓人們?cè)诮：?b class="flag-6" style="color: red">算法選擇的時(shí)候考慮能根據(jù)輸入數(shù)據(jù)來選擇最合適的算法來獲得最好的結(jié)果。

2022-08-11 11:20:17

1399

17個(gè)機(jī)器學(xué)習(xí)的常用算法！

源自：AI知識(shí)干貨根據(jù)數(shù)據(jù)類型的不同，對(duì)一個(gè)問題的建模有不同的方式。在機(jī)器學(xué)習(xí)或者人工智能領(lǐng)域，人們首先會(huì)考慮算法的學(xué)習(xí)方式。在機(jī)器學(xué)習(xí)領(lǐng)域，有幾種主要的學(xué)習(xí)方式。將算法按照學(xué)習(xí)方式分類是一個(gè)不錯(cuò)

2022-08-22 09:57:33

1445

機(jī)器學(xué)習(xí)算法的基礎(chǔ)介紹

現(xiàn)在，機(jī)器學(xué)習(xí)有很多算法。如此多的算法，可能對(duì)于初學(xué)者來說，是相當(dāng)不堪重負(fù)的。今天，我們將簡要介紹 10 種最流行的機(jī)器學(xué)習(xí)算法，這樣你就可以適應(yīng)這個(gè)激動(dòng)人心的機(jī)器學(xué)習(xí)世界了！

2022-10-24 10:08:42

1518

訓(xùn)練數(shù)據(jù)的質(zhì)量決定了機(jī)器學(xué)習(xí)算法的上限

由于欺詐(與洗錢非常相似)在交易總量中所占的比重不到 0.01% 或萬分之一，因此，存在確認(rèn)欺詐活動(dòng)的訓(xùn)練數(shù)據(jù)體量非常小。相應(yīng)地，數(shù)量如此之少的訓(xùn)練數(shù)據(jù)將導(dǎo)致機(jī)器學(xué)習(xí)算法的準(zhǔn)確度不佳。

2022-11-02 12:45:50

947

常用機(jī)器學(xué)習(xí)算法的基本概念和特點(diǎn)

沒有哪一種算法能夠適用所有情況，只有針對(duì)某一種問題更有用的算法。 機(jī)器學(xué)習(xí)算法不會(huì)要求一個(gè)問題被 100%求解，取而代之的是把問題轉(zhuǎn)化為最優(yōu)化的問題，用不同的算法優(yōu)化問題，從而比較得到盡量好的結(jié)果

2023-01-17 15:43:09

2979

機(jī)器學(xué)習(xí)算法的隨機(jī)數(shù)據(jù)生成簡析

在學(xué)習(xí)機(jī)器學(xué)習(xí)算法的過程中，我們經(jīng)常需要數(shù)據(jù)來驗(yàn)證算法，調(diào)試參數(shù)。

2023-03-15 09:07:48

360

機(jī)器學(xué)習(xí)的經(jīng)典算法與應(yīng)用

? 一、機(jī)器學(xué)習(xí)基礎(chǔ)概念 ? 關(guān)于數(shù)據(jù) ? 機(jī)器學(xué)習(xí)就是喂入算法和數(shù)據(jù)，讓算法從數(shù)據(jù)中尋找一種相應(yīng)的關(guān)系。 ? Iris 鳶尾花數(shù)據(jù)集是一個(gè)經(jīng)典數(shù)據(jù)集，在統(tǒng)計(jì)學(xué)習(xí)和機(jī)器學(xué)習(xí)領(lǐng)域都經(jīng)常被用作示例。數(shù)據(jù)

2023-05-28 11:29:41

652

微美全息構(gòu)建AI數(shù)據(jù)模型算法數(shù)據(jù)采集系統(tǒng)，大力提升數(shù)據(jù)利用效能

的關(guān)鍵。這就需要一些新的技術(shù)手段來幫助企業(yè)高效地處理大規(guī)模數(shù)據(jù)，從中挖掘出更有價(jià)值的信息，實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型和升級(jí)。據(jù)了解，微美全息(NASDAQ:WIMI)開發(fā)了AI數(shù)據(jù)模型算法數(shù)據(jù)采集系統(tǒng)，AI數(shù)據(jù)模型算法數(shù)據(jù)采集系統(tǒng)是一個(gè)綜合性

2023-07-03 11:00:25

304

機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的區(qū)別

　　機(jī)器學(xué)習(xí)是一種方法，利用算法來讓機(jī)器可以自我學(xué)習(xí)和適應(yīng)，而且不需要明確地編程。在許多應(yīng)用中，需要機(jī)器使用歷史數(shù)據(jù)訓(xùn)練模型，然后使用該模型來對(duì)新數(shù)據(jù)進(jìn)行預(yù)測或分類

2023-08-02 17:36:34

333

深度學(xué)習(xí)框架和深度學(xué)習(xí)算法教程

了基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方法。深度學(xué)習(xí)算法可以分為兩大類：監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)的基本任務(wù)是訓(xùn)練模型去學(xué)習(xí)輸入數(shù)據(jù)的特征和其對(duì)應(yīng)的標(biāo)簽，然后用于新數(shù)據(jù)的預(yù)測。而無監(jiān)督學(xué)習(xí)通常用于聚類、降維和生成模型等任務(wù)中

2023-08-17 16:11:26

638

機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘的對(duì)比與區(qū)別

。 機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘是一對(duì)相互關(guān)聯(lián)的領(lǐng)域。它們都是理解數(shù)據(jù)、建立模型和提取知識(shí)的工具，但目標(biāo)和方法有所不同。在這篇文章中，我們將比較機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘，并討論它們之間的區(qū)別和聯(lián)系。 機(jī)器學(xué)習(xí) 機(jī)器學(xué)習(xí)是一種人工

2023-08-17 16:11:33

1014

機(jī)器學(xué)習(xí)算法的5種基本算子

自主決策的方法和插件，其中包含了一系列常用的基本算子。在本文中，我們將會(huì)介紹機(jī)器學(xué)習(xí)算法的五種基本算子。一、求值算子求值算子是常用的機(jī)器學(xué)習(xí)算法中的一個(gè)基本元素，它通常用于對(duì)輸入數(shù)據(jù)進(jìn)行處理。在數(shù)據(jù)分析和處

2023-08-17 16:11:46

1245

機(jī)器學(xué)習(xí)算法匯總機(jī)器學(xué)習(xí)算法分類機(jī)器學(xué)習(xí)算法模型

機(jī)器學(xué)習(xí)算法匯總 機(jī)器學(xué)習(xí)算法分類 機(jī)器學(xué)習(xí)算法模型 機(jī)器學(xué)習(xí)是人工智能的分支之一，它通過分析和識(shí)別數(shù)據(jù)模式，學(xué)習(xí)從中提取規(guī)律，并用于未來的決策和預(yù)測。在機(jī)器學(xué)習(xí)中，算法是最基本的組成部分之一。算法

2023-08-17 16:11:48

632

機(jī)器學(xué)習(xí)算法總結(jié) 機(jī)器學(xué)習(xí)算法是什么機(jī)器學(xué)習(xí)算法優(yōu)缺點(diǎn)

機(jī)器學(xué)習(xí)算法總結(jié) 機(jī)器學(xué)習(xí)算法是什么?機(jī)器學(xué)習(xí)算法優(yōu)缺點(diǎn)? 機(jī)器學(xué)習(xí)算法總結(jié) 機(jī)器學(xué)習(xí)算法是一種能夠從數(shù)據(jù)中自動(dòng)學(xué)習(xí)的算法。它能夠從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)特征，進(jìn)而對(duì)未知數(shù)據(jù)進(jìn)行分類、回歸、聚類等任務(wù)。通過

2023-08-17 16:11:50

939

機(jī)器學(xué)習(xí)算法入門機(jī)器學(xué)習(xí)算法介紹機(jī)器學(xué)習(xí)算法對(duì)比

，討論一些主要的機(jī)器學(xué)習(xí)算法，以及比較它們之間的優(yōu)缺點(diǎn)，以便于您選擇適合的算法。一、機(jī)器學(xué)習(xí)算法的基本概念 機(jī)器學(xué)習(xí)是一種人工智能的技術(shù)，它允許計(jì)算機(jī)從歷史數(shù)據(jù)中學(xué)習(xí)模式，以便于更好地預(yù)測未來的數(shù)據(jù)。機(jī)器學(xué)習(xí)算法

2023-08-17 16:27:15

569

機(jī)器學(xué)習(xí)vsm算法

（VSM）算法計(jì)算相似性。本文將從以下幾個(gè)方面介紹機(jī)器學(xué)習(xí)vsm算法。 1、向量空間模型向量空間模型是一種常見的文本表示方法，根據(jù)文本的詞頻向量將文本映射到一個(gè)高維向量空間中。這種方法在信息檢索中被廣泛使用，可以使用余弦相

2023-08-17 16:29:35

529

python數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)

python數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí) Python是一個(gè)非常流行的編程語言，被廣泛用于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)領(lǐng)域。在本篇文章中，我們將探討Python在數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)中的應(yīng)用，并介紹一些Python中常

2023-08-17 16:29:38

818

機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘的區(qū)別機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘的關(guān)系

機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘的區(qū)別， 機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘的關(guān)系 機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘是如今熱門的領(lǐng)域。隨著數(shù)據(jù)規(guī)模的不斷擴(kuò)大，越來越多的人們認(rèn)識(shí)到數(shù)據(jù)分析的重要性。但是，機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘在實(shí)踐中常常被混淆

2023-08-17 16:30:00

1370

機(jī)器學(xué)習(xí)是什么意思？機(jī)器學(xué)習(xí)屬于什么分支？機(jī)器學(xué)習(xí)有什么用處？

的技術(shù)。在這個(gè)過程中，計(jì)算機(jī)通過不斷地迭代和學(xué)習(xí)，提高算法的準(zhǔn)確性和可靠性，從而可以更好地解決各種實(shí)際問題。 機(jī)器學(xué)習(xí)屬于計(jì)算機(jī)科學(xué)領(lǐng)域的一種技術(shù)，并在人工智能領(lǐng)域中具有重要的地位。它是數(shù)據(jù)挖掘和人工智能領(lǐng)域

2023-08-17 16:30:04

1148

機(jī)器學(xué)習(xí)有哪些算法？機(jī)器學(xué)習(xí)分類算法有哪些？機(jī)器學(xué)習(xí)預(yù)判有哪些算法？

機(jī)器學(xué)習(xí)有哪些算法？機(jī)器學(xué)習(xí)分類算法有哪些？機(jī)器學(xué)習(xí)預(yù)判有哪些算法？ 機(jī)器學(xué)習(xí)是一種人工智能技術(shù)，通過對(duì)數(shù)據(jù)的分析和學(xué)習(xí)，為計(jì)算機(jī)提供智能決策。機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)機(jī)器學(xué)習(xí)的基礎(chǔ)。常見的機(jī)器學(xué)習(xí)算法

2023-08-17 16:30:11

1245

機(jī)器學(xué)習(xí)的研究現(xiàn)狀和發(fā)展趨勢(shì) 機(jī)器學(xué)習(xí)的常見算法和優(yōu)缺點(diǎn)

隨著計(jì)算能力和大數(shù)據(jù)的崛起，機(jī)器學(xué)習(xí)算法正迎來快速發(fā)展的時(shí)期。在研究層面上，機(jī)器學(xué)習(xí)和深度學(xué)習(xí)是當(dāng)前最主要的熱點(diǎn)。在計(jì)算能力的推動(dòng)下，機(jī)器學(xué)習(xí)算法取得了許多重大突破，如AlphaGo戰(zhàn)勝人類棋手

2023-08-22 17:49:27

1659

已全部加載完成

搜索歷史

機(jī)器學(xué)習(xí)中更多的數(shù)據(jù)比更好的算法好？沒有合理的方法數(shù)據(jù)會(huì)成為噪音

評(píng)論

機(jī)器學(xué)習(xí)中更多的數(shù)據(jù)比更好的算法好？沒有合理的方法數(shù)據(jù)會(huì)成為噪音