0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

讓機器學(xué)習(xí)更容易的14種自由開源軟件工具

如意 ? 來源:今日頭條 ? 作者:云智時代 ? 2020-09-29 15:00 ? 次閱讀

通過一些易于實現(xiàn)的多樣化庫和框架能夠充分挖掘機器學(xué)習(xí)的預(yù)測能力。垃圾郵件過濾,面部識別,推薦引擎等等。當你要對大型數(shù)據(jù)集執(zhí)行預(yù)測分析或模式識別時,機器學(xué)習(xí)都是必經(jīng)之路。

自由開源軟件的激增,讓機器學(xué)習(xí)更容易在單機上大規(guī)模地通過大多數(shù)流行的編程語言實現(xiàn)。以下這些開源工具包括了適用于Python,R,C ++,Java,Scala,Clojure,JavaScript和Go之類的庫。

Apache Mahout

Apache Mahout提供了一種構(gòu)建用于托管機器學(xué)習(xí)應(yīng)用程序環(huán)境的方法,該環(huán)境可以快速有效地擴展來滿足需求。

Mahout主要與Apache Spark一起工作,最初是為了運行分布式應(yīng)用程序而設(shè)計,可以與Hadoop一起使用,但現(xiàn)在已擴展為與Flink和H2O等其他分布式后端一起使用。

Mahout在Scala中使用了一種域特定語言。版本0.14是對該項目做了主要內(nèi)部重構(gòu),默認基于Apache Spark 2.4.3。

Compose

Compose針對機器學(xué)習(xí)模型的一個常見問題,即標記原始數(shù)據(jù),這可能是一個緩慢而乏味的過程,但沒有它,機器學(xué)習(xí)模型就無法提供有用的結(jié)果。

通過Compose,用戶可以使用Python為數(shù)據(jù)編寫一組標記功能,因此可以通過編程方式進行標記。可以在數(shù)據(jù)上設(shè)置各種變換和閾值,以簡化標記過程。

Core ML Tools

Apple的Core ML框架能夠讓用戶將機器學(xué)習(xí)模型集成到應(yīng)用程序中,但使用其自己獨特的學(xué)習(xí)模型格式。但幸運的是,不必以Core ML格式預(yù)先訓(xùn)練模型就能使用它們;可以使用Core ML Tools將幾乎所有常用的機器學(xué)習(xí)框架中的模型轉(zhuǎn)換為Core ML。

Core ML Tools作為Python包運行,因此與大量的Python機器學(xué)習(xí)庫和工具集成在一起。TensorFlow,PyTorch,Keras,Caffe,ONNX,Scikit-learn,LibSVM和XGBoost的模型都可以轉(zhuǎn)換。神經(jīng)網(wǎng)絡(luò)模型還可以通過使用訓(xùn)練后量化來優(yōu)化大小。

Cortex

Cortex提供了一種方便的方法來使用Python和TensorFlow,PyTorch,Scikit-learn和其他模型提供來自機器學(xué)習(xí)模型的預(yù)測服務(wù)。大多數(shù)Cortex軟件包僅包含幾個文件,即你的核心Python邏輯,描述要使用的模型,以及要分配的計算資源類型的cortex.yaml文件,以及用于安裝任何所需Python要求的require.txt文件。

整個程序包作為Docker容器部署到AWS或另一個與Docker兼容的托管系統(tǒng)。計算資源的分配方式與在Kubernetes中使用的定義相呼應(yīng),因此你可以使用GPU或Amazon Inferentia ASIC加快服務(wù)速度。

Featuretools

特征工程或特征創(chuàng)建涉及獲取用于訓(xùn)練機器學(xué)習(xí)模型的數(shù)據(jù),并通常手動生成數(shù)據(jù)的經(jīng)過轉(zhuǎn)換和聚合的版本,這對于訓(xùn)練模型更為有用。

Featuretools為用戶提供了通過綜合數(shù)據(jù)幀中的數(shù)據(jù)而構(gòu)建的高級Python對象來執(zhí)行此操作的功能,并且可以針對從一個或多個數(shù)據(jù)幀中提取的數(shù)據(jù)執(zhí)行此操作。Featuretools還為綜合操作提供了通用原語(例如,time_since_previous提供帶時間戳數(shù)據(jù)實例之間的時間間隔),因此用戶不必自己滾動這些原語。

GoLearn

GoLearn是針對Google Go語言的機器學(xué)習(xí)庫,其創(chuàng)建的目標是簡化和可定制性。簡單之處在于在庫中加載和處理數(shù)據(jù)的方式,該方式在SciPy和R之后進行了模式化??啥ㄖ菩栽谟谌绾卧趹?yīng)用程序中輕松擴展某些數(shù)據(jù)結(jié)構(gòu)。

Gradio

構(gòu)建機器學(xué)習(xí)應(yīng)用程序時的一個常見挑戰(zhàn)是為模型訓(xùn)練和預(yù)測服務(wù)機制構(gòu)建可靠且易于定制的UI。Gradio提供了用于創(chuàng)建基于Web的UI的工具,這些工具讓用戶可以與模型進行實時交互。

其中包括幾個示例項目,例如Inception V3圖像分類器的輸入接口或MNIST手寫識別模型,讓用戶對如何在自己的項目中使用Gradio有所了解。

H2O

H2O目前正在進行第三次大修訂,它為內(nèi)存中的機器學(xué)習(xí)提供了一個完整的平臺,從訓(xùn)練到服務(wù)預(yù)測。H2O的算法適合于業(yè)務(wù)處理——比如欺詐或趨勢預(yù)測——而不是圖像分析。H2O可以獨立地與HDFS store交互,在YARN之上,在MapReduce中,或者直接在Amazon EC2實例中。

Hadoop專家可以使用Java與H2O進行交互,但是該框架還提供了針對Python,R和Scala的綁定,從而讓用戶也可以與這些平臺上可用的所有庫進行交互。還可以使用REST調(diào)用,將H2O集成到大多數(shù)管道中。

Oryx

由Cloudera Hadoop發(fā)行版的創(chuàng)建者提供的Oryx,使用Apache Spark和Apache Kafka在實時數(shù)據(jù)上運行機器學(xué)習(xí)模型。Oryx提供了一種構(gòu)建項目的方式,這些項目需要立即做出決定,例如推薦引擎或?qū)崟r異常檢測,這些都可以通過新數(shù)據(jù)和歷史數(shù)據(jù)獲得通知。

版本2.0對該項目幾乎進行了完全重新設(shè)計,其組件以lambda架構(gòu)松散耦合??梢噪S時添加新算法和這些算法的新抽象(例如,用于超參數(shù)選擇)。

PyTorch Lightning

當功能強大的項目流行時,通常會輔以易于使用的第三方項目。PyTorch Lightning為PyTorch提供了組織包裝,因此用戶可以專注于重要的代碼,而不必為每個項目編寫樣板。

PyTorch Lightning使用基于類的結(jié)構(gòu),因此PyTorch項目的每個常見步驟都封裝在類方法中。訓(xùn)練和驗證循環(huán)是半自動化的,因此你只需要為每個步驟提供邏輯即可。在多個GPU或不同的硬件組合中設(shè)置訓(xùn)練結(jié)果也更加容易,因為這樣做的指令和對象引用是集中的。

Scikit-learn

由于Python易于采用且?guī)缀踹m用于所有應(yīng)用程序的庫的廣泛性,它已成為數(shù)學(xué)科學(xué)和統(tǒng)計學(xué)的首選編程語言。Scikit-learn通過在幾個現(xiàn)有的Python軟件包(NumPy,SciPy和Matplotlib)之上構(gòu)建數(shù)學(xué)和科學(xué)工作來利用這一廣度。

生成的庫可用于交互式“工作臺”應(yīng)用程序或嵌入到其他軟件中并重新使用。該套件可通過BSD許可獲得,因此它是完全開放的,并且可重復(fù)使用。

Shogun

Shogun是這個工具中時間最長的項目之一。它創(chuàng)建于1999年,用C ++編寫,但是可以與Java,Python,C#,Ruby,R,Lua,Octave和Matlab一起使用。最新的主要版本6.0.0增加了對微軟Windows和Scala語言的本機支持。

雖然廣受歡迎,范圍廣泛,但Shogun也有競爭對手。另一個基于c++的機器學(xué)習(xí)庫Mlpack是在2011年才出現(xiàn)的,但是它聲稱比其他庫更快、更容易使用(通過一個更完整的API集)。

Spark MLlib

MLlib是Apache Spark和Apache Hadoop的機器學(xué)習(xí)庫,擁有許多常用算法和有用的數(shù)據(jù)類型,能夠快速,大規(guī)模地運行。盡管Java是在MLlib中工作的主要語言,但是Python用戶可以將MLlib與NumPy庫連接,Scala用戶可以針對MLlib編寫代碼,而R用戶可以從1.5版開始插入Spark。

MLlib的版本3專注于使用Spark的DataFrame API(與較早的RDD API相對),并提供了許多新的分類和評估功能。

另一個項目,MLbase,建立在MLlib的頂部,以使其更容易得出結(jié)果。用戶無需編寫代碼,而是使用SQL的聲明性語言進行查詢。

Weka

由Waikato大學(xué)的機器學(xué)習(xí)小組創(chuàng)建的Weka被稱為“無需編程的機器學(xué)習(xí)”。這是一個GUI工作臺,數(shù)據(jù)科學(xué)家無需編寫代碼即可組裝機器學(xué)習(xí)管道,訓(xùn)練模型和運行預(yù)測。

Weka直接與R,Apache Spark和Python合作,后者通過直接包裝或通過通用數(shù)值庫(如NumPy,Pandas,SciPy和Scikit-learn)的接口進行工作。Weka的一大優(yōu)勢在于,它為工作的各個方面提供了可瀏覽的友好界面,包括包裝管理,預(yù)處理,分類和可視化。
責編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編程
    +關(guān)注

    關(guān)注

    88

    文章

    3544

    瀏覽量

    93492
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8325

    瀏覽量

    132196
  • 開源工具
    +關(guān)注

    關(guān)注

    0

    文章

    27

    瀏覽量

    4438
收藏 人收藏

    評論

    相關(guān)推薦

    “0元購”智元靈犀X1機器人,軟硬件全套圖紙和代碼全公開!資料免費下載!

    軟件算法代碼+高性能關(guān)節(jié)電機,“人形機器人人人造”的理想真正成為現(xiàn)實,不管是愛好者還是科技達人,都能夠迅速搭建機器人并實現(xiàn)基本的行走功能,還可以通過智元
    發(fā)表于 10-25 15:20

    【「時間序列與機器學(xué)習(xí)」閱讀體驗】+ 簡單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機器學(xué)習(xí)融合應(yīng)用的宏偉藍圖。作者不僅扎實地構(gòu)建了時間序列分析的基礎(chǔ)知識,巧妙地展示了機器
    發(fā)表于 08-12 11:21

    ROS機器人開發(fā)更便捷,基于RK3568J+Debian系統(tǒng)發(fā)布!

    機器軟件框架一起使用,如ROS已與OpenRAVE、Orocos和Player集成。正是由于這一特點,探索開發(fā)ROS系統(tǒng)的人員眾多,遍布世界各地,形成一“百花齊放,家爭鳴”局面,促使ROS功能
    發(fā)表于 07-09 11:38

    機器學(xué)習(xí)在數(shù)據(jù)分析中的應(yīng)用

    隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)量的爆炸性增長對數(shù)據(jù)分析提出了更高的要求。機器學(xué)習(xí)作為一強大的工具,通過訓(xùn)練模型從數(shù)據(jù)中學(xué)習(xí)規(guī)律,為企業(yè)和組織提
    的頭像 發(fā)表于 07-02 11:22 ?431次閱讀

    工業(yè)機器人仿真軟件有哪些

    功能強大的機器人仿真和離線編程軟件,支持多種機器人品牌,如Fanuc、KUKA、ABB等。它提供了豐富的工具,如3D可視化、碰撞檢測、路徑優(yōu)化等。 CoppeliaSim (前稱V-R
    的頭像 發(fā)表于 06-17 09:34 ?3135次閱讀

    深入探討機器學(xué)習(xí)的可視化技術(shù)

    機器學(xué)習(xí)可視化(簡稱ML可視化)一般是指通過圖形或交互方式表示機器學(xué)習(xí)模型、數(shù)據(jù)及其關(guān)系的過程。目標是使理解模型的復(fù)雜算法和數(shù)據(jù)模式
    發(fā)表于 04-25 11:17 ?343次閱讀
    深入探討<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>的可視化技術(shù)

    示波器六大采集模式,信號采集容易

    示波器六大采集模式,信號采集容易! 示波器是一廣泛應(yīng)用于電子、電氣工程和通信領(lǐng)域的測量儀器。它可以將電信號轉(zhuǎn)換成可視化的波形圖,以便觀察和分析信號特征。在實際應(yīng)用中,示波器有多種
    的頭像 發(fā)表于 01-19 16:16 ?3161次閱讀

    開源項目!教你如何復(fù)刻自平衡賽車機器人、智能家居中控、競技機器人先進模糊控制器等

    開源項目作品 為了方便大家更好提升自己,電子發(fā)燒友小編為大家整理了一些工程師大佬設(shè)計的開源項目作品,供大家可以參考學(xué)習(xí),希望對廣大工程師有所幫助。 1.用全志R128復(fù)刻自平衡賽車機器
    發(fā)表于 12-26 09:17

    開源作品!稚暉君超迷你低成本開發(fā)板、超酷機器人、智能手環(huán)等參考方案

    復(fù)合機器人 本項目中,履足式復(fù)合機器人擁有兩行進模式:四足行進模式、履帶行進模式,應(yīng)對不同場景及地形時能夠切換形態(tài)。四足形態(tài)下整體總共擁有8個自由度DOF,單腿各具備2個
    發(fā)表于 12-12 10:28

    盤點國內(nèi)外免費SCADA軟件工具

    隨著工業(yè)自動化的飛速發(fā)展,SCADA系統(tǒng)已經(jīng)成為工業(yè)領(lǐng)域智能化轉(zhuǎn)型繞不開的重要工具,不少個人和公司也都加入到了學(xué)習(xí)研究SCADA系統(tǒng)的隊伍中。數(shù)維圖小編耗費大量時間整理了國內(nèi)外免費(非完全免費)的SCADA軟件
    的頭像 發(fā)表于 12-07 17:11 ?1757次閱讀
    盤點國內(nèi)外免費SCADA<b class='flag-5'>軟件</b><b class='flag-5'>工具</b>

    ROS機器人開發(fā)更便捷,基于RK3568J+Debian系統(tǒng)發(fā)布!

    是一個開源免費,架構(gòu)精簡的機器人操作系統(tǒng)。ROS被設(shè)計為盡可能精簡,以便為ROS編寫的代碼可與其他機器軟件框架一起使用,如ROS已與OpenRAVE、Orocos和Player集成。
    發(fā)表于 11-30 16:01

    精密信號鏈設(shè)計容易

    電子發(fā)燒友網(wǎng)站提供《精密信號鏈設(shè)計容易.pdf》資料免費下載
    發(fā)表于 11-23 15:54 ?0次下載
    <b class='flag-5'>讓</b>精密信號鏈設(shè)計<b class='flag-5'>更</b><b class='flag-5'>容易</b>

    Chiplet可以SoC設(shè)計變得容易嗎?

    理想情況下,chiplet可以像搭積木一樣組合成現(xiàn)成的產(chǎn)品,無需使用EDA工具。
    的頭像 發(fā)表于 11-09 11:48 ?405次閱讀

    NNI:自動幫你做機器學(xué)習(xí)調(diào)參的神器

    。 想要在 不同的環(huán)境中 加速運行機器學(xué)習(xí)。 想要容易 實現(xiàn)或試驗新的機器學(xué)習(xí)算法 的研究員
    的頭像 發(fā)表于 10-30 10:28 ?2240次閱讀
    NNI:自動幫你做<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>調(diào)參的神器