0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

10個(gè)Python機(jī)器學(xué)習(xí)庫介紹

馬哥Linux運(yùn)維 ? 來源:量子位 ? 作者:量子位 ? 2022-09-05 15:55 ? 次閱讀

1. Awkward Array

根據(jù)官方介紹,Awkward Array用于嵌套的、大小不一的數(shù)據(jù),包括任意長度的列表、記錄、混合的類型和缺失數(shù)據(jù),使用起來類似NumPy。

看起來像是升級(jí)版的NumPy呀。

73291e1a-2c5b-11ed-ba43-dac502259ad0.png

果然,不同長度的數(shù)組可以直接放在一起運(yùn)算。

734e081a-2c5b-11ed-ba43-dac502259ad0.png

并且,官方表示Awkward Array不僅使用起來更簡便,在速度和內(nèi)存上也有量級(jí)的優(yōu)勢。

看看是不是可以安排上了~

https://pypi.org/project/awkward/

2. Jupytext

相信大家對(duì)Jupyter Notebook都不陌生。

當(dāng)你有了Jupytext這個(gè)小插件就可以將Jupyter Notebook和IDE完美結(jié)合,聽起來是不是很棒!

從此Jupyter Notebook可以被存儲(chǔ)為Markdown文件或多種語言的腳本文件。

Jupytext可以做的事主要有:

Jupyter Notebook的版本控制

在你喜歡的文本編輯器中編輯、合并或重構(gòu)Notebook

在Notebook上使用Q&A檢查

Python中使用的樣子:

737403c6-2c5b-11ed-ba43-dac502259ad0.png

此項(xiàng)目在Github上已有5k+star。

https://github.com/mwouts/jupytext

3. Gradio

比Streamlit還輕量的UI設(shè)計(jì)庫,Gradio讓你輕松在瀏覽器中“玩轉(zhuǎn)”你的模型,可以直接在瀏覽器中拖放圖片,粘貼文字,錄制聲音,等等。

739bbbdc-2c5b-11ed-ba43-dac502259ad0.png

73b51c6c-2c5b-11ed-ba43-dac502259ad0.gif

只要將launch()函數(shù)中的參數(shù)設(shè)置為share=True,還能得到一個(gè)可分享的網(wǎng)址,拿到鏈接的朋友在電腦手機(jī)端都能打開,活脫脫就是一個(gè)小程序。

時(shí)常需要做Demo的小伙伴快看起來吧,此項(xiàng)目在Github上已有4.5k+star。

https://github.com/gradio-app/gradio

4. Hub

這個(gè)Hub在數(shù)據(jù)管理和數(shù)據(jù)預(yù)處理上可是一把好手。

它可以處理任何類型,任何大小的數(shù)據(jù),并且因?yàn)閿?shù)據(jù)儲(chǔ)存在云端上,所以可以無縫在任何機(jī)器上訪問。

被壓縮為二進(jìn)制字節(jié)的數(shù)據(jù)可以被存儲(chǔ)在任何地方,并且只有在需要的時(shí)候才會(huì)被獲取,所以沒有TB級(jí)硬盤也可以處理TB級(jí)數(shù)據(jù)。

Hub貼心地提供了重要API,支持?jǐn)?shù)據(jù)在常用工具(PyTorch等)上的使用,數(shù)據(jù)版本控制,數(shù)據(jù)轉(zhuǎn)換等功能。

此項(xiàng)目在github上已有4.1k+star。

https://github.com/activeloopai/Hub

5. AugLy

AugLy是facebook最新推出的數(shù)據(jù)增強(qiáng)庫,同時(shí)支持語音,文本,圖像和視頻類型的數(shù)據(jù),包含了100多種增強(qiáng)方式。

數(shù)據(jù)對(duì)于模型訓(xùn)練至關(guān)重要,而標(biāo)注大規(guī)模數(shù)據(jù)十分困難。由于人力資源,和模型特性的限制,數(shù)據(jù)增強(qiáng)的應(yīng)用越來越廣泛。

AugLy的優(yōu)點(diǎn):

處理類型更為全面。其他的數(shù)據(jù)增強(qiáng)庫,例如Albumentations和NVIDIA DALI,主要負(fù)責(zé)圖像相關(guān)數(shù)據(jù)的處理,文字?jǐn)?shù)據(jù)不支持。

處理方式十分人性化。AugLy可以將一張圖片做成備忘錄,在圖片/視頻上疊加文字/Emojis,轉(zhuǎn)發(fā)社交媒體上的截圖,還可以幫助你處理諸如拷貝檢測、仇恨言論檢測或版權(quán)侵權(quán)等問題。

此項(xiàng)目在Github上已有4.1k+star。

https://github.com/facebookresearch/AugLy

6. Evidently

Evidently是用來監(jiān)測模型效果的工具,可從Pandas DataFrame或csv文件中生成交互式可視化報(bào)告和JSON格式的效果簡介。在Jupyter Notebook中可以使用。

741daec6-2c5b-11ed-ba43-dac502259ad0.png

目前可以提供6種報(bào)告:數(shù)據(jù)漂移、數(shù)值目標(biāo)漂移、分類目標(biāo)漂移、回歸模型性能、分類模型性能和概率分類模型性能。

此項(xiàng)目在Github上已有1.8k+star。

https://github.com/evidentlyai/evidently

7. YOLOX

如果你熟悉YOLO的話,那你或許會(huì)對(duì)曠視今年推出的YOLOX感興趣。

YOLO就是那個(gè)目標(biāo)檢測算法,可以被使用在汽車自動(dòng)駕駛等前沿技術(shù)中。

而YOLOX是YOLO的無錨版本,設(shè)計(jì)更簡單,但性能更好!它的目標(biāo)是在研究界和工業(yè)界之間架起一座橋梁,同時(shí)彌合兩方之間的差距。

這個(gè)Github上的開源項(xiàng)目在短短半年內(nèi)已獲得5.2k+star。

https://github.com/Megvii-BaseDetection/YOLOX

8. LightSeq

正如它的名字一樣,LightSeq是一款由字節(jié)跳動(dòng)開發(fā)的支持BERT、GPT、Transformer等眾多模型的超快推理引擎。

可以看到它的表現(xiàn),比FasterTransformer還要Fast。

747d7a04-2c5b-11ed-ba43-dac502259ad0.png

LightSeq支持的模型也是非常全面。

74a211de-2c5b-11ed-ba43-dac502259ad0.png

總之就是兩個(gè)字“好用”。此項(xiàng)目在Github上已有1.9k+star。

https://github.com/bytedance/lightseq

9. Greykite

想預(yù)測COVID-19的恢復(fù)速度嗎?那就來看看LinkedIn為了自家時(shí)間序列預(yù)測需求開發(fā)的Greykite吧。

74b22a74-2c5b-11ed-ba43-dac502259ad0.png

功能全面(多種時(shí)間趨勢),界面直觀,預(yù)測速度快和可擴(kuò)展性強(qiáng)是它最大的亮點(diǎn)。

74e67bd0-2c5b-11ed-ba43-dac502259ad0.png

被應(yīng)用在上面的三大算法:

Silverkite (Greykite’s flagship algorithm)

Facebook Prophet

Auto Arima

感興趣的話就去研究看看吧,此項(xiàng)目在Github上已有1.4k+star。

https://github.com/linkedin/greykite

10. Jina and Finetuner

如今,在搜索引擎等應(yīng)用上,語義識(shí)別的地位越來越高,因?yàn)樗梢杂行П苊庾衷~匹配的局限。

不過語義識(shí)別涉及的神經(jīng)網(wǎng)絡(luò)可能會(huì)讓很多人感到頭大,Jina和Finetuner可以幫你解決這些問題。

750864b6-2c5b-11ed-ba43-dac502259ad0.png

Jina是一個(gè)神經(jīng)搜索框架,使任何人都能在幾分鐘內(nèi)建立可擴(kuò)展的深度學(xué)習(xí)搜索應(yīng)用程序。

Finetuner配合Jina幫助你對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行調(diào)參,以獲得神經(jīng)搜索任務(wù)的最佳結(jié)果。

Jina和Finetuner適合沒什么經(jīng)驗(yàn),又想嘗試的朋友。

https://github.com/jina-ai/finetuner

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4259

    瀏覽量

    62228
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8323

    瀏覽量

    132165
  • python
    +關(guān)注

    關(guān)注

    54

    文章

    4758

    瀏覽量

    84289

原文標(biāo)題:這 10 個(gè) Python 機(jī)器學(xué)習(xí)庫,你用過哪些?

文章出處:【微信號(hào):magedu-Linux,微信公眾號(hào):馬哥Linux運(yùn)維】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和?

    RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和?還請(qǐng)壇友們多多指教一下。
    發(fā)表于 10-10 22:24

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

    本人有些機(jī)器學(xué)習(xí)的基礎(chǔ),理解起來一點(diǎn)也不輕松,加油。 作者首先說明了時(shí)間序列的信息提取是時(shí)間序列分析的一個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測任務(wù),可以
    發(fā)表于 08-14 18:00

    pytorch和python的關(guān)系是什么

    在當(dāng)今的人工智能領(lǐng)域,Python已經(jīng)成為了最受歡迎的編程語言之一。Python的易學(xué)易用、豐富的和框架以及強(qiáng)大的社區(qū)支持,使其成為了數(shù)據(jù)科學(xué)、機(jī)器
    的頭像 發(fā)表于 08-01 15:27 ?1204次閱讀

    opencv-python和opencv一樣嗎

    不一樣。OpenCV(Open Source Computer Vision Library)是一個(gè)開源的計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)軟件,它提供了大量的圖像和視頻處理功能。OpenCV-
    的頭像 發(fā)表于 07-16 10:38 ?682次閱讀

    深度學(xué)習(xí)常用的Python

    深度學(xué)習(xí)作為人工智能的一個(gè)重要分支,通過模擬人類大腦中的神經(jīng)網(wǎng)絡(luò)來解決復(fù)雜問題。Python作為一種流行的編程語言,憑借其簡潔的語法和豐富的支持,成為了深度
    的頭像 發(fā)表于 07-03 16:04 ?471次閱讀

    如何使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)自動(dòng)訓(xùn)練?

    如何使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)自動(dòng)訓(xùn)練? 使用Python進(jìn)行圖像識(shí)別的自動(dòng)學(xué)習(xí)和自動(dòng)訓(xùn)練需要掌握一些重要的概念和技術(shù)。在本文中,我們將
    的頭像 發(fā)表于 01-12 16:06 ?499次閱讀

    python常用機(jī)器學(xué)習(xí)及深度學(xué)習(xí)介紹

    目前,隨著人工智能的大熱,吸引了諸多行業(yè)對(duì)于人工智能的關(guān)注,同時(shí)也迎來了一波又一波的人工智能學(xué)習(xí)的熱潮,雖然人工智能背后的原理并不能通過短短一文給予詳細(xì)介紹,但是像所有學(xué)科一樣,我們并不需要從頭開始”造輪子“,可以通過使用豐富的人工智能框架來快速構(gòu)建人工智能模型,從而入門
    的頭像 發(fā)表于 01-03 10:28 ?714次閱讀
    <b class='flag-5'>python</b>常用<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>及深度<b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>庫</b><b class='flag-5'>介紹</b>

    phpy:PHP與Python互調(diào)用

    phpy 是識(shí)沃團(tuán)隊(duì)最新推出的開源項(xiàng)目,目標(biāo)是為 PHP 引入 Python 生態(tài),來彌補(bǔ) PHP 生態(tài)的空缺和不足。phpy 使得 PHP 可以調(diào)用所有 Python 的包。 包括當(dāng)下非常流行
    的頭像 發(fā)表于 12-12 10:43 ?935次閱讀
    phpy:PHP與<b class='flag-5'>Python</b>互調(diào)用<b class='flag-5'>庫</b>

    python軟件對(duì)電腦配置要求

    Python是一種流行的編程語言,它在許多不同的領(lǐng)域中被廣泛使用,例如網(wǎng)站開發(fā)、數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)等。對(duì)于使用Python的開發(fā)者來說,了解Pyth
    的頭像 發(fā)表于 11-29 14:58 ?9388次閱讀

    python第三方有哪些

    和物理模擬等領(lǐng)域中發(fā)揮著重要的作用。 Pandas Pandas 是一個(gè)用于數(shù)據(jù)處理和分析的 Python 。它
    的頭像 發(fā)表于 11-29 14:31 ?2017次閱讀

    python軟件怎么運(yùn)行代碼

    Python是一種高級(jí)編程語言,它被廣泛用于開發(fā)各種類型的應(yīng)用程序,從簡單的腳本到復(fù)雜的網(wǎng)絡(luò)應(yīng)用和機(jī)器學(xué)習(xí)模型。要運(yùn)行Python代碼,您需要一個(gè)
    的頭像 發(fā)表于 11-28 16:02 ?817次閱讀

    python如何打開gui界面

    Python中打開GUI界面,可以使用多種或框架,如Tkinter、PyQt、wxPython等。下面將詳細(xì)介紹如何使用Tkinter創(chuàng)建一個(gè)GUI界面。在寫文章時(shí),建議參考以下提
    的頭像 發(fā)表于 11-22 14:12 ?871次閱讀

    python中如何引入math

    Python中,要使用math,首先需要先引入它。mathPython的一個(gè)標(biāo)準(zhǔn),它提
    的頭像 發(fā)表于 11-22 11:03 ?3752次閱讀

    時(shí)間序列分析的四個(gè)基本Python介紹

    在本文中,我們將介紹個(gè)主要的Python——statmodels、tslearn、tssearch、 tsfresh ——每個(gè)都針對(duì)時(shí)
    的頭像 發(fā)表于 11-03 10:17 ?751次閱讀
    時(shí)間序列分析的四<b class='flag-5'>個(gè)</b>基本<b class='flag-5'>Python</b><b class='flag-5'>庫</b><b class='flag-5'>介紹</b>

    Python項(xiàng)目中遇到的10個(gè)安全陷阱

    極少的微妙之處或細(xì)節(jié)會(huì)使開發(fā)者們疏忽大意,從而在代碼中引入嚴(yán)重的安全漏洞。 在這篇博文中,我們將分享在實(shí)際 Python 項(xiàng)目中遇到的 10 個(gè)安全陷阱。我們選擇了一些在技術(shù)圈中不太為人所知的陷阱。通過
    的頭像 發(fā)表于 10-30 10:34 ?419次閱讀