0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

推薦神器:四大可供學(xué)習(xí)Pandas的GitHub代碼庫

如意 ? 來源:讀芯術(shù)微信公眾號 ? 作者:讀芯術(shù)微信公眾號 ? 2020-08-19 13:40 ? 次閱讀

Github的大名想必?zé)o人不知,無人不曉。一些新手或許會不敢接觸Github,但同為初學(xué)者,我非常清楚Github的用途遠(yuǎn)不止管理項(xiàng)目版本。除了人人都可參與的開源項(xiàng)目以外,Github上還有豐富的學(xué)習(xí)資源。

網(wǎng)課固然讓人受益良多,但輔以練習(xí)才能鞏固新知。一些常用網(wǎng)站,例如“Codewars”和“Codekata”,提供每日練習(xí),用戶可根據(jù)自身需求選擇語言并解題。

如果要針對Pandas進(jìn)行強(qiáng)化練習(xí),可以參考下列四大可供學(xué)習(xí)Pandas的Github代碼倉庫。其中一個代碼倉庫經(jīng)Fork次數(shù)最多,受眾層次廣,Pandas新手以及進(jìn)階學(xué)習(xí)者都可使用。

Pandas Exercises——多種類數(shù)據(jù)(4k Forks)

該代碼倉庫由11個部分組成,涵蓋了從數(shù)據(jù)預(yù)處理到高級數(shù)據(jù)可視化等內(nèi)容。每個文件夾中有多個數(shù)據(jù)集,包含不同的練習(xí)。

用戶可下載IPYNB文件,打開Jupyter notebook,親自動手一試。可將代碼輸入題目下方的空白cell框格中,并查看“Exercise_with_Solution.ipynb”文件以核對答案。

該代碼倉庫資源綜合性強(qiáng),共有27個notebook可供使用。即使已經(jīng)熟悉Pandas,“入門須知(Getting and knowing)”部分也值得一看,或許可從中新學(xué)到.describe(include=all) 和 .nunique()等函數(shù)。

Pandas Videos——多種類數(shù)據(jù)/含視頻(1.2k Forks)

該代碼倉庫內(nèi)含的Jupyter notebook附有代碼,其代碼來自于一個介紹Pandas多種不同功能的系列視頻。作者使用真實(shí)數(shù)據(jù)集,遍歷了解決問題的全過程,將其寫進(jìn)notebook中并發(fā)布于網(wǎng)上。

理想狀態(tài)下,打開Jupyter notebook后便會隨之播放視頻。視頻和代碼都瀏覽完畢后,可將代碼倉庫中的notebook作為“答題紙”。這些notebook中還附有腳注,有助于厘清特定cell框格的輸出結(jié)果。

這些視頻與相應(yīng)的notebook綜合性極強(qiáng)。對于Pandas相關(guān)的疑問,諸如“如何對Pandas中的Series和Dataframe進(jìn)行排序”等簡單小問題,或是“如何用Pandas和sci-kit learn在Kaggle完成提交”等復(fù)雜大問題,都能在這一代碼倉庫中獲得解答。

100 Pandas Puzzles(1k Forks)

該代碼庫中含有一個Jupyter notebook文件和一些練習(xí)以供下載。用戶可將代碼填入問題下方的cell框格中,并可與“solutionsnotebook”文件中的相應(yīng)cell框格進(jìn)行比對。

notebook由不同部分組成,包括“導(dǎo)入Pandas(Importing Pandas)”、“DataFrame基礎(chǔ)知識(DataFrame basics)”和“Series與DatetimeIndex(Series andDatetimeIndex)”等。大多數(shù)問題并不需大段代碼,在理想情況下僅用寥寥幾行即可解決。

該代碼倉庫中的“掃雷(Minesweeper)”部分很有趣,內(nèi)容包含:創(chuàng)建DataFrame,使其內(nèi)含掃雷游戲的必要數(shù)據(jù),包括方格坐標(biāo)值、格內(nèi)是否含雷及其相鄰方格中的含雷數(shù)量?!皰呃住敝械绕y,對于已完成之前練習(xí)的人來說,仍屬力所能及之范圍。有別于傳統(tǒng)的數(shù)據(jù)分析,該部分考察了在特殊場景中運(yùn)用DataFrame的能力,頗具趣味性。

作者也指出了題目列表尚不完整,有意完善題目的人可以提出申請,以獲取更多練習(xí)、做出更正和改進(jìn)。

Pycon 2019 Tutorial——中等難度(180 Forks)

該代碼倉庫中含有一個極長的notebook,其中有作者在自制的“使用Pandas的最佳數(shù)據(jù)科學(xué)實(shí)踐(Data Science Best Practices with Pandas)”視頻中討論到的代碼。該代碼倉庫不含Pandas的基礎(chǔ)知識,因此適合中等水平的Pandas用戶使用。

它共有八個主要部分,并不十分遵循“教程”模式,更類似于真實(shí)的數(shù)據(jù)分析項(xiàng)目,從數(shù)據(jù)檢驗(yàn)、數(shù)據(jù)清洗到創(chuàng)建初步可視化,以幫助解答一些具體的問題,例如“平均來說,哪類職業(yè)的工作者發(fā)表的TED演講最為有趣?”等。

對于剛接觸Python和Pandas的數(shù)據(jù)分析項(xiàng)目的新手來說,可以觀看整個視頻來學(xué)習(xí)他人如何完成數(shù)據(jù)清洗、探索和分析等不同步驟,取其精華并活用于自己的項(xiàng)目之中。

學(xué)習(xí)的途徑多種多樣,你不妨從中選取符合自己Pandas水平的學(xué)習(xí)資源,在Github上一試身手。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    6760

    瀏覽量

    88619
  • 源代碼
    +關(guān)注

    關(guān)注

    96

    文章

    2943

    瀏覽量

    66570
  • GitHub
    +關(guān)注

    關(guān)注

    3

    文章

    461

    瀏覽量

    16327
收藏 人收藏

    評論

    相關(guān)推薦

    上傳本地項(xiàng)目代碼github

    概述 GitHub是一個面向開源及私有軟件項(xiàng)目的托管平臺,因?yàn)橹恢С謌it 作為唯一的版本格式進(jìn)行托管,故名GitHub。本文主要講解如何將本地代碼上傳至
    發(fā)表于 09-11 16:33

    一種常用嵌入式開發(fā)代碼

    語言std,工具等等。具有簡單,通用,高效的特點(diǎn),目的為了學(xué)習(xí)以及在開發(fā)中拿來就用,提高開發(fā)效率以及代碼可靠穩(wěn)定性。
    的頭像 發(fā)表于 09-04 08:06 ?324次閱讀
    一種常用嵌入式開發(fā)<b class='flag-5'>代碼</b><b class='flag-5'>庫</b>

    GitHub推出GitHub Models服務(wù),賦能開發(fā)者智能選擇AI模型

    8月2日,全球領(lǐng)先的代碼托管平臺GitHub宣布了一項(xiàng)重大創(chuàng)新——GitHub Models服務(wù)的正式推出。該服務(wù)被定位為AI時代的工程師助手,旨在幫助全球超過1億的GitHub用戶輕
    的頭像 發(fā)表于 08-02 15:39 ?458次閱讀

    深度學(xué)習(xí)常用的Python

    深度學(xué)習(xí)作為人工智能的一個重要分支,通過模擬人類大腦中的神經(jīng)網(wǎng)絡(luò)來解決復(fù)雜問題。Python作為一種流行的編程語言,憑借其簡潔的語法和豐富的支持,成為了深度學(xué)習(xí)研究和應(yīng)用的首選工具。本文將深入探討
    的頭像 發(fā)表于 07-03 16:04 ?473次閱讀

    GitHub推出新功能:智能掃描代碼潛在漏洞

    代碼掃描”功能還能預(yù)防新手引入新的問題,并支持在設(shè)定的日期和時間進(jìn)行掃描,或者讓特定事件(如推送到倉庫中)觸發(fā)掃描。若AI判定代碼內(nèi)可能存在隱患,GitHub將在倉庫中發(fā)出預(yù)警,待用戶修正引發(fā)求救信號的部分后,再撤銷警告。
    的頭像 發(fā)表于 03-21 14:55 ?530次閱讀

    MES實(shí)施的四大疑惑

    電子發(fā)燒友網(wǎng)站提供《MES實(shí)施的四大疑惑.docx》資料免費(fèi)下載
    發(fā)表于 03-01 15:35 ?0次下載

    GitHub Copilot Enterprise全線向企業(yè)客戶開放,提供個性化定制服務(wù)

    在官方博客中,GitHub 詳細(xì)說明了新版本 Enterprise 在標(biāo)準(zhǔn)版和商業(yè)版 GitHub Copilot 基礎(chǔ)上的差異點(diǎn)。Enterprise 特有功能包括依據(jù)企業(yè)特定代碼和知識
    的頭像 發(fā)表于 02-28 15:45 ?600次閱讀

    Python利用pandas讀寫Excel文件

    使用pandas模塊讀取Excel文件可以更為方便和快捷。pandas可以將Excel文件讀取為一個DataFrame對象,方便進(jìn)行數(shù)據(jù)處理和分析。
    的頭像 發(fā)表于 12-16 11:22 ?1162次閱讀
    Python利用<b class='flag-5'>pandas</b>讀寫Excel文件

    GitHub入門與實(shí)踐

    GitHub 是一個基于 Git 版本控制系統(tǒng)的代碼托管平臺,它提供了許多功能和用途,主要面向軟件開發(fā)和協(xié)作。以下是 GitHub 的主要用途和一些關(guān)鍵技術(shù):GitHub 的主要用途:
    發(fā)表于 12-14 09:53 ?6次下載

    GitHub底層數(shù)據(jù)無縫升級到MySQL 8.0的經(jīng)驗(yàn)

    GitHub 團(tuán)隊(duì)近日分享了他們將 GitHub.com 的底層數(shù)據(jù)無縫升級到 MySQL 8.0 的經(jīng)驗(yàn)。 據(jù)介紹,GitHub 使用 MySQL 來存儲大量關(guān)系數(shù)據(jù),因此在不影響
    的頭像 發(fā)表于 12-13 10:21 ?447次閱讀
    <b class='flag-5'>GitHub</b>底層數(shù)據(jù)<b class='flag-5'>庫</b>無縫升級到MySQL 8.0的經(jīng)驗(yàn)

    使用pandas進(jìn)行數(shù)據(jù)選擇和過濾的基本技術(shù)和函數(shù)

    Python pandas提供了幾種選擇和過濾數(shù)據(jù)的方法,如loc、iloc、[]括號操作符、query、isin、between等等
    的頭像 發(fā)表于 12-01 10:14 ?310次閱讀
    使用<b class='flag-5'>pandas</b>進(jìn)行數(shù)據(jù)選擇和過濾的基本技術(shù)和函數(shù)

    Pandas DataFrame的存儲格式性能對比

    Pandas 支持多種存儲格式,在本文中將對不同類型存儲格式下的Pandas Dataframe的讀取速度、寫入速度和大小的進(jìn)行測試對比。 創(chuàng)建測試Dataframe 首先創(chuàng)建一個包含不同類型數(shù)據(jù)
    的頭像 發(fā)表于 11-03 09:58 ?468次閱讀
    <b class='flag-5'>Pandas</b> DataFrame的存儲格式性能對比

    Black:自動格式化代碼神器

    代碼規(guī)范??! 沒事,現(xiàn)在有Black這個神器,我們可以在終端中輸入一句命令就自動格式化代碼!而且對于初學(xué)者來說,用Black來學(xué)習(xí)代碼規(guī)范也
    的頭像 發(fā)表于 11-02 14:51 ?1152次閱讀
    Black:自動格式化<b class='flag-5'>代碼</b>的<b class='flag-5'>神器</b>

    如何利用Python和pandas來處理json數(shù)據(jù)

    了如何利用Python和pandas(Python的第三方)來處理json數(shù)據(jù),主要內(nèi)容包含: json數(shù)據(jù)簡介 常用json數(shù)據(jù)轉(zhuǎn)化網(wǎng)站 json數(shù)據(jù)和Python數(shù)據(jù)的轉(zhuǎn)化 pandas處理
    的頭像 發(fā)表于 11-01 10:59 ?2049次閱讀
    如何利用Python和<b class='flag-5'>pandas</b>來處理json數(shù)據(jù)

    NNI:自動幫你做機(jī)器學(xué)習(xí)調(diào)參的神器

    NNI 自動機(jī)器學(xué)習(xí)調(diào)參,是微軟開源的又一個神器,它能幫助你找到最好的神經(jīng)網(wǎng)絡(luò)架構(gòu)或超參數(shù),支持 各種訓(xùn)練環(huán)境 。 它常用的 使用場景 如下: 想要在自己的代碼、模型中試驗(yàn) 不同的機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 10-30 10:28 ?2235次閱讀
    NNI:自動幫你做機(jī)器<b class='flag-5'>學(xué)習(xí)</b>調(diào)參的<b class='flag-5'>神器</b>