0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GitHub上開源了個集眾多數(shù)據(jù)源于一身的爬蟲工具箱——InfoSpider

人工智能與大數(shù)據(jù)技術(shù) ? 來源:開源最前線 ? 作者:開源最前線 ? 2020-11-23 11:28 ? 次閱讀

國內(nèi)一位開發(fā)者在 GitHub 上開源了個集眾多數(shù)據(jù)源于一身的爬蟲工具箱——InfoSpider,一不小心就火了?。?!

有多火呢?開源沒幾天就登上GitHub周榜第四,標星1.3K,累計分支172個(GitHub地址:https://github.com/kangvcar/InfoSpider) 在這樣一個信息爆炸的時代,每個人都有很多個賬號,賬號一多就會出現(xiàn)這么一個情況:個人數(shù)據(jù)分散在各種各樣的公司之間,就會形成數(shù)據(jù)孤島,多維數(shù)據(jù)無法融合,這個項目可以幫你將多維數(shù)據(jù)進行融合并對個人數(shù)據(jù)進行分析,這樣你就可以更直觀、深入了解自己的信息。 InfoSpider 是一個集眾多數(shù)據(jù)源于一身的爬蟲工具箱,旨在安全快捷的幫助用戶拿回自己的數(shù)據(jù),工具代碼開源,流程透明。并提供數(shù)據(jù)分析功能,基于用戶數(shù)據(jù)生成圖表文件,使得用戶更直觀、深入了解自己的信息。

目前支持數(shù)據(jù)源包括GitHub、QQ郵箱、網(wǎng)易郵箱、阿里郵箱、新浪郵箱、Hotmail郵箱、Outlook郵箱、京東、淘寶、支付寶、中國移動、中國聯(lián)通、中國電信、知乎、嗶哩嗶哩、網(wǎng)易云音樂、QQ好友、QQ群、生成朋友圈相冊、瀏覽器瀏覽歷史、12306、博客園、CSDN博客、開源中國博客、簡書。 根據(jù)創(chuàng)建者介紹,InfoSpider 具有以下特性:

安全可靠:本項目為開源項目,代碼簡潔,所有源碼可見,本地運行,安全可靠。

使用簡單:提供 GUI 界面,只需點擊所需獲取的數(shù)據(jù)源并根據(jù)提示操作即可。

結(jié)構(gòu)清晰:本項目的所有數(shù)據(jù)源相互獨立,可移植性高,所有爬蟲腳本在項目的 Spiders 文件下。

數(shù)據(jù)源豐富:本項目目前支持多達24+個數(shù)據(jù)源,持續(xù)更新。

數(shù)據(jù)格式統(tǒng)一:爬取的所有數(shù)據(jù)都將存儲為json格式,方便后期數(shù)據(jù)分析。

個人數(shù)據(jù)豐富:本項目將盡可能多地為你爬取個人數(shù)據(jù),后期數(shù)據(jù)處理可根據(jù)需要刪減。

數(shù)據(jù)分析:本項目提供個人數(shù)據(jù)的可視化分析,目前僅部分支持。

InfoSpider使用起來也非常簡單,你只需要安裝python3和Chrome瀏覽器,運行 python3 main.py,在打開的窗口點擊數(shù)據(jù)源按鈕, 根據(jù)提示選擇數(shù)據(jù)保存路徑,接著輸入賬號密碼,就會自動爬取數(shù)據(jù),根據(jù)下載的目錄就可以查看爬下來的數(shù)據(jù)。 是不是很簡單呢,如果你對InfoSpider也感興趣,趕緊試一下。

責任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3185

    瀏覽量

    42241
  • GitHub
    +關(guān)注

    關(guān)注

    3

    文章

    461

    瀏覽量

    16327
  • 爬蟲
    +關(guān)注

    關(guān)注

    0

    文章

    82

    瀏覽量

    6801

原文標題:一款爆紅的開源爬蟲工具箱

文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    雖然下載contourlet工具箱但是運行代碼出現(xiàn)函數(shù)或變量 \'resampc\' 無法識別。

    下載并將contourlet工具箱放到matlab路徑中了,依然不能使用pdfbdec函數(shù)
    發(fā)表于 08-22 17:14

    如何使用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱

    神經(jīng)網(wǎng)絡(luò)是種模擬人腦神經(jīng)元網(wǎng)絡(luò)的計算模型,廣泛應(yīng)用于各種領(lǐng)域,如圖像識別、語音識別、自然語言處理等。在MATLAB中,可以使用神經(jīng)網(wǎng)絡(luò)工具箱(Neural Network Toolbox)來構(gòu)建
    的頭像 發(fā)表于 07-03 10:34 ?1767次閱讀

    matlab神經(jīng)網(wǎng)絡(luò)工具箱結(jié)果分析

    神經(jīng)網(wǎng)絡(luò)是種強大的機器學(xué)習技術(shù),廣泛應(yīng)用于各種領(lǐng)域,如圖像識別、語音識別、自然語言處理等。MATLAB提供功能強大的神經(jīng)網(wǎng)絡(luò)工具箱,
    的頭像 發(fā)表于 07-03 10:32 ?444次閱讀

    常見的數(shù)據(jù)采集工具的介紹

    數(shù)據(jù)采集是數(shù)據(jù)分析和處理的基礎(chǔ),它涉及到從各種數(shù)據(jù)源中提取、收集和整理數(shù)據(jù)的過程。數(shù)據(jù)采集工具
    的頭像 發(fā)表于 07-01 14:51 ?559次閱讀

    DP1363F 多協(xié)議NFC 兼容CLRC663開發(fā)資料

    ?DP1363F是高度集成的收發(fā)器芯片,用于13.56Mhz的非接觸式通訊。強大的多協(xié)議支持、最高射頻輸出功率,以及突破性技術(shù)低功耗卡片檢測等優(yōu)勢于一身,滿足市場對更高集成度、更小外殼和互操作性
    發(fā)表于 05-31 10:48

    使用PSoc6在Modus工具箱中創(chuàng)建示例應(yīng)用程序時,終端報錯的原因?

    你好, 每當我嘗試使用 PSoc6 在 Modus 工具箱中創(chuàng)建示例應(yīng)用程序時,我的終端都會顯示以下兩錯誤。 有人有什么建議嗎? 1) make[1]:*** [../mtb_s
    發(fā)表于 03-04 07:01

    為什么無法在modustoolbox?工具箱中打開新應(yīng)用程序?

    我無法在modustoolbox?工具箱中打開新應(yīng)用程序。 如何解決這個問題?
    發(fā)表于 01-31 07:32

    可以在Modus工具箱eclipse中使用DAVE?創(chuàng)建的項目嗎?

    我們可以將項目(在 IDE 中創(chuàng)建 DAVE? )使用 Modus 工具箱 eclipse IDE 嗎? 如果是,怎么做? 如果不是,為什么不呢?
    發(fā)表于 01-26 06:55

    使用自定義BSP的空項目出現(xiàn)Modus工具箱編譯錯誤的原因?

    的日志。 有人能為我指出有關(guān)這個錯誤的方向嗎? 也許使用 BZI 芯片然后嘗試在 LQI 芯片加載代碼是更好的主意嗎? (我可以確認 BZI 芯片成功兼容空應(yīng)用程序)。 看來這是我要問的關(guān)于 modus 工具箱眾多問題之
    發(fā)表于 01-23 06:32

    請問KitProg2是否支持加載使用Modus工具箱構(gòu)建的程序閃存?

    。 對于編程工具,我考慮使用Modus工具箱編程器或 PSoC? 編程器。 我想在 PSOC4100s MAX 設(shè)備加載 Flash。
    發(fā)表于 01-19 06:29

    芯片行業(yè)的幾個專業(yè)術(shù)語盤點

    芯片設(shè)計、芯片制造、芯片封裝和測試等多個產(chǎn)業(yè)鏈環(huán)節(jié)于一身,早期多數(shù)集成電路企業(yè)采用的模式,目前僅有極少數(shù)企業(yè)能夠維持。
    發(fā)表于 01-18 09:50 ?3271次閱讀

    WT588F02KD-24SS語音芯片:多功能于一身,引領(lǐng)小家電產(chǎn)品智能化升級

    擴展功能、LED數(shù)碼管驅(qū)動接口、鍵盤掃描接口等,成為了小家電產(chǎn)品智能化升級的利器。、強大功能集于一身作為款專用芯片,WT588F02KD-24SS具備非常強大
    的頭像 發(fā)表于 12-02 09:44 ?412次閱讀
    WT588F02KD-24SS語音芯片:<b class='flag-5'>集</b>多功能<b class='flag-5'>于一身</b>,引領(lǐng)小家電產(chǎn)品智能化升級

    在ADAU1761的工具箱庫下的部分組件沒有Help說明是為什么?

    在ADAU1761的工具箱庫下的部分組件沒有Help說明,比如MSEnv組件,有沒有這部分的資料?
    發(fā)表于 11-29 07:20

    如何在TSMaster面板和工具箱中實現(xiàn)多語言切換

    TSMaster軟件平臺已經(jīng)提供多語言的支持,對于軟件內(nèi)部用戶二次開發(fā)的模塊如Panel和工具箱模塊,TSMaster也提供多語言的支持。這特性讓基于TSMaster開發(fā)的工程只
    的頭像 發(fā)表于 11-11 08:21 ?805次閱讀
    如何在TSMaster面板和<b class='flag-5'>工具箱</b>中實現(xiàn)多語言切換

    feapder:款功能強大的爬蟲框架

    今天推薦款更加簡單、輕量級,且功能強大的爬蟲框架:feapder 項目地址: https://github.com/Boris-code/feapder 2. 介紹及安裝 和 Scrapy 類似
    的頭像 發(fā)表于 11-01 09:48 ?979次閱讀