0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Github上Star過千的PyTorch NLP相關(guān)項(xiàng)目都在這兒了!

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-07-11 09:35 ? 次閱讀

Github 上有許多成熟的 PyTorch NLP 代碼和模型, 可以直接用于科研和工程中。本文介紹其中一下 Star 過千的時(shí)下熱點(diǎn)項(xiàng)目。

AllenNLP 2504 Star

AllenNLP,是AI2公司家的開源項(xiàng)目,致力于成為 PyTorch 下 NLP 算法研究和實(shí)現(xiàn)的全能平臺(tái)。AllenNLP 的設(shè)計(jì)理念是: 模塊化和輕量級(jí)。它將 NLP中個(gè)各種需求進(jìn)行了非常好的封裝,包括:padding, masking 等等。特別的,AllenNLP 對(duì)實(shí)驗(yàn)非常友好,實(shí)驗(yàn)流程和參數(shù)有Json文件配置,并行、重現(xiàn)完全不是問題,而且每一步都有豐富的 log 記錄你想記錄的一切。

AllenNLP 自身實(shí)現(xiàn)了包括:命名實(shí)體識(shí)別、語義角色標(biāo)注、閱讀理解在內(nèi)的多種常用算法。AllenNLP是由艾倫人工智能研究所(Allen Institute for Artificial Intelligence)與華盛頓大學(xué)(University of Washington)和其他機(jī)構(gòu)的研究人員密切合作建立和維護(hù)的。

DrQA 2374 Star

https://github.com/facebookresearch/DrQA

DrQA 是 facebook 開源的開放式閱讀理解智能問答算法。原論文發(fā)布在 ACL2016上, 名字是:Reading Wikipedia to Answer Open-Domain Questions

鏈接:

http://www.zhuanzhi.ai/paper/ec2483da392a7e054eeb0f0a58d3ddee。

DrQA是一個(gè)用于閱讀理解的系統(tǒng),適用于開放領(lǐng)域的問答。特別是,DrQA致力于解決大規(guī)模機(jī)器閱讀理解。在這種情況下,算法在一個(gè)非常大的非結(jié)構(gòu)化文檔語料庫中尋找問題的答案。因此,系統(tǒng)必須將文檔檢索(查找相關(guān)文檔)與文本的機(jī)器理解(識(shí)別來自這些文檔的答案)結(jié)合起來。

faieseq 1711 Star

https://github.com/pytorch/fairseq

fairseq是facebook 開源的一個(gè)序列建模工具包,而并不是單純的某個(gè)模型的實(shí)現(xiàn)。

它允許研究人員和開發(fā)人員為機(jī)器翻譯、自動(dòng)摘要、語言模型和其他文本生成任務(wù)訓(xùn)練自定義模型。它提供了各種Seq2seq 的模型的實(shí)現(xiàn),包括:

Convolutional Neural Networks (CNN)

Dauphin et al. (2017): Language Modeling with Gated Convolutional Networks

Gehring et al. (2017): Convolutional Sequence to Sequence Learning

NewEdunov et al. (2018): Classical Structured Prediction Losses for Sequence to Sequence Learning

NewFan et al. (2018): Hierarchical Neural Story Generation

Long Short-Term Memory (LSTM) networks

Luong et al. (2015): Effective Approaches to Attention-based Neural Machine Translation

Wiseman and Rush (2016): Sequence-to-Sequence Learning as Beam-Search Optimization

Transformer (self-attention) networks

Vaswani et al. (2017): Attention Is All You Need

NewOtt et al. (2018): Scaling Neural Machine Translation

OpenNMT-py 1558 Star

https://github.com/OpenNMT/OpenNMT-py

OpenNMT 全稱是Open Source Neural Machine Translation in PyTorch(PyTorch 開源神經(jīng)翻譯模型), 致力于研究促進(jìn)新idea 在神經(jīng)翻譯,自動(dòng)摘要,看圖說話,語言形態(tài)學(xué)和許多其他領(lǐng)域的發(fā)展。

作為自動(dòng)翻譯的平臺(tái)型項(xiàng)目, OpenNMT 當(dāng)然也支持各種文本數(shù)據(jù)預(yù)處理,包括各種 RNN 單元,各種 attention機(jī)制,花式日志,語音轉(zhuǎn)文本,看圖說話等等。

DeepNLP-models-Pytorch 1256 Star

https://github.com/DSKSD/DeepNLP-models-Pytorch

最后,給大家介紹的是DeepNLP-models in PyTorch。這個(gè)庫,是韓國(guó)的Kim Sungdong同學(xué),在看完 CS224的課后,用 PyTorch 將其中的模型都實(shí)現(xiàn)了一遍, 包括:

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46348

    瀏覽量

    236505
  • GitHub
    +關(guān)注

    關(guān)注

    3

    文章

    461

    瀏覽量

    16325
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    483

    瀏覽量

    21971
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    795

    瀏覽量

    13080

原文標(biāo)題:GitHub獲贊過千:PyTorch 自然語言處理項(xiàng)目Top 5

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    目前常用的自然語言處理開源項(xiàng)目/開發(fā)包大匯總

    StackoverFlow-java or python for nlp相關(guān)問題&文章:(1)如何用 Python 中的 NLTK 對(duì)中文進(jìn)行分析和處理? 這個(gè)問題下的回答也詳說了其他的語音處理包(2)中文分詞項(xiàng)目
    發(fā)表于 11-26 10:31

    分享幾個(gè)在GitHub嵌入式相關(guān)的開源項(xiàng)目

    關(guān)注+星標(biāo)公眾號(hào),不錯(cuò)過精彩內(nèi)容來源 | 人人都是極客大家平時(shí)學(xué)習(xí)的資源可能來自不同地方,對(duì)于程序員來說,Github上高星的開源項(xiàng)目值得了解并學(xué)習(xí)。今天就給大家分享幾個(gè)在GitHub上高...
    發(fā)表于 10-27 08:10

    通過Cortex來非常方便的部署PyTorch模型

    ,Hugging Face 生成的廣泛流行的自然語言處理(NLP)庫,是建立在 PyTorch 的。Selene,生物前沿 ML 庫,建在 PyTorch
    發(fā)表于 11-01 15:25

    2018 年 2 月份 GitHub 最熱門的開源項(xiàng)目

    2 月份 GitHub 最熱門的開源項(xiàng)目又出爐,又有哪些新的項(xiàng)目擠進(jìn)熱門榜單呢,一起來看看
    的頭像 發(fā)表于 03-23 08:53 ?4611次閱讀

    NLP-Progress庫NLP的最新數(shù)據(jù)集、論文和代碼

    方向是自然語言處理的同學(xué)們有福啦,為了跟蹤自然語言處理(NLP)的進(jìn)展,有大量仁人志士在 Github 維護(hù)一個(gè)名為 NLP-Progr
    的頭像 發(fā)表于 11-17 09:21 ?2510次閱讀

    Leap Motion公布一款開源AR頭顯原型設(shè)計(jì)Project North Star

    Leap Motion公司的Florian Maurer寫道,該項(xiàng)目的最新更新版本“Release 3”在本周發(fā)布,提供一項(xiàng)重大的設(shè)計(jì)更新,匯集了“數(shù)月的研究和洞察新的3D文件和圖紙” 。更新后的設(shè)計(jì)可以在Project North
    的頭像 發(fā)表于 01-26 10:08 ?4264次閱讀

    PyTorch版《動(dòng)手學(xué)深度學(xué)習(xí)》開源

    目前,該項(xiàng)目GitHub 已獲得超過 1.1 萬星,并且中文版電子書還發(fā)布紙質(zhì)版書籍。不過雖然書籍非常優(yōu)秀,但還是有一些讀者不太習(xí)慣用 Gluon 來寫代碼,畢竟開源
    的頭像 發(fā)表于 09-20 15:25 ?2769次閱讀

    NLP 2019 Highlights 給NLP從業(yè)者的一個(gè)參考

    自然語言處理專家elvis在medium博客發(fā)表關(guān)于NLP在2019年的亮點(diǎn)總結(jié)。對(duì)于自然語言處理(NLP)領(lǐng)域而言,2019年是令人印象深刻的一年。
    的頭像 發(fā)表于 09-25 16:56 ?1664次閱讀

    10月份GitHub最熱門的Python開源項(xiàng)目上榜詳情

    10月份GitHub最熱門的Python開源項(xiàng)目排行已經(jīng)出爐啦,一起來看看上榜詳情吧: 1 GHunt https://github.com/mxrch/GHunt
    的頭像 發(fā)表于 11-05 15:29 ?1767次閱讀

    GitHub 40K Star工程師求職記分享

    ? 本文作者是??途W(wǎng)知名大佬 CyC2018,在他的 GitHub 有一個(gè)高達(dá) 40K Star 的技術(shù)倉庫(在所有倉庫中排名前五十),可以說在開源項(xiàng)目方面是一騎絕塵的牛人。今天我們分享一下他的求職
    的頭像 發(fā)表于 12-30 10:15 ?1698次閱讀

    2020年11月Github最熱門的11個(gè)開源項(xiàng)目

    11月份GitHub最熱門的開源項(xiàng)目排行已經(jīng)出爐啦,一起來看看上榜詳情吧: 1 tinygrad https://github.com/geohot/tinygrad
    的頭像 發(fā)表于 01-04 14:26 ?3611次閱讀
    2020年11月<b class='flag-5'>Github</b><b class='flag-5'>上</b>最熱門的11個(gè)開源<b class='flag-5'>項(xiàng)目</b>

    githubpytorch學(xué)習(xí)資料詳細(xì)說明

    本文檔的主要內(nèi)容詳細(xì)介紹的是githubpytorch學(xué)習(xí)資料詳細(xì)說明。
    發(fā)表于 02-25 14:48 ?6次下載

    關(guān)于OCR 你想了解的可能都在這兒

    導(dǎo)讀 OCR中的研究,工具和挑戰(zhàn),都在這兒。 介紹 我喜歡OCR(光學(xué)字符識(shí)別)。對(duì)我來說,它代表數(shù)據(jù)科學(xué),尤其是計(jì)算機(jī)視覺的真正挑戰(zhàn)。這是一個(gè)現(xiàn)實(shí)世界的問題,它有很多方法,包括計(jì)算機(jī)視覺
    的頭像 發(fā)表于 04-26 13:43 ?9155次閱讀
    關(guān)于OCR 你想了解的可能<b class='flag-5'>都在這兒</b><b class='flag-5'>了</b>

    那些年在pytorch的坑

    今天又發(fā)現(xiàn)一個(gè)pytorch的小坑,給大家分享一下。手上兩份同一模型的代碼,一份用tensorflow寫的,另一份是我拿pytorch寫的,模型架構(gòu)一模一樣,預(yù)處理數(shù)據(jù)的邏輯也一模一樣,測(cè)試發(fā)現(xiàn)模型推理的速度也差不多。一份預(yù)處
    的頭像 發(fā)表于 02-22 14:18 ?992次閱讀
    那些年在<b class='flag-5'>pytorch</b><b class='flag-5'>上</b>踩<b class='flag-5'>過</b>的坑

    RT-Thread 新里程碑達(dá)成——GitHub Star 破萬!

    RT-Thread實(shí)時(shí)操作系統(tǒng)開源項(xiàng)目GitHubstar數(shù)量突破一萬!截止發(fā)文,RT-Thread作為實(shí)時(shí)操作系統(tǒng)在業(yè)界Star數(shù)量
    的頭像 發(fā)表于 07-04 08:35 ?336次閱讀
    RT-Thread 新里程碑達(dá)成——<b class='flag-5'>GitHub</b> <b class='flag-5'>Star</b> 破萬!