Github 上有許多成熟的 PyTorch NLP 代碼和模型, 可以直接用于科研和工程中。本文介紹其中一下 Star 過千的時(shí)下熱點(diǎn)項(xiàng)目。
AllenNLP 2504 Star
AllenNLP,是AI2公司家的開源項(xiàng)目,致力于成為 PyTorch 下 NLP 算法研究和實(shí)現(xiàn)的全能平臺(tái)。AllenNLP 的設(shè)計(jì)理念是: 模塊化和輕量級(jí)。它將 NLP中個(gè)各種需求進(jìn)行了非常好的封裝,包括:padding, masking 等等。特別的,AllenNLP 對(duì)實(shí)驗(yàn)非常友好,實(shí)驗(yàn)流程和參數(shù)有Json文件配置,并行、重現(xiàn)完全不是問題,而且每一步都有豐富的 log 記錄你想記錄的一切。
AllenNLP 自身實(shí)現(xiàn)了包括:命名實(shí)體識(shí)別、語義角色標(biāo)注、閱讀理解在內(nèi)的多種常用算法。AllenNLP是由艾倫人工智能研究所(Allen Institute for Artificial Intelligence)與華盛頓大學(xué)(University of Washington)和其他機(jī)構(gòu)的研究人員密切合作建立和維護(hù)的。
DrQA 2374 Star
https://github.com/facebookresearch/DrQA
DrQA 是 facebook 開源的開放式閱讀理解智能問答算法。原論文發(fā)布在 ACL2016上, 名字是:Reading Wikipedia to Answer Open-Domain Questions
鏈接:
http://www.zhuanzhi.ai/paper/ec2483da392a7e054eeb0f0a58d3ddee。
DrQA是一個(gè)用于閱讀理解的系統(tǒng),適用于開放領(lǐng)域的問答。特別是,DrQA致力于解決大規(guī)模機(jī)器閱讀理解。在這種情況下,算法在一個(gè)非常大的非結(jié)構(gòu)化文檔語料庫中尋找問題的答案。因此,系統(tǒng)必須將文檔檢索(查找相關(guān)文檔)與文本的機(jī)器理解(識(shí)別來自這些文檔的答案)結(jié)合起來。
faieseq 1711 Star
https://github.com/pytorch/fairseq
fairseq是facebook 開源的一個(gè)序列建模工具包,而并不是單純的某個(gè)模型的實(shí)現(xiàn)。
它允許研究人員和開發(fā)人員為機(jī)器翻譯、自動(dòng)摘要、語言模型和其他文本生成任務(wù)訓(xùn)練自定義模型。它提供了各種Seq2seq 的模型的實(shí)現(xiàn),包括:
Convolutional Neural Networks (CNN)
Dauphin et al. (2017): Language Modeling with Gated Convolutional Networks
Gehring et al. (2017): Convolutional Sequence to Sequence Learning
NewEdunov et al. (2018): Classical Structured Prediction Losses for Sequence to Sequence Learning
NewFan et al. (2018): Hierarchical Neural Story Generation
Long Short-Term Memory (LSTM) networks
Luong et al. (2015): Effective Approaches to Attention-based Neural Machine Translation
Wiseman and Rush (2016): Sequence-to-Sequence Learning as Beam-Search Optimization
Transformer (self-attention) networks
Vaswani et al. (2017): Attention Is All You Need
NewOtt et al. (2018): Scaling Neural Machine Translation
OpenNMT-py 1558 Star
https://github.com/OpenNMT/OpenNMT-py
OpenNMT 全稱是Open Source Neural Machine Translation in PyTorch(PyTorch 開源神經(jīng)翻譯模型), 致力于研究促進(jìn)新idea 在神經(jīng)翻譯,自動(dòng)摘要,看圖說話,語言形態(tài)學(xué)和許多其他領(lǐng)域的發(fā)展。
作為自動(dòng)翻譯的平臺(tái)型項(xiàng)目, OpenNMT 當(dāng)然也支持各種文本數(shù)據(jù)預(yù)處理,包括各種 RNN 單元,各種 attention機(jī)制,花式日志,語音轉(zhuǎn)文本,看圖說話等等。
DeepNLP-models-Pytorch 1256 Star
https://github.com/DSKSD/DeepNLP-models-Pytorch
最后,給大家介紹的是DeepNLP-models in PyTorch。這個(gè)庫,是韓國(guó)的Kim Sungdong同學(xué),在看完 CS224的課后,用 PyTorch 將其中的模型都實(shí)現(xiàn)了一遍, 包括:
-
人工智能
+關(guān)注
關(guān)注
1789文章
46348瀏覽量
236505 -
GitHub
+關(guān)注
關(guān)注
3文章
461瀏覽量
16325 -
nlp
+關(guān)注
關(guān)注
1文章
483瀏覽量
21971 -
pytorch
+關(guān)注
關(guān)注
2文章
795瀏覽量
13080
原文標(biāo)題:GitHub獲贊過千:PyTorch 自然語言處理項(xiàng)目Top 5
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論