专栏首页量子位NLP如何入门?这里有一份经典资源汇总

NLP如何入门?这里有一份经典资源汇总

允中 编译整理自 Medium 量子位 出品 | 公众号 QbitAI

自然语言处理入门该上什么课,看什么书,有哪些工具可用?Medium作者Melanie Tosik汇总了一份资源,量子位节选了其中的课程、库、教材部分,并进行了简单的说明。

在线课程

斯坦福大学自然语言处理入门课程 教师:Dan Jurafsky & Chris Manning https://www.youtube.com/watch?v=nfoudtpBV68&list=PL6397E4B26D00A269

斯坦福CS224d:用深度学习做自然语言处理 教师:Richard Socher http://cs224d.stanford.edu/syllabus.html 与Manning的入门课程相比,这门课讲解了更高级的机器学习算法,以及用于NLP的深度学习和神经网络架构。

Coursera公开课:自然语言处理入门 https://www.coursera.org/learn/natural-language-processing 密歇根大学提供的NLP入门课程

库和开源工具

spaCy 网站 https://spacy.io/ 博客 https://explosion.ai/blog/ demo https://spacy.io/docs/usage/showcase 一个开源Python库,有很好的用例、API文档和demo应用。

自然语言工具包 (NLTK) 网站 http://www.nltk.org/ 教程 http://www.nltk.org/book/ Python NLP编程的实用入门工具,主要用于教学。

斯坦福CoreNLP 网站 https://stanfordnlp.github.io/CoreNLP/ 一个高质量Java分析工具包

教材

Speech and Language Processing 第二版:http://www.cs.colorado.edu/~martin/slp2.html 第三版:https://web.stanford.edu/~jurafsky/slp3/ 作者:Daniel Jurafsky & James H. Martin 自然语言处理经典教科书,覆盖了这一领域的所有基础知识。第二版可以购买纸质版,也可以在线阅读作者发布的电子版;第三版尚未出版,作者目前发布了部分章节。 本书在国内有中译本《自然语言处理综论》https://book.douban.com/subject/1390499/ 和影印版《语音与语言处理》https://book.douban.com/subject/5373023/ ,可能已断货。

Foundations of Statistical Natural Language Processing https://nlp.stanford.edu/fsnlp/ 作者:Chris Manning & Hinrich Schütze 比上一本书略高阶,主要讲NLP中的统计学方法。 中译本《统计自然语言处理基础》https://book.douban.com/subject/1224802/ ,可能已断货。

Introduction to Information Retrieval https://nlp.stanford.edu/IR-book/ 作者:Chris Manning、Prabhakar Raghavan & Hinrich Schütze 排名/搜索领域的一本好书。 中译本《信息检索导论》https://book.douban.com/subject/5252170/

Neural Network Methods in Natural Language Processing https://www.amazon.com/Network-Methods-Natural-Language-Processing/dp/1627052984 作者:Yoav Goldberg 对NLP领域神经网络应用的深入介绍。 电子版:http://u.cs.biu.ac.il/~yogo/nnlp.pdf

数据集

见Nicolas Iderhoff在GitHub上发布的NlP资源汇总: https://github.com/niderhoff/nlp-datasets

本文分享自微信公众号 - 量子位(QbitAI)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-05-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 新年快乐!这是份值得收藏的2017年AI与深度学习要点大全

    若朴 夏乙 编译自 WILDML 量子位 出品 | 公众号 QbitAI 2017已经正式离我们远去。 过去的一年里,有很多值得梳理记录的内容。博客WILDML...

    量子位
  • 4行代码再现《黑客帝国》数字雨,在终端实现的那种

    不急,博主还非常好心的总结了许多类似的,用其他语言可以在终端实现的GitHub项目。

    量子位
  • 令人激动!谷歌推强化学习新框架「多巴胺」,基于TensorFlow,已开源丨附github

    上周那个在DOTA2 TI8赛场上“装逼失败”的OpenAI Five,背后是强化学习的助推。

    量子位
  • 不好意思,我还是习惯“谷歌”

    身为一个科研工作者,上网查查文献或者论文是一件很平常的事。虽然各大学校的图书馆都会买一些数据库供学生使用,不过,还是以国内文献居多。又由于一些众所周知的原因,国...

    课代表
  • 就这样,我成为了一个半吊子渣渣

    大家好,我是光城,简单描述一下如何成为半吊子渣渣的。本科非计算机,出于存粹电脑的兴趣,自学java开发,学习了安卓开发,期间学习AE、Vegas、Pr、fina...

    公众号guangcity
  • 2018年值得开发者收藏的免费资源

    2018年新年依此,奉上一堆免费资源,赶紧收藏吧! DevFreeBooks https://devfreebooks.github.io ? 在这里你会发现超...

    企鹅号小编
  • 如何在Ubuntu和Debian上安装R.

    R是包含了数据可视化功能的用于统计分析的编程语言。该语言通过Comprehensive R Archive Network(CRAN)拥有高度的可扩展性,该网络...

    魔法少女伊莉雅
  • 资源 | 致深度学习的入门者与小白的一份学习清单

    本篇文章是基本按照学习的先后顺序进行写的。具体的入门方式取决于你已经掌握的知识。要理解并应用深度学习,必须先掌握线性代数、微积分和统计学,还应当具备编程及机器学...

    用户2769421
  • 前端技术观察第12期 - 2020 年 Node.js 将会有哪些新功能

    ConardLi
  • 那些有意思的网站(二)

    这是一个苹果公司档案网站(非官方),收集了苹果公司从成立以来的所有广告、海报和宣传材料 https://www.applearchive.org/

    苏生不惑

扫码关注云+社区

领取腾讯云代金券