【Manning主讲】斯坦福CS224n深度学习与NLP课程全部视频、PPT

新智元

发布于 2018-03-22 17:12:43

1.4K0

发布于 2018-03-22 17:12:43

文章被收录于专栏：新智元

【新智元导读】斯坦福大学CS224n（全称：深度学习与自然语言处理）是自然语言处理领域很受欢迎的课程，由 Chris Manning 和 Richard Socher 主讲。本课程所有教学视频和课程材料同样在网上开放可得，新智元带来每课内容简介。

全部课程视频（英文字幕）：http://t.cn/R6RGxtR

所有课程资料、PPT等：http://web.stanford.edu/class/cs224n/

课程描述

讲师和助教团队

自然语言处理（NLP）是信息时代最重要的技术之一，理解复杂的人类话语也是人工智能的重要任务。NLP的应用无处不在，因为人们的日常生活大部分都需要语言交流，例如网页搜索、广告、电子邮件、客户服务、语言翻译，电台广播等。为NLP的应用赋能的有大量广泛的底层任务和机器学习模型。最近，深度学习的方法在许多NLP任务中获得了非常好的性能。这些模型通常可以通过单个端到端的模型进行训练，并且不需要传统的任务特定的特征工程。

在今年春季的NLP课程中，我们将学习实现，训练，调试，可视化和创建自己的神经网络模型。这门课程为深入学习NLP应用的前沿研究提供了深入的探索。课程最后的项目将涉及训练复杂的循环神经网络并将其应用于大型NLP问题。在模型方面，我们将涵盖词向量表示，基于窗口的神经网络，循环神经网络，长短期记忆模型，递归神经网络，卷积神经网络以及一些涉及 memory component 的非常新的模型。通过讲座和编程任务，学生将学会令神经网络在实际问题上工作的必要工程技巧。

先修要求

熟悉 Python 编程语言
大学微积分，线性代数（例如MATH 19或41，MATH 51）
基本概率和统计知识（例如 CS109 或其他统计课程）
CS229（机器学习）的同等知识

推荐掌握

自然语言处理的相关知识（CS224N 或 CS224U）
凸优化
卷积神经网络知识（CS231n）

内容简介

第1讲：自然语言处理与深度学习

第1讲介绍了自然语言处理（NLP）的概念和当前的NLP研究面临的问题，然后介绍将词表示为数字向量的概念，以及设计词向量的流行方法。

关键词：自然语言处理、词向量、奇异值分解、skip-gram模型、连续词袋模型（Continuous Bag-Of-Words，CBOW）、负采样、 Hierarchical Softmax、Word2Vec

第2讲：词向量表示：word2vec

第2讲继续讨论词向量的概念，以及流行的设计词向量的方法。

第3讲 | GloVe：用于词汇表示的全局向量

第3讲介绍了用于训练词向量的 GloVe 模型。本讲接着通过观察如何评估词向量（又称词嵌入）来拓展对它的理解。作为评估技术的一种，接着我们讨论了词的类比问题（word analogies），以及如何利用类比来调整词嵌入。然后我们讨论了训练模型的权重/参数，以及外部任务的词向量。最后，我们鼓励用人工神经网络作为自然语言处理任务的一类模型。

关键词：GloVe、内部和外部评估、超参数对类比评估任务的影响、人类判断与词向量距离的相关性、使用上下文处理歧义、窗口分类

第4讲：词窗口分类和神经网络