首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

自然语言处理,破译人类对话计算机的秘密

自然语言处理|介绍

自然语言处理(NLP),简单来说即是计算机接受用户自然语言形式的输入,并在内部通过人类所定义的算法进行加工、计算等系列操作,以模拟人类对自然语言的理解,并返回用户所期望的结果。因为计算机无法像人一样处理文本,需要有自己的处理方式。正如机械解放人类的双手一样,自然语言处理的目的在于用计算机代替人工来处理大规模的自然语言信息。它是人工智能、计算机科学、信息工程的交叉领域,涉及统计学、语言学等的知识。

2018年是NLP研究的分水岭,各种突破接连不断,随着ULMFiT语言模型、ELMo词向量还有最近大热的谷歌BERT模型的发布,都让自然语言处理实现了历史性的突破,开启了NLP新时代。自然语言处理工程师、算法工程师、NLP专家这些岗位需求也随之迅速增加,岗位薪资比同级别其他岗位薪资高出很多。

NLP是研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,是人工智能的最高任务与境界。所以不论是理论研究还是付诸实际应用,自然语言处理在将来都必然会有令人期待的惊喜和异常快速的发展。

自然语言处理的应用非常广泛,例如机器翻译、情感分析、手写体和印刷体字符识别、语音识别及文语转换、信息检索、信息抽取与过滤、文本分类与聚类、舆情分析和观点挖掘等。

如果你还不了解自然语言处理,如果你想提升自己的职业前景,那么不要再观望,顺应时代发展和需求,赶紧补上这一课吧!

我们特别邀请了中国科学院电子学研究所通信与信息系统专业博士、中国科学遥感与数字地球研究所大数据处理系统设计师周老师讲授《自然语言处理应用实战》,让学员全面系统的掌握自然语言处理应用,结合实操案例,深入浅出的帮助学员们快速提升NLP的应用技术和实操技能!

一、 NLP基础(1课时)

1. 自然与自然语言研究

2. NLP概述

. 什么是NLP

. NLP发展阶段

. NLP研究内容

. NLP的困难

3. 现代自然语言系统简介

. NLP流程与开源框架

. 哈工大NLP平台及其演示环境

. Stanford NLP平台及演示

. NLTK开发环境搭建实践环境

4. NLP相关知识的构成

. 基本术语

. 知识结构

.NLP相关技术与应用

分词技术

文本分类

词性标注

信息抽取

句法分析

问答系统

语义角色标注

5. NLP的研究领域及应用

6. 正则表达式在NLP的基本应用

7. NLP案例分析

二、 实践语料库与数据集(1课时)

1. 语料库

2. 语料库的作用

3. 语料分析

4. 数据属性类型

5. 免费语料库资源

6. NLP应用准备数据集

三、 中文分词技术(2.5课时)

1. 中文分词简介

2. 规则分词

. 正向最大匹配法

. 逆向最大匹配法

. 双向最大匹配法

3. 统计分词

. 语言模型

. HMM模型

. 其他统计分词算法

4. 混合分词

5. 中文分词工具——Jieba

. Jieba的三种分词模式

. 实战之高频词提取

四、 词性标注与命名实体识别(1课时)

1. 词性标注与命名实体识别

2. 词性标注

3. 命名实体识别

4. 词性标注与命名实体识别实战

五、 关键词提取算法(2课时)

1. 关键词提取技术概述

2. 关键词提取算法TF/IDF算法

3. TextRank算法

4. LSA/LSI/LDA算法

5. LSA/LSI算法

6. LDA算法

7. 实战提取文本关键词

六、 句法分析(2课时)

1. 句法分析概述

2. 句法分析的数据集与评测方法

3. 句法分析的数据集

4. 句法分析的评测方法

5. 句法分析的常用方法

. 基于PCFG的句法分析

. 基于最大间隔马尔可夫网络的句法分析

. 基于CRF的句法分析

. 基于移进–归约的句法分析模型

. 使用Stanford Parser的PCFG算法进行句法分析

. Stanford Parser

6. 基于PCFG的中文句法分析实战

七、 文本向量化 (2.5课时)

1. 文本向量化概述

2. 向量化算法word2vec

. 神经网络语言模型

. C&W模型

. CBOW模型和Skip-gram模型

3. 向量化算法doc2vec/str2vec

4. 案例:将网页文本向量化

. 词向量的训练

. 段落向量的训练

. 利用word2vec和doc2vec计算网页相似度

八、 情感分析技术(2课时)

1. 情感分析的应用

2. 情感分析的基本方法

3. 词法分析

4. 机器学习方法

5. 混合分析

6. 实战电影评论情感分析

九、 NLP中用到的机器学习算法(3课时)

1. 简介

2. 机器学习训练的要素

3. 机器学习的组成部分

4. 几种常用的机器学习方法

. 文本分类

. 特征提取

. 标注

. 搜索与排序

. 推荐系统

. 序列学习

5. 分类器方法

. 朴素贝叶斯Naive Bayesian

. 逻辑回归

. 支持向量机

. 无监督学习的文本聚类

. 文本分类实战:中文垃圾邮件分类

十、 基于深度学习的NLP算法(2课时)

1. 深度学习概述

2. 神经元模型

. 激活函数

. 感知机与多层网络

. 神经网络模型

. 多输出层模型

. 反向传播算法

. 最优化算法

. 梯度下降

3. 深度学习在NLP中的应用

十一、 知识图谱(1课时)

1. 什么是知识图谱

2. 知识图谱与人工智能

3. 知识图谱构建有学识的人工智能

4. 知识图谱与深度学习

5. 如何构建行业知识图谱

. 知识图谱构建关键技术

. 知识图谱构建难点

. 知识图谱与NLP

6. 知识图谱实战案例分享

十二、 课程总结

扫码下方二维码

快速报名

有任何问题都可以咨询怪兽学堂助教-小白

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190124B0STTR00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券