大家都知道NLP近几年非常火,而且相关技术发展也特别快,像BERT、GPT-3、图神经网络、知识图谱等技术被大量应用于项目实践中,这也推动了NLP在产业中的持续落地,以及行业对相关人才的需求。于是很多人欲转行NLP。
但是最近有同学私信我,NLP很难学,这条路能坚持走吗?
对于这位朋友的问题,我想从两方面开始回答。
NLP学起来不容易
01
很多大多数欲从事NLP相关工作的同学,往往都是通过自学的方式来进行学习,但是这样很明显的问题是:
1. 虽然学习了解了很多算法模型,但是技术深度和宽度的理解是比较薄弱的,大多还是只停留在调用现有工具比如BERT、XLNet等阶段。 导致无论面试还是真正去业界做NLP,都会被NLP领域的”老枪老炮“们一眼识别出小白属性。
2. 对于算法原理理解不深刻,这就会导致实际应用时不能很好地发挥出来,另外面试时对于大厂面试官的刨根问底,只能是眼睁睁的丢掉offer。
学到多好才能找到好工作?
02
人的精力肯定是有极限的,既然急于求成要不得,那么我们究竟得学到多好才算是“出山”,可以去外面纵横天下了呢?
而对于NLP行业的面试无非就是向面试官证明两点:
没错,在这个行业内企业最看重的自然是项目经历,但初学者又很难接触到工业界项目,怎么办?
安心,我已经给你准备好了,
为了迎合大家学习的需求,我们重磅推出了《自然语言处理训练营》(一定要看到最后),主要有两个目的:
1. 对于今后想从业NLP领域的人,这可能是最全面但同时最精简的课程,学完绝对可以满足相关岗位的要求(当然面试不仅仅看技术哦~),而且大概率在技术层面上能做到同行业TOP20%的水准
2. 对于已经从业AI领域的人,可以帮助你利用最少的时间成本来加深对知识的理解和对前沿技术的理解。
2017年有一篇开创性的文章叫作"Attention is all you need", 那我们可以很自信地说“This course is all you need”,覆盖了从经典的机器学习、文本处理技术、序列模型、深度学习、预训练模型、知识图谱到图神经网络所有必要的技术。
课程已经过10期正式开班的迭代优化,不需要任何AI基础,唯一的要求是较好的编程基础。
NLP算法工程师培养计划
助你成为行业TOP10%的工程师
对课程有意向的同学
扫描二维码咨询
01
本课程适合谁
在读学生
在职人士
02
课程导师团介绍
李文哲
贪心学院CEO,曾任凡普金科集团首席数据科学家、 美国亚马逊和高盛高级工程师, 是金融行业开创知识图谱做大数据反欺诈的第一人。美国南加州大学博士,先后在AAAI、KDD、AISTATS、CHI等发表高水平学术论文15篇以上。
Frank Max
香港城市大学博士, 加州大学博士后,师从领域大牛。主要从事于数据分析,机器学习,图卷积,图嵌入的研究。先后在ECCV, Trans on Cybernetics, Trans on NSE, INDIN等发表高水平学术论文
王老师
毕业于QS世界综合排名TOP20名校计算机学院。研究方向为机器阅读理解,信息检索,文本生成等。曾多次于新加坡国立大学,南洋理工大学等世界名校访学交流。先后在AAAI, ICLR等发表高水平学术论文,拥有多项国家发明专利。
【课程辅导导师】高老师
数据科学家,中国科学院博士,曾发表多篇高水平学术论文。曾参与简历信息抽取与匹配项目、机器阅读理解、问答系统 无监督文本匹配、业务场景分类识别和BD交流、微博博文品牌识别、微博博文评论句子级情感分析、微博博文微信文章文本分类、微博博文微信文章关键词提取、KOL和微博周榜榜单人群画像等项目,具有十分丰富的项目经验。
【答疑导师】闫老师
某国家研究院NLP算法工程师,中国人民大学硕士,曾就职于网易,阿里巴巴等互联网大厂。负责过高阶NLP3,4,5,6,7,8,9期、高阶机器学习1,2,3,4期等课程的答疑工作。
03
课程大纲
第一周:
第一节:自然语言处理概述
第二节:数据结构与算法基础
【直播课程】:关于逻辑回归的一切
第一节:机器学习基础 - 逻辑回归
第二节:机器学习基础 - 模型的泛化
【直播课程】:案例讲解
第一节:机器学习基础 - 其他机器学习模型
第二节:分词、词的标准化、过滤
【直播课程】文本预处理实践
第一节:文本的表示
第二节:【项目作业】豆瓣电影评分预测
【直播课程】(项目一)豆瓣电影评分预测讲解
第一节:词向量技术
第二节:【项目作业】智能客服问答系统
【直播课程】代码直播实战:用Python从零实现SkipGram
第一节:语言模型
第二节:隐马尔科夫模型
【直播课程】:(项目二)智能客服问答系统项目讲解
第一节:无向图模型与标记偏置
第二节:Linear-CRF模型
【直播课程】:基于HMM的结巴分词
第一节:【项目三】基于Liner-CRF的医疗实体识别
第二节:深度学习基础
第一节:Pytorch的使用
第二节:RNN与LSTM
【直播课程】:基于特征工程+CRF的实体识别
第一节:Seq2Seq模型与注意力机制
【直播课程】:智能营销文案生成
第一节:动态词向量与ELMo技术
第二节:自注意力机制与Transformer
【直播课程】:代码训练之利用ELMo训练词向量
第一节:BERT与ALBERT
第二节:【项目作业】基于闲聊的对话系统搭建
【直播课程】:基于Transformer模型的机器翻译
第一节:BERT的其他变种
第二节:GPT与XLNet
【直播课程】:实战案例之GPT-3代码解读和应用
第一节:命名实体识别与实体消歧
第二节:关系抽取
【直播课程】:基于BERT-BILSTM-CRF的命名实体识别
第一节:句法分析
第二节:依存文法分析
【直播课程】A Fast and Accurate Dependency Parser using Neural Networks
第一节:知识图谱
第二节:【项目作业】搭建基于医疗知识图谱的问答系统
【直播课程】:(项目四)基于闲聊的对话系统搭建
第一节:模型的压缩
第二节:基于图的学习
【直播课程】:模型压缩实战
第三十四章:图神经网络
第三十五章:GraphSage与GAT
【直播课程】:(项目五)搭建基于医疗知识图谱的问答系统讲解
第三十六章:图神经网络与其他应用
【直播课程】GCN在文本分类中的应用
【直播课程】就业指导
NLP算法工程师培养计划
助你成为行业TOP10%的工程师
对课程有意向的同学
扫描二维码咨询
04
课程中的部分案例
1. 实现一个拼写纠错器 |
---|
2. 从零实现Word2Vec词向量 |
3. 利用SkipGram做推荐 |
4. 从零实现HMM模型 |
5. 基于Linear-CRF的词性分类器实现 |
6. 从零实现深度学习反向传播算法 |
7. 实现AI程序帮助写程序 |
8. 实现AI程序帮助写文章 |
9. 基于Transformer的机器翻译 |
10. 基于KG-BERT的知识图谱学习 |
11. 基于知识图谱的风控系统 |
12. 基于知识图谱的个性化教学 |
13. 利用蒸馏算法压缩Transformer |
14. 利用GCN实现社交推荐 |
15. 基于GAT的虚假新闻检测 |
(剩下20+个案例被折叠,完整请咨询...) |
05
部分项目作业
(完整的请咨询)
01
豆瓣电影评分预测
涉及到的知识点:
02
智能客服问答系统
涉及到的知识点:
03
基于Linear-CRF的医疗实体识别
涉及到的知识点:
04
基于闲聊的对话系统搭建
涉及到的知识点:
05
搭建基于医疗知识图谱的问答系统
涉及到的知识点:
NLP算法工程师培养计划
助你成为行业TOP10%的工程师
对课程有意向的同学
扫描二维码咨询