杨熹的专栏

263 篇文章
40 人订阅

全部文章

杨熹

中文NLP笔记:14. 中文命名实体提取

  一般包括三大类(实体类、时间类和数字类)和七小类(人名、地名、机构名、时间、日期、货币和百分比)

484
杨熹

节后如何快速进入工作状态

回家过年时觉得时间过的特别快,不回家过年时觉得时间过得更快,今年虽然没回家,但也在心理上偷了个懒儿,美滋滋地过了几天节,看小品看电影,一会哭的稀里哗啦一会哈哈大...

462
杨熹

中文NLP笔记:13 用 Keras 实现一个简易聊天机器人

1442
杨熹

图解精度和召回率

例如方形的左边一半,是实际上为正的样本。右边一半,是实际上为负的样本。那除了算法判断正确的,以外,就是判断错误的样本。

883
杨熹

中文NLP笔记:12 中文情感分析

  需要大量的人工标注的语料作为训练集,提取文本特征,构建分类器,进行情感的分类。

562
杨熹

中文NLP笔记:11. 基于 LSTM 生成古诗

  在每行末尾加上 ] 符号是为了标识这首诗已经结束,说明 ] 符号之前的语句和之后的语句是没有关联关系的,后面会舍弃掉包含 ] 符号的训练数据。

1054
杨熹

中文NLP笔记:8. 基于CNN的推荐系统

  如果一段文字包含有 n 个词,每个词有 m 维的词向量,那么可以得到一个 n*m 的词向量矩阵

972
杨熹

中文NLP笔记:8. 基于LSTM的文本分类

  有些句子即使把词的顺序打乱,还是可以看懂这句话在说什么,有时候词的顺序打乱,句子意思就变得面目全非

1053
杨熹

中文NLP笔记:7. 基于HMM的中文分词

今天是大年三十儿,祝各位简友新春快乐,心想事成,万事如意!今天也继续来学一波nlp技术。

1093
杨熹

中文NLP笔记:7. 如何做中文短文本聚类

  将一个个文档表示成高维空间点,通过计算哪些点距离比较近,聚成一个簇,簇的中心叫做簇心

701
杨熹

中文NLP笔记:6. 如何做中文短文本分类

  这里可以使用的模型有:朴素贝叶斯,SVM,决策树、随机森林、XGBoost、神经网络等

812
杨熹

中文NLP笔记:5. 文本数据如何转换成计算机能够计算的数据

  把文本(段落或者文档)看作无序的集合,忽略语法和单词的顺序,计算每个单词出现的次数

763
杨熹

硅谷心情:谷歌,计算机,Intel

在地图上搜 Googleplex 就到了总部,公司还有专门给visitor的停车位置,这个细节很让人喜欢。

932
杨熹

Auto ML 一种自动完成机器学习任务的系统

在 2018 年比较火,很多大公司都开源了各自的auto ml库,例如 Cloud AutoML, AUTO KERAS, Auto Sklearn, Auto...

592
杨熹

代码实例:如何使用 Google 近日推出的 TensorFlow 2.0 Preview

去年8月13日,谷歌宣布 “TensorFlow 2.0 is coming”, 最近几天,谷歌 TensorFlow 团队刚刚发布了 TensorFlow ...

1192
杨熹

图解什么是 Transformer

Transformer 是 Google 团队在 17 年 6 月提出的 NLP 经典之作, 由 Ashish Vaswani 等人在 2017 年发表的论文...

1014
杨熹

情感分析的方法有哪些

情感分析也称为意见挖掘,是自然语言处理(NLP)中的一个领域,它试图在文本中识别和提取意见

731
杨熹

既能抬头看路,也能低头走路的目标实现方法

2020年我的目标是:完成2019年那些本该在2018年完成的我在2017年就信誓旦旦要完成2016年制定的目标!

763
杨熹

机器学习模型算法 List

Reinforcement or Semi-Supervised Machine Learning

922
杨熹

中文NLP笔记:4. 文本数据可视化 的几个方法

  常用的可视化形式有树状图、节点连接的网络图、力导向图、叠式图和 Word Tree 等

772

扫码关注云+社区