这些网址是我在学习python中文文本挖掘时觉得比较好的网站,记录一下,后期也会不定期添加:
非常全的网址,讲了各个库,还有github代码地址
2.http://blog.csdn.net/abcjennifer/article/details/23615947
Rachel Zhang的文章,运用的各种算法,可以测出准确率
3.http://www.ibm.com/developerworks/cn/data/library/bd-natural-language/
利用python、scikit和文本分析来实现行为分析
4.http://developer.51cto.com/art/201507/485276.htm
一个完整的介绍分词,从导入数据集到最后结果
5.http://www.tuicool.com/articles/U3uiiu
一个简单的例子,jieba分词
6.http://scikit-learn.org/stable/modules/feature_extraction.html
官网上对文本分析的介绍
7.http://ju.outofmemory.cn/entry/74958
scikit文本特征提取
8.http://blog.csdn.net/lsldd/article/details/41520953
一个博主写的,简单的分词
9.http://zhuanlan.zhihu.com/textmining-experience/19630762
知乎上的文本分析专栏
10.http://www.clips.ua.ac.be/pages/pattern-en#sentiment
pattern包得用法