《Python数据挖掘入门与实践》

本期为大家推荐的书籍是《Python数据挖掘入门与实践》

本书的作者Robert Layton是计算机科学博士,网络犯罪问题和文本分析方面的专家。多年来一直热衷于Python编程,参与过scikit-learn库等很多开源库的开发,曾担任2014年度“谷歌编程之夏”项目导师。他曾与全球几大数据挖掘公司密切合作,挖掘真实数据并研发相关应用。他的公司dataPipeline为多个行业提供数据挖掘和数据分析解决方案。

本书分12章进行论述,第一章先简单介绍了安装Python的步骤和演示一下简单的数据挖掘算法,比如亲和性分析和分类问题。第二章重点讲述分类问题,在这一章提出了建立估算器的思路去处理数据,估算器可以看做是数据流水线处理的第一车间。第三章讲述了用决策树算法预测一个实际问题,并提及了一下随机森林这个机器学习范畴的算法。第四章深入讲解用亲和性分析算法去分类。第五章讲述用转换器提取特征。第六章讲解朴素贝叶斯算法,作者在这一章用该算法进行了对社会媒体的挖掘,其本质是文本挖掘。第七章讲解用图挖掘。第八章讲解用神经网络破解验证码。第九章解决归属问题。第十章用聚类方面的算法对新闻语料进行分类。第十一章用深度学习对图象中的物体分类。第十二章讲大数据在现实中的应用。

总的来说,本书的作者从众多的算法中挑选出了较为经典的几类算法,用实际问题为我们讲解了用Python怎样去实现这些算法和解决实际问题。本书深入浅出,每一章都是一环扣一环,层层递进,初学者在阅读这本书时,要多去参考其他的书籍或网络,这样才能掌握本书的精髓。

编辑:黄一鸣

排版:何晓芙

责任编辑:何晓芙

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180124G0BR8200?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券