Python实现大数据实例(1)

最近对Python的学习有点慢了,原因是家里添了一位新成员。还好这几天总算缓过神来,继续自己Python之路。

最近在着手研究如何用Python来教K12。Python是一门高级编程语言,不是图形化的编程语言,而且全是英文的,所以我想对于小学高年级生来说应该接受能力会好一点;但是如何教,从哪里着手,一直是我这个程序员爸爸需要重点思考的地方。

前面教了孩子图形化编程,最近在让孩子用Python做数学题的简单验算。我想如何教还是得从自己孩子身上试起。

今天要介绍的就是用Python来实现大数据。

这里说的实现大数据就是把聚集在一起的大批量的信息按一定规则分割成一小块,然后从一块一块的信息中再把重要的信息给匹配提炼出来。所以这时Python其实就是大数据实现的工具。

由于自己有微信小程序和一个网站,每天有人浏览的记录都会被自动记录在服务器上的LOG日志里。我取了1月4日的LOG日志文件的一部分来分析。

由于浏览量不是很大,所以我象征性地从原有的日志文件每取10条生成一个新文件来分析。

具体分析什么信息我会放在下一次的文章里发布。

今天着重介绍从一个大文件分割成数十个文件的演示过程。

这是原先的Log文件。

把写好的Python代码和Log文件放在自己选定的目录下

执行Python fileSplit.py,生成数十个小文件

生成的文件如下

RICH the imagination

of all possibilite

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180105A11HBN00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券