不让我复制粘贴,那我就只能把你给扒了,哼……

本想做一下酷狗音乐的产品分析,分析学习一下酷狗是怎么做的产品迭代,但是手机乐园网站居然做了限制不让我复制酷狗的版本更新信息,所以我就只能把它给扒了,哈哈哈......

先介绍一下用的的python的一些库和资源:

BeautifulSoup:以 Python 风格的方式来对 HTML 或 XML 进行迭代,搜索和修改。

requests:人性化的HTTP请求库。

XlsxWriter:一个用于创建 Excel .xlsx 文件的 Python 模块。

NumPy:使用 Python 进行科学计算的基础包。

代码编写逻辑如下:

获取到网页数据-》对需要的数据进行拆分组合-》将需要的数据保存到excel

希望可以对需要做产品分析获取产品版本更新资料的朋友有用,所以将代码附上,下载地址在文章底部。

这里只展示主执行程序:

# -*- coding: utf-8 -*-

import html_downloader,html_parser,html_outputer

# 程序的入口

if __name__ == “__main__”:

#想获取APP版本更新的数据地址

baseUrl = “https://soft.shouji.com.cn/down/18684.html”

#下载网站数据

pageLoader = html_downloader.HtmlDownloader()

pageContent = pageLoader.get_page(baseUrl)

# 对下载数据进行拆分组合

pageParser = html_parser.HtmlParser()

versionNumResult = pageParser.parse(pageContent)

# 保存需要的数据到excel

pageOutputer = html_outputer.HtmlOutputer()

pageOutputer.save_to_excel(versionNumResult,’test1′)

获取到的结果展示:

遇到的问题:

感觉很久没有写代码了,写代码其实还是蛮有乐趣的,哈哈哈哈....现学现用python,花了快一天完成的上面的代码,虽然对于一些大佬来说是小意思没什么难度,但是自己折腾出来,感觉还是挺棒的。python附带的库资源真的蛮多的,比较灵活可以根据自己的需求选择对应的库,整体感觉还可以,有空可以在瞎折腾一下。

哈哈,周末快乐,刷电影去了。

下载地址:

https://github.com/henya/phoneLy.git

馄饨世界

用了这么久了,

也还没关注公众号

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181021G0XY1V00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券