学习
实践
活动
工具
TVP
写文章

python数据分析案例-数据获取

仰望星空,脚踏实地

保持一颗沉静的心

一步一步向前走

去发现生活中的日常点滴

去探索生活中的美丽风景

去积累生活中的思思感悟

去沉淀生活中的浓郁芬香

今天及今后的几篇文章,探长将通过一个实例和大家一起探讨数据分析的流程,在这里探长将从数据的获取开始,进而对数据清洗、数据分析及可视化进行案例分析。

Part 0 - 项目概览

数据获取、数据清洗、数据分析及可视化是数据分析流程的三大步骤,在本次项目中探长将以手机为分析对象,通过多维度的数据分析了解当前手机市场概况;

今天探长将首先从数据分析流程的第一步-数据获取进行展开,后续会对获取到的数据进行清洗、分析及可视化。

Part 1 - 数据获取维度

由于手头上没有现成数据,探长制定了数据采集策略--通过爬虫技术从网站上进行数据采集,同时探长确定了数据采集来源--某东网站数据,并且明确了数据采集的维度,本次主要获取两个维度数据-产品数据和店铺数据。

Part 2 - 采集结果

通过利用python编写爬虫程序(应用到requests、beautifulsoup、pandas),探长最终获取到3000条左右数据。

Part 3 - 资料获取

为方便大家交流探讨,请在公众号输入窗口中:

回复“手机代码”获取爬虫源代码

或添加“探长微信”获取爬虫源码文件和结果数据。

Part 4 - 总结

以上就是撰写手机行业数据分析报告的前提--数据的获取,探长希望能够帮助到你!如有任何问题,欢迎与探长联系(在探长交流-->学习交流中可以加探长微信),或者进行留言互动!

茫茫人海中 期待与你相遇 在你我最美丽的时刻

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180714G152RI00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券