通常我们会在购物网站上搜索产品,同时我们想分析这些产品就会涉及到一些下载整理这些产品的资料,那我们如何进行快速的整理呢?
我们拿最近被兰亭集势收购的ezbuy网站举例。
登录到ezbuy的新加坡分站的主页,我们可以看到左边的分类菜单列表。我们点进去一个分类类别,就可以看到如下画面。
我们要获取这些产品的信息,那该如何操作呢?复制粘帖然后在一个一个整理?使用Power Query即能获得我们所需要的信息并整理归类。那我们看下如何操作?
我们通过抓包,也就是在刷新时网页显示的一些信息会在一些数据文件里会有显示,通常我们在浏览器上按F12即可调出抓包工具。
通过F12的抓包工具,我们可以看到我们需要的数据在文件ListProductsByCondition里面,这些信息包含的很详细了,而且分门别类。
这个页面我们是通过Preview显示的,这个只是一个显示的方式,但是真正数据存储的格式并不是这样。我们通过点击Response来查看,数据的格式是这样存放的。是用大括号{}的josn格式存放的。
JSON(JavaScript Object Notation, JS 对象简谱) 是一种轻量级的数据交换格式,通常用于网址数据交换及存储。一般购物网站的数据基本都是以这种格式存放,我们看到很长一段数据以{}存放的,基本就是了。
我们直接复制这一段信息到Power Query中作为单个文本存放。我们可以看下存放到Power Query中是这样的。
这样复杂的格式,我们怎么可以提取我们想要的信息呢?这里就要用到Power Query中非常重要的一个功能,分析功能。这个功能在哪里呢?
我们试下,如果点击这个按钮后,原来的文本进行了如下的变化。
通过分析我们可以看到,Power Query已经把文件进行了归类,我们需要的产品信息就在Products的list列表里面,我们点击并展开后就能获得需要的信息了。
这个才是我们需要的产品信息的格式,这样我们就能快速的整理出页面的产品信息分类了。
如果还在傻傻的用手动进行复制粘贴获取数据的操作,可以试试这个,能够让你的工作效率加倍。