前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何快速的获得一些购物网站的产品信息?

如何快速的获得一些购物网站的产品信息?

作者头像
逍遥之
发布2020-03-23 16:34:45
9850
发布2020-03-23 16:34:45
举报
文章被收录于专栏:数据技巧

如何快速的获得并整理一些购物网站的产品信息?

通常我们会在购物网站上搜索产品,同时我们想分析这些产品就会涉及到一些下载整理这些产品的资料,那我们如何进行快速的整理呢?

我们拿最近被兰亭集势收购的ezbuy网站举例。

登录到ezbuy的新加坡分站的主页,我们可以看到左边的分类菜单列表。我们点进去一个分类类别,就可以看到如下画面。

我们要获取这些产品的信息,那该如何操作呢?复制粘帖然后在一个一个整理?使用Power Query即能获得我们所需要的信息并整理归类。那我们看下如何操作?

我们通过抓包,也就是在刷新时网页显示的一些信息会在一些数据文件里会有显示,通常我们在浏览器上按F12即可调出抓包工具。

通过F12的抓包工具,我们可以看到我们需要的数据在文件ListProductsByCondition里面,这些信息包含的很详细了,而且分门别类。

这个页面我们是通过Preview显示的,这个只是一个显示的方式,但是真正数据存储的格式并不是这样。我们通过点击Response来查看,数据的格式是这样存放的。是用大括号{}的josn格式存放的。

JSON(JavaScript Object Notation, JS 对象简谱) 是一种轻量级的数据交换格式,通常用于网址数据交换及存储。一般购物网站的数据基本都是以这种格式存放,我们看到很长一段数据以{}存放的,基本就是了。

我们直接复制这一段信息到Power Query中作为单个文本存放。我们可以看下存放到Power Query中是这样的。

这样复杂的格式,我们怎么可以提取我们想要的信息呢?这里就要用到Power Query中非常重要的一个功能,分析功能。这个功能在哪里呢?

我们试下,如果点击这个按钮后,原来的文本进行了如下的变化。

通过分析我们可以看到,Power Query已经把文件进行了归类,我们需要的产品信息就在Products的list列表里面,我们点击并展开后就能获得需要的信息了。

这个才是我们需要的产品信息的格式,这样我们就能快速的整理出页面的产品信息分类了。

如果还在傻傻的用手动进行复制粘贴获取数据的操作,可以试试这个,能够让你的工作效率加倍。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-11-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据技巧 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 如何快速的获得并整理一些购物网站的产品信息?
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档