Facebook数据被滥用?8个视频案例教你用好Facebook Graph API

大数据文摘作品

编译:Aileen

过去的一个周末,社交网络Facebook因为用户数据被第三方API滥用帮助美国大选的事情上了热搜。直到现在,Facebook CEO小扎也没有发出任何官方回应,以及未来该如何更好的保护私人数据。有人认为作为坐拥海量用户数据的网站在获得巨大收益的同时,理应预想到数据被滥用的可能并作出防范措施,在事情发生之后也应该更积极的面对而不是回避。也有人提出犯法的是第三方API, 原罪不在Facebook。

先把这件事情放一边,可以确定的是Facebook拥有大量可供人们浏览的数据,人们可以使用此数据做很多事情。今天我们来了解一下如何使用Facebook Graph API用Python进行数据抓取和分析。

Facebook拥有大量数据供您探索,您可以使用以下数据做很多事情:分析Facebook页面或Facebook群组,将这些数据用于社交网络分析(SNA),为数字营销做数据分析, 甚至收集和保存自己个人项目的数据。

这些视频将向你展示如何做基本的分析,例如:

  • 从Facebook下载数据
  • 从json转换为更方便的数据结构
  • 处理Graph API中的日期变量和其他数据

第1课:介绍和了解Graph API

在本视频中,我将向您介绍GRAPH API,我将使用GRAPH API Explorer并向您展示一些示例请求。

视频内容

第2课:下载并保存Facebook数据

在本视频中,我将向您展示如何从Facebook页面或Facebook群组下载并保存所有数据,并记住某些要点。

视频内容

第3课:设置和清理数据

在第三课中,我将使用notebook来清理和审计从Facebook获得的数据,并为分析做好准备。

视频内容

第4课:评论最多的帖子

在第四课中,我将向您展示一种简单的方式,以获得评论最多的帖子。

https://v.qq.com/x/page/s06098fb92o.html

第5课:点赞最多帖子

在这个课程中发生了一些有趣的事情,因为我发现我可以使用API访问了一些已删除的帖子。

https://v.qq.com/x/page/r0609s6vt80.html

第6课:计算词频

在这个视频中,我将向您展示如何数一个组或一个页面中的所有帖子词频。

您也可以在评论中使用相同的功能。

https://v.qq.com/x/page/j0609g7vvhp.html

第7课:按关键字对帖子进行分组

在这个视频中,我会将在页面中具有关键字“free”的帖子进行分组,并计算有多少人拥有这个关键字,以及有多少人没有这个关键字。

分组方式非常有用,我们将在未来的视频中更频繁地使用更多变量。

https://v.qq.com/x/page/f06099j7ats.html

第8课:按日期分组

在本视频中,我们将探索“创建时间”变量,以按照年份,月份或星期几对帖子进行分组。

这可以用来查找发布模式等等。

https://v.qq.com/x/page/e0609puvw9j.html

原文作者:Nour Galaby

原文地址:https://www.kdnuggets.com/2017/06/6-interesting-things-facebook-python.html

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2018-03-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PHP在线

微信小程序

什么是小程序 “小程序” 是一种不需要下载即可使用的应用,它实现了应用‘触不可及’的梦想, 用户扫一扫或者搜一下即可打开应用。 这也体现了‘用完即走’的理念,...

92480
来自专栏京东技术

移动测试避坑指南(第一篇):从流程到技术的知识概要

20740
来自专栏纯洁的微笑

从既有系统到微服务架构

微服务近年来可谓炙手可热,合理的使用微服务架构可以解耦系统、提供更好的软件伸缩性以及提高组织的敏捷性。然而现实中较少有项目一开始就会选择使用微服务架构,绝大多数...

10030
来自专栏养码场

《王者荣耀》技术总监复盘回炉历程:没跨过这三座大山,就是另一款MOBA霸占市场了

来听听邓君站在技术视角对《王者荣耀》内部的解读:《王者荣耀》如何从从立项之初经历的惨淡时期到华丽的翻盘;它实际原理、问题和优化的思路,和现在见到大部分不同的技术...

13920
来自专栏灯塔大数据

大数据圈盘点:你不知道的15个新技术

大数据中的大作为 对于大数据来说,业界这几周算是比较忙碌的。因为很多初创公司和一些老牌的公司都推出了数据分析和数据管理产品,以及更新了现有产品,提供更丰富的功能...

31060
来自专栏Android 开发者

开发者也是用户 - 简介:易用性 - 学于 UI,用于 API

18330
来自专栏Golang语言社区

微服务架构崛起 能否成为下一代云计算?

复杂度可控、灵活可扩展与独立部署 IT架构一直从all in one到近两年热门的微服务架构,技术不断进步,微服务架构模式(Microservice Arch...

36740
来自专栏精讲JAVA

想要成为顶级程序员必须具备的思维,学会了少走三年弯路

《THe Effective Engineer》的作者Edmond Lau采访了很多硅谷顶级科技公司的顶尖软件工程师。他发现这些给世界带来巨大影响的的工程师们至...

20280
来自专栏技术翻译

2018年ETL工具比较

提取,转换和加载(ETL)工具使组织能够跨不同的数据系统使其数据可访问,有意义且可用。通常,公司在了解尝试编码和构建内部解决方案的成本和复杂性时,首先意识到对E...

1.6K10
来自专栏钱塘大数据

【推荐阅读】顶尖数据工程师的五种思维模式

《THe Effective Engineer》的作者Edmond Lau采访了很多硅谷顶级科技公司的顶尖软件工程师。他发现这些给世界带来巨大影响的的工程师们至...

36270

扫码关注云+社区

领取腾讯云代金券