专栏首页大数据文摘Facebook数据被滥用?8个视频案例教你用好Facebook Graph API

Facebook数据被滥用?8个视频案例教你用好Facebook Graph API

大数据文摘作品

编译:Aileen

过去的一个周末,社交网络Facebook因为用户数据被第三方API滥用帮助美国大选的事情上了热搜。直到现在,Facebook CEO小扎也没有发出任何官方回应,以及未来该如何更好的保护私人数据。有人认为作为坐拥海量用户数据的网站在获得巨大收益的同时,理应预想到数据被滥用的可能并作出防范措施,在事情发生之后也应该更积极的面对而不是回避。也有人提出犯法的是第三方API, 原罪不在Facebook。

先把这件事情放一边,可以确定的是Facebook拥有大量可供人们浏览的数据,人们可以使用此数据做很多事情。今天我们来了解一下如何使用Facebook Graph API用Python进行数据抓取和分析。

Facebook拥有大量数据供您探索,您可以使用以下数据做很多事情:分析Facebook页面或Facebook群组,将这些数据用于社交网络分析(SNA),为数字营销做数据分析, 甚至收集和保存自己个人项目的数据。

这些视频将向你展示如何做基本的分析,例如:

  • 从Facebook下载数据
  • 从json转换为更方便的数据结构
  • 处理Graph API中的日期变量和其他数据

第1课:介绍和了解Graph API

在本视频中,我将向您介绍GRAPH API,我将使用GRAPH API Explorer并向您展示一些示例请求。

视频内容

第2课:下载并保存Facebook数据

在本视频中,我将向您展示如何从Facebook页面或Facebook群组下载并保存所有数据,并记住某些要点。

视频内容

第3课:设置和清理数据

在第三课中,我将使用notebook来清理和审计从Facebook获得的数据,并为分析做好准备。

视频内容

第4课:评论最多的帖子

在第四课中,我将向您展示一种简单的方式,以获得评论最多的帖子。

https://v.qq.com/x/page/s06098fb92o.html

第5课:点赞最多帖子

在这个课程中发生了一些有趣的事情,因为我发现我可以使用API访问了一些已删除的帖子。

https://v.qq.com/x/page/r0609s6vt80.html

第6课:计算词频

在这个视频中,我将向您展示如何数一个组或一个页面中的所有帖子词频。

您也可以在评论中使用相同的功能。

https://v.qq.com/x/page/j0609g7vvhp.html

第7课:按关键字对帖子进行分组

在这个视频中,我会将在页面中具有关键字“free”的帖子进行分组,并计算有多少人拥有这个关键字,以及有多少人没有这个关键字。

分组方式非常有用,我们将在未来的视频中更频繁地使用更多变量。

https://v.qq.com/x/page/f06099j7ats.html

第8课:按日期分组

在本视频中,我们将探索“创建时间”变量,以按照年份,月份或星期几对帖子进行分组。

这可以用来查找发布模式等等。

https://v.qq.com/x/page/e0609puvw9j.html

原文作者:Nour Galaby

原文地址:https://www.kdnuggets.com/2017/06/6-interesting-things-facebook-python.html

本文分享自微信公众号 - 大数据文摘(BigDataDigest),作者:文摘菌

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-03-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Facebook又叒陷数据门,5亿条数据不安全存储在亚马云服务器中

    Facebook发言人对各大主流媒体承认,用户的多组个人数据被存放在亚马逊AWS数据库中,包括数以百万计的Facebook用户的超过5亿条记录。

    大数据文摘
  • 美国政府发布:2015新版营养指南

    大数据文摘
  • 从人脸识别到情感分析,这有50个机器学习实用API!

    大数据文摘
  • 划重点! TensorFlow 2.0 中的符号和命令式 API

    文 / Josh Gordon, Google Developer Advocate

    abs_zero
  • 从零学Paddle系列-0 Paddle框架整体概览

    Paddle是百度开发的一个深度学习框架,运行时可采用静态图和动态图,通过多个版本的优化,Paddle的动态图运行效率已经可以媲美静态图,这里我推荐使用动态图来...

    BBuf
  • 机器学习和深度学习视频资料精选(附学习资料)

    来源:大数据挖掘DT数据分析 本文长度为633字,建议阅读3分钟。 本文为你介绍机器学习和深度学习的视频资料。 第一部分 基础语言 pandax视频教程链接: ...

    数据派THU
  • 机器学习和深度学习视频资料精选(附学习资料)

    pandax视频教程 链接: https://pan.baidu.com/s/1pLqavVX 密码: fath python入门到精通 链接: http...

    华章科技
  • <object>标签

    <object> 标签(或者称作 HTML 嵌入对象元素)表示引入一个外部资源,这个资源可能是一张图片,一个嵌入的浏览上下文,亦或是一个插件所使用的资源。<ob...

    Html5知典
  • 模板方法模式

    模板方法模式在一个方法中定义一个算法的骨架,而将一些步骤的实现延迟到子类中。模板方法使得子类可以在不改变算法结构的情况下,重新定义算法中某些步骤的具体实现。

    帅飞
  • 自建图床应用,我只推荐 Serverless

    我们发起 Serverless 应用征集后,发现程序员们真的有太多奇思妙想了,Serverless 除了可以用来自建网盘,还能特别便捷地搭建图床。 活动详情 ...

    腾讯云serverless团队

扫码关注云+社区

领取腾讯云代金券