专栏首页大数据文摘大数据彻底改变社科研究过程,学者面临道德考验

大数据彻底改变社科研究过程,学者面临道德考验

[摘要]利用互联网用户资料搞研究,到底需不需要提前获得用户授权?当下这成了一个问题。

美国康奈尔大学教授杰弗里•汉考克

Facebook、谷歌、亚马逊和其他科技创业公司收集了用户的大量个人数据,这些大数据让学者们感到异常兴奋,因为这足以改变他们研究社会科学的进程。

与过去必须通过田野调查和采访才能收集到数据相比,现在学者们坐在屏幕面前就可以立即接入数百万的互联网用户资料。这已经成为当前社会科学的研究前沿:学者们借助互联网用户的资料进行研究,而这些用户可能永远也不知道他们曾经被当做研究目标,更别说征求他们的意见了。

美国康奈尔大学通讯与信息科学专业教授杰弗里•汉考克(Jeffrey T. Hancock)指出:“这是社科研究的一个全新时代。这就好比显微镜的诞生对化学科学发展所起到的促进作用。”

Facebook实验引发争议

不过,这也已经引发了一些争议。Facebook曾在今年6月公布了一份研究报告,当时这家全球最大的社交网站对近70万个毫不知情的用户所发布消息的算法进行了调整和处理,这样人们就会看到一些不正常的少数积极或消极的帖子。这份报告一公开就立即引发了争议。而汉考克恰恰是这份报告的创作人员之一。

现在,汉考克与其他大学和公司的研究人员却面临着又一个难题:如何为从事此类社科研究制定道德上的指导原则。汉考克在Facebook公布研究报告后接受采访时表示,他将通过召集学者、企业研究人员和政府部门召开一系列讨论会的形式来帮助起草和制定相应的指导原则。

来自麻省理工学院和斯坦福大学的学者们正在围绕上述议题筹备召开专题讨论会和大型会议,数本专业期刊也在忙着推出专刊研究数据使用的道德问题。作为微软旗下的一个准独立部门,微软研究院(Microsoft Research)在此类讨论会中发挥了重要作用。该研究院在上个月与汉考克共同就Facebook的研究召开了一次专题讨论会,并向学者提供一套软件工具,帮助他们针对一项研究在早期所遇到的道德问题进行消费者调查。

美国联邦贸易委员会(FTC)负责规范公司在隐私问题和公平对待互联网用户方面的行为。尽管FTC拒绝就Facebook的研究报告发表任何评论,但FTC主席伊迪斯•拉米雷兹(Edith Ramirez)却对用户数据使用规范问题十分关注。拉米雷兹指出:“当涉及到自身数据被使用的问题时,消费者应该处于主动地位。他们不想被遗忘在角落里,也不想在获知数据使用方式后而不寒而栗。”

Facebook已经就其研究进行了道歉,但拒绝发表进一步评论。

很多互联网公司所进行的类似研究都在内部完成,而且目的是完善各自的产品,比如测试用户是喜欢Facebook消息源中的新闻,还是更喜欢收看视频,以及如何让谷歌搜索结果变得更加精准。

然而,互联网公司也经常与学术机构一起研究更具意义的社会问题,而且科学家们也非常渴望进行更具抱负的研究。

Facebook在2010年向用户发送美国总统竞选投票提醒信息

Facebook所进行的情感实验便是由企业数据科学家亚当•克拉默(Adam D.I. Kramer)发起的,汉考克和另一位研究人员杰米•古伊洛瑞(Jamie E. Guillory)也参与了这项实验。在该实验中,Facebook的数据科学家们研究了用户的动态消息,并得出一个结论,像快乐和悲伤之类的更持久情绪能够在社交网络之间进行传播。

在另一项众所周知的实验中,Facebook在2010年美国总统竞选期间向其6100万美国用户发送了投票提醒信息。部分用户还看到了已经投完票的Facebook好友列表。研究人员发现,这种特殊的社交提醒能够让更多的美国人参与总统竞选投票。这项研究还让一些科学家认为,Facebook有能力影响总统竞选结果。

美国约会网站OKCupid也在近期展开了多项测试,包括将用户的图片移除7个小时后,分析对话的深度。除此之外,该网站还暂时改变了资料评级系统,向用户推荐一些与之匹配度较低的约会对象,看看他们是否会影响用户彼此之间的印象。

联邦法律缺失

类似的实验一直在引发着争议:什么样的实验需要提前获得用户的授权呢?公司怎样才能确定消费者对个人信息的使用具有知情权呢?谁来决定其中的游戏规则呢?

很多社会科学的研究人员纷纷表示,现有的联邦法律并没有涵盖大范围的互联网用户研究,也没有为此类研究提供合适的指导原则。对于由大学研究人员发起的互联网项目而言,互联网公司提供的用户评论平台有助于他们完成项目研究。

麻省理工学院斯隆管理学院的希南•亚拉(Sinan Aral)教授指出,任何新指导原则的出台都必须经过深思熟虑。他表示:“我们需要知道,如何在不阻碍这些研究的前提下制定指导原则,因为这些研究能够帮助我们更好地了解人类的行为。” 麻省理工学院将在今年10月主办以数字实验为主题的大型会议,而亚拉也正筹备在这次大会上召开以互联网伦理为主题的研讨会。

指导原则需循序渐进

微软研究院高级研究员玛丽•格雷

美国印第安纳州立大学媒体学院助理教授兼微软研究院高级研究员的玛丽•格雷(Mary L. Gray)曾经对社会科学领域的伦理问题进行过广泛研究。她曾多次表示,进行数字实验的研究人员很少受到外部其他原则的制约。格雷和微软研究院的其他研究人员花费了长达两年时间成立了一个伦理咨询委员会,并针对微软实验室的研究人员推出了伦理培训项目。现在,格雷正与汉考克一起将这种伦理原则推广至更大的研究领域。

格雷指出:“如果每个人都能做正确的事情,那么我们也就永远都不会伤害到任何人。”不过她向研究人员推荐了一种简单的检验标准:如果你在完成研究的过程中害怕征求受试者的授权,那么你就必须得考虑深层次的伦理问题了。

而汉考克则认为,公司不愿被牵涉入限制他们创新能力的活动中,因此任何指导性原则必须“有效、快速、易于理解且循序渐进”。一些研究人员指出,Facebook所进行的研究存在明显风险。但汉考克则表示研究人员并没有意识到,对Facebook消息源做出的微小调整也会让一些用户感到自己的权利遭到了侵犯。

作者:景隼 摘自:腾讯科技

本文分享自微信公众号 - 大数据文摘(BigDataDigest)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2014-08-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

 • 打开大数据研究的潘多拉魔盒

  大数据文摘
 • Nature杂志总编辑:如何培养一个有价值的研究者

  在第六届腾讯WE大会上,自然集体总编辑Philip Campbell宣布了与腾讯的合作——《自然》杂志和腾讯合作推出“自然科研全球影响力大奖(Nature Re...

  大数据文摘
 • 中国AI人才图鉴:59%的中国籍研究员隶属美国研究机构

  因此,根据专家认可的顶级AI年度会议上发表的论文,保尔森研究所宏观政策智库研究员在Macarpolo创建了一个原始数据集,为评估中美AI科研人员的数量和质量提供...

  大数据文摘
 • SCI写作专题第三期:Materials and Methods

  Scientific writing的主要任务是将研究者的信息清晰、简明地传达给科学界,一是为了科学论文的发表,二是推动了科学和循证决策的进展,在过去的几十年里...

  百味科研芝士
 • 如何设计好一门集成电路设计MOOC课程

  在过去的一年中,我发布了两门在线MOOC课程,分别是中国大学MOOC平台的“芯动力——硬件加速设计方法”、IC创新学院的“数字集成电路静态时序分析基础”均收到了...

  网络交换FPGA
 • Python 切片(Slice)

  在实际开发中,经常遇到下面的需求:在线性表(数组)中提取若干个元素的操作,提取规则有很多,比如说提取前5个、提取后5个、提取奇数/偶数位元素等等。 ...

  Steve Wang
 • 浅谈Javascript中的Hook技术

  Hook是一种动态修改函数执行流程或返回结果的方法,在实际应用中非常广泛。Javascript作为一种动态语言,也可以进行Hook操作。随着Javascript...

  drunkdream
 • TMD成不了BAT的接班人

  刚刚过去的六月份,缺少布道和对决的互联网圈似乎有了一点涟漪。新美团大众点评(以下简称美大)CEO王兴接受访谈重提阿里的股权插曲,饿了吗创始人对王兴的观点颇有异议...

  华章科技
 • 工业界第一手实战经验:深度学习高效网络结构设计

  这一年来一直在做高效网络设计的工作,2018年即将结束,是时候写一篇关于高效网络设计的总结。

  SIGAI学习与实践平台
 • 完美解决-RuntimeError: CUDA error: device-side assert triggered

  pytorch会自己扫描train_path下的每一个文件夹(每类图片都位于其类别的文件夹下),并将每一个类映射成数值,比如有4类,类别标签就是[0,1,2,3...

  绝命生

扫码关注云+社区

领取腾讯云代金券