犀牛鸟人物丨专访人民大学范举老师:数据之美 ---社交影响力研究

犀牛鸟人物

2013年,CCF与腾讯合作发起犀牛鸟基金,旨在助力青年学者开展致力于提升人类生活品质的创新研究,推动研究成果的产业应用和落地。至今,犀牛鸟基金已经走过了五年,期间共计760名优秀青年学者提交申请,共计支持89项科研基金项目,78项创意基金项目。“犀牛鸟人物”系列将通过对话访谈,带您深入了解项目人物背后的故事。

【导读】

网络自媒体时代,人人都是信息的传播节点,有人通过发帖就火爆了朋友圈,有很多话题因为某个人的传播而登上热搜,大V或网红的一举一动更是常常引起模仿的热潮,而更多的人总是默默无闻的“小透明”。这种现象自然就带来一些我们很关心的问题——为什么人和人的传播影响力不一样?如何发现大数据下的传播规律,找到最具传播力的“节点”?如何精准辨识用户并向其针对性地推荐?如何对“三人成虎”后的谣言进行遏制和监管?CCF-腾讯犀牛鸟科研基金获得者、中国人民大学副教授范举将为我们阐释其中的”奥秘“,带我们一起领略数据之美。

Q1

Q::我们了解到您现在的研究项目可以帮助发现具有话题影响力的用户,怎么判断一个用户是否具备影响力?

范举:我们跟腾讯合作的研究工作就是希望能够发现社交网络中比较有影响力的人。首先稍微介绍一点背景知识。

影响力的度量实际上是以信息社交网络上的传播为标准。有些人在网上说了一句话,发了一个帖子,可以被很多人转载,这个过程很类似“病毒感染”,这个帖子就像病毒一样,“感染”了非常多的其他的人,这种传播的行为我们叫“社交网络传播”。

显然人和人是不太一样的,有些大V或者网红发一个帖子,传播范围很广,很多人都会被“感染”到,但有些“小透明”发了很多帖子,别人都不太知道。我们从这个角度来度量他的传播有多大影响力。

Q2

Q:能否举例解释一下?

范举:我举两个比较实际的例子,第一个例子就是商业营销。我们在网络上找一些种子用户,给他们一些优惠券或是打折券,然后让他们试用或试吃等,希望他在社交网络上帮助宣传。这样的话,一传十、十传百就带动了消费行为。商家以此扩大影响力就是通过一些关键性的节点,即有影响力的人,去传播消息,使传播的范围尽可能广。

还有一个例子是跟社会治理比较相关的——谣言。网上,尤其是朋友圈,会有很多听上去很有道理但实际上是伪科学的东西,这种信息的传播是一个很严峻的社会现象,相关部门在治理的时候需要找到一些传播谣言的关键性节点,进行重点把控,避免谣言“传染”到更多的人。

Q3

Q:那如何才能找到这些关键节点上的有影响力的人?

范举:我们把它建模成一个算法问题,从而度量社交网络上任何两个人之间的传播关系。

比如,如果你发现A每次发消息后,他的好友B都会转发,就说明A对B非常有影响力,这是直接影响力。往往这种大V有很多追随者或是好友,那么这种直接影响力的效果就会很强。此外还有间接影响力。比如你传给你的好友,好友再去传给他的好友,这样不断地传播我们叫“级联传播”,这个过程会影响到更多的人。

所以我们希望对社交网络上的这种影响力关系进行建模,然后用算法的方式找到在网络结构上比较重要的节点,这个节点有一个特性:么是追随者很多,要么是他通过他的好友进行级联传播,影响到其他人的范围也会很大。

Q4

Q:如何才能成为您所说的关键节点上的有影响力的人呢?这与一个人的职位、社会地位有关吗?

范举:传统看来是有关的。不过现在属于自媒体时代,我们经常会看到新闻——《我是如何从小透明变成点赞过万的大V》,实际上现在很多情况下传播呈现出一种话题性,可能与传播者本身线下的特性,如职位、社会地位的关联没那么大了。恰好你发的某个帖子或某个话题与热点相关,大家就比较愿意去转它。比如知乎上常有一些原来不出名的人,提供了某种非常好的视角或是答案的话,就会被很多人点赞,突然就可能爆发出来了。所以我觉得在自媒体时代会出现具有话题性的社交影响力涌现的情况。这其实也带来了一些社会问题,比如我们常看到的“抖机灵”、“蹭热度”,等等。

Q5

Q:除了发现具有影响力的用户,是否可以帮助用户预测、发现最具传播价值的话题?

范举:对的,我们和腾讯就此做了一次相关的合作,希望通过数据挖掘的方式,去发现这个用户在哪些话题上是比较有影响力的。换言之,比如你是一个自媒体,你之前可能发过各种方面的新闻,社会类的、时政类的或者民生类的,但你会产生一个疑惑:我发了这么多不同类别的新闻,在哪些类别上我的传播影响力最大?这对于自媒体来讲是非常想知道的问题,因为这会知道他后续在哪些领域发力。

所以我们通过算法的方式,发现用户可能在某类话题上的传播力最广。我可以举一个例子,我们之前对媒体发布的电商类广告做研究,最后挖掘出来一些关键词,比如护肤品、食品,在这种话题上他的声音可以传播的最广,可以被更多人转发;但是可能在其他一些,比如说电子商品上,就几乎没有人去转发他。针对不同的人,信息还需要一个分类体系,这个体系可以分得很细,比如护肤类里还有各种各样不同类型的护肤品,食品类也一样,对传播的信息打上类别标签,分析会更精准。所以我们也希望通过数据驱动的方式,来帮助这些社交网络的用户,发现哪些话题是最有影响力的。

Q6

Q:能分享一下您是如何参与到犀牛鸟基金项目中的?

范举:计算机这个学科,特别是大数据分析这个领域,数据就是研究的养料。对于我们来讲,没有数据就像是闭门造车。企业可以第一时间捕捉到非常多的真实用户需求以及数据资源。2016年我关注到犀牛鸟基金发布的命题中有“社交网络大数据的分析“一项,带着两个问题,第一是想看企业怎样处理真实的数据,第二很希望能够验证研究的模型能不能用在实际的社交大数据上产生效果,我申请了当年的犀牛鸟基金,由此开始了和腾讯研发团队的项目合作。

Q7

Q:在具体与企业研发团队的合作中您有哪些体会?

范举:在合作的过程中我发现高校和企业有碰撞,也有很好的互补关系。学术界面对问题时,往往会把它建模,我们更重视从理论上讲这个模型或算法是不是好。我们会对传播模型或者影响力用户的发现算法进行很长时间的调研。而企业更实际一些,他们更想知道如果使用这个算法,是不是真的可以提升用户的一些指标,比如点击率、互动率。所以在这个过程中,我们也会有一些碰撞。如何权衡工程效果和学术上的理论价值?实际上也是我们经常争论的一个话题。

Q8

Q:您认为研究成果在推向实际应用过程中有哪些挑战与机遇?

范举:这是个非常重要的问题,也就是说,高校做的研究成果如何通过企业合作来进行落地?事实上我们现在也是在探索的过程中。不可忽视的是,落地的过程在企业内部实际上有非常复杂的业务流程,以广告为例,我们试图把我们这种基于传播的分析结果在互联网广告的投放过程中落地,但整个互联网广告投放是个非常复杂的系统,它要考虑到方方面面的因素。以朋友圈为例,不止是感兴趣就可以了,还要参考用户的活跃程度,如果用户十天八天都不刷朋友圈,那这个广告其实就浪费了;此外,还需要考虑到用户对社交网络的敏感度,有些人觉得自己在社交网络上给一些比较高大上的东西点赞显得很有面子,但有些人可能就比较希望看一些和他生活切实相关的东西。

通过合作最终我们发现了一些意想不到的结果,而这些结果与我们之前通过一些公开数据或者一些小规模数据得出的结果并不一致。因此,和企业接触的过程中,我们不断的修改算法和模型,最后在碰撞中实现一个既有学术价值,也有很强的实际价值的算法或模型。但这个效果距离帮助企业实现业务指标来讲,还有一段路要走,所以我们还要把这个算法和模型做进一步的落地。总体来讲,道路是曲折的,前途是光明的,过程是非常有趣有意义的。

原文发布于微信公众号 - 腾讯高校合作(Tencent_UR)

原文发表时间:2018-04-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏企鹅号快讯

人工智能与个性化学习

自从2016 年,开启了人工智能时代元年后,云计算、大数据、积层神经网络、深度学习带来的人工智能展现在大众面前。随着技术的突破,成本的下降和应用的普及,巨头们纷...

2005
来自专栏机器之心

Nature | 走向实用化:谷歌量子计算的三大商业前景

选自Nature 作者:Masoud Mohseni等人 机器之心编译 参与:李泽南、黄小天、蒋思源 谷歌量子人工智能实验室的 Masoud Mohseni、...

3429
来自专栏AI科技评论

线性资本王淮:明年人工智能泡沫将达到顶点

虽然说当下几乎各行各业都在拥抱人工智能,但你是否知道人工智能曾经有过一段时间被忽视,且只能以数据挖掘、机器学习等其他称呼来进行代替? ? 近日由网易科技和网易智...

2969
来自专栏灯塔大数据

大数据行业人士必知10大数据思维原理

大数据思维原理是什么?简单概括为10项原理,当样本数量足够大时,你会发现其实每个人都是一模一样的。 一 数据核心原理 从“流程”核心转变为“数据”核心 大数据...

4065
来自专栏数据的力量

大数据思维的十大原理:当样本数量足够大时,你会发现每个人都是一模一样的

4786
来自专栏大数据架构师专家

【人工智能】权威解读!2018年的人工智能趋势

2017年12月30日晚,“预见2018”吴晓波年终秀在无锡灵山梵宫举行。在本届年终秀的下半场,IBM全球副总裁、IBM大中华区首席技术官沈晓卫,预测了未来3-...

864
来自专栏AI科技评论

雷锋网专访CSAIL主任Daniela Rus:人机关系之未来的最靠谱预测

前言: 人工智能的支持者们和反对者们的争论可能直到强人工智能真的出现的那一天都不会停止,但大众可能并不是非常清楚机器人和AI到底发展到什么程度了,以及认真思考过...

3568
来自专栏大数据文摘

对话第四范式胡时伟:让数据科学家成为业务专家,再为他们配一支技术军团

1894
来自专栏大数据文摘

机器人“女神”亮相GMIC:大数据与人工智能关系几何?

22510
来自专栏智能算法

一文看懂大数据思维

真正的革命并不在于分析数据的机器,而在于数据本身和我们如何运用数据。将大规模的数据与运用融合一起,将会颠覆很多我们原来的思维。大数据思维原理到底是什么?笔者概括...

3945

扫码关注云+社区