Scan Order in Gibbs Sampling: Models in Which it Matters and Bounds on How Much(笔记)

title:  学习和预测社交网络中的意见动态

背景介绍:

    这篇文章的作者通过对当前的在线新闻和社交媒体平台新闻的观察,基于:“社交媒体用户经常通过学习朋友分享的观点来更新自己对某一特定话题的看法” ,  提出了一个构想:"我们能否学习一个数据驱动的意见动态模型,能够准确地预测用户的意见?",本文就是作者围绕这个问题,来搭建了一个网络模型———— 一种舆论动力学的概率建模框架-斜率模型(SLANT 3),该框架通过标记跳跃扩散随机微分方程表示用户的意见,并允许根据历史细粒度事件数据进行有效的模型模拟和参数估计。然后,我们利用我们的框架,推导出一套有效的预测公式,用于意见预测,并确定意见在何种情况下收敛到稳定状态。从Twitter收集的数据的实验表明,我们的模型对数据提供了一个很好的拟合,我们的公式实现了比替代方案更精确的预测。

模型的详细思路:    

  这个模型将用户的潜在意见,用一组一组标记跳跃随机微分方程(SDES)驱动的连续时间随机过程[14]来表示。这种结构允许每个用户的潜在意见随着时间的推移被邻居异步表达的意见作为情感信息加以调整。在这里,每当用户通过发布情感信息来表达自己的观点时,她都会对自己当前潜在的观点做出一种杂乱无章的估计。然后,利用模型的一个关键属性-马尔可夫性质-来开发:

  1.通过凸规划找到最大可能产生一组(数百万)情感信息的参数的有效估计过程。

  2.一个可扩展的模拟过程,可以在几分钟内从模型中抽取数百万条情感信息。

  3.一套新的预测公式,用于有效和准确的舆论预测,也可用于确定意见在何种情况下收敛到稳定的共识或两极分化状态。

先关工作:

   在这部分,作者描述了一些以前模型的惯用套路,应该是想做突出一下自己的创新点吧.

 以前的模型通常有以下限制:

  1. 不区分潜在意见和情绪(或表示意见),这是对意见的一种嘈杂的观察(例如,大拇指向上/向下,文本情感);

       2. 认为用户的意见是在离散时间内同步更新的,但是,意见可以按照复杂的时间模式异步更新。

       3. 模型参数很难从真正的细粒度数据中学习,而是任意设置,因此,它们提供了不准确的细粒度预测。

       4.  只分析用户意见的稳态,而忽略了真实舆论动态的瞬态行为,这使得舆论预测方法成为可能。最近,在设计模型方面做出了一些努力,克服了上述一些限制,并提供了更准确的预测[7,8]。然而,他们没有区分意见和感情,仍然认为意见是在离散时间内同步更新的。我们的建模框架解决了上述局限性,并通过这样做,实现了比替代方案更准确的意见预测。

Proposed model :

     在这部分,讲述了作者模型的着陆点.

  在这一部分中,作者首先从设计的数据出发,建立了他们的意见动力学模型,然后介绍了模型参数估计和模型仿真的有效方法。

  作者所用数据介绍:(Opinions data 评论数据)

    给出一个定向的社交网络: G = (V, E) , 并将每条消息(评论)记录为e:=(u,m,t) ,这个表示着,u属于V,在时间t上发布了带有情感的消息m。

给定消息集合 {e1=(u1,m1,t1),.,en=(un,mn,tn)},历史Hu(T)收集用户u发送到但不包括时间t的所有消息,即,

       H u (t) = {ei = (ui, mi , ti ) | ui = u  && ti < t};H(T):=∪u∈V  Hu(T)表示消息的全部历史,但不包括时间t。

 。。。记录中.

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

一次搞定多种语言:Facebook展示全新多语言嵌入系统

42880
来自专栏数据科学与人工智能

【教程】机器学习Python教程:1机器学习

机器学习是一种编程,它使计算机能够在没有显式编程的情况下自动地从数据中学习。换句话说,这意味着这些程序通过学习数据来改变它们的行为。

13220
来自专栏Python小屋

Python+sklearn使用线性回归算法预测儿童身高

问题描述:一个人的身高除了随年龄变大而增长之外,在一定程度上还受到遗传和饮食以及其他因素的影响,本文代码中假定受年龄、性别、父母身高、祖父母身高和外祖父母身高共...

43430
来自专栏社区的朋友们

个性化资讯推荐算法 ( 下 )

头条为何能取得成功?很多人会说是头条的个性化推荐技术做得好,个人认为其实不尽然。本文罗列了相关的个性化推荐技术,特别是资讯推荐常用的算法,带大家从“内行”的角度...

2K00
来自专栏华章科技

看《纽约时报》如何用数据算法打造新一代推荐系统!

通过精炼读者获取这些内容的途径,即在移动应用和网站上基于读者喜好调整文章布局,能够帮助读者找到与他们相关的内容,比如在正确的时间推送读者感兴趣的内容、重大事件的...

10120
来自专栏AI研习社

从数据预处理到排序算法,全方位解读 Uber 人工智能客服 COTA

日前,Uber 官网上的一篇文章详细介绍了基于 NLP 和机器学习构建的 COTA 客服系统。利用该系统,Uber 可以快速高效地解决 90% 以上的客服问题,...

33870
来自专栏量子位

普通程序员如何向人工智能靠拢?(免费教程,自学指南)

这是「范式大学推荐课程」第 4 篇文章,量子位获第四范式授权转载并重新编辑。 相信看到这篇文章的朋友,几乎都想成为机器学习科学家。 事实上,绝大多数的付费课程,...

39060
来自专栏机器之心

业界 | 用于机器阅读理解的迁移学习:微软提出通用型SynNet网络

选自Microsoft Research Blog 作者:Xiaodong He 机器之心编译 参与:Smith、路雪 不是每个人都会下围棋,但大多数人都会阅读...

32560
来自专栏机器之心

前沿 | BAIR展示新型模仿学习,学会「像人」那样执行任务

通过观察另一个人来学习新技能的模仿能力,是体现人类和动物智能的关键部分。我们是否可以让一个机器人做同样的事情?通过观察人类操作物体进而学会操作一个新的物体,就像...

14120
来自专栏机器人网

程序猿:这四种方式开启机器学习之路

学习机器学习有很多方法,大多数人选择从理论开始。 如果你是个程序员,那么你已经掌握了把问题拆分成相应组成部分及设计小项目原型的能力,这些能力能帮助你学习新的技...

29570

扫码关注云+社区

领取腾讯云代金券