Arxiv网络科学论文摘要14篇

祝大家新年快乐!

意见动态中的交叉问题团结与真相收敛;

普查与第二定律:美国众议院最优分摊的熵权法;

基于主体的模型的特征;

Power Plexus:基于网络的分析;

将大数据表征为网络:新方法和新见解;

用高阶网络检测序列数据中的异常;

美国最高法院的一致意见跨越了一个世纪;

ASYMP:大规模图的容错挖掘;

用于复杂网络上多数投票模型的淬火平均场理论;

当名人赞同政治家:分析2016年美国总统选举中名人追随者的行为;

最大限度地减少社会网络中的极化和分歧;

集体智慧的社会贝叶斯学习;

社交博客安全和敌对用户聊天安全检测模型的开发;

共享出行的好处;

意见动态中的交叉问题团结与真相收敛

原文标题: Cross-Issue Solidarity and Truth Convergence in Opinion Dynamics

地址: http://arxiv.org/abs/1712.09343

作者: Zong Xuan Tan, Kang Hao Cheong

摘要: 参与多重社会问题的运动和联盟如何成功实现交叉问题的团结,以及何时变得分散?为了解决这个问题,必须理解交叉问题交互的机制。舆论动态和政治分歧的先前工作集中在单一问题的共识和两极分化。受到交叉问题运动建设实践的启发,我们制定了多问题舆论动态的一般模型,其中关于一个问题的一致意见可以在讨论其他问题时促进更大的包容性,从而避免排他性交互的缺陷,在每个考虑的问题上充分同意。我们的模型表明,随着更多问题的出现,只有在对不同立场的包容性增加的情况下,才能保持共识和团结。我们进一步调查是否更大的包容性和妥协的问题导致人们接近或远离规范的真相,从而解决关于政治共识的非理想性质的担忧。

普查与第二定律:美国众议院最优分摊的熵权法

原文标题: The Census and the Second Law: An Entropic Approach to Optimal Apportionment for the U.S. House of Representatives

地址: http://arxiv.org/abs/1712.09440

作者: A.E. Charman

摘要: 根据宪法规定的任命,将美国国会议席分配给与其代表人口相称的国会席位(“根据他们的人数”),引起了很多争论,而不是那么一致。利用信息论和统计热力学基础相同的熵推理原理,在图像处理,谱分析,机器学习,计量经济学,生物信息学等领域也有着丰富的应用,我们激励和探索基于最小化相对熵(也称为Kullback-Leibler散度)的国会分配方法,或等价地使香农熵最大化。就传播理论而言,我们可以说熵的分配给了每个组成部分一个平等的声音。如果我们把代表性权重看作是一个有限的资源在代表人口中分布的话,那么这个熵指标就等于长期用来衡量财富或收入分配中不平等的泰尔指数,或者用来衡量生物质分布的生态指标或生殖健康。除了国会分配之外,这种方法也可以直接适用于其他多区议会或多选区立法机构,在各种议会选举中使用的党派比例投票制度,以及类似的设置,其任务是分配一定数量的席位,其他资源,主要目标是最大比例或公平。此外,可以同时使用相同的熵值系数来比较代表总人数的不同选择,然后评估不同的国会地区规模,分配座位和提出区域边界。

基于主体的模型的特征

原文标题: Features of Agent-based Models

地址: http://arxiv.org/abs/1712.09496

作者: Reiko Heckel (University of Leicester), Alexander Kurz (University of Leicester), Edmund Chattoe-Brown (University of Leicester)

摘要: 基于主体的模型(ABMs)的设计在定义其范围时往往是临时的。为了使网络结构,位置或动态变化等特征具有合理性,应对其在模型中的作用进行系统分析。我们提出一个机制来比较和评估这些功能的影响。特别是我们正在使用软件工程和语义学的技术来支持ABM的开发和评估,比如图转换作为基于Agent的模型的语义表示,识别正在考虑的成分的特征图以及图转换系统之间的扩展关系表达特征的模型片段。

Power Plexus:基于网络的分析

原文标题: Power Plexus: A network based analysis

地址: http://arxiv.org/abs/1712.09618

作者: Malvika Singh, Sneha Mandan, Smriti Sharma

摘要: 发电和配电仍然是工业革命以来讨论的重要话题。随着系统的不断发展,它需要在基础设施,稳健性和应变能力方面发展。我们在这项工作中的一个潜在的失败是级联失败。这种雪崩效应通过网络传播,我们通过渗流理论研究这种传播,并实施一些缓解的解决方案。我们扩大了马克·纽曼给出的渗流理论。网络:介绍一种随机节点到具有高负载的目标节点,从网络中消除以研究级联效应。我们还实施缓解策略来改善网络性能。

将大数据表征为网络:新方法和新见解

原文标题: Representing Big Data as Networks: New Methods and Insights

地址: http://arxiv.org/abs/1712.09648

作者: Jian Xu

摘要: 我们的世界每天产生大量的数据;它们以多种形式存在,从配对数据和矩阵到时间序列和轨迹。同时,我们可以访问网络分析的多功能工具箱。网络也有不同的形式;从简单网络到高阶网络,每一种表示都有不同的信息承载能力。对于那些想要利用网络工具包的力量,并将其应用到网络数据之外的连续数据,扩散数据等等的研究人员,问题是:如何表示大数据和网络?本文首先回答了这个问题。它提出了高阶网络,它是表示高阶交互数据的关键部分;它引入了用于构建网络的可扩展算法以及用于交互式探索的可视化工具。最后,介绍了高阶网络在现实世界中的广泛应用。

用高阶网络检测序列数据中的异常

原文标题: Detecting Anomalies in Sequential Data with Higher-order Networks

地址: http://arxiv.org/abs/1712.09658

作者: Jian Xu, Mandana Saebi, Bruno Ribeiro, Lance M. Kaplan, Nitesh V. Chawla

摘要: 异常检测方法的一个主要分支依赖于动态网络:原始顺序数据首先被转换为一系列网络,然后在不断发展的网络结构中识别关键变化点。然而,现有方法使用一阶网络(FON)来表示基础原始数据,这可能会丢失重要的高阶序列模式,使得在后续分析中高阶异常不可检测。通过用高阶网络(HONs)代替FON,我们显示现有的异常检测算法可以更好地捕获可能被忽略的高阶异常。我们发现由于额外的参数和可扩展性差,现有的HON构造算法不能用于异常检测任务;我们引入了一个在大数据集中构造HON的无参数算法。使用大规模合成数据集与110亿网络点击流,我们演示如何提出的方法可以捕捉变量的异常顺序。使用真实世界的出租车轨迹数据,我们展示了如何提出的方法放大高阶异常信号。最后,我们提供复杂性分析和基准测试,以显示如何以较小的开销合并更高阶的依赖关系。

美国最高法院的一致意见跨越了一个世纪

原文标题: Strong consensus on US Supreme Court spans a century

地址: http://arxiv.org/abs/1712.09696

作者: Edward D. Lee

摘要: 20世纪美国最高法院的特点是在自由派和保守派之间划分界线,表明具有类似意识形态的法官如果在任期内重叠,他们的投票也会类似。如果他们有?我们建立了这个反事实假设的定量投票模型,用成对最大熵来推断1946 - 2016年的36名法官将如何投票到超级最高法院。与历史法院一样,超级法院也是以协商一致为主。包括更多法官在内的共识衰落的速度非常缓慢,将近100年,表明现代最高法院是一个非常保守和稳定的机构。除了共识之外,我们还发现了一个丰富的反对集团结构,这些结构沿着重尾Zipf法则分布。沉重的尾部意味着不存在主导性的异议模式,因此最高法院的投票随着时间的推移不能被像意识形态这样的低维度的表述所捕捉。以个人为中心,我们发现特殊的法官,他们经常异议异议,可能会被视为法院历史上的特立独行者。当我们按照法律主题对案件进行分组时,关于这个主题的信息被编码在反对集团的结构中,使得直观相似的主题对应于类似的异议模式。尽管模型简单,但它与法院以前的观察结果相一致,同时用统计物理学的语言表达了政治投票的复杂结构。

ASYMP:大规模图的容错挖掘

原文标题: ASYMP: Fault-tolerant Mining of Massive Graphs

地址: http://arxiv.org/abs/1712.09731

作者: Eduardo Fleury, Silvio Lattanzi, Vahab Mirrokni, Bryan Perozzi

摘要: 我们提出ASYMP,这是一个分布式图处理系统,用于及时分析具有数万亿个边的图。 ASYMP有几个显著特点,包括鲁棒的容错机制,可以无缝扩展到数千台机器的无锁架构,以及有效的数据访问模式,以减少每台机器的开销。 ASYMP用于分析Google上最大的图表,我们在这里的经验评估中所考虑的图表据我们所知,是文献中考虑最多的。我们的实验结果显示,与Google之前的图处理框架相比,ASYMP可以扩展到更大的图表,在更拥挤的集群上运行,并更快地完成真实世界的图挖掘分析任务。首先,我们评估ASYMP的速度,在那里我们展示了跨越多种图的选择,它比在MapReduce和Pregel中最先进的实现速度快了3-50倍。然后我们展示这个框架的可伸缩性和并行性:首先通过增加图的大小(不改变机器数量)来显示运行时间线性增加,然后通过显示运行时间的增加,同时增加机器。最后,我们演示了框架的容错性能,显示出50%的机器出现故障会使运行时间增加41%。

用于复杂网络上多数投票模型的淬火平均场理论

原文标题: Quenched mean-field theory for the majority-vote model on complex networks

地址: http://arxiv.org/abs/1712.09733

作者: Feng Huang, Hanshuang Chen, Chuansheng Shen

摘要: 多数票(MV)模型是在临界噪声下呈现连续的有序 - 无序相变的最简单的非平衡伊辛模型之一。在本文中,我们提出了一个淬火平均场理论的动力学MV模型在网络上。我们通过分析推导出任意淬火的未加权网络上的临界噪声,这是由修改的网络邻接矩阵的最大特征值决定的。通过在合成网络和真实网络上进行广泛的蒙特卡洛模拟,我们发现淬灭平均场理论的性能优于先前论文中提出的异构平均场理论[Chen \ emph ,Phys。 Rev. E 91,022816(2015)],特别是对于有向网络。

当名人赞同政治家:分析2016年美国总统选举中名人追随者的行为

原文标题: When Celebrities Endorse Politicians: Analyzing the Behavior of Celebrity Followers in the 2016 U.S. Presidential Election

地址: http://arxiv.org/abs/1712.09757

作者: Yu Wang, Jiebo Luo

摘要: 由于他们的名声和知名度,名人在美国政治中扮演着重要的角色。名人代言可能会增加政治家的竞选势头,并赢得候选人广泛的媒体报道。但有一点需要注意:明星追随者的政治偏好可能与名人不同。在本文中,我们探讨了这种可能性。通过仔细研究2016年美国总统选举中领先的总统候选人的六个突出代言,并对Twitter“跟随”行为进行统计建模,我们显示(1)除Lady Gaga之外的所有名人的追随者更可能追随大量(2)明星追随者的意见可能与名人的系统有所不同。我们的方法可以概括为研究NBA球员拒绝访问白宫和流行歌手与达赖喇嘛会面等事件。

最大限度地减少社会网络中的极化和分歧

原文标题: Minimizing Polarization and Disagreement in Social Networks

地址: http://arxiv.org/abs/1712.09948

作者: Cameron Musco, Christopher Musco, Charalampos E. Tsourakakis

摘要: 社交媒体和在线社会网络的兴起一直是社会上的破坏力量。在线社交媒体上的互动日益形成意见,包括分歧和两极分化在内的社会现象现在已经紧密地融入到日常生活中。在这项工作中,我们开始研究以下问题:给定$ n $代理人,每个代理人都有自己的初始意见,这个意见反映了它在某个主题上的核心价值,以及一个意见动态模型,一个社会网络的结构是什么, \极化}和{\ em分歧}同时?这个问题是推荐系统的核心:如果推荐系统偏好两个具有相似心态的在线用户之间的联系建议,以保持低分,或者两个不同意见的用户之间为了暴露彼此的世界观,并减少两极分化的总体水平?我们的贡献包括这个问题的数学形式化作为一个优化问题和一个精确的,省时的算法。我们还证明,总是存在一个$ O(n / \ epsilon ^ 2)$边的网络,它是一个$(1 +ε)$近似的最优值。对于一个固定的图,我们另外展示了如何在多项式时间内优化我们的目标函数而不是代理人天生的观点。我们对我们提出的合成和现实世界数据方法进行实证研究,验证它们作为挖掘工具的价值,从而更好地理解分歧与极化之间的权衡。我们发现在现实世界的网络中有很大的空间来减少两极分化和分歧;例如,在一个用户交换对政治评论的Reddit网络上,我们的方法实现了两极分化和分歧的减少60,000倍的减少。

集体智慧的社会贝叶斯学习

原文标题: Social Bayesian Learning in the Wisdom of the Crowd

地址: http://arxiv.org/abs/1712.09960

作者: Dhaval Adjodah, Yan Leng, Shi Kai Chong, Peter Krafft, Alex Pentland

摘要: 能够将许多人的信仰正确地归纳为单一的信念,是许多重要的社会,经济和政治过程,如决策,市场定价和投票的基础问题。虽然存在多种模式和聚合机制,但在个体之间存在影响和学习时,缺乏关于意见聚合的方法和文献。这部分是因为在暴露于别人的信仰时,人们如何更新自己的信念的模型并不多,因此很难量化人们心智模型之间的依赖关系,这对于尽量减少聚合中的冗余至关重要。在本文中,我们探讨了许多用户如何互相影响和学习的模型,我们将模型与着名的DeGroot模型进行了对比。我们的主要贡献是:1)我们收集一个前所未有的大小和细节的新数据集在网上发布; 2)我们开发了一个新的社会贝叶斯模型,即人们如何更新他们的心理模型,3)我们的模型与其他着名的社会学习模型进行比较。具体来说,我们表明,我们的新社会贝叶斯模型是优于其他模型测试。

社交博客安全和敌对用户聊天安全检测模型的开发

原文标题: Development of Security Detection Model for the Security of Social Blogs and Chatting from Hostile Users

地址: http://arxiv.org/abs/1712.10008

作者: Shubhankar Gupta, Nitin

摘要: 世界范围内,大量的人通过在线聊天互相交流。 WhatsApp,Facebook和Twitter等社交和专业平台的数量都有了显著的增长,让人们可以与他人分享他们的经验,观点和知识。令人遗憾的是,随着在线沟通日益融入我们的日常交流,无礼和不当行为已经从专业的不端行为到职业衰退带来了许多细微差别。一般来说,燃烧起源于粗鲁的信息和评论的交流,这反过来引发火焰更高的规模。为了防止在线沟通被降级,防止来自通信平台的恶意用户是非常重要的。本文提出了一个安全检测模型和一个工具,检查和防止在线燃烧。它在聊天或张贴博客的同时检测到火焰的存在,并且审查员发誓言词以及阻止用户燃烧。

共享出行的好处

原文标题: The Merits of Sharing a Ride

地址: http://arxiv.org/abs/1712.10011

作者: Pooyan Ehsani, Jia Yuan Yu

摘要: 分享而非所有权的文化在个人行为中急剧增加。特别是在交通方面,最近采用了拼车或乘坐共乘的概念。任何搭乘系统的核心都是实时匹配乘客的高效优化方法。在本文中,我们将乘车共享模型作为一般图的在线匹配问题,以使乘客不驾驶私家车和使用共享的出租车。我们提出一个优化算法来解决它。概述的算法计算乘客到达时的最佳等待时间。这导致了匹配成本最小化,同时最大限度地增加了合作伙伴的数量。为了评估我们的算法的行为,我们使用纽约市出租车实际数据集。结果代表了整体开销的大幅减少。

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

本文来自企鹅号 - 网络科学研究速递媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

资源 | AI Challenger 2018 即将进入决赛,八大数据集抢先看

AI 研习社消息,由创新工场、搜狗、美团点评、美图联合主办的 AI Challenger 2018 即将进入第二阶段比赛。今年的大赛主题是「用 AI 挑战真实...

2112
来自专栏大数据挖掘DT机器学习

深度学习的GPU:深度学习中使用GPU的经验和建议

深度学习是一个计算需求强烈的领域,您的GPU的选择将从根本上决定您的深度学习体验。在没有GPU的情况下,这可能看起来像是等待实验结束的几个月,或者运行一天或更长...

55111
来自专栏新智元

运用谷歌 BigQuery 与 TensorFlow 做公共大数据预测

【新智元导读】谷歌BigQuery的公共大数据集可提供训练数据和测试数据,TensorFlow开源软件库可提供机器学习模型。运用这两大谷歌开放资源,可以建立针对...

7196
来自专栏新智元

【干货】如何成为深度学习专家的七大步骤

首先为用Buzz做为点击标题的诱饵道歉,但是它确实是起到了一定的作用,并且吸引了大批读者来阅读此文章。 在我们的工作中,经常被问及的问题之一就是“从哪里开始学习...

3758
来自专栏PPV课数据科学社区

「数据会说谎」的真实案例有哪些?你知道多少,知乎大神分享

问:「数据会说谎」的真实例子有哪些? 究竟是数据在说谎,还是逻辑在说谎?最好是你遇到的真实案例,你是如何判断数据表明的错误的? Han Hsiao答:[1600...

3755
来自专栏PPV课数据科学社区

企业如何把“想法”变成“算法”自动执行业务流程?

普兰数据智能——业务流程自动执行“企业大脑” 机器人系统整体方案提供商 企业营销生产管理过程受制于人员的专业水平、理念心态诸多你不能控制的因素,导致大量人员低效...

31311
来自专栏大数据文摘

新一季《权力的游戏》谁又要挂掉?算法神预测龙妈要去领盒饭了!

1994
来自专栏大数据文摘

哥伦比亚大学数据科学课程笔记(2)

2159
来自专栏数据订阅

数据库和AI的一次火花

我们生活中很多数据是有时间维度的。比如说天气或者股票价格。对于这种带有时序的数据,有一种基于时间序列的预测模型---Prophet。

2.5K107
来自专栏AI研习社

AI Challenger 2018 即将进入决赛,八大数据集抢先看

雷锋网(公众号:雷锋网) AI 研习社消息,由创新工场、搜狗、美团点评、美图联合主办的 AI Challenger 2018 即将进入第二阶段比赛。今年的大赛主...

1454

扫码关注云+社区

领取腾讯云代金券