Arxiv网络科学论文摘要4篇

对中世纪医学文本进行数据挖掘揭示了成分选择中的模式,这些模式反映了针对特定感染的致病因子的生物活性;

您倾向于发布什么样的内容?推特用户的多主题偏好模型;

搜索网络的模块;

防止对基于AI的威胁情报系统的下毒攻击;

对中世纪医学文本进行数据挖掘揭示了成分选择中的模式,这些模式反映了针对特定感染的致病因子的生物活性

原文标题: Datamining a medieval medical text reveals patterns in ingredient choice that reflect biological activity against the causative agents of specified infections

地址: http://arxiv.org/abs/1807.07127

作者: Erin Connelly, Charo I. del Genio, Freya Harrison

摘要: 中世纪欧洲的医生和非专业人士使用的药典在很大程度上被视为安慰剂或迷信。虽然我们现在认识到中世纪医生使用的一些药物可能具有有用的生物学特性,但是在这一领域的研究受到搜索和解释历史医学文本的劳动密集型过程的限制。在这里,我们展示了将中世纪医学文本转化为适合通过算法探索的情境化电子数据库的潜在力量。我们使用网络科学的既定方法,在关键文本中发现成分选择和使用的统计学显著模式,十五世纪的Medicynes Lylye,重点是治疗微生物感染症状的补救措施。我们讨论这些模式反映合理医疗决策的可能性。在提供数据驱动的文本分析的实例时,我们展示了这种方法在鼓励跨学科合作和揭示历史医学文本的民族药理学方面的潜力。

您倾向于发布什么样的内容?推特用户的多主题偏好模型

原文标题: What kind of content are you prone to tweet? Multi-topic Preference Model for Tweeters

地址: http://arxiv.org/abs/1807.07162

作者: Lorena Recalde, Ricardo Baeza-Yates

摘要: 根据口味,一个人可以或多或少地表现出对给定类别的内容的偏好。然而,量化人们对某个主题感兴趣的数量是一项具有挑战性的任务,特别是考虑到他们所接触的大量数字信息。例如,在Twitter的上下文中,与他/她的偏好一致,用户可以发布和转发关于技术而不是体育的更多信息,并且不共享任何与音乐相关的内容。我们在本文中讨论的问题是通过分析他们倾向于在Twitter上发布的内容类别来识别用户的隐含主题偏好。我们的建议非常重要,因为对多主题配置文件建模可能有助于查找类别首选项之间的模式或关联,发现趋势主题和群集类似用户以生成更好的内容组推荐。在目前的工作中,我们提出了一种基于混合高斯模型的方法来提取399个厄瓜多尔高音扬声器的多维偏好表示,涉及22个不同的主题(或维度),这些主题通过手动分类68.186推文而得知。我们的实验结果表明,所提出的方法在检测用户的主题兴趣方面是有效的。

搜索网络的模块

原文标题: Searching for network modules

地址: http://arxiv.org/abs/1807.07275

作者: Giovanni Rossi

摘要: 在分析复杂网络时,关键目标是揭示其模块化结构,这意味着搜索一系列模块,即跨越每个子网络的节点子集,其比平均值更密集地连接。该工作以多线性多项式的形式提出了一种用于图聚类的新型目标函数,其系数由网络拓扑确定。它可以被认为是一个潜在的函数,被最大化,将其值放在模糊聚类或节点的模糊子集族上,每个节点分配一个单元成员资格。当适当地进行参数化时,当每个节点将其所有单元成员集中在某个模块上时,该潜力被证明达到其最大值。因此输出是分区,而原始离散优化问题变成连续版本,允许构思替代搜索策略。问题的实例是伪布尔函数,将实值聚类得分分配给节点子集,采用模块化最大化来举例说明所谓的二次形式,因为单例和对的得分也完全确定了较大聚类的得分。虽然得到的多线性多项式势函数具有阶数2.在考虑了进一步的二次实例之后,不同于模块性并且通过以替代方式解释网络拓扑而获得,将连续框架的贪婪局部搜索策略与现有的贪婪凝聚过程进行分析比较。对于离散的情况。最后根据多次运行讨论重叠,即具有不同初始化的若干本地搜索。

防止对基于AI的威胁情报系统的下毒攻击

原文标题: Preventing Poisoning Attacks on AI based Threat Intelligence Systems

地址: http://arxiv.org/abs/1807.07418

作者: Nitika Khurana, Sudip Mittal, Anupam Joshi

摘要: 随着人工智能系统变得越来越普遍,保护它们成为一项新兴挑战。多年来,随着在线社交媒体使用和可用于分析的数据的激增,已经构建了AI系统来提取,表示和使用这些信息。然而,从开源中提取的这种信息的可信度通常是有问题的。恶意或不正确的信息可能会导致资金,声誉和资源的损失;在某些情况下,对人类生命构成威胁。在本文中,我们使用集成的半监督方法通过估计其信誉得分来确定Reddit帖子的可信度,以确保AI系统摄取的信息的有效性。我们在网络安全领域展示了我们的方法,安全分析师利用这些系统通过分析社交媒体网站,论坛,博客等上散布的数据来确定可能的威胁。

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180720G0DLCC00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券