首页
学习
活动
专区
工具
TVP
发布

arxiv.org 翻译专栏

专栏成员
12
文章
6328
阅读量
12
订阅数
近距离接触: 一个制止疾病爆发的方法(CS CY)
我们提供了一个移动应用程序解决方案,通过跟踪疾病潜伏期中可能的感染,帮助遏制疫情爆发。 我们考虑一个主要通过近端接触,通过呼吸道飞沫在人群中传播的感染的特殊病例。 这个智能手机应用程序将离线工作,并将能够检测其他设备接近,并以一个匿名和加密的方式列出所有的互动范围。 如果一个应用程序用户被检测出阳性,因此被认定为感染,应用程序会立即通知列表中的设备潜在的传染,并建议开始自愿隔离和进行医学测试。 我们认为,这一解决办法可能对目前的大流行病尤其有用,而且可用于防止今后发生类似事件。
用户7095611
2020-03-26
3660
加速斯坦福医学临床数据科学的新模式(CS CY)
斯坦福医学正在建立一个新的数据平台,为我们的学术研究团体做更好的临床数据科学。 医院拥有大量的病人数据,研究人员已经证明了重用这些数据和人工智能方法的能力,以获得新颖的见解,支持病人护理,并提高护理质量。 但是,当前使用的传统数据仓库和诚实代理方法是不可伸缩的。 我们正在建立一个新的安全的大数据平台,旨在减少访问和分析数据的时间。 在这个平台上,数据是匿名的,以保护病人的数据隐私,并提供准备机构审查委员会(IRB)提交。 此外,数据是标准化的,这样在斯坦福做的分析可以在其他地方复制使用相同的分析代码和临床概念。 最后,分析数据仓库集成了一个安全的数据科学计算设备,以支持大规模的数据分析。 这个生态系统旨在将现代数据科学界带入一个安全和协作的大数据分析环境中,以实现更大、更好和更快的科学。
用户7095611
2020-03-26
4600
伤害性词语: 量化临床上下文词语嵌入中的偏见(CS CL)
在这项工作中,我们研究了嵌入在多大程度上可能以不同的方式对边缘化人群进行编码,以及这是如何导致偏见的持续存在和临床任务表现的恶化。 我们根据MIMIC-III 医院的数据集,对深度嵌入模型(BERT)进行预先训练,并用两种方法对潜在的差异进行量化。 首先,我们识别危险的潜在关系,所捕获的上下文词嵌入使用填补空白的方法,文字来自真实的临床记录和日志概率偏差评分量化。 第二,我们评估超过50个下游临床预测任务的公平性的不同定义的性能差距,包括急性和慢性疾病的检测。 我们发现从 BERT表征训练出来的分类器在表现上有统计学意义上的显著差异,在性别、语言、种族和保险状况方面往往偏向于大多数人群。 最后,我们探讨了在上下文字嵌入中使用对抗性消偏来模糊子群信息的缺点,并推荐了这种深嵌入模型在临床应用中的最佳实践。
用户7095611
2020-03-26
5170
人工智能在欧盟决策中的应用。对公民的输入、输出和输出合法性的影响(CS CY)
缺乏合法性削弱了欧盟(EU)解决重大危机的能力,并威胁到整个体系的稳定。 通过将数字数据纳入政治进程,欧盟寻求将决策越来越多地建立在健全的经验证明之上。 特别是,人工智能系统有可能通过识别紧迫的社会问题、预测潜在的政策结果、为政策过程提供信息以及评估政策的有效性来提高合法性。 本文研究了三种不同的决策安排如何影响公民对欧盟投入、吞吐量和产出合法性的认知。 第一,独立的人类决策,HDM,第二,独立的算法决策,ADM,第三,欧盟政客和人工智能系统的混合决策。 对572名受访者预先注册的在线实验结果显示,欧盟现有的决策安排仍被视为最民主的投入合法性。 然而,关于决策进程本身——通过量合法性——及其政策成果——产出合法性,在涉及行政和民主选举的欧盟机构的现状和混合决策之间没有观察到差异。 在ADM系统是唯一决策者的情况下,受访者往往认为这些决策是非法的。 本文讨论了这些发现对欧盟合法性和数据驱动政策制定的影响。
用户7095611
2020-03-26
6950
以动能为基础,确保学习动态系统的稳定性(CS RO)
非线性动力系统是一种紧凑、灵活、有力的反应运动生成工具。 动态系统的有效性依赖于它们精确表示稳定运动的能力。 为了从演示中学习稳定和准确的运动,已经提出了几种方法。 有些方法将精度和稳定性分离为两个学习问题,增加了开放参数的数量和总的训练时间。 替代解决方案利用了单向性学习,但限制了对一种回归技术的适用性。 本文提出了一个单步方法来学习稳定和准确的运动,工作与任何回归技术。 该方法使考虑学习动态稳定系统在运行时,同时引入小偏差的演示运动。 由于注入系统的能量的初始值影响再生产的准确性,它是使用一个有效的程序从训练数据开始估计。 在实际机器人上的实验和公共基准上的比较表明了该方法的有效性。
用户7095611
2020-03-26
3800
人机交互的社会适应框架(CS RO)
在我们的日常生活中,我们习惯于与同龄人进行复杂的、个性化的、适应性的互动。 对于一个社交机器人来说,能够再现这种丰富的,类似人类的互动,它应该意识到我们的需求和情感状态,并且能够不断地调整自己的行为来适应它们。 解决这个问题的一个建议是,让机器人学习如何选择行为,以最大限度地提高与同伴交流的愉悦性,并在内部激励系统的指导下,为其决策过程提供自主权。 我们感兴趣的是研究这种自适应机器人框架如何针对不同的用户发挥作用和个性化。 此外,我们还探讨了在认知框架中加入适应性和个性化因素是否会给人机交互带来额外的丰富性,还是会带来机器人的人类同伴所不能接受的不确定性和不可预测性。 为此,我们为人形机器人 iCub 设计了一个社会适应框架,使其能够感知和重用来自人的情感和交互信号,作为基于内部社会动机的适应输入。 我们提出了一个与 iCub 的比较互动研究,其中用户扮演机器人的守护者,而 iCub 的社会适应是由内部舒适度引导的,这个舒适度随着 iCub 从守护者那里接收到的刺激量而变化。 我们调查并比较了当机器人没有个性化交互时,以及当机器人具有自适应能力时,人们会如何感知机器人的内部动态。 最后,我们建立了一个自适应框架可能带来的潜在好处,与人形机器人重复互动的环境。
用户7095611
2020-03-26
7380
利用深度学习识别 twitter 上的药物使用情况(CS SI)
社交媒体的收集和检测已经成为研究用户心理活动和行为倾向的有效机制。通过分析收集到的 twitter 数据,建立了分类与毒品有关的 tweets 的模型。 通过使用与主题相关的关键词,比如俚语和吸毒方法,生成了一组 tweets。然后对潜在的候选者进行预处理得到了3696150行的数据集。比较了支持向量机(SVM)、 XGBoost 和基于卷积神经网络(CNN)的多种分类器的分类能力 不是简单的特征或属性分析,而是采用深度学习方法来筛选和分析推文的语义含义。 与其他方法相比,两个基于CNN的分类器得到了最好的结果。第一组用2661个人工标记的样本进行训练,而另一组则包括综合生成的12142个样本的 tweets。 准确率分别为76.35% 和82.31%,AUC分别为0.90和0.91。 此外,关联规则挖掘表明,通常提到的药物与经常使用的非法物质有一定程度的对应关系,证明了该系统的实用性。 最后,综合生成集提供了更高的分数,提高了分类能力,并证明了这种方法的价值。
用户7095611
2020-03-26
4440
生命科学的重写理论: CTMC语义学的统一理论(CS LO)
Kappa 生物化学和MD有机化学框架是迄今为止在生命科学中重写理论方法的最为成熟的应用之一。这些类型的重写理论的一个典型特征是必须对要重写的对象实施某些结构约束(一个蛋白质被经验性地发现具有某些特定的位点,一个碳原子最多可以形成四个键,...)。 在本文中,我们为这些类型的重写理论的理论基础做出了贡献,许多概念和技术的发展使得连续时间马尔可夫链(CTMCs)的通用理论能够应用于随机重写。 我们的核心数学概念是一个新颖的规则代数结构,用于在双重和倍半推出语义学中相关的重写规则设置,并通过一个合适的随机力学形式扩展得到模式计数统计的动态演化方程。
用户7095611
2020-03-26
4770
学会忘记: 联邦学习法中的用户记忆消除(CS LG)
学会忘记:联邦学习中的用户级记忆消除是一种分散性的机器学习技术,在研究领域和现实市场都引起了广泛的关注。 然而,目前保护隐私的联邦学习方案只是为用户提供了一个安全的方式来贡献他们的私有数据,而没有留下一个方法来收回对模型更新的贡献。这种不可逆的设置可能会打破有关数据保护的规定,并增加数据抽取的风险。 为了解决这个问题,本文提出了联邦学习的一个新概念,叫做记忆消除。基于这个概念,我们提出了sysname,一个联邦学习框架,允许用户在训练模型中消除对私人数据的记忆。具体来说,sysname 中的每个用户都部署了一个可训练的虚拟梯度生成器。经过一系列的训练,生成器可以产生虚拟梯度来刺激机器学习模型的神经元,从而消除对特定数据的记忆。同时,我们证明 sysname 的附加存储消除服务并没有破坏联邦学习的一般流程或降低其安全性。
用户7095611
2020-03-26
1K0
数据科学的下一次火爆:数据科学指导的创新策略(CS CY)
随着数据挖掘的研究和应用不断扩展到医学、金融、安全等各个领域,人们清楚地感受到对多样化人才的需求。随着大数据在联邦、私人和学术领域的推广,在国内和国际上提供了大量的机会,这种情况尤为明显。BPDM讲习班是7年多以前创建的,目的是为数据科学和机器学习社区中的少数群体和代表性不足的群体培养导师、进行指导和联系,同时也丰富一群有才华的学生的技术能力,为他们提供接触的机会。迄今为止,它已经影响了超过330名数据科学领域的学员的人生。我们提供一个场所,将有才华的学生与各行业,学术界,专业协会,政府的创新研究人员联系起来。我们的任务是促进BPDM参与者之间有意义的,持久的联系,最终增加数据挖掘的多样性。 最近的一次研讨会于2019年2月在华盛顿特区的霍华德大学举行。 在这里,我们报告了在2019年BPDM采取的指导策略,以及这些是如何被接受的。
用户7095611
2020-03-26
3520
国际研究合作中的性别差异: 对25000名大学教授的大规模文献计量研究(CS DL)
在本研究中,我们检验了国际研究合作中的性别差异因合作强度、学术地位、年龄和学术学科而不同的假设。主要研究结果如下: (1)虽然女科学家在一般、国家和机构合作方面的比率较高,但男科学家在国际合作方面的比率较高,这一发现对于解释影响、生产力和获得大笔赠款方面的性别差异至关重要。 (2)性别差异的综合图片后隐藏了一个更加细致入微的跨学科现象。 (3)对国际科研合作三个不同强度水平(低、中、高)的分析表明,男性科学家在各个层次的国际科研合作中占主导地位。 然而,在每个层次上,都有一些特定的学科,在这些学科中,女性比男性合作得更多。此外,性别差异显然与年龄有关。直到40岁左右,开始呈现边缘化,然后深化。最后,我们使用线性逻辑分析模型来估计参与国际研究合作的可能性。 被调查的样本包括来自85所大学的25463名具有国际生产力的波兰大学教授,分为27个学科,他们撰写了159943篇 scopus 索引文章。
用户7095611
2020-03-26
3920
第二次世界范围内对COVID-19病毒的关注浪潮:谷歌趋势研究(CS CY)
最近出现的新型冠状病毒COVID-19,在大众媒体和全球新闻中得到了广泛的报道。截至2020年3月24日,该病毒已在中国武汉造成数万人病毒性肺炎,并在其他184个国家和地区造成数千人感染。这项研究探索了谷歌趋势(GT)的潜在用途,以监测这个COVID-19流行病的全球发展状况。考虑到人们对这个话题的兴趣,GT被选为逆向工程数据的来源。利用冠状病毒这一主要搜索主题,从(GT)中检索了目前有关 covid-19的数据,地理位置设置在世界各地、中国、韩国、意大利和伊朗。 报告期为2020年1月15日至2020年3月24日。 结果显示,在第一波信息需求中,全球最高峰出现在2020年1月31日。 在第一个高峰期之后,新增病例报告数连续6天上升。 2020年2月21日,在意大利爆发疫情后,第二波疫情开始蔓延,最高峰在2020年3月16日。 第二波是第一波的六倍。 每天报告的新病例数量在逐日上升。本文简要介绍了通过GT人们对冠状病毒疫情的信息需求情况。
用户7095611
2020-03-26
4720
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档