专栏首页arxiv.org翻译专栏数据分裂对泛化的影响:从咳嗽和环境中识别COVID-19

数据分裂对泛化的影响:从咳嗽和环境中识别COVID-19

事实证明,快速扩大筛查、检测和隔离是对抗 COVID-19 大流行的有效策略。我们考虑应用深度学习技术,通过使用从手机获取的数据来区分冠状病毒感染者和非冠状病毒感染者。使用咳嗽和环境(症状和元数据)是一种很有前景的方法。在这个方向上的几项独立工作已经显示出有希望的结果。然而,它们都没有报告临床相关数据拆分的性能。具体地说,是指开发和测试集在时间上(回顾性验证)和跨站点(广泛验证)进行划分的性能。尽管在这些分割中存在有意义的泛化,但性能却存在显著差异(最高为0.1 AUC分数)。此外,我们研究了有症状和无症状个体在这三个分组中的表现。最后,我们展示了我们的模型关注输入的有意义的特征,咳嗽的咳嗽发作和环境的相关症状。代码和检查点可以在https://github.com/WadhwaniAI/cough-against-covid上找到

原文题目:Impact of data-splits on generalization: Identifying COVID-19 from cough and context

原文:Rapidly scaling screening, testing and quarantine has shown to be an effective strategy to combat the COVID-19 pandemic. We consider the application of deep learning techniques to distinguish individuals with COVID from non-COVID by using data acquirable from a phone. Using cough and context (symptoms and meta-data) represent such a promising approach. Several independent works in this direction have shown promising results. However, none of them report performance across clinically relevant data splits. Specifically, the performance where the development and test sets are split in time (retrospective validation) and across sites (broad validation). Although there is meaningful generalization across these splits the performance significantly varies (up to 0.1 AUC score). In addition, we study the performance of symptomatic and asymptomatic individuals across these three splits. Finally, we show that our model focuses on meaningful features of the input, cough bouts for cough and relevant symptoms for context. The code and checkpoints are available at https://github.com/WadhwaniAI/cough-against-covid

原文链接:https://arxiv.org/abs/2106.03851

原文作者:Makkunda Sharma, Nikhil Shenoy, Jigar Doshi, Piyush Bagad, Aman Dalmia, Parag Bhamare, Amrita Mahale

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 比测体温更有效?《柳叶刀》称丧失嗅觉是新冠最强指标,优于发烧

    如果某天早晨,你发觉忽然闻不出咖啡的香味了,那么或许要担心一下,自己是不是患上了新冠肺炎。

    大数据文摘
  • SensiML COVID-19 Cough Screening Dataset

    COVID-19疫情仍在全球肆虐,基于最新的学术研究成果(recent academic research),即通过分析录入的咳嗽数据预测COVID感染可以达到...

    用户6026865
  • Wolfram 技术帮您通过咳嗽音来预测诊断新冠病毒

    声音分类可能是一项艰巨的任务,尤其是当声音样本的变化很小而人耳无法察觉时。机器的使用以及最近的机器学习模型已被证明是解决声音分类问题的有效方法。这些应用程序可以...

    WolframChina
  • 韩国一周新增千例确诊,想用 AI 定位出咳嗽的人

    场景描述:新冠肺炎在全球的发展态势依然不见好转。韩国近日又出现反弹,近 7 日新增患者累计达到 1576 例,今日新增 288 例。韩国科学技术院的团队,开发出...

    HyperAI超神经
  • 基于端到端AI的即时诊断系统,用于呼吸系统疾病分类并早期检测COVID-19(CS HA)

    呼吸道症状可能是由不同的潜在疾病引起的,通常是由病毒感染引起的,例如流感样疾病或其他新兴病毒,例如冠状病毒。这些呼吸道病毒通常具有常见症状,包括咳嗽,高温,鼻子...

    刘子蔚
  • 疫情期间戴口罩仍可识别的Sensory Biometric面部识别解决技术

    Sensory TrulySecure人声和面部生物识别技术(face and voice biometrics)为用户带来极大的便利性,同时为用户在COVID...

    用户6026865
  • 如何用深度学习分辨新冠肺炎与流行感冒?五项研究,从初期筛查到重症病危预测

    截止到3月16日,新冠肺炎全国累计确诊81078例,国外累计确诊85133例,国外确诊超国内,COVID-19全球流行已经是不争的事实。

    AI科技评论
  • 新冠病毒侵入人体全过程!从脚趾到大脑,科学家追踪到病毒对身体的巨大摧残

    在杜兰大学医学院,肺病和重症监护医生Joshua Denson发现,一天之内,在约20位重症监护病人中,有2名患者出现癫痫症状,其余不少患者出现呼吸衰竭的症状,...

    大数据文摘
  • 苹果联合创始人:我和妻子可能都已感染新冠病毒!钟南山团队建议严格防控措施实施至4月底

    亚马逊在1月份就对来往中国的旅行设置了限制,告知到中国的员工回国后要在家中工作两周,如果出现症状请就医。上周五,亚马逊告知其全部798,000名员工,停止在美国...

    新智元
  • 从Reddit上COVID-19个人经历的叙述中提取症状(CS CL)

    社会媒体对COVID-19的讨论为该病毒如何影响人们的生活提供了丰富的信息来源,这在质量上与传统的公共卫生数据集有所不同。特别是,当个人在社交媒体上自我报告病毒...

    刘子蔚
  • 一周AI最火论文 | 一种基于YOLOv3的算法,可以对车辆、驾驶员进行检测和分类

    呜啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly栏目又和大家见面啦!

    大数据文摘
  • 金融/语音/音频处理学术速递[6.24]

    【1】 Chebyshev Greeks: Smoothing Gamma without Bias 标题:契比雪夫希腊人:没有偏见地平滑伽马

    公众号-arXiv每日学术速递
  • 金融/语音/音频处理学术速递[7.29]

    【1】 MobilityCoins -- A new currency for the multimodal urban transportation sys...

    公众号-arXiv每日学术速递
  • AI“黑头盔”亮相成都,警察街头2分钟筛查上百人体温!

    新冠病毒已进入全球传播阶段,截止发稿,中国累计确诊已超80000例,国外累计确诊已超14000例,形势严峻。

    新智元
  • 欧美国家是时候人人戴口罩了!N95之父华裔科学家Peter Tsai 教你如何正确戴口罩

    为何疫情在东亚国家蔓延较慢(日本、新加坡等)、或是已被部分或彻底遏制(中国、韩国),而在欧美国家蔓延速度如此令人震惊?公众和专家越来越多地开始质疑两边社会行为的...

    新智元
  • 金融/语音/音频处理学术速递[9.2]

    【1】 The Potential of Sufficiency Measures to Achieve a Fully Renewable Energy S...

    公众号-arXiv每日学术速递
  • 树莓派“听”咳嗽就能判断是否得新冠,便携式AI设备神预测大规模流行病

    最近马萨诸塞州大学的研究人员发明了一个名叫 Flusense 的便携式设备,这个新的边缘计算设备可能会用于预测季节性流感和其他病毒性呼吸道疾病爆发(如 COVI...

    新智元
  • 金融/语音/音频处理学术速递[6.22]

    【1】 Dynamics of Disruption in Science and Technology 标题:科学技术中的颠覆动力学

    公众号-arXiv每日学术速递
  • 独家 | 数据科学如何用于理解COVID-19(附链接)

    阅读这篇概览,你将获得对数据科学家们是如何努力理解COVID-19拥有更清楚的认识。

    数据派THU

扫码关注云+社区

领取腾讯云代金券