专栏首页arxiv.org翻译专栏BlaBla:多种语言临床分析的语言特征提取(cs.LG)
原创

BlaBla:多种语言临床分析的语言特征提取(cs.LG)

我们介绍BlaBla,一个开源的Python库,用于提取语言特征,这些语义特征与跨越多种语言的神经和精神疾病具有临床相关性。BlaBla 是加速和简化临床语言研究的统一框架。该库基于最先进的 NLP 框架构建,支持通过本机 Python 调用和命令行接口进行多线程/GPU 的特征提取。我们描述了BlaBla在12种疾病中的架构和针对其特征的临床验证。我们进一步展现了基于AphasiaBank数据集的真实临床数据上BlaBla的应用,任务为分类以及可视化三种语言的语言障碍。我们为研究人员免费提供代码库,希望为下一代临床语言研究提供一致、经过验证的良好基础。

原文标题:BlaBla: Linguistic Feature Extraction for Clinical Analysis in Multiple Languages

原文:We introduce BlaBla, an open-source Python library for extracting linguistic features with proven clinical relevance to neurological and psychiatric diseases across many languages. BlaBla is a unifying framework for accelerating and simplifying clinical linguistic research. The library is built on state-of-the-art NLP frameworks and supports multithreaded/GPU-enabled feature extraction via both native Python calls and a command line interface. We describe BlaBla's architecture and clinical validation of its features across 12 diseases. We further demonstrate the application of BlaBla to a task visualizing and classifying language disorders in three languages on real clinical data from the AphasiaBank dataset. We make the codebase freely available to researchers with the hope of providing a consistent, well-validated foundation for the next generation of clinical linguistic research.

原文作者:Abhishek Shivkumar, Jack Weston, Raphael Lenain, Emil Fristed

原文地址:http://arxiv.org/abs/2005.10219

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 为 UCCA 优化隐式参数注释(cs.CL)

    很少有资源代表自然语言理解的隐含角色,而 NLP 中的现有研究只是粗略地区分了语言形式中省略的参数类别。在本文中,我们设计了一个类型学,用于在通用概念认知注释的...

    Donuts_choco
  • 在存在累计前景博弈者的博弈论下的黑盒策略与平衡(cs.GT)

    偏好关系的中间属性规定了两个彩票的可能性混合应该在这两个彩票的偏好之间。它是独立属性的一种弱化形式,并且因此满足于期望效应理论(EUT)。实验中对于中间属性的违...

    Donuts_choco
  • 高维数据的一致且灵活的选择性估计(cs.LG)

    选择性估计旨在估计满足选择标准的数据库对象的数量。准确高效地回答这个问题对于密度估计、异常值检测、查询优化和数据集成等应用至关重要。估计问题对于大规模高维数据尤...

    Donuts_choco
  • DCO分析器:分布式测试场景的局部可控性与可观测性的分析与实现(CS SE)

    为了确保关键场景中异构分布式系统的互操作性和行为的正确性,必须要基于部署在系统组件附近的分布式测试组件(称为本地测试程序)来执行自动化集成测试,以模拟来自环境的...

    Elva
  • 有关gitlab的神秘操作.....version&&domain设置...

    在使用gitlab的时候,如果服务器IP变动,之前的domain写入了配置文件了,如下路径:

    超蛋lhy
  • 第15天:NLP——语言模型(上)

      在自然语言处理中最为核心的就是语言模型(LM)。因此,学习语言模型是自然语言处理中的重中之重。在介绍语言模型之前,我们首先给大家介绍Nosiy Chan...

    stefan666
  • 【GitLab专题】如何进行备份恢复与迁移?

    前段时间,在某台CenterOS服务器上搭建了Gitlab环境,并且大家陆陆续续的都把代码从svn迁移到了gitlab,但是之前的CenterOS服务器并不是...

    open
  • Gitlab 一个涵盖项目管理、代码仓库、持续集成的高可用系统

    GitLab,是一个利用 Ruby on Rails 开发的开源应用程序,实现一个自托管的Git项目仓库,可通过Web界面进行访问公开的或者私人项目安装。它拥有...

    测试邦
  • Log system architecture

    Keywords: Collector, Processor, Aggregator

    潘成涛
  • 符号网络中形成的团队(CS SI)

    在社交网络中,团队形成的问题需要一组人,他们不仅具备完成任务所需的技能,而且还能有效地相互沟通。现有的工作假设社交网络中的所有链接都是正的,也就是说,它们表示个...

    用户6853689

扫码关注云+社区

领取腾讯云代金券