专栏首页arxiv.org翻译专栏共享任务:稳健的口语识别

共享任务:稳健的口语识别

虽然语言识别是一项基本的语音和语言处理任务,但对于许多语言和语系来说,它仍然是一项具有挑战性的任务。对于许多资源匮乏和濒临灭绝的语言,这部分是由于资源可用性:在存在较大数据集的情况下,它们可能是单一说话者或具有与预期应用程序场景不同的领域,这就需要领域和说话者不变的语言识别系统。今年关于稳健口语识别的共享任务试图仅研究这种情况:系统将主要在来自一个领域的单一说话者语音上进行训练,但在不同记录环境下从说话者记录的其他领域中的数据上进行评估,模仿真实的低资源场景。我们看到,对于目前的方法来说,域和说话人不匹配是非常具有挑战性的,这些方法在域中的准确率可以达到95%以上,而域自适应可以在一定程度上解决这些问题,但是这些条件值得进一步研究,以便在许多场景中实现口语识别。

原文题目:SIGTYP 2021 Shared Task: Robust Spoken Language Identification

原文:While language identification is a fundamental speech and language processing task, for many languages and language families it remains a challenging task. For many low-resource and endangered languages this is in part due to resource availability: where larger datasets exist, they may be single-speaker or have different domains than desired application scenarios, demanding a need for domain and speaker-invariant language identification systems. This year's shared task on robust spoken language identification sought to investigate just this scenario: systems were to be trained on largely single-speaker speech from one domain, but evaluated on data in other domains recorded from speakers under different recording circumstances, mimicking realistic low-resource scenarios. We see that domain and speaker mismatch proves very challenging for current methods which can perform above 95% accuracy in-domain, which domain adaptation can address to some degree, but that these conditions merit further investigation to make spoken language identification accessible in many scenarios.

原文链接:https://arxiv.org/abs/2106.03895

原文作者:Elizabeth Salesky, Badr M. Abdullah, Sabrina J. Mielke, Elena Klyachko, Oleg Serikov, Edoardo Ponti,

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 智慧医疗管理系统解决方案:医药电商系统实现智能化改造

    现在的互联网智慧医疗系统拥有强大的技术优势,支持连接政府、医疗服务机构、医药研发与流通、康养等,构建医疗大健康产业云生态,助力数字化升级。【数商云】医疗系统平台...

    数商云
  • 十八届五中全会公报:实施“互联网+”行动计划及国家大数据战略

    中国共产党第十八届中央委员会第五次全体会议,于2015年10月26日至29日在北京举行。这是习近平、李克强、张德江、俞正声、刘云山、王岐山、张高丽等在主席台上...

    灯塔大数据
  • 发改委:组织实施2018年“互联网+”、人工智能创新发展和数字经济试点重大工程的通知

    人工智能/互联网+/发改委国家发展改革委办公厅关于 组织实施2018年“互联网+”、人工智能创新发展和数字经济试点重大工程的通知   发改办高技〔2017〕16...

    AI科技大本营
  • 国务院印发《促进大数据发展行动纲要》(全文)

    大数据文摘
  • 国务院正式印发《促进大数据发展行动纲要》(附视频、通知及全文)

    国务院印发促进大数据发展行动纲要   人民网北京9月5日电 据中国政府网消息,国务院9月5日公开发布《国务院关于印发促进大数据发展行动纲要的通知》。   《纲要...

    小莹莹
  • NAACL| 基于标签感知的双迁移学习在医学命名实体识别中的应用

    本期给大家介绍上海交通大学APEX数据和知识管理实验室俞勇教授课题组发表在NAACL的文章“Label-aware Double Transfer Learni...

    DrugAI
  • 镁客网每周硬科技领域投融资汇总 | 本周人工智能领域依旧最为瞩目

    镁客网
  • 直击微信公开课:2019年小程序将会有哪些改变?

    在过去的一年里,小程序俨然已经成为最热门的开发平台,包括百度、支付宝、头条、手机厂商等等也纷纷推出自己的小程序,而作为行业的领导者,我们也很期待小程序接下来的发...

    全栈程序员站长
  • IOT语义互操作性之标准与开源

    这个系列文章描述了一个单一的语义数据模型来支持物联网和建筑、企业和消费者的数据转换。 这种模型必须简单可扩展, 以便能够在各行业领域之间实现插件化和互操作性。 ...

    半吊子全栈工匠
  • 重磅 | 大数据正式提升为国家战略,下一个万亿风口正席卷而来!

    自6月国务院出台《运用大数据加强对市场主体服务和监管的若干意见》、8月19日国务院常务会议审核通过了《关于促进大数据发展的行动纲要》。9月5日,国务院正式印发《...

    华章科技
  • 干货:NIST评测(SRE19)获胜团队声纹识别技术分析 | CSDN博文精选

    近日,NIST说话人识别技术评测 (Speaker Recognition Evaluation,SRE)正式公布榜单,芯片初创公司清微智能和清华大学等机构组成...

    AI科技大本营
  • 学界 | 稳!DeepMind提出多任务强化学习新方法Distral

    选自arXiv 机器之心编译 参与:蒋思源、黄小天 深度强化学习因为复杂的环境而很难进行有效的训练,通常我们会简化环境或使用共享神经网络参数的方法进行多任务学习...

    机器之心
  • 高性能可靠服务集群架构

    老七Linux
  • 《基因大数据智能生产及分析》笔记

    基因慧的行业报告整体上不错,这次《基因大数据智能生产及分析》也不例外,一口气读完,感受是智能化是行业趋势,打工人的日子更难了。文章有点长,没时间看的话你可以拉到...

    简说基因
  • 腾讯健康码 16 亿亮码背后的 Elasticsearch 系统调优实践

    ? Elasticsearch(以下简称 ES)是近年来炙手可热的开源分布式搜索分析引擎,通过简单部署,就可以轻松实现日志实时分析、全文检索、结构化数据分析等...

    腾讯技术工程官方号
  • 大数据正强势入侵生活的各个方面,你发觉了吗?

    随着互联网的发展,信息交流也在不断加速,大数据在各行各业几乎都站稳了脚跟,特别是越来越多的政府机构与公司组织都已经把大数据应用作为了重要的一环。那么,大数据在社...

    数据猿
  • PLOS Biology:语言控制的功能连接组

    背景:在过去的几年里,已有研究致力于探讨大脑不同区域在人类不同行为中功能相互作用的复杂性。其中,神经影像学研究提出,言语的实现需要大脑区域的协调来理解、规...

    用户1279583
  • 大数据的机遇与挑战:清华、复旦、中科院、春雨移动及考拉征信专家的观点

    用户1737318
  • 斯坦福发布重磅NLP工具包StanfordNLP,支持中文等53种语言

    StanfordNLP是一个软件包组合,包括斯坦福团队在CoNLL 2018 的通用依存解析(Universal Dependency Parsing)共享任务...

    新智元

扫码关注云+社区

领取腾讯云代金券