专栏首页arxiv.org翻译专栏PJS:音素平衡的日语歌唱语音语料库(CS S)
原创

PJS:音素平衡的日语歌唱语音语料库(CS S)

本文提出了一个免费的日语歌唱语音语料库,可用于具有高度实用性和可复制性的歌唱语音合成研究。歌唱语音语料库有助于歌唱语音合成的发展,但现有的语料库存在两个关键问题:数据不平衡(歌唱语音语料库不能保证音素平衡,不像说话语音语料库)和版权问题(不能合法共享数据)。为了避免这些问题,我们构建了一个PJS(phoneme balanced Japanese sing voice)语料库,该语料库保证了音素的平衡,并获得了CC BY-SA 4.0的许可,并且使用音素平衡的口语语料库编写了旋律。本文描述了如何构建语料库。

原文标题:PJS: phoneme-balanced Japanese singing voice corpus

原文:This paper presents a free Japanese singing voice corpus that can be used for highly applicable and reproducible singing voice synthesis research. A singing voice corpus helps develop singing voice synthesis, but existing corpora have two critical problems: data imbalance (singing voice corpora do not guarantee phoneme balance, unlike speaking-voice corpora) and copyright issues (cannot legally share data). As a way to avoid these problems, we constructed a PJS (phoneme-balanced Japanese singing voice) corpus that guarantees phoneme balance and is licensed with CC BY-SA 4.0, and we composed melodies using a phoneme-balanced speaking-voice corpus. This paper describes how we built the corpus.

原文作者:Junya Koguchi, Shinnosuke Takamichi

原文地址:https://arxiv.org/abs/2006.02959

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 自动解码图(CS ML)

    我们提出了一个系统,允许用户在依赖图上使用句法模式搜索大型语言注释语料库。与之前的尝试不同,我们引入了一种轻量级的查询语言,它不需要用户知道底层语法表示的细节,...

    蔡秋纯
  • 命名实体识别作为依赖分析(CS CL)

    命名实体识别(NER)是自然语言处理中的一项基本任务,它涉及到识别文本对实体的引用范围。净资产收益率研究通常只关注扁平实体(扁平净资产收益率),忽略了实体引用可...

    蔡秋纯
  • 我们需要联系追踪应用程序吗?(CS CS)

    本文的目的是阐明接触追踪智能手机应用程序对遏制COVID-19大流行的有用性。我们回顾了病毒传播过程中接触者追踪的基础知识,我们将数字与COVID-19的情况相...

    蔡秋纯
  • 【NLP】Python NLTK获取文本语料和词汇资源

    NLTK是由宾夕法尼亚大学计算机和信息科学使用python语言实现的一种自然语言工具包,其收集的大量公开数据集、模型上提供了全面、易用的接口,涵盖了分词、词性标...

    机器学习AI算法工程
  • 简单有效的多标准中文分词详解

    本文介绍一种简洁优雅的多标准中文分词方案,可联合多个不同标准的语料库训练单个模型,同时输出多标准的分词结果。通过不同语料库之间的迁移学习提升模型的性能,在10个...

    IT小白龙
  • 简单有效的多标准中文分词

    -欢迎 加入AI技术专家社群>> 本文介绍一种简洁优雅的多标准中文分词方案,可联合多个不同标准的语料库训练单个模型,同时输出多标准的分词结果。通过不同语料库之间...

    企鹅号小编
  • jQuery UI Datepicker使用介绍

    本博客使用Markdown编辑器编写 在企业级web开发过程中,日历控件和图表控件是使用最多的2中第三方组件。jQuery UI带的Datepicker,日历控...

    八哥
  • Pytorch-ResNet(残差网络)-上

    由之前的研究,会有人疑问是否往往更深层次的神经网络具有更佳的表现?这种问题现在还无法进行完美的解答。

    用户6719124
  • 'telnet' 不是内部或外部命令,也不是可运行的程序 或批处理文件。

      系统中的telnet客户端是关闭状态。即Win10默认没有安装telnet功能。

    黑泽君
  • 程序员职业发展的要命Bug

    用户1682855

扫码关注云+社区

领取腾讯云代金券