首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

语音标注工具介绍-开放式标注平台

虽然理论技术取得了长足进步,但是在实际应用过程中仍绕不开数据标注这一话题,训练数据的准确性很大程度上影响了算法模型的表现。...有一篇文章比较详细地介绍了语音标注工具Praat的使用方法,我想说的是Praat真的非常难用,今天找到一款在web上运行的语音数据标注工具,京东做的并且开放了出来,可以自主配置 https://biao.jd.com...③ 选择或增加分层:系统默认给出了常用的角色、性别,可以根据你的需要增加或减少分层 ④ 判断项:可针对噪音、发音重叠等情况做特殊处理 ⑤ 填写具体的标注规则,方便标注人员实时查看 2....预览工具 添加描述 接下来你可以试用一下刚才配置的标注工具,可以转写音频,标注角色、性别、噪音等。可以拖拽时间段、播放每一段的音频,体验还是非常好的,标注效率也会大大提高。 3....我与一些标注团队沟通过,转写一小时的语音大约要150-200元左右,当然还要看各位具体的需求和标注难度。希望未来大厂们将更多的语音数据开源出来推动科技进步,开源万岁!

8.4K40
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    TTS朗读IPA音标——你家TTS怎么和我家不一样?

    最近Google的时候,意外发现一个神奇的软件——eSpeak。这个TTS和别的TTS不同的是,这个TTS竟然支持朗读IPA?!! 这么神奇吗?停停停,你不是在骗我吧?...所以这个软件用了一套神奇的ASCII转写IPA的方案,节选如下: 转写符号 IPA Unicode码 r ɹ 0279 B β 03B2 C ç 00E7 D ð 00F0 R ɚ\ʀ 025A\0208...不错,可以尝试鬼畜一点的了,所以我找了诗经的《隰有苌楚》,用中原音韵朗读: https://static.kaaass.net/phonetics/%E4%B8%AD%E5%8E%9F%E9%9F%B3%...E9%9F%B5-%E9%9A%B0%E6%9C%89%E8%8B%8C%E6%A5%9A%E5%85%A8.wav 是不是忘了原文2333333还有更鬼畜的,以下是郑张尚芳拟音的上古音韵版本和原文。...因为这是诗经中为数不多的,现代汉语朗读也押韵的一段。

    1.6K00

    NeurIPS 2019 | 一种对噪音标注鲁棒的基于信息论的损失函数

    AI科技评论获授权转载自北京大学前沿计算研究中心 本文是第三十三届神经信息处理系统大会(NeurIPS 2019)入选论文《L_DMI:一种对噪音标注鲁棒的基于信息论的损失函数(L_DMI: A Novel...Arxiv link: https://arxiv.org/abs/1909.03388 Code link: https://github.com/Newbeeer/L_DMI 简介 噪音标注(noisy...许多之前处理噪音标注的工作仅仅对特定的噪音模式(noise pattern)鲁棒,或者需要额外的先验信息,比如需要事先对噪音转移矩阵(noise transition matrix)有较好的估计。...实际上,当噪音满足条件独立(conditional independence)假设时,即噪音标签和具体数据条件独立时,我们有下列等式成立: 这意味着,理论上,用 作为损失函数在噪音标注上训练分类器和在正确标注...但仅这一点是不够的,实际上我们希望的是找到一个信息测度 I,满足下列性质: 也就是说,这个信息测度在噪音标注(noisy label)上对分类器的序应该与其在正确标注(clean label)上对分类器的序相同

    1K20

    NeurIPS 2019 | 一种对噪音标注鲁棒的基于信息论的损失函数

    来源:北京大学前沿计算研究中心 本文是第三十三届神经信息处理系统大会(NeurIPS 2019)入选论文《L_DMI:一种对噪音标注鲁棒的基于信息论的损失函数(L_DMI: A Novel Information-theoretic...论文链接:https://arxiv.org/abs/1909.03388 代码链接:https://github.com/Newbeeer/L_DMI 简介 噪音标注(noisy label)是机器学习领域的一个热门话题...许多之前处理噪音标注的工作仅仅对特定的噪音模式(noise pattern)鲁棒,或者需要额外的先验信息,比如需要事先对噪音转移矩阵(noise transition matrix)有较好的估计。...作为损失函数在噪音标注上训练分类器和在正确标注(clean label)上训练分类器没有区别。 之前,人们使用的损失函数仅仅对特定的噪音模式鲁棒。...也就是说,这个信息测度在噪音标注(noisy label)上对分类器的序应该与其在正确标注(clean label)上对分类器的序相同。然而,香农的互信息不满足以上性质。

    45730

    记一次智能语音软件的开发-终于为孩子找到了个靠谱的口语老师

    --phoneme 音标 --start 音标开始时间,单位是秒 --end 音标结束时间,单位是秒 --judge 判断音素是否错误,true为发音正确,false为发音错误,同时calibration.../标准答案,如果为true,说明参考答案认为该元音应该发重音,辅音时无意义 --stress_detect 在一个单词中,用户该音标发音为重音 Demo开发: 这个demo使用python3开发,包括...'stress_detect': False,//在一个单词中,用户该音标发音不为重音 'phoneme': 'ɝ', //音标名称 'start': 0.73, //音标开始时间...,秒 'end': 0.76, //音标结束时间,秒 'judge': True, //判断音标是否错误,true为发音正确,false为发音错误,同时calibration给出提示...'calibration': 'ɝ', //判断音标是否错误,true为发音正确,false为发音错误,同时calibration给出提示 'prominence': 1 //重音程度,当前音标越可能是重音

    1.7K00

    看我如何使用Python打造一个带娃神奇(一玩能玩一天)?

    –phoneme 音标 –start 音标开始时间,单位是秒 –end 音标结束时间,单位是秒 –judge 判断音素是否错误,true为发音正确,false为发音错误,同时calibration给出提示...true,说明参考答案认为该元音应该发重音,辅音时无意义 –stress_detect 在一个单词中,用户该音标发音为重音 (一)Demo开发: 这个demo使用python3开发,包括maindow.py...'stress_detect': False,//在一个单词中,用户该音标发音不为重音 'phoneme': 'ɝ', //音标名称 'start': 0.73, //音标开始时间...,秒 'end': 0.76, //音标结束时间,秒 'judge': True, //判断音标是否错误,true为发音正确,false为发音错误,同时calibration给出提示...'calibration': 'ɝ', //判断音标是否错误,true为发音正确,false为发音错误,同时calibration给出提示 'prominence': 1 //重音程度,当前音标越可能是重音

    1.6K10

    基于Tacotron汉语语音合成的开源实践

    比如有这么一句: 绿 是 阳春 烟 景 大块 文章 的 底色 四月 的 林 峦 更是 绿 得 鲜活 秀媚 诗意 盎然 用汉语拼音标注为: lv4 shi4 yang2 chun1 yan1 jing3...除此之外还有个train.txt文件,里面基本上就是csv的格式将拼音标注同每个文件的声谱对应起来。 再提醒一遍,我们的tacotron根目录默认是~/tacotron,更改需要改变命令行参数。...,同时将Python进程置于后台,这是由于训练过程十分漫长(一般收敛需要10个小时,得到好的效果需要2天),免得网络中断或者终端断开导致Python进程被杀死。...不过我们无法直接输入汉字文本,而是拼音标注,好在有开源项目python-pinyin帮我们搞定:https://github.com/mozillazg/python-pinyin 比如我们想合成一句...我们使用python-pinyin输出的拼音标注拷贝到eval.py里,输入命令行: > python3 eval.py --checkpoint logs-thchs30/model.ckpt-133000

    1.3K20

    Django框架中的英文单词

    本文采用的音标均为美式音标,有部分通用或者其他国家的语言,没有进行标注或者采用了通用音标。所有的意思均为牛津词典中的原意。...因为上次文章直接使用的是学习python时,我们计算机的意思,怕把大家带跑偏。特意选取了正规的翻译,然后后面对计算机中的意思进行了注释,并且将对应的知识点进行了回忆,希望对大家有所帮助。...ˈvɝtʃʊəl/虚拟的 environment /ɪn'vaɪrənmənt/环境,看到这三个单词的时候有没有发现python其实就是英语直接翻译的语言,哈哈。...36、migrations迁移这个没有音标,因为是法国的单词,全球通用,我们在迁移的时候,生成迁移文件时用到了命令:python manage.py makemigrations 37、migrate也是迁移...,我们在同步到数据库中的时候使用,命令为:python manage.py migrate 38、tail /tel/踪迹,尾随,名词也有尾巴的意思,我们再查看数据库日志的时候见到了这个单词,命令:sudo

    1.6K30

    ​我拿 12 年 36 套四级真题做了什么 ?

    程序介绍 这是一个单词频率统计程序 ,基于python3 ,我将往年真题按照词频排序得到了四级词库 :总结出了 5000 个出现频率极高的单词 。...work.py python translate.py python db2csv.py 具体实现 数据 (docx 复杂的文档结构不好用,可以在word里面以txt方式保存) ?...name = CharField() # 解释 explanation = TextField(default='') # 词频 frequency = IntegerField(default=0) # 音标...data = info['baesInfo']['symbols'][0] assert info['baesInfo']['symbols'][0] # 去除没有音标的单词...出现次数最多的简单词 ? 出现次数较少,值得一背的词 ? 上述完整代码和获取到的统计结果(5000个高频词)分享到公号【小詹学python】,公号后台回复关键词 “四级” 即可获取 。

    70510

    ​我拿 12 年 36 套四级真题做了什么 ?

    程序介绍 这是一个单词频率统计程序 ,基于python3 ,我将往年真题按照词频排序得到了四级词库 :总结出了 5000 个出现频率极高的单词 。...work.py python translate.py python db2csv.py 具体实现 数据 (docx 复杂的文档结构不好用,可以在word里面以txt方式保存) ?...name = CharField() # 解释 explanation = TextField(default='') # 词频 frequency = IntegerField(default=0) # 音标...data = info['baesInfo']['symbols'][0] assert info['baesInfo']['symbols'][0] # 去除没有音标的单词...出现次数最多的简单词 ? 出现次数较少,值得一背的词 ? 上述完整代码和获取到的统计结果(5000个高频词)分享到公号【小詹学python】,公号后台回复关键词 “四级” 即可获取 。

    55520

    十个程序员八个读错!?你来试试看呢

    因为不是咱的母语,所以经常会遇到一些词不知道怎么正确发音。在公司里,时不时听到同事的“自创读法”,通常大家也都知道什么意思,最多心照不宣地会心一笑,毕竟常在词边走,哪有不读错?...不过,自黑归自黑,如果你总能保证正确的单词拼写和发音,在职场上还是很加分的。 最近,我看到一个 Github 上的项目,整理了程序员最容易发音错误的单词。...,又为了避免程序猿们出现选择困难症,“正确音标”采用了最接近有道词典音频的英式 DJ 音标,不代表其唯一性。...这个项目的地址: https://github.com/shimohq/chinese-programmer-wrong-pronunciation 作者是石墨文档团队 如果光看音标还不能 get 到准确的读音...www.v2ex.com/t/63781 https://www.v2ex.com/t/246033 https://www.v2ex.com/t/342087 ---- _往期文章推荐_ 用程序整理了一份Python

    84420

    英语中常见表示行为、动作、品格的单词有那些?Intelligent、Kind、Brave、Honest、Creative、Patient、Dependable等21个详解

    Intelligent 音标: /ɪnˈtɛlɪdʒənt/ 起源: 来自拉丁语“intelligere”,意为“理解”。 本义: 聪明的,拥有快速学习和理解的能力。...(一句善意的话可以让某人的一天变得更好。) Brave 音标: /breɪv/ 起源: 来自拉丁语“barbarus”,意为“勇敢的”。 本义: 勇敢的,面对危险或困难时毫不畏惧。...Honest 音标: /ˈɒnɪst/ 起源: 来自拉丁语“honestus”,意为“荣誉的”。 本义: 诚实的,总是说实话,行为正直。 引申义: 值得信赖的,不欺骗他人。...(她的悲观态度使她很难看到事物的积极面。) Charismatic 音标: /ˌkærɪzˈmætɪk/ 起源: 来自希腊语“kharisma”,意为“神圣的礼物”。...Modest 音标: /ˈmɒdɪst/ 起源: 来自拉丁语“modestus”,意为“适度的”或“谦逊的”。 本义: 谦逊的,不炫耀自己的成就。 引申义: 表现出谦虚和低调的态度。

    11710

    英语中常见表示很多、许多、大量、丰富、充足、无数、数不清的单词若干带示例、使用场景、同义词以及反词-many, a lot of, plenty,numerous, multiple,myriad,

    **Many** - 音标:/ˈmeni/ - 起源:源自古英语“mānig”,意为“许多的”。 - 基本义:表示数量众多,用于可数名词。...(生活中有无数的机会。) 6. **Multiple** - 音标:/ˈmʌltɪpəl/ - 起源:源自拉丁语“multiplex”,意为“多样的”。...**Copious** - 音标:/ˈkəʊpiəs/ - 起源:源自拉丁语“copiosus”,意为“丰富的”。 - 基本义:表示丰富的、大量的,用于不可数名词。...(他有丰富的经验。) 8. **Abundant** - 音标:/ˈæbʌndənt/ - 起源:源自拉丁语“abundāns”,意为“丰富的”。...**Tons of** - 音标:/tʌnz əv/ - 起源:源自英语“ton”(吨)。 - 基本义:表示大量的、的,用于可数和不可数名词。

    29310

    单音素、三音素、决策树

    以前的音标现在也可以叫音素,而且现在正广泛的把音标叫音素。 每一种语言中的音素都是不一样的,即使是同种语言中,方言的音素也是不一样的。...音素应该与人体的发音严格的区分开,因为音素是指一个有规律的有限的发音系统而人体的发音则是无限的。 以英语为例,英语共有48个音素,其中元音20个,辅音28个。...英语辅音和元音在语言中的作用,就相当于汉语中的声母和韵母。记录语音音素的符号叫做音标。音标可以分为两种,即严式音标和宽式音标。一般学习语言使用宽式音标即可,比如广泛运用的英语国际音标。...而对于语音、音韵等专业研究来说,用严式音标则最大可能地记录任意一种语言的语音。 音素是构成音节的最小单位或最小的语音片段,是从音质的角度划分出来的最小的线性的语音单位。...在语音学与音韵学中,音素一词所指的是说话时所发出的声音。音素是具体存在的物理现象。国际音标(这里指的是国际语音协会制定的国际音标,注意同英语国际音标区分)的音标符号与全人类语言的音素具有一一对应。

    3.2K10

    明月机器学习系列014:用Docker构建深度学习环境

    主要的框架 ---- 现在深度学习的框架主要有Tensorflow,Pytorch,MXNet,Paddle和Keras,简单总结一下: 就是想构建一个镜像,将这些都安装进去,避免每次都需要编译一个...基础镜像 ---- 基础镜像包含cuda和python的基础组件,Dockerfile如下: 主要在NVIDIA镜像的基础上安装了Python3和pip,还有配置环境变量。 3....开发包,它在解决命名实体识别(NER)、部分语音标注(PoS)、语义消歧和文本分类等NLP问题达到了当前的最高水准。...git clone https://github.com/facebookresearch/fastText.git /fastText \ && cd /fastText \ && python3...# install jupyter RUN pip3 install jupyterlab 配置matplotlib,支持中文字体: ENV matplotlibrc /usr/local/lib/python3.6

    1K10

    ChatGPT学习之旅 (7) 参数化表达的魔力

    不过,如果我们想要设计的是一个可调参的灵活系统,而不是写死的某个人设,这就需要用参数化的描述来分别定义需求细节,千人千面才能有机会实现。 那么,什么是参数化表达呢?...'变量' 输出'num'组参考 默认值:提供一个高容错的默认值。 初始化和帮助:第一个使用,能够引导用户沟通个人偏好,同时提供功能指令集的菜单,明确助理的职能。...高级> /style: else 正式的 /num: else 3 /音标:的拼音,国际音标、含声调的日语罗马音>else 音标(美、英) `instructions` /word:单词讲解...用户用任何语言输入单词,请按以下模版输出单词相关信息: ## 单词: 用表格输出:**单词**,音标,词性(abbr),词根,释义(中、英) ## 例句: 列表输出/num组*英文例句*(中文翻译).../help:输出支持的指令指引 `rules` - 正确按输出模版渲染 markdown - 用户学习日语时,/word 的音标使用含数字音调的罗马音音标,如:**雨**:あめ①,音标:ame - 假如单词有多个词性

    12810

    一图背单词

    拍摄一张包含英文单词(词组、句子)的图片,通过 扣子[1] 中的智能体:一图背单词[2] 上传并设定 tag,之后在 word-practice[3] 中进行随机练习。...智能体流程执行结束后,稍等片刻,即可进行练习: handwriting_practice1 handwriting_practice2 示例 2 以 大学英语四六级词汇完整版带音标(PDF下载版)[5]...中的 大学英语四级词汇完整版带音标.pdf[6] 为例,截取其中某页图片,设定 tag 为 lv4/8_of_113: lv4 智能体流程执行结束后,稍等片刻,即可进行练习: lv4_practice...添加书签(页面刷新后书签重置) 自动生成单词音标及记忆技巧 手动勘误 从图片中识别的单词,都会以 json 格式存储到 https://github.com/AlphaHinex/word-practice.../tree/main/words 路径下,tag 中的 / 可用来表示子文件夹,如: abc/test1、abc/test2、def/test、test 四个 tag 对应 words 路径下的子路径及文件为

    9100
    领券