前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >语音数据标注工具与平台

语音数据标注工具与平台

原创
作者头像
扬起
发布2022-06-23 10:23:00
2.3K0
发布2022-06-23 10:23:00
举报

语音标注工具–Praat

Praat是目前已经成为比较流行也比较专业的语音处理的软件,可以进行语音数据标注、语音录制、语音合成、语音分析等等,具有免费、占用空间小、通用性强、可移植性好等特点 官网链接 http://www.fon.hum.uva.nl/praat/ 汉化版下载 http://www.hejingzong.cn/blog/ViewBlog_54.aspx#vidio

  1. 打开音频文件,点击标注(Annotate),转换为 TextGrid文件
 语音数据标注
语音数据标注
  1. 分“层”,这里分为文本、性别、身份、噪音 四层
语音数据标注
语音数据标注
  1. 按住Ctrl,将音频文件和TextGrid文件都选上,点击 查看&编辑(View & Edit),开始进行标注

 语音数据标注
语音数据标注
  1. 完成标注,保存

总的来说,Praat功能强大,但是用作语音标注,操作并不简便,难以对大批量的语音数据做好管理。最近我们找到几家数据标注平台,各家自研的标注工具更加简单好用。

语音数据标注平台

京东众智

京东众智的工具是单独开发的(这个也挺好开发和复用的)操作方面简单很多,标注人员全部是在线上作答,也避免了数据外泄问题。值得一提的是,因为我们的初始数据是用算法跑过一遍的,虽然准确率不是很高…京东众智可以把我们的标注结果展示出来,标注人员简单修改一下,效率就提高很多。经过协商,因为不用重新标注,报价也减少了一些。

语音数据标注平台

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 语音标注工具–Praat
  • 语音数据标注平台
    • 京东众智
    相关产品与服务
    语音合成
    语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档