测试准备说下。这次选了三款工具,测试内容是3段电台录音,每段1小时。
一段是早间新闻(普通话标准,语速快),一段是访谈节目(3人对话,偶尔插话),一段是夜间情感节目(轻声说话,有背景音乐)。
测试标准有四个:准确率(人工数错字)、速度(上传到出稿时间)、操作难度(步骤多少)、价格(年费换算)。
先聊实际体验:
操作最简便的网页版就能直接用,不用装软件。打开网站,拖音频文件进去就行,两步操作。1小时的新闻录音,传完5分钟就出稿了。
自动标了3个说话人,还带时间戳。我试着点文本里的句子,播放器直接跳到对应位置。校对时改起来方便,不用来回翻。
访谈节目测试更惊喜。嘉宾插话、笑声这些,都识别出来了。连主持人说的"嗯""这个"这种口头禅,也标了"[语气词]",方便后期删。
夜间节目那段,本来担心声音轻会不准,结果处理得不错,背景音乐自动过滤掉了,人声识别率没降多少。
再说说专业的音频软件,转文字算附加功能。得先装客户端,2.3GB大小,等了15分钟才装好。
操作步骤多:导入音频降噪处理生成脚本导出文本。前前后后折腾了20分钟,才出结果。
转文字本身还行,但多人对话不会分说话人。整段文本堆在一起,分不清谁在说。得手动听着标,又花了半小时。如果不是本来就用它剪音频,专门用来转文字有点浪费。功能是强,但太复杂了。
还有款是手机APP,打开首页就弹广告,关了才能用。免费版只能转15分钟,我那段1小时的录音,转了15分钟就停了,提示要开会员,会员月费不算贵。但转写结果里,"的""得""地"经常混。比如"开心得笑了"写成"开心的笑了",得手动改,导出格式只有TXT,想存Word还得复制粘贴。整体感觉,就是基础能用,但体验一般。
数据对比看这里:
准确率,新闻类:98%(1小时错12字)、85%(错60字)、80%(错75字),差距明显。
访谈类:95%(错28字)、78%(错92字)、72%(错110字)。
夜间轻声类:90%(错45字)、65%(错175字)、60%(错200字)。
速度方面:5分钟/小时音频、20分钟(含降噪)、15分钟。
价格对比:年费199元(月均16.6元)、月费88元、年费358元。
问题也得说清楚:
有的方言支持还得加强,测试时用粤语新闻,准确率掉到75%。
有的没离线功能,如果没网,想转录音就不行了。希望以后能加这个功能。
有的广告太多,每操作一步弹一次。免费版限制太死,15分钟根本不够用。导出格式也少,不方便后续编辑。
总结建议来了!
如果你是电台编辑,每周要转3-5小时录音,选操作简单准确率高的。
要是你本身是音频后期,每天要剪音频,选专业剪音频的,顺带用它转文字也行。不用多装软件,就是效率慢点。
偶尔转一段短录音(15分钟内),选免费试用的也能应付。就是广告多,校对费时间,应急用可以。
话说回来,选转文字工具,核心就看三点:准不准、快不快、贵不贵。