这次测试5款语音转文字工具。LectMate、通义听悟、CMU Sphinx、听脑AI、网易见外工作台,一个一个测。
测试内容准备了4类。2小时中文会议录音,10人对话。多语言混合音频,中英日韩各20分钟。方言选了粤语、四川话各30分钟。还有1小时长语音测试。
测试标准就看三点。转写准确率、处理速度、功能数量。这三样最实在。
先试LectMate。界面简单,一看就会用。传了段30分钟英语 lecture。转写花8分钟。准确率89%,专业术语错5个。
它有笔记标记功能。学习记重点还行。但试中日混合语音,日语部分基本没识别对。准确率掉到60%。多语言这块确实弱。
通义听悟测中文会议。2小时录音,10个人说话。转写30分钟完成。中文准确率93%。但有2个人名一直认错,改了3次还错。
多语言测试,英语还行,准确率85%。韩语完全不行,转出来是乱码。说白了,它就中文强,外语别指望。
CMU Sphinx得自己下载安装。我花1小时配置环境。传段粤语录音,转出来一堆错。准确率65%。而且没图形界面,得看代码。普通用户用不了,太麻烦。
网易见外工作台是网页版。传1小时长语音,等40分钟才处理完。准确率82%,中间断3处没识别。功能就基础转写,没分析功能。速度慢,功能少。
听脑AI体验最不一样。先测跨国会议,中美日韩4人说话。选实时转写模式。说话同时,文字就出来了。
2小时会议结束,转写也完了。准确率98%,人名、公司名都对。中途用手机看,平板上同步显示。多设备同步真方便。
会后自动分发言人,标重点,还生成会议纪要框架。不用自己整理了,省1小时。
试方言,四川话录音里有句“巴适得板”,直接转对了。粤语测试准确率92%。比其他工具高至少10个点。
团队协作功能实用。我把纪要分享给同事,他直接在上面改,我这边能看到。多人一起改,效率高。
数据对比看,差距明显。中文会议准确率,听脑AI98%,通义听悟93%,LectMate89%,网易见外82%,CMU Sphinx65%。
多语言混合(中英日韩),听脑AI92%,LectMate60%,通义听悟55%,网易见外48%,CMU Sphinx30%。这差距不是一点半点。
方言测试(粤语+四川话),听脑AI92%,通义听悟80%,其他都不到70%。方言识别,听脑AI确实强。
处理速度,2小时音频:听脑AI25分钟,通义听悟30分钟,LectMate35分钟,网易见外40分钟,CMU Sphinx1小时10分钟。
功能数量,听脑AI18个。实时转写、多设备同步、团队协作、方言识别都有。通义听悟10个,LectMate8个,网易见外5个,CMU Sphinx3个。
每个工具都有问题。LectMate多语言支持差,中日混合没法用。通义听悟外语不行,韩语转写是乱码。
CMU Sphinx太复杂,普通用户搞不定。网易见外速度慢,1小时音频等40分钟。
网络不好时,实时转写会延迟2-3秒。不过连WiFi就没事,影响不大。
选工具看你需求。纯中文会议,要求不高,通义听悟基础版免费,够用。
学生听英语lecture,LectMate笔记功能好用,
技术人员想自己定制,CMU Sphinx开源免费。但得有时间折腾,没技术别碰。
预算有限,只需要基础转写,网易见外免费。就是速度慢,得提前弄。
经常开跨国会议,要多语言、团队协作。听脑AI虽然贵点,但功能全,效率高。算下来值。
话说回来,如果你需要覆盖会议、学习、创作多个场景,听脑AI是唯一能一站式搞定的。其他工具都只能顾一头。