学习
实践
活动
工具
TVP
写文章

语音评测之——websocket

前言 前段时间小编收到一份测试任务要求对搜狗输入法的语音功能进行评测评测任务主要拆分为评测语料的选取和整理,硬件的调研和采购,评测工具的开发以及评测的执行和结果整理。 小编负责评测工具服务端的开发工作,主要使用了websocket的技术,此次与大家做一个简单的分享。 评测过程 语音评测过程中由web端连接音响实现语音的播放功能,手机客户端接收语音并处理。 评测过程会逐条播放音频,每一条音频播放后web端需要知道每个手机客户端的状态(是否语音处理完毕,是否准备好接收下一条语音等等),以此来决定何时开始播放下一条音频;同理客户端也需要实时接收到web端的播放状态 整个评测过程中web端和客户端需要频繁通信,所以我们需要选择一个合适的通讯技术以保证效率和质量。 在本次评测过程中由于客户端与服务端通信频繁,且对实时性要求较高,开始便考虑使用长连接的方式。

67710

ASR(语音识别)评测学习

一、引言 小编新接触语音SDK项目,SDK无UI、底层调用多个C++算法库、提供的是AI服务。语音AI项目,识别效果是至关重要的一环,识别效果评测也是一项测试重点。 希望对测试小伙伴有所帮助~~(●—●) 二、ASR流程、系统结构、评测指标及评测模型 1、语音识别(Automatic Speech Recognition,ASR) 语音识别,也被称自动语音识别,所要解决的问题是让机器能够 4、语音识别(ASR)评测指标 语音识别(ASR)评测指标:WER(字错误率)和SER(句错误率) (1). 1、ASR评测方案设计——确定测试场景(简单举例) 考虑评测的各种影响因素,需要先确定某些维度(下例),制定一个测试场景评测: 确定:语种分类(普通话)、声音来源(人声录音)、对话方式(单人)、语音内容 ;调研用户top N的数据内容类型;收集⾼频的badcase; 4、ASR评测方案执行——过程设计 小编所在项目的ASR评测需要基于语音SDK进行,具体执行方案还在修订,遇到的问题和解决方案,小编在实践总结后再总结分享

2K50
  • 广告
    关闭

    语音识别特惠,低至1元!!

    为企业提供极具性价比的语音识别服务。被微信、王者荣耀、腾讯视频等大量内部业务使用,外部落地录音质检、会议实时转写、语音输入法等多个场景。

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【AI专栏】语音合成系统评测介绍

    本文针对TTS前端、后端的问题介绍了一种包括主观评测、客观评测TTS测试方法。 在合成语音过程中引入背景噪声、字词间隔不顺畅。 二、客观评测 针对前后端可能存在的问题,本评测方法选择如下语料和指标对TTS系统做客观评测。 ,准备测试语料,包括语料文本,待检查词汇,标准发音等,合成语音后人工评测发音准确率。 三、主观评测 1、MOS评测 国际上对语音自然度的评测,一般是使用MOS评测,邀请听音人对被测系统输出语音打分衡量。 目前我们的评测是培训众测用户做为听音人,流程大致如下: (1)双方语音音量归一化; (2)语音字词发音准确性校验; (3)生成众测问卷,语音顺序交叉打乱; (4)众测用户培训,试听自然人声和较差合成音锚定打分标准

    1.8K20

    Android语音录制,语音发送

    这是一个录音的例子,可用于IM的语音发送,OA的语音留言等。 首先我们需要引入权限: <uses-permission android:name="android.permission.RECORD_AUDIO" /> <uses-permission android :name="android.permission.READ_EXTERNAL_STORAGE" /> <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE > <layer-list xmlns:android="http://schemas.android.com/apk/res/android" > <item android:id="@android :id/background" android:drawable="@mipmap/icon_microphone_normal" /> <item android:id="@android:id

    1.6K20

    Android 语音播报

    Auto-generated method stub if (status == tts.SUCCESS) { // Toast.makeText(MainActivity.this,"成功输出语音 TextToSpeech.LANG_NOT_SUPPORTED) { Toast.makeText(Xueya.this, "数据丢失或不支持", Toast.LENGTH_SHORT).show(); } } } }); //在需要语音播报的地方 //tts.speak("语音播报的内容", TextToSpeech.QUEUE_FLUSH, null); 欢迎关注技术公众号,微信号搜索ColorfulCode 代码男人 分享技术文章,投稿分享

    86830

    Chrome语音搜索评测:效果华丽!可惜大墙相隔

    笔者使用中文普通话进行了一轮评测,识别效果超出我的预期。除了PC端使用场景有限,识别效果仍不够完善,最大的问题是:得访问外国网站。下面是一个简单评测。 如果不访问外国网站,别说语音搜索,访问Google也会经常出现大家熟悉的界面。 评测总结: Google语音搜索对于中文用户来说具备可用性。 另外PC的语音搜索是小众需求。PC正在没落,擅长的场景往往是办公、会议等开放的、不适合语音交互的地方。键盘输入成本不高的时候提供不够智能的语音输入是鸡肋。 Google语音搜索进步不在于其提供了“语音”这种输入方式。百度、搜狗等搜索引擎在PC端都已提供语音搜索功能,进步在于“自然语言”的语义理解。 语音输入除了声音转换为文字外,搜索引擎更需要从自然语言精准理解用户需求,并以知识图谱的形式反馈个性化的结果。从评测看,Google表现优秀。

    1.4K70

    语音评测的PC端demo代码为例,讲解口语评测如何实现

    未标题-1.png 概述 腾讯云智聆口语评测(英文版)(Smart Oral Evaluation-English,SOE-E)是腾讯云推出的语音评测产品,是基于英语口语类教育培训场景和腾讯云的语音处理技术 ,应用特征提取、声学模型和语音识别算法,为儿童和成人提供高准确度的英语口语发音评测。 腾讯云智聆口语评测(英文版)支持单词和句子模式的评测,多维度反馈口语表现,可广泛应用于英语口语类教学应用中。 默认值 InitUrl String 初始化接口地址 是 无 TransUrl String 评分接口地址 是 无 WorkMode Integer 上传方式:语音输入模式

    2.1K30

    Android语音识别

    语音识别 - 科大讯飞 开放平台 http://open.voicecloud.cn/ 需要拷贝lib、assets、并在清单文件中写一些权限 public class MainActivity extends savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout.activity_main); // 初始化语音引擎 ="@drawable/btn_selector" android:onClick="startListen" android:text="点击开始语音识别 findViewById(R.id.lv_list); mAdapter = new ChatAdapter(); lvList.setAdapter(mAdapter); // 初始化语音引擎 public TextView tvAnswer; public LinearLayout llAnswer; public ImageView ivPic; } /** * 解析语音数据

    13010

    如何评测语音技能的智能程度(2)——服务提供

    《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第2篇。 “你是做什么行业的?” 前一篇文章,笔者重点谈了【意图理解】维度,本篇文章为大家带来【服务提供】维度的评测点拆解。 在谈及这个模块的时候,评测考量的是场景理解及整合应用CP和SP的能力。 故而内容展示的合理程度,也应该成为一个评测标准。 就算是复杂的内容,也需要做好信息处理,根据用户的情况,分层次分阶段,进行内容展示。 为了帮助大家理解,我举几个语音交互层面的例子。 你通过语音跟对方完成指路行为。注意,这是一个纯语音对话的场景。 故而列为评测点。 阶段性结尾 写东西不光光是罗列和定义评测点是什么,笔者更期望在每个点上,加入更多的业务思考和理解。 ?

    31620

    如何评测语音技能的智能程度(1)——意图理解

    《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第1篇。 平日里研究各种各样的语音助手,输出各种类型的调研分析报告,以培养自己的业务敏锐度,同时也研究各种框架型知识以丰富自己的知识库。 不过多举例,但是有无处理方案,应该纳入进评测点。 【意图理解】(5)目标达成表现 核心考量点:帮助用户达成目标中间所花费的成本。 所以在当前的技术实现下,输出了过往在工作中一些评测产品以及处理问题的具体表现。 实际上,原本在意图理解这个单元模块,有更多评测点去列举,但是受限于篇幅以及能力所限,删掉的一些内容。 既然是评测指标,自然是有权重之分。 有些是可以努力做好的部分,比如前文中就【意图理解】这个维度提及的5个模块,各个例子的列举,都是基于用户的对话日志后台,是实际业务中非常高频的。

    42031

    如何评测语音技能的智能程度(3)——交互流畅

    《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第3篇。 评测点已经讲完了,十分清晰,几乎每一个互联网从业者都能够说出个1234,然后呢? 语音交互这件事,本身就是因为语音输入的高效性。 当用户发出了需求,希望尽快拿到反馈, 现在的用户极其没有耐心,速度一旦过慢,注定会被弃而不用。 ? 体验各家智能语音助手,在这一块的表现上各不一致,故而列为评测点。 行业新的新手引导教学其实非常多的种类,滑屏海报,蒙版遮罩,文字tips,互动式引导。 同样的,在【交互流畅】这个单元模块,有更多评测点去列举,但是受限于篇幅以及能力所限,删掉的一些内容。保留以及删除评测点的原则,也是基于评测指标的普适性。 同样用提问的方式,列举一下我删除掉的考核点。

    43820

    如何评测语音技能的智能程度(4)——人格特质

    《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第4篇。 前三篇文章,依次拆解了【意图理解】、【服务提供】、【交互流畅】三个维度,如果这些维度的各个评测指标全部达标,即是一款水平线以上的智能语音助手,但是距离“令人愉悦和兴奋”还少了一个维度,即——人格化。 大厂制造,资源齐备,各个性能表现都十分优秀,同一个时期的产品,硬件配置,技能,语音交互表现差不太多。 现在的语音助手大多是一个工具型产品,并基于此,努力附加人格化。 高德语音导航这个工具的使用体验无疑是做得令人愉悦的,与它们的互动充满了乐趣。 ? 笔者能列举的计算机表现方式:文字、表情、语音、音效、图像、光效、甚至是机器人的肢体动作。这些方式,叠加的越多,其表现力越丰富。

    37820

    语音项目——Android录音学习

    二、Android两种录音方式 1、音频采集简介 Android提供了两个API用于录音的实现:MediaRecorder 和AudioRecord。 (1). 输出的是PCM的语音数据,如果保存成音频文件是不能被播放器播放的。要用AudioTrack进行处理。API还有待完善,常见的暂停功能都不支持。 2、利用AudioRecord实现Android录音的流程 (1). 构造一个AudioRecord对象,其中需要的最小录音缓存buffer大小可以通过getMinBufferSize方法得到。 MediaRecorder.AudioSource.VOICE_CALL:设定录音来源为语音拨出的语音与对方说话的声音 MediaRecorder.AudioSource.VOICE_COMMUNICATION /reference/android/media/AudioRecord https://blog.csdn.net/u010126792/article/details/86309592 https:

    49010

    Android语音声波控件 Android条形波控件

    许久不来 , 冒个泡 , 发一个刚做的声音波动的View吧 : 代码不多 , 没什么技术含量 , 权当给您省时间了 , 直接复制粘贴就能用 , 直接上代码: SoundWavesView /** * 语音通话的声波控件 void wave(){ // TODO 防止UI抽风 } /** * 生成有序的 */ private void order(){ // TODO 防止UI抽风 } } SoundLine /** * 语音音频波纹的单个音波属性

    87341

    指标权重设计——如何评测语音技能的智能程度(终篇)

    《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第5篇,也是最后一篇。 评测语音技能的智能程度有4大维度: 如何评测语音技能的智能程度(1)——意图理解 如何评测语音技能的智能程度(2)——服务提供 如何评测语音技能的智能程度(3)——交互流畅 如何评测语音技能的智能程度( 如果某个玩具/手办具备语音交互功能,用户非常在意玩具/手办的语音交互是否匹配角色气质,故而对这类用户而言,“人格特质“就要要求高权重。 语音技能评测指标的选择和量化 这份清单花了笔者太多的时间,仍然有太多的问题值得讨论: 为什么是4个维度,而不是5个或者是3个? 基于什么依据设置每个维度的重点和加分项? 语音技能服务的上限和下限 除去调研和评测其他智能语音技能,这份清单的还可以用于服务的产品定位,以及作为清单来评价语音技能服务表现。

    60920

    Android自带类实现语音合成

    说到语音技术,大部分开发者最先想到的就是科大讯飞,百度语音这些吧,毕竟这几个第三方的语音技术做的非常完善。我也不例外,因为之前有同事用过,而且给我说过讯飞的比较好,所以我直接就去讯飞官网看相关文档了。 开始爬坑 怎么办呢怎么办呢,这个时候,只能说天无绝人之路,让我发现了一个类,而且是android自带的类,它可以很好的支持英文的语音合成,这个类就是TextToSpeech。 具体描述传送门: https://developer.android.google.cn/reference/android/speech/tts/TextToSpeech.html 重要的是:这个类在 Android 1.6版本中就有了,惭愧的是我今天才知道。 ,其实android本身就支持的很好了。

    1.2K20

    实时Android语音对讲系统架构

    本文属于Android局域网内的语音对讲项目(https://github.com/yhthu/intercom)系列,《通过UDP广播实现Android局域网Peer Discovering》(http 本文主要包含以下内容: 1、AudioRecord、AudioTrack 2、Speex编解码 3、Android语音对讲系统架构 01 AudioRecord、AudioTrack AudioRecorder 在网络电话、语音对讲等场景中,由于实时性的要求,不能采用文件传输,因此,MediaRecorder和MediaPlayer就无法使用。 AudioRecorder和AudioTracker是Android在Java层对libmedia库的封装,所以效率较高,适合于实时语音相关处理的应用。 private static final int DEFAULT_COMPRESSION = 5; 03 Android 语音对讲项目系统架构 再次说明,本文实现参考了论文:Android real-time

    2.8K40

    学习|Android使用TTS语音合成

    Android本地TTS语音合成 前两天做WinForm项目中,有客户需求是加入语音提示,同事的努力下也是花了两天时间给更新上线了,由于我做的Android端用的手持PDA较多,在使用过程中如果有语音提示 ,会让用户使用起来更方便些,于是这篇就主要研究下Android端的TTS语音合成。 " android:id="@+id/edttext" android:hint="请输入语音合成的文字" /> <Button android " android:text="TTS语音合成" /> <Button android:layout_width="wrap_content" android:layout_height="wrap_content" android:id="@+id/btn2" android:text="TTS语音设置" />

    2K32

    Android实现语音合成与识别功能

    Android语音合成与语音识别,供大家参考,具体内容如下 这里调用科大讯飞语音的API,语音云开放平台介绍 调用科大讯飞语音的API,需要加添库文件Msc.jar,添加libmsc.so文件,还需添加权限 ,具体步骤可参看SDK里的文档 参看开发的文档写了一个简单的语音合成和识别demo,图示如下 ? 在EditText里输入文字,点击语音合成,可以实现文字转化为语音 ? 点击语音合成,输入语音,识别的文字以提示的形式显示,并且显示在EditText中 ? android:text="语音合成" / <Button android:id="@+id/btn2" android:layout_width="wrap_content" android:layout_height ="wrap_content" android:layout_weight="0.03" android:text="语音识别" / </TableLayout 解析Json格式的数据是参照讯飞的文档中的

    26420

    Android 天气APP(三十三)语音播报

    前言   在这篇文章中我将给天气APP加入语音功能,首当其冲的就是这个语音播报功能。语音使用了第三方SDK,做语音开发不可能不知道讯飞,因此我这里用的也是讯飞的SDK,下面开始吧。 点击这个应用名字之后会进入可使用的SDK功能页面,然后点击语音合成,之后下滑,找到Android的SDK,如下图所示。 ? ,好像太单调了,因此我把语音播报的设置加进去,丰富一下这个页面。 --语音播报--> <LinearLayout android:orientation="vertical" android:layout_width="match_parent android:text="语音播报" /> <LinearLayout android:layout_width="match_parent"

    27510

    扫码关注腾讯云开发者

    领取腾讯云代金券