当我连续点击启动和停止操作时，我的应用程序崩溃。我正在使用语音识别 - 腾讯云开发者社区

---- 新智元报道编辑：Aeneas 好困【新智元导读】用一个Chrome扩展程序，让ChatGPT开口说话！现在，ChatGPT可以和我们语音聊天了！只需在浏览器上安装一个「Talk-to-ChatGPT」扩展就可以。如何安装 Talk-to-ChatGPT扩展程序可以从此处的Chrome在线商店下载：https://chrome.google.com/webstore/detail/talk-to-chatgpt/hodadfhfagpiemkeoliaelelfbboamlk

Android 天气APP（三十五）修复BUG、升级网络请求框架

之前在GoodWeather2.6的时候陆陆续续出现了一些小bug，只不过是一句话就能改好，所以就没有单独写一篇文章来说明，不过当问题积累的多了之后，就有这个必要了。当然这些问题很多并不是我发现的，而是细心的读者发现的。那就不说废话了，进入正题。

您找到你想要的搜索结果了吗？

是的

没有找到

Android 天气APP（三十五）修复BUG、升级网络请求框架

语音打断功能——深入语音识别技术，设计语音用户界面（VUI）

语音打断功能常用于交互式语音应答（IVR）系统，从而用户可以随时中断系统。当系统检测到任意语音时，它都会立即停止播放当前的提示并开始收听用户说话，如下面的示例所示。

语音控制化繁为简，让你在VR中的交互方式更自然

带上VR头显，转动头部寻找有效的文字信息，再控制手柄一一删选，确认最终选项，这是现阶段VR中最常见的一种交互方式，但操作复杂，且不方便，并不符合VR所想带给玩家的那种自然感与沉浸感。在VR交互方面，目

刚刚！OpenAI 在 ChatGPT 中推出新的语音和图像功能，多模态更进一步！

我们正在开始推出 ChatGPT 的新语音和图像功能。它提供了一种新的、更直观的接口类型,允许您进行语音对话或向 ChatGPT 展示您在谈论的内容。

深度解读 | 为何众科技巨头都在抢滩语音识别技术？

大数据文摘作品，转载要求见文末作者 | Alon Bonder 编译 | 蒋宝尚，杨捷，廖远舒上周的科技圈头条几乎都被语音技术抢占：百度AI开发者大会在北京召开，发布DuerOS对话式人工智能系统，搭载DuerOS的设备可让用户以自然语言对话的方式进行人机交互；同天下午，阿里人工智能实验室召开了新品发布会，发布第一款智能音箱产品天猫精灵 X1，这款音箱内置智能语音助手AliGenie，能够听懂中文普通话语音指令，并实现智能家居控制、语音购物、手机充值、音乐播放等功能。国内两大公司先后发布智能语音产品，

DJI和GoPro运动相机语音控制对比和语音控制技术和创新应用的探讨

作为运动相机，必须要满足运动场景下的HANDS-FREE解放双手的操作，而语音则以用户最自然的方式，赋予用户直观，强大和自然的人机交互方式。

Windows Phone SDK 8.0 新特性-Speech

1. 引言随着Windows Phone SDK 8.0的发布，其包含的新特性也受到了广大开发者的关注，其中之一就是语音方面的提升。其实在Windows Phone SDK 8.0发布之前，Kinect for Windows也更新了其SDK，支持了其他新的语言，可惜没有看到支持中文的选项。而Windows Phone SDK 8.0的Speech中包含了中文的支持，这点令我们中文用户感受到了MS对中国市场的重视。这点大家可以在Windows Phone 8 模拟器中看到，将模拟器的语言设置为中文

010

最佳实践 | 零基础实现小程序语音输入法

可以看到，语音识别的应用场景越来越广泛，我们在做小程序开发的时候，也经常会遇到使用语音识别的场景；其中语音输入法是非常基础的功能场景，如果能实现这个基础功能，那其他场景都可以基于这个功能来打造更有趣的小程序服务。

基于嵌入式Linux的移动机器人控制系统

随着科学技术的发展和社会的需要，移动机器人技术得到了迅速发展，正在渗透到各行各业中，使人们的生活更加便利。现今以单片机为核心的移动机器人存在处理数据量有限、控制系统速度低、人机交互机制单一等缺点，不能满足机器人多任务的要求。系统中增加协处理器的系统结构也得到了广泛应用，虽然可以管理多种传感器，但这种结构却增加了硬件的冗余度和复杂度，见参考文献。为此，提出了以嵌入式处理器S3C2440为核心的多任务机器人控制系统。 1 控制系统硬件设计控制系统选用两轮独立驱动小车为移动式机器人平台，后轮为一个尼龙万向轮

吴恩达谈深度学习局限：AI 经济价值目前仅来自监督学习

【新智元导读】《财富》昨日刊登吴恩达专访，吴恩达介绍了百度内部深度学习平台等人工智能应用。吴恩达还指出，近年来 AI 发展主要得益于数据（燃料）和计算力（引擎）的发展，眼下数据比计算力发展稍快（给引擎的燃料还够），但硬件发展日益加快，在某些领域甚至超过了数据（给引擎的燃料不够），要努力保持两者同步发展 AI 才能继续往前。 2016 年 5 月 23 日，《财富》网站刊登了对吴恩达在加州森尼韦尔的百度人工智能实验室接受了《财富》杂志的专访，他谈了几个问题：（1）为什么现在人工智能这么火；（2）企业是如何利

013

最佳实践 | 用腾讯云AI语音识别零基础实现小程序语音输入法

先回顾下，生活、工作中你使用过哪些语音识别相关的产品或者服务？培训/考试相关的小程序，使用语音识别来判断回答是否正确；英语口语练习的小程序，使用语音识别来打分；你画我猜类的小程序，使用语音识别来判断是否猜对；活动营销类的小程序，比如口令识别、口令红包等；直播/短视频类小程序，使用语音识别生成字幕；客服类的小程序，使用语音识别、语音合成来实现智能客服。可以看到，语音识别的应用场景越来越广泛，我们在做小程序开发的时候，也经常会遇到使用语音识别的场景；其中语音输入法是非常基础的功能场景，如果能实

吴恩达谈深度学习局限：AI 经济价值目前仅来自监督学习

《财富》近日刊登吴恩达专访，吴恩达介绍了百度内部深度学习平台等人工智能应用。吴恩达还指出，近年来 AI 发展主要得益于数据（燃料）和计算力（引擎）的发展，眼下数据比计算力发展稍快（给引擎的燃料还够），

Monkey测试4——Monkey命令行可用的全部选项

谷歌开放人工智能语言处理技术

据投资资讯网VentureBeat (http://venturebeat.com/)报道，谷歌从2016年5月12日起开放SyntaxNet的源代码，作为谷歌TensorFlow开源机器学习资料库的一部分。SyntaxNet是一款自然语言理解（NLU）软件，可用于自动分析语句。本次公开包括训练新模型的代码，以及用于分析英语语言文本的预训练模型。据谷歌称，这款分析器是全球最准确的解析器，可自动分辨单词词性，其准确率堪比人类语言学家。对于自然语言研究界而言，此举意义重大。而这对谷歌也非常重要。Ventur

Google发布最新「语音命令」数据集，可有效提高关键词识别系统性能

图源：unsplash 来源 | 雷克世界（公众号ID：raicworld）编译 | 嗯~是阿童木呀、EVA 导语：在本文中，我们描述了Google最新发布的一个用于帮助训练和评估关键词识别系统的口语词汇组成的音频数据集。讨论了为什么这个任务是一个有趣的挑战，以及为什么它需要一个专门的，与用于对完整句子进行自动语音识别的传统数据集所不同的数据集。我们提出了一种对该任务进行可重复、可比较的精确度指标度量方法。描述了数据是如何被收集和验证的，它所包含的内容，以及其以前的版本和属性。通过报告在该数据集上训练的

谷歌幻灯片可以识别并转录口头报告，创建实时字幕

谷歌正在为其谷歌幻灯片演示程序添加一个新的自动隐藏式字幕功能，该程序可以通过口语创建实时字幕。

AI公开课丨语音识别初探——基础理论与关键技术

随着物联网技术和智能设备技术的快速发展，人与机器的交互，不再仅依赖于鼠标和键盘，更有可能的是直接采用语音。这其中的关键技术就是自动语音识别（Automatic Speech Recognition，ASR）。其所要完成的工作，简单地说，就是在与机器进行语音交流时，能够让机器听懂你在说什么。但语音识别技术的发展日新月异，新的理论和方案不断出现，读者除了掌握基本原理，也亟须了解语音识别最新的前沿技术，例如加权有限状态转换器（WFST）、端到端（E2E）语音识别等。本次博文视点学院公开课，我们特邀厦门大

iOS 10中如何搭建一个语音转文字框架

原文：Building a Speech-to-Text App Using Speech Framework in iOS 10

HarmonyOS学习路之开发篇—AI功能开发（语音识别）

语音识别功能提供面向移动终端的语音识别能力。它基于华为智慧引擎（HUAWEI HiAI Engine）中的语音识别引擎，向开发者提供人工智能应用层API。该技术可以将语音文件、实时语音数据流转换为汉字序列，准确率达到90%以上（本地识别95%）。

APP测试之Monkey压力测试（一）

Monkey意指猴子，顽皮淘气。所以Monkey测试，顾名思义也就像猴子一样在软件上乱敲按键，猴子什么都不懂，就爱捣乱。Monkey原理也是类似，通过向系统发送伪随机的用户事件流（如按键输入、触摸屏输入、滑动Trackball、手势输入等操作），来对设备上的程序进行压力测试，检测程序多久的时间会发生异常。

APP测试之Monkey压力测试（一）

专访 | 语音助手的涅槃关头，我们应该完全抛弃屏幕还是选择“语音+图形界面”？

AI科技评论按：距离苹果Siri的推出已经快6年了，期间很多智能手机厂商也纷纷将语音助手列为卖点之一，但是其使用率一直不高，究其原因，还是语音助手的功能有限。不过随着深度学习带来的技术进展，以及亚马逊

Appium+python自动化（十九）- 猴哥失散多年的混血弟弟还是妹妹- Monkey（猴子）参数（超详解）

前边几篇介绍了Monkey以及Monkey的事件，今天就给小伙伴们介绍和分享一下Monkey的参数。

使用 Web Speech API 和 ChatGPT API 开发一个智能语音机器人

随着 AI 的不断发展，我们前端工程师也可以开发出一个智能语音机器人，下面是我开发的一个简单示例，大家可以访问这个视频地址查看效果。

最佳实践 | 基于腾讯云MRCP-Server打造简单智能外呼系统

智能外呼在国内已发展多年，整体的技术早已非常成熟。那么一个简单的智能外呼系统应该包含哪些东西呢？

010

拍照、说话就能查询垃圾分类，这个技能你get到了吗~

最近上海垃圾分类成为了热门话题，身为程序猿的袁小威思前想后总觉得应该做些啥子，最后就说干就干，开发了这个小程序——垃圾分类引导指南（支付宝上叫袁小威垃圾分类指南，目前迭代至第二版）。

金拱门使用智能语音点餐惹大祸，被控告侵犯顾客生物信息隐私，可能面临巨额罚款！

今年四月，伊利诺伊州麦当劳的一位顾客对麦当劳提起诉讼，称该公司在使用语音识别点餐之前没有事先获得批准，违反了州生物信息隐私法案。

语音隐私问题

最近几年，语音技术的普及率激增。然而，伴随着这种增长的是制造语音控制设备的科技公司对语音数据的收集。因此，消费者和企业对语音隐私的担忧越来越大。

基于腾讯云智能语音的实时语音识别微信小程序的开发

本文介绍了一种基于腾讯云智能语音的实时语音识别微信小程序的开发和实现。该小程序使用Wafer服务器进行音频文件的上传和识别，利用腾讯云的语音识别API进行实时语音转文字，并将识别结果展示在小程序中。具体实现包括搭建项目结构、配置服务器、上传音频文件、添加识别和转文字功能、以及处理异常情况等。该小程序可以方便地在手机端进行调试和体验。

085

Android 测试工具——Monkey参数

常规类参数包括帮助参数和日志信息参数。帮助参数用于输出Monkey命令使用指导；日志信息参数将日志分为三个级别，级别越高，日志的信息越详细。

译 | .NET Core 3.0 对诊断的改进

在 .NET Core 3.0 中，我们将引入一套工具，这些工具利用 .NET 运行时中的新功能，使诊断和解决性能问题变得更加容易。

蓦然认知龚思颖：定位“对话即应用”，在应用场景中实现“对话”的真正落地 | 镁客请讲

在龚思颖看来，蓦然认知所要做的就是，基于NLP和NLU技术打造智能搜索引擎，自动连接服务，做内容与服务的分发。在以联合创始人身份进入蓦然认知之前，龚思颖担任的是大疆北美地区人力资源及客户关系负责人。可以说，对于人工智能行业，她没有真正的进入过。也因此，在创始人戴帅湘找到她的时候，她虽然看好但也没有一口答应，而是拿着BP向周边的投资人和算法工程师朋友咨询了一圈，均得到了积极的反馈。彼时，因为周边朋友的影响，龚思颖也动起了“进一步接触中国科技”的念头。多种因素交叉之下，她最终决定回国并加入蓦然认知。图 |

汽车AI语音交互正在让机器交互更接近真人交互

“重复唤醒，答非所问，这不是人工智能，是‘人工智障智障’。”这是大部分智能网联汽车用户对语音交互的抱怨。

2019谷歌I/O大会：两款全新Pixel，Android Q出炉，让AI无处不在

一年一度的谷歌I/O大会终于到来，这场科技盛会吸引了全球各地的开发者和用户，这次，整个大会都围绕着各种AI技术，可以说谷歌越来越离不开AI了。

这一篇就够了 python语音识别指南终极版

【导读】亚马逊的 Alexa 的巨大成功已经证明：在不远的将来，实现一定程度上的语音支持将成为日常科技的基本要求。整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是，在 Python 程序中实现语音识别非常简单。阅读本指南，你就将会了解。你将学到：

Python语音识别终极指北，没错，就是指北！

整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是，在 Python 程序中实现语音识别非常简单。阅读本指南，你就将会了解。你将学到：

python语音识别终极指南

【导读】亚马逊的 Alexa 的巨大成功已经证明：在不远的将来，实现一定程度上的语音支持将成为日常科技的基本要求。整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是，在 Python 程序中实现语音识别非常简单。阅读本指南，你就将会了解。你将学到： •语音识别的工作原理； •PyPI 支持哪些软件包; •如何安装和使用 SpeechRecognition 软件包——一个功能全面且易于使用的 Python 语音识别库。 ▌语言识别工作原理概述语音识别源于 20 世纪

Python语音识别终极指南

译者 | 廉洁编辑 | 明明出品 | AI科技大本营（公众号ID：rgznai100）【AI科技大本营导读】亚马逊的 Alexa 的巨大成功已经证明：在不远的将来，实现一定程度上的语音支持将成为日常科技的基本要求。整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是，在 Python 程序中实现语音识别非常简单。通过本指南，你将学到：语音识别的工作原理； PyPI 支持哪些软件包; 如何安装和使用 SpeechRecognition 软件包——一个功能全面且易于

python语音识别终极指南

译者 | 廉洁编辑 | 明明【AI科技大本营导读】亚马逊的 Alexa 的巨大成功已经证明：在不远的将来，实现一定程度上的语音支持将成为日常科技的基本要求。整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是，在 Python 程序中实现语音识别非常简单。阅读本指南，你就将会了解。你将学到： •语音识别的工作原理； •PyPI 支持哪些软件包; •如何安装和使用 SpeechRecognition 软件包——一个功能全面且易于使用的 Python 语音识别库。

Python语音识别终极指北，没错，就是指北！

--AI科技大本营-- 整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是，在 Python 程序中实现语音识别非常简单。阅读本指南，你就将会了解。你将学到： •语音识别的工作原理； •PyPI 支持哪些软件包; •如何安装和使用 SpeechRecognition 软件包——一个功能全面且易于使用的 Python 语音识别库。 ▌语言识别工作原理概述语音识别源于 20 世纪 50 年代早期在贝尔实验室所做的研究。早期语音识别系统仅能识别单个讲话者以及只有约十几个单

Python语音识别终极指北，没错，就是指北！

整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是，在 Python 程序中实现语音识别非常简单。阅读本指南，你就将会了解。你将学到： •语音识别的工作原理； •PyPI 支持哪些软件包; •如何安装和使用 SpeechRecognition 软件包——一个功能全面且易于使用的 Python 语音识别库。 ▌语言识别工作原理概述语音识别源于 20 世纪 50 年代早期在贝尔实验室所做的研究。早期语音识别系统仅能识别单个讲话者以及只有约十几个单词的词汇量。现代语音识

Common Voice开源语音识别数据集项目范围再扩大，开始建立多语言数据集

Common Voice项目旨在创建开源语音识别数据集，Mozilla宣布它正在扩大此众包项目，以加入更多语言。

语音关键词检测方法综述【附PPT与视频资料】

随着智能音箱、语音助手等应用的出现，普通人也可以像科幻场景一样使用语音与机器进行交流。语音关键词检测是实现人机语音交互的重要技术，被广泛地应用于各类智能设备、语音检索系统当中。语音关键词检测可以分成两种，一种是用于设备唤醒、设备控制keyword spotting；一种是应用于语音文档检索的spoken termdetection，二者虽然名字类似，但从功能侧重和技术路线上都有所区别。本次分享介绍语音关键词检测的主要方法与最新进展。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐