视觉语音识别 - 腾讯云开发者社区

文章/答案/技术大牛

发布

3回答

Objective-C中的图像/语音识别

iphone、objective-c、speech-recognition、image-recognition、voice-recognition

我正在开发一个具有图像和语音识别的应用程序。你有任何来源或想法如何做到这一点吗？谢谢，ZaldzBugz

浏览 0提问于2010-07-15得票数 4

回答已采纳

1回答

LoadGrammar语音识别误差

c#、speech-recognition

在语音识别属性中，我有两个语言选项： Microsoft语音识别器8.0 for Windows (英语-美国)。是否有一个隐藏设置的微软视觉C# 2010快车，可以让我改变它从美国到英国？

浏览 1提问于2013-11-25得票数 1

1回答

结束节目后，NAO的眼睛仍然是白的(不要变成蓝色/绿色)

nao-robot、choregraphe

当它在听的时候眼睛不会变蓝，当它在识别的时候眼睛不会变绿。有没有办法解决这个问题？眼睛颜色指示非常有用。

浏览 3提问于2018-03-21得票数 0

1回答

上采样/内插视频特征的简单技术？

signal-processing、interpolation、hidden-markov-models

我正在尝试同时分析音频和视觉特征。我的音频语音特征是使用隐马尔可夫模型工具包以100fps采样的mel频率倒谱系数。我的视觉特征来自我构建的嘴唇跟踪程序，采样速度为29.97fps。我知道我需要插入我的视觉特征，以便采样率也是100fps，但我找不到一个很好的解释或在线教程如何做到这一点。我发现的大多数帮助来自语音识别社区，他们代表读者假设有插值知识，即大多数人用一个简单的“插值视觉特征，以便采样率等于100fps”来覆盖这一步骤。万分感

浏览 0提问于2011-09-22得票数 0

2回答

绝对定位对语音激活软件的影响

css、css-position、accessibility、absolute、voice-recognition

在网站上使用绝对定位会对语音激活软件产生负面影响吗？我为一家公司工作，他们已经评估了他们网站的可访问性。其中一项评论是：这里显示的滴答框不是龙捡起来的。这意味着，语音激活用户需要使用键盘命令，以标签到它们上。通过在CSS中实现以下操作，确保语音激活用户能够访问这些复选框：.checkbox__input { /*位置:绝对；*/ /*：指针；/*左: 0；*/ /*顶部: 0；*/宽度:38 to；高度:38他们的评论向我暗示，在内容上使用语音</

浏览 2提问于2018-09-14得票数 1

回答已采纳

1回答

是否有云服务来支持图像特征识别？

google-app-engine、azure、amazon-web-services、amazon、azure-mobile-services

现在，我的主要问题是，我需要一个系统或云服务来帮助我识别图像，我不想做太多的事情，那么是否有现有的云服务来支持我这样做？免费或付费都可以。

浏览 1提问于2015-08-03得票数 0

2回答

开放源码的性别识别工具.使用声音识别

open-source、speech-recognition、kinect、cmusphinx

晚上好，我正在和Kinect一起做一个项目，我需要用传感器的麦克风捕捉到的声音信息来进行性别识别。识别也可以是基于文本的，即用户说的句子总是一样的。我“只是”需要男性/女性的二元答案。

浏览 1提问于2012-05-02得票数 3

回答已采纳

1回答

Google -将应用程序上下文中的菜单触发器“ok玻璃”语音触发器替换为实际的顶级菜单选择作为语音触发器。

android、google-glass

我见过几个例子，在电话中，语音识别器作为后台服务运行--不断地监听和处理语音。我不知道在当前的GDK中实现这样的服务是否受到限制。

浏览 5提问于2014-10-21得票数 0

回答已采纳

1回答

如何帮助Google Assistant识别我的操作名称？

actions-on-google

我已经创建了一个名为序列的操作。该名称是单词sequence和automatic的组合。不幸的是，当谷歌要求谷歌“与序列对话”时，它很难辨认出这个名字。我能做些什么来帮助你认出这个名字吗？

浏览 13提问于2020-03-25得票数 1

3回答

人脸、情感和语音识别

c#、.net、voice-recognition、face-recognition

我正在寻找一种好的C#的人脸、情感和语音识别方法。对于人脸识别，我很早就使用了Emgu CV，它不准确，在弱光条件下性能非常低。我还需要找到用户的情绪。无论是悲伤还是快乐。另外，对于语音识别，我还找不到任何解决方案，我找到了语音识别，但它不是我需要的。我不想使用任何在线API。有没有人能推荐我一些SDK或算法，用来实现人脸、情感和语音识别？

浏览 4提问于2012-06-13得票数 6

回答已采纳

2回答

文本分析与自然语言处理有什么区别？

nlp、stanford-nlp、uima

今天我度过了一个艰难的夜晚，试图说服我的一位同事，NLP或自然语言处理程序是超级集，Text Analytics是其中的一个子集。在最好的情况下，两者可能是同义词，可以互换使用。

浏览 3提问于2017-08-22得票数 1

1回答

如何在Android上使用pocketsphinx添加音素识别

java、android、speech-recognition、pocketsphinx

我正在做一个关于线索语音的项目(这是一种与失聪或重听人之间使用的交流的视觉系统)。我已经学习了有关音素识别(pocketsphinx_continuous)的教程，它在安卓系统上运行良好。我现在在Android上工作，但这个项目的最终目标是让它在谷歌眼镜上工作。最好的情况是在设备上写下语音(更接近实时)和3D头像，它将根据识别的音素再现正确的手形和嘴唇移动。(这就是为什么我需要使用音素，而不是单词it本身)具

浏览 4提问于2014-11-28得票数 0

1回答

如何将扫描的图像还原为一致的哈希？

c#、image-processing、image-scanner

我希望能够扫描图像并将其减少为一致的散列，以便随后与新的扫描进行比较，以查看两个图像是否相同。

浏览 4提问于2012-08-17得票数 1

2回答

离线语音识别可以提供个识别本地语音数据的demo吗？本地语音数据的如何填充到boby中呢？

语音识别

离线语音识别可以提供个识别本地语音数据的demo吗？本地语音数据的如何填充到boby中呢？

浏览 623提问于2018-04-28

1回答

基于embeddedTTS的安卓系统离线语音识别

android、voice-recognition

我有兴趣看看离线语音识别是否可能使用Android上的谷歌TTS，并试图做到这一点，但没有成功。当我连接到网络时，语音识别工作得很好，但我需要让它离线工作。它返回了两个特性:用于谷歌文本语音转换引擎的embeddedTts和networkTts，因此embeddedTts特性是可用的。

浏览 4提问于2013-02-14得票数 1

2回答

SFSpeechRecognizer需要互联网连接吗？

ios、speech-recognition、ios10

SFSpeechRecognizer是像Siri那样在苹果服务器上进行处理，还是在iPhone上本地完成？

浏览 9提问于2016-06-20得票数 3

回答已采纳

1回答

Android语音活动离线检测

android、speech-recognition、voice-recognition

我从这里读到一条的提示，上面说我可以“下载离线语音识别”，但我不知道这是否足以满足我的需要。我对信号处理和分类有一定的了解，我认为我可以使用Android AudioRecord类开发语音活动检测，但是我想首先知道SpeechRecognizer是否允许离线检测(以及它是如何做到的)，这样我就可以节省时间

浏览 3提问于2013-06-18得票数 1

回答已采纳

1回答

购买了语音识别，怎么使用呢？

语音识别

浏览 490提问于2021-01-24

1回答

COS+离线识别这个是只要我在对象存储管理上传文件，后台就会自动触发识别，并且把结果写到cos上吗？

对象存储、官方文档

请描述您的问题地址：https://cloud.tencent.com/document/product/441/6199

浏览 216提问于2018-03-12

点击加载更多

Objective-C中的图像/语音识别

LoadGrammar语音识别误差

结束节目后，NAO的眼睛仍然是白的(不要变成蓝色/绿色)

上采样/内插视频特征的简单技术？

绝对定位对语音激活软件的影响

是否有云服务来支持图像特征识别？

开放源码的性别识别工具.使用声音识别

Google -将应用程序上下文中的菜单触发器“ok玻璃”语音触发器替换为实际的顶级菜单选择作为语音触发器。

如何帮助Google Assistant识别我的操作名称？

人脸、情感和语音识别

文本分析与自然语言处理有什么区别？

如何在Android上使用pocketsphinx添加音素识别

如何将扫描的图像还原为一致的哈希？

离线语音识别可以提供个识别本地语音数据的demo吗？本地语音数据的如何填充到boby中呢？

基于embeddedTTS的安卓系统离线语音识别

SFSpeechRecognizer需要互联网连接吗？

Android语音活动离线检测

购买了语音识别，怎么使用呢？

COS+离线识别这个是只要我在对象存储管理上传文件，后台就会自动触发识别，并且把结果写到cos上吗？

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐