腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
Objective-C中的图像/
语音
识别
、
、
、
、
我正在开发一个具有图像和
语音
识别
的应用程序。你有任何来源或想法如何做到这一点吗? 谢谢,ZaldzBugz
浏览 0
提问于2010-07-15
得票数 4
回答已采纳
1
回答
LoadGrammar
语音
识别
误差
、
在
语音
识别
属性中,我有两个语言选项: Microsoft
语音
识别
器8.0 for Windows (英语-美国)。是否有一个隐藏设置的微软
视觉
C# 2010快车,可以让我改变它从美国到英国?
浏览 1
提问于2013-11-25
得票数 1
1
回答
结束节目后,NAO的眼睛仍然是白的(不要变成蓝色/绿色)
、
当它在听的时候眼睛不会变蓝,当它在
识别
的时候眼睛不会变绿。有没有办法解决这个问题?眼睛颜色指示非常有用。
浏览 3
提问于2018-03-21
得票数 0
1
回答
上采样/内插视频特征的简单技术?
、
、
我正在尝试同时分析音频和
视觉
特征。我的音频
语音
特征是使用隐马尔可夫模型工具包以100fps采样的mel频率倒谱系数。我的
视觉
特征来自我构建的嘴唇跟踪程序,采样速度为29.97fps。我知道我需要插入我的
视觉
特征,以便采样率也是100fps,但我找不到一个很好的解释或在线教程如何做到这一点。我发现的大多数帮助来自
语音
识别
社区,他们代表读者假设有插值知识,即大多数人用一个简单的“插值
视觉
特征,以便采样率等于100fps”来覆盖这一步骤。万分感
浏览 0
提问于2011-09-22
得票数 0
2
回答
绝对定位对
语音
激活软件的影响
、
、
、
、
在网站上使用绝对定位会对
语音
激活软件产生负面影响吗?我为一家公司工作,他们已经评估了他们网站的可访问性。其中一项评论是: 这里显示的滴答框不是龙捡起来的。这意味着,
语音
激活用户需要使用键盘命令,以标签到它们上。通过在CSS中实现以下操作,确保
语音
激活用户能够访问这些复选框:.checkbox__input { /*位置:绝对;*/ /*:指针;/*左: 0;*/ /*顶部: 0;*/宽度:38 to;高度:38他们的评论向我暗示,在内容上使用
语音</
浏览 2
提问于2018-09-14
得票数 1
回答已采纳
1
回答
是否有云服务来支持图像特征
识别
?
、
、
、
、
现在,我的主要问题是,我需要一个系统或云服务来帮助我
识别
图像,我不想做太多的事情,那么是否有现有的云服务来支持我这样做?免费或付费都可以。
浏览 1
提问于2015-08-03
得票数 0
1
回答
人脸
识别
只是
视觉
AI 落地的开始,技术融合或成
视觉
AI落地未来趋势?
人脸
识别
只是
视觉
AI 落地的开始 作为一个天然入口,人脸
识别
已普遍应用在手机刷脸、刷脸考勤、人脸门禁、刷脸过关、人证比对等实际场景中。从实质上来说,人脸
识别
是
视觉
AI领域中一项
视觉
认知技术。
视觉
认知是指通过深度学习让机器可以用镜头感知世界,它可以用于
识别
场景,如分析到画面是在海边、草原、会议室、学校。值得一提的是,近期还发布的一项非常有趣的生物
识别
技术。
视觉
AI技术提供商ArcSoft虹软发布了全新的“猪脸
识
浏览 286
提问于2018-06-30
2
回答
开放源码的性别
识别
工具.使用声音
识别
、
、
、
晚上好,我正在和Kinect一起做一个项目,我需要用传感器的麦克风捕捉到的声音信息来进行性别
识别
。
识别
也可以是基于文本的,即用户说的句子总是一样的。我“只是”需要男性/女性的二元答案。
浏览 1
提问于2012-05-02
得票数 3
回答已采纳
1
回答
Google -将应用程序上下文中的菜单触发器“ok玻璃”
语音
触发器替换为实际的顶级菜单选择作为
语音
触发器。
、
我见过几个例子,在电话中,
语音
识别
器作为后台服务运行--不断地监听和处理
语音
。我不知道在当前的GDK中实现这样的服务是否受到限制。
浏览 5
提问于2014-10-21
得票数 0
回答已采纳
1
回答
如何帮助Google Assistant
识别
我的操作名称?
我已经创建了一个名为序列的操作。该名称是单词sequence和automatic的组合。 不幸的是,当谷歌要求谷歌“与序列对话”时,它很难辨认出这个名字。 我能做些什么来帮助你认出这个名字吗?
浏览 13
提问于2020-03-25
得票数 1
3
回答
人脸、情感和
语音
识别
、
、
、
我正在寻找一种好的C#的人脸、情感和
语音
识别
方法。对于人脸
识别
,我很早就使用了Emgu CV,它不准确,在弱光条件下性能非常低。我还需要找到用户的情绪。无论是悲伤还是快乐。另外,对于
语音
识别
,我还找不到任何解决方案,我找到了
语音
识别
,但它不是我需要的。 我不想使用任何在线API。有没有人能推荐我一些SDK或算法,用来实现人脸、情感和
语音
识别
?
浏览 4
提问于2012-06-13
得票数 6
回答已采纳
2
回答
文本分析与自然语言处理有什么区别?
、
、
今天我度过了一个艰难的夜晚,试图说服我的一位同事,NLP或自然语言处理程序是超级集,Text Analytics是其中的一个子集。在最好的情况下,两者可能是同义词,可以互换使用。
浏览 3
提问于2017-08-22
得票数 1
1
回答
如何在Android上使用pocketsphinx添加音素
识别
、
、
、
我正在做一个关于线索
语音
的项目(这是一种与失聪或重听人之间使用的交流的
视觉
系统)。我已经学习了有关音素
识别
(pocketsphinx_continuous)的教程,它在安卓系统上运行良好。我现在在Android上工作,但这个项目的最终目标是让它在谷歌眼镜上工作。最好的情况是在设备上写下
语音
(更接近实时)和3D头像,它将根据
识别
的音素再现正确的手形和嘴唇移动。(这就是为什么我需要使用音素,而不是单词it本身)具
浏览 4
提问于2014-11-28
得票数 0
1
回答
如何将扫描的图像还原为一致的哈希?
、
、
我希望能够扫描图像并将其减少为一致的散列,以便随后与新的扫描进行比较,以查看两个图像是否相同。
浏览 4
提问于2012-08-17
得票数 1
2
回答
离线
语音
识别
可以提供个
识别
本地
语音
数据的demo吗?本地
语音
数据的如何填充到boby中呢?
离线
语音
识别
可以提供个
识别
本地
语音
数据的demo吗?本地
语音
数据的如何填充到boby中呢?
浏览 571
提问于2018-04-28
1
回答
基于embeddedTTS的安卓系统离线
语音
识别
、
我有兴趣看看离线
语音
识别
是否可能使用Android上的谷歌TTS,并试图做到这一点,但没有成功。当我连接到网络时,
语音
识别
工作得很好,但我需要让它离线工作。它返回了两个特性:用于谷歌文本
语音
转换引擎的embeddedTts和networkTts,因此embeddedTts特性是可用的。
浏览 4
提问于2013-02-14
得票数 1
2
回答
SFSpeechRecognizer需要互联网连接吗?
、
、
SFSpeechRecognizer是像Siri那样在苹果服务器上进行处理,还是在iPhone上本地完成?
浏览 9
提问于2016-06-20
得票数 3
回答已采纳
1
回答
Android
语音
活动离线检测
、
、
我从这里读到一条的提示,上面说我可以“下载离线
语音
识别
”,但我不知道这是否足以满足我的需要。我对信号处理和分类有一定的了解,我认为我可以使用Android AudioRecord类开发
语音
活动检测,但是我想首先知道SpeechRecognizer是否允许离线检测(以及它是如何做到的),这样我就可以节省时间
浏览 3
提问于2013-06-18
得票数 1
回答已采纳
1
回答
购买了
语音
识别
,怎么使用呢?
浏览 423
提问于2021-01-24
1
回答
COS+离线
识别
这个是只要我在对象存储管理上传文件,后台就会自动触发
识别
,并且把结果写到cos上吗?
、
请描述您的问题地址:https://cloud.tencent.com/document/product/441/6199
浏览 162
提问于2018-03-12
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
微软沈向洋预测:语音识别视觉识别10年内将完胜人类
超强实体ChatGPT机器人:语音推理、视觉识别,“终结者”来啦!
如何语音识别翻译?语音识别翻译软件哪个好?
在线语音识别和离线语音识别各有哪些特点
语音识别小车
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券