腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(66)
视频
沙龙
7
回答
目前国内的
语音
识别技术达到了什么水准?还存在哪些问题?
现在技术越来越厉害了,前几年还感觉
语音
打字特别不靠谱,各种
语音
助手也相当蠢萌,想问下现在国内
语音
识别发展到什么水平了? 实时且准确的将
语音
转化成相对应的文本已经达到了什么样的水准?
浏览 2379
提问于2018-08-06
0
回答
语音
识别支持的功能?
我是腾讯云合作伙伴上海安畅的产品经理,目前接到客户有
语音
识别的需求,能否加一下你们的微信。我的微信号shisanshao0002。能支持识别排版吗
浏览 238
提问于2018-09-05
1
回答
录音时注意
、
、
我正在寻找一个Android的
语音
记录器软件,这将允许我做笔记,这将是与录音时间戳。 我开始录音这个声音。1分钟后,我写了一个便条:“你好”。25分钟后,我又写了一个笔记“这是个测试”。
浏览 0
提问于2015-10-30
得票数 2
1
回答
语音
识别支持什么语言?
浏览 251
提问于2022-06-15
1
回答
语音
识别支持
方言
语音
转
普通话
语音
吗?
浏览 156
提问于2022-06-15
3
回答
可以在Twilio呼叫中访问实时音频流吗?
、
Twilio可以提供,但这不是实时的。是否有可能编写一个应用程序,实时处理调用者的音频,并在处理音频后做出响应?我希望有一些软件“倾听”,并以编程的方式作出反应。
浏览 1
提问于2015-05-12
得票数 11
回答已采纳
2
回答
如何评估
语音
到文本数据的质量,而不访问真正的标签?
、
、
、
在某些情况下,它只不过是胡言乱语,往往是由于机器无法处理的不同
方言
。我们无法访问原始记录(数据隐私),因此无法获取或创建真正的标签。正如我们所承诺的那样,这个制度是不能被取代的。
浏览 0
提问于2021-01-24
得票数 2
2
回答
tts文本转
语音
出现音频最后停顿声音,请问如何解决?
、
、
、
、
tts文本转
语音
出现音频最后停顿声音,请问如何解决?音频如下: tencentAi_1.zip
浏览 1220
提问于2019-04-29
1
回答
如何在Skype中使用合成
语音
进行呼叫
、
、
、
我的目标是在Skype通话中使用合成
语音
。这可以用于一种场景,例如同时举行两次
会议
(一次本地
会议
,一次远程
会议
),而不能大声发言(在本地
会议
中)。这是可行的,但在远程
会议
产生的声音,然后立即返回给我,进入耳机的监视器音频流,然后返回到Skype作为输入!所以,这是个回声问题。 我需要更直接的东西。我怎么能把合成声音的声音直接输入Skype呢?
浏览 0
提问于2014-09-02
得票数 2
回答已采纳
2
回答
R在tm包中分割文本-识别扬声器
、
、
、
我正在努力找出国会演讲中使用频率最高的词语,并由国
会议
员将它们分开。我刚刚开始学习R和tm包。我有一个可以找到最常用单词的代码,但是我可以使用哪种代码来自动识别和存储
语音
的说话人呢?我希望能够得到这些名字,或由人单独的
文字
。希望你能帮助我。非常感谢。
浏览 1
提问于2012-01-11
得票数 1
5
回答
用
语音
识别软件编程
几年前,我很简单地用了“龙”这个词,当时我在想,这是否是一个可行的编程解决方案?同样的问题的回答是这样的,但没有得到答复。
浏览 0
提问于2012-05-16
得票数 10
回答已采纳
1
回答
Unihan:组合UTF-8字符
、
、
我正在使用一个
语音
识别程序(cmusphinx),它可以从我的数据中返回一个短语。它返回UTF-8字符,当返回一个中
文字
符(三个字节)时,它将其分成三个单独的字符。例如:当我想要人时,我看到:‰∫∫。我尝试使用Objective-C的内置转换方法(到UTF-8和从UTF-16
转
换),但这些方法使我的字符串保持为三个字符。 如何将这三个独立的字符解码为一个utf-8码点的中
文字
符?
浏览 1
提问于2011-10-29
得票数 0
回答已采纳
2
回答
单程呼叫思科7936
我们一直在经历一个问题,从我们的思科7936
会议
电话单向VOIP电话,直到最近。 最初,电话开始正常,但几分钟后,远程腿下降,他们无法听到我们。这适用于内部和外部调用。
浏览 0
提问于2016-12-14
得票数 1
8
回答
有没有办法记录Google相会现场字幕?
、
、
有没有办法记录(并保存)这个全部/全部
会议
记录记录?
浏览 0
提问于2019-10-18
得票数 6
1
回答
任何Smalltalk
方言
的时间格式(HH:MM:SS)
、
、
我有三个整数,比如说m := 19.我想要生成字符串'03:19:08'。我知道如何把一个数字转换成一个字符串,如果有必要的话,我甚至可以用一个零来填充它。因此,作为第一遍,我写了这个绝对可怕的代码:m < 10 ifTrue: [ms := '0', (m asString)] ifFalse: [ms := m asString]. s < 10 i
浏览 2
提问于2017-05-23
得票数 1
回答已采纳
6
回答
android: TTS会说广东话吗?
、
、
、
当我通过
语音
(广东话)输入信息时,手机能识别广东话。实际上,是否还有其他方法来执行输出为广东话的TTS? 谢谢!!
浏览 14
提问于2013-09-20
得票数 2
回答已采纳
1
回答
想要在我的颤音项目中使用Whisper,并且不确定从哪里开始
、
、
、
关于我想要的应用程序的一些注释:基本上是一个笔记应用程序,记录一个讲座或
会议
或其他什么,并为你抄写课文,加上一些额外的功能。我希望在本地处理所有的
语音
,以确保其脱机工作,并减少应用程序对云服务的依赖。 我正在尝试使用,一种新的
文字
软件,在本地处理所有的东西,这是我的应用程序所必需的。
浏览 12
提问于2022-10-12
得票数 -1
2
回答
在
语音
生成中添加重音
、
、
、
、
这个问题的第一部分现在是它自己的,在这里:我想出的是: 这实际上更像是一个通用的DSP问题,但我想提出一个编程算法来完成这个任务,而不是一般的想法。
浏览 11
提问于2012-03-15
得票数 8
回答已采纳
2
回答
使用卡尔曼滤波器进行多边形航迹平滑?
、
、
、
关于通过多边化进行飞机跟踪,我有以下问题:我们设法实现了一些算法,使用3或4个接收器来计算基于多边化的飞机位置。问题是,这首曲目看起来相当“摇摇欲坠”(请看链接中的图片,很抱歉我不能在这里添加它,因为声誉。) 什么是平滑赛道的好方法?我偶然发现了卡尔曼滤波器。我不是一个数学家,也没有任何机器人或类似的经验。这个级别的数学对我来说是非常难理解的(我很高兴我很好地处理了多边化)。航迹的计算采用闭式算法。也许切换到迭代算法也会有所帮助? 那么,在
浏览 2
提问于2013-02-06
得票数 3
回答已采纳
1
回答
如何为
语音
识别准备音频文本数据
、
、
我收集了一些原始的音频,从所有的
会议
,讲座和随意的谈话,我是其中的一部分。机器转录没有提供良好的结果(从Azure,AWS等)。理想情况下,我将有自己的
语音
识别系统,干净的板(开放听取建议的模式选择),但需要知道的格式和风格的数据应该创建。在我看来,音频分割(比方说,将30分钟的音频切割成200部分)可以自动完成,但是如何将
文字
记录分割成200行呢?(需要手动检查换行。),因此,对于大型数据集来说,这不是一个很好的选择。
浏览 0
提问于2020-08-03
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
云直播
活动推荐
运营活动
广告
关闭
领券