会议语音转文字方言 - 腾讯云开发者社区

文章/答案/技术大牛

发布

7回答

目前国内的语音识别技术达到了什么水准？还存在哪些问题？

现在技术越来越厉害了，前几年还感觉语音打字特别不靠谱，各种语音助手也相当蠢萌，想问下现在国内语音识别发展到什么水平了？实时且准确的将语音转化成相对应的文本已经达到了什么样的水准？

浏览 2379提问于2018-08-06

0回答

语音识别支持的功能？

我是腾讯云合作伙伴上海安畅的产品经理，目前接到客户有语音识别的需求，能否加一下你们的微信。我的微信号shisanshao0002。能支持识别排版吗

浏览 238提问于2018-09-05

1回答

录音时注意

、、

我正在寻找一个Android的语音记录器软件，这将允许我做笔记，这将是与录音时间戳。我开始录音这个声音。1分钟后，我写了一个便条：“你好”。25分钟后，我又写了一个笔记“这是个测试”。

浏览 0提问于2015-10-30得票数 2

1回答

可以在Twilio呼叫中访问实时音频流吗？

、

Twilio可以提供，但这不是实时的。是否有可能编写一个应用程序，实时处理调用者的音频，并在处理音频后做出响应？我希望有一些软件“倾听”，并以编程的方式作出反应。

浏览 1提问于2015-05-12得票数 11

回答已采纳

2回答

如何评估语音到文本数据的质量，而不访问真正的标签？

、、、

在某些情况下，它只不过是胡言乱语，往往是由于机器无法处理的不同方言。我们无法访问原始记录(数据隐私)，因此无法获取或创建真正的标签。正如我们所承诺的那样，这个制度是不能被取代的。

浏览 0提问于2021-01-24得票数 2

2回答

tts文本转语音出现音频最后停顿声音，请问如何解决？

、、、、

tts文本转语音出现音频最后停顿声音，请问如何解决？音频如下： tencentAi_1.zip

浏览 1220提问于2019-04-29

1回答

如何在Skype中使用合成语音进行呼叫

、、、

我的目标是在Skype通话中使用合成语音。这可以用于一种场景，例如同时举行两次会议(一次本地会议，一次远程会议)，而不能大声发言(在本地会议中)。这是可行的，但在远程会议产生的声音，然后立即返回给我，进入耳机的监视器音频流，然后返回到Skype作为输入！所以，这是个回声问题。我需要更直接的东西。我怎么能把合成声音的声音直接输入Skype呢？

浏览 0提问于2014-09-02得票数 2

回答已采纳

2回答

R在tm包中分割文本-识别扬声器

、、、

我正在努力找出国会演讲中使用频率最高的词语，并由国会议员将它们分开。我刚刚开始学习R和tm包。我有一个可以找到最常用单词的代码，但是我可以使用哪种代码来自动识别和存储语音的说话人呢？我希望能够得到这些名字，或由人单独的文字。希望你能帮助我。非常感谢。

浏览 1提问于2012-01-11得票数 1

5回答

用语音识别软件编程

几年前，我很简单地用了“龙”这个词，当时我在想，这是否是一个可行的编程解决方案？同样的问题的回答是这样的，但没有得到答复。

浏览 0提问于2012-05-16得票数 10

回答已采纳

1回答

Unihan:组合UTF-8字符

、、

我正在使用一个语音识别程序(cmusphinx)，它可以从我的数据中返回一个短语。它返回UTF-8字符，当返回一个中文字符(三个字节)时，它将其分成三个单独的字符。例如:当我想要人时，我看到：‰∫∫。我尝试使用Objective-C的内置转换方法(到UTF-8和从UTF-16转换)，但这些方法使我的字符串保持为三个字符。如何将这三个独立的字符解码为一个utf-8码点的中文字符？

浏览 1提问于2011-10-29得票数 0

回答已采纳

2回答

单程呼叫思科7936

我们一直在经历一个问题，从我们的思科7936会议电话单向VOIP电话，直到最近。最初，电话开始正常，但几分钟后，远程腿下降，他们无法听到我们。这适用于内部和外部调用。

浏览 0提问于2016-12-14得票数 1

8回答

有没有办法记录Google相会现场字幕？

、、

有没有办法记录(并保存)这个全部/全部会议记录记录？

浏览 0提问于2019-10-18得票数 6

1回答

任何Smalltalk方言的时间格式(HH:MM:SS)

、、

我有三个整数，比如说m := 19.我想要生成字符串'03:19:08'。我知道如何把一个数字转换成一个字符串，如果有必要的话，我甚至可以用一个零来填充它。因此，作为第一遍，我写了这个绝对可怕的代码：m < 10 ifTrue: [ms := '0', (m asString)] ifFalse: [ms := m asString]. s < 10 i

浏览 2提问于2017-05-23得票数 1

回答已采纳

6回答

android: TTS会说广东话吗？

、、、

当我通过语音(广东话)输入信息时，手机能识别广东话。实际上，是否还有其他方法来执行输出为广东话的TTS？谢谢！！

浏览 14提问于2013-09-20得票数 2

回答已采纳

1回答

想要在我的颤音项目中使用Whisper，并且不确定从哪里开始

、、、

关于我想要的应用程序的一些注释:基本上是一个笔记应用程序，记录一个讲座或会议或其他什么，并为你抄写课文，加上一些额外的功能。我希望在本地处理所有的语音，以确保其脱机工作，并减少应用程序对云服务的依赖。我正在尝试使用，一种新的文字软件，在本地处理所有的东西，这是我的应用程序所必需的。

浏览 12提问于2022-10-12得票数 -1

2回答

在语音生成中添加重音

、、、、

这个问题的第一部分现在是它自己的，在这里：我想出的是：这实际上更像是一个通用的DSP问题，但我想提出一个编程算法来完成这个任务，而不是一般的想法。

浏览 11提问于2012-03-15得票数 8

回答已采纳

2回答

关于通过多边化进行飞机跟踪，我有以下问题:我们设法实现了一些算法，使用3或4个接收器来计算基于多边化的飞机位置。问题是，这首曲目看起来相当“摇摇欲坠”(请看链接中的图片，很抱歉我不能在这里添加它，因为声誉。) 什么是平滑赛道的好方法？我偶然发现了卡尔曼滤波器。我不是一个数学家，也没有任何机器人或类似的经验。这个级别的数学对我来说是非常难理解的(我很高兴我很好地处理了多边化)。航迹的计算采用闭式算法。也许切换到迭代算法也会有所帮助？那么，在

浏览 2提问于2013-02-06得票数 3

回答已采纳

1回答

如何为语音识别准备音频文本数据

、、

我收集了一些原始的音频，从所有的会议，讲座和随意的谈话，我是其中的一部分。机器转录没有提供良好的结果(从Azure，AWS等)。理想情况下，我将有自己的语音识别系统，干净的板(开放听取建议的模式选择)，但需要知道的格式和风格的数据应该创建。在我看来，音频分割(比方说，将30分钟的音频切割成200部分)可以自动完成，但是如何将文字记录分割成200行呢？(需要手动检查换行。)，因此，对于大型数据集来说，这不是一个很好的选择。

浏览 0提问于2020-08-03得票数 1

点击加载更多