语音文字转录 - 腾讯云开发者社区

腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

1回答

蔚蓝语翻译:如何激活识别只有当语音被检测到？

、、、、

我目前正在开发一个实时翻译网络应用程序，允许多个参与者使用，并以多种语言分享他们的转录。提前感谢！

浏览 5提问于2021-02-08得票数 1

1回答

对文字引擎的演讲:你有什么经验？

、

我刚刚试用了IBM Watson的演示，用于自动语音到文本的转录。我试着用火狐浏览器实时转录我的声音。大多数情况下，抄写是错误的或缺失的词。我还读到了泰德的演讲是如何转录的，我了解到他们是通过志愿者手工完成的。我想听听那些有演讲和文字引擎经验的人关于他们当前技术现状的经验。它似乎不够好的转录文本的动态，也不够好的转录文本，而没有认真的手动干预。链接到演讲到文本演示

浏览 2提问于2015-11-12得票数 0

回答已采纳

1回答

“捐赠这个语音邮件”和“允许自动谷歌系统分析你的语音邮件”是不是多余的？

如果我“允许自动谷歌系统分析您的语音邮件信息，以帮助提高转录质量”：在编辑成绩单时，是否建议检查“捐赠此语音信箱”选项？📷 我感到惊讶的是，当“允许自动谷歌系统分析语音邮件信息以帮助提高转录质量”时，默认情况下不会检查该选项，这让我怀疑这两种选项之间是否有任何区别。

浏览 0提问于2014-08-12得票数 2

回答已采纳

1回答

Google语音到文本的延迟

、、

这是一个问题，我遇到了使用谷歌语音文字引擎。我目前正在以32 in块实时播放16位/ 16 kHz音频。但是在发送音频和接收记录之间平均有25秒的延迟，这违背了实时转录的目的。

浏览 3提问于2018-07-26得票数 3

回答已采纳

2回答

语音到文本的大型音频文件(Microsoft语音API)

、、、、

使用Microsoft语音API转录中/大型音频文件的最佳方法是什么，每个文件6~10分钟？比如批处理音频文件的转录？顺便说一句，我认为Bing语音API和新的语音服务API没有什么区别，对吗？谢谢大家！

浏览 1提问于2018-06-11得票数 4

回答已采纳

1回答

我收到了不止一份Speech to text IBM云服务的最终文本

、、

我正在Angular的一个项目中使用Speech to text服务，我正在将来自麦克风的语音转换为文本，当我收到转录时，该服务有时会返回不止一个最终的转录。backgroundAudioSuppressio: 0.5, }, ); 在文档中，它提到interimResults是文字记录数量有限的地方，但通过将其放在错误的位置，我没有收到任何文字记录

浏览 16提问于2020-04-18得票数 0

1回答

使用Watson对文本进行连续语音处理

、、、

我以前一直在使用IBM语音文本服务来转录已预先录制的完整音频文件。然而，我现在尝试在使用说话人识别功能的同时进行实时转录。

浏览 2提问于2018-02-28得票数 1

1回答

YouTube的自动字幕比产生了更好的效果(模型:视频，UseEnhanced: true)。这怎么可能？

、、、、

这里我的谷歌语音设置给AI发短信以下是语音到文本AI：的输出文件这是视频链接：Google to Text的SRT (由YouTube分配的时间)：例如 Google文字演讲: Represent the

浏览 5提问于2020-10-12得票数 4

1回答

如何对iOS上的音频输入进行实时音节计数？

、、、、

应该注意的是，说话者不会使用他们的母语，因此大多数现有的语音识别解决方案都无法工作。我看了一下CoreML，我也许可以用编码的音节数访问语音语料库，但我不确定我将如何开始训练这个模型。

浏览 6提问于2022-11-11得票数 0

1回答

过滤掉某些语音Google Speech API

、、、

我正在创建一个语音机器人使用谷歌语音流API和谷歌文本到语音。我只希望用户的语音被转录，即使用户“中断”了voicebot的响应。如何避免voicebot转录自己的声音？根据我对Siri等现有语音机器人的测试，当使用扬声器时，“过滤”某些声音的能力似乎是可行的。谢谢

浏览 1提问于2019-02-27得票数 2

2回答

它的目标是让失聪人士在网页上输入电话号码，发起电话呼叫，实时将接收端的语音转录为文本，并将响应端的文本实时转换为语音。我计划使用Twilio进行呼叫，捕获音频流，使用语音识别API转录语音，并使用Twilio的文本到语音转换功能来转换文本。我知道Twilio没有实时转录的能力，我似乎也找不到一种通过twilio.connection对象访问音频流的方法。因此，我正在考虑使用Media Capture API来捕获该语音。这有可能吗？

浏览 3提问于2017-02-27得票数 0

1回答

哪种语言无法识别的语音转录方法？

我的计划是使用谷歌的云语音到文本来转录演讲，并将其通过云翻译api来检测转录的语言。然而，因为语音转文本需要在转录之前设置语言代码，所以我计划用不同的语言集多次运行它，并比较“置信度”值以找到最有信心的转录，这将通过云翻译api。这是不是最理想的方式？或者还有其他可能的选择吗？

浏览 2提问于2020-04-14得票数 0

1回答

我能在谷歌玻璃语音识别中使用希伯来语吗？

、、、

我在这里读到，玻璃里有两种声音命令：2)言论自由识别(例如“纽约第五大道”) 我希望开发一个玻璃应用程序，并使用语音识别。

浏览 1提问于2014-01-29得票数 3

1回答

下载语音信箱的RingCentral接口

、、

当有人留下语音信箱时，我希望让RingCentral向我发送一封电子邮件，并将语音信箱作为音频文件附加。RingCentral发送“通知”，并可选地发送语音邮件的转录文本，但不发送音频文件。是否可以使用RingCentral应用程序接口访问语音信箱音频文件(和转录)？

浏览 3提问于2020-12-23得票数 1

1回答

你能将Google语音的模型版本固定在文本上吗？

、、

我想转录音频使用谷歌语音到文本API (STT)，但我需要的转录是一致的时间。换句话说，即使Google改进了STT模型，是否有可能将我最初使用的STT模型的版本固定下来，从而使转录保持一致？我正在使用Google语音Python客户端库。

浏览 1提问于2021-09-10得票数 1

回答已采纳

3回答

语音/音频数据转文本接口

我正在开发一个iphone应用程序，在其中我将用户的声音存储为音频文件，并希望在文本中显示。谢谢，阿良

浏览 1提问于2009-11-06得票数 3

2回答

多语言youtube字幕支持

、、

我很想找到youtube视频字幕/字幕的替代品。我希望任何人都可以开放访问，为我网站上发布的视频添加母语字幕。

浏览 0提问于2009-09-27得票数 1

回答已采纳

2回答

双音转录替换

、、、

我想用这项服务实际上是合理转录的。

浏览 1提问于2012-07-13得票数 4

回答已采纳

1回答

直接从音频/转录转换为文本(语音识别)

、、、、

需要能够转换或转录音频(如从.MP3，其他音频格式)包含语音到文本文本转录使用语音(语音识别)算法在高精度。有许多方法可以做到这一点，这些方法越来越准确，但都是为对着设备麦克风说出的语音而设计的(例如，用于web的谷歌翻译/相应的API，用于iOS的Dragon应用程序)。我需要一种直接将音频文件输入语音识别引擎/API的方法。不希望通过扬声器播放音频并用麦克风捕获它--长音频文件需要相当长的时间，并且会降低音频质量和最终的转录质量

浏览 1提问于2014-05-26得票数 10

回答已采纳

4回答