语音识别成文字软件_识别语音文字软件_语音识别文字软件 - 腾讯云开发者社区

、、

我搜索并找到了这篇文章：是否可以用语音识别来识别手机用户？然而，它并没有回答我的问题。是否有任何方法改变一个人的声音，足以使手机呼叫无法识别的语音识别技术？

浏览 0提问于2019-08-29得票数 2

1回答

iPhone中的语音识别

、

语音识别是iPhone音频的一部分吗？我想为iPhone构建一个关于语音识别的示例代码。如何开始？请给我一些想法。在iPhone应用程序开发人员中有关于语音识别编程的文档吗？谢谢,

浏览 3提问于2010-07-01得票数 0

回答已采纳

2回答

用于登录web应用程序的语音识别

、、

我正在创建一个web应用程序，用户应该通过语音识别作为密码注册该应用程序。应识别语音以进行授权。有没有办法通过Java语言实现语音识别？ PS:如果用户提供语音，那么语音应该能够识别已经存储的语音，并能够登录应用程序。

浏览 2提问于2014-12-26得票数 2

2回答

Google语音API与Web语音API的区别

、

我正在研究网络语音识别。我发现Google为开发者提供了一个名为“V2”的API。但是我注意到每天使用它是有限度的。之后，我发现有一个本地的WEB语音API也可以实现语音识别。它只是在google chrome和opera上工作：那么，Google语音API和Web语音API有什么不同呢？他们有关系吗？语音识别结果json是从谷歌回来的。谷歌语音api会比网络语音api更精确吗？谢谢。

浏览 2提问于2015-09-11得票数 17

回答已采纳

3回答

OSX的语音识别库？

、、、

所以我一直在网络上寻找Python语音识别，我找到了pyspeech。但这只适用于Windows。我想要一个语音识别库，与Mac aswel一起工作。谢谢!

浏览 2提问于2012-06-21得票数 3

回答已采纳

1回答

如何向语音识别器提供要查找的单词列表

、

有没有办法让android的语音识别器只从联系人列表或任何预定义的列表中捕捉单词？例如:我希望用户说出一个名字，而不是查看无用的单词，语音识别器会尝试从联系人列表中找到匹配的单词。

浏览 1提问于2013-08-22得票数 1

2回答

有没有办法在python中同时执行两个无限循环？

、、

我使用语音识别，而tkinter，我有一个inifinte循环中的语音识别，因为我希望他们能一直与tkinter的GUI一起识别我的声音，我需要他们在同一个程序中运行，因为我希望gui随语音识别一起改变，但是如果有人可以给我另一个解决方案，我会很高兴的。

浏览 13提问于2022-07-02得票数 0

回答已采纳

1回答

语音识别语音识别音频数据支持8k采样率吗？

语音识别音频数据支持8k采样率吗？

浏览 1287提问于2018-01-11

1回答

非英文窗口系统上语音识别

、、、

我无法在我的荷兰语windows系统上使用语音识别应用程序，因为它只在英文版本上可用。现在我想使用c#将语音识别集成到winforms应用程序中，当然我更喜欢英语。这个是可能的吗？有这样的库吗？

浏览 1提问于2013-11-05得票数 2

4回答

基于语音识别的游戏

、、

由于重复的压力伤害，我想限制我的使用键盘和鼠标。是否有完全(或几乎完全)基于语音识别的游戏？我更喜欢策略或角色扮演游戏。我对基于Windows或Linux的产品都没意见。

浏览 0提问于2014-08-11得票数 4

2回答

我在Android中开发语音到文本转换应用程序。其基本思想是在android中录制语音，并将录制的wav文件发送到服务器。在服务器端，我创建了一个使用Microsoft语音识别API的C#服务应用程序。该服务从Android设备接收音频wav文件，将其转换为文本，并将识别出的文本发送回Android设备。这可以很好地工作，因为我已经多次训练过语音识别API。现在我的问题是:我可以在另一台计算机上使用已经训练好的语音识别配置文件吗？

浏览 1提问于2012-10-09得票数 0

4回答

基于iPhone的语音识别

、

我需要开发一个识别语音的iPhone应用程序，并根据结果执行进一步的任务。我知道iPhone 3.0不支持语音识别，我需要在服务器端实现语音识别软件。我只知道这件事，因为我是新手，我不知道如何处理它。是指我需要购买哪些软件并在服务器端实现它，以及如何使用该服务?？

浏览 2提问于2009-07-13得票数 6

7回答

目前国内的语音识别技术达到了什么水准？还存在哪些问题？

现在技术越来越厉害了，前几年还感觉语音打字特别不靠谱，各种语音助手也相当蠢萌，想问下现在国内语音识别发展到什么水平了？实时且准确的将语音转化成相对应的文本已经达到了什么样的水准？主要还存在哪些方面的问题？

浏览 2284提问于2018-08-06

3回答

是否可以通过语音识别登录？

、

虽然我喜欢面部识别，但我更喜欢使用语音识别登录。有可能吗？如果可能的话，我该如何设置软件？

浏览 0提问于2012-03-31得票数 62

1回答

什么是好的语音识别软件？

我正在运行Lubuntu15.04，我正在寻找一个语音识别软件，允许我打开和运行我的声音文件。在那里我可以定制，如果我说，因为我想要一个骑士凯特汽车的语音识别，我想要能够与汽车交谈。就像我说“嘿凯特”。当我说“嘿Kitt”时，它会打开一个音频文件并播放我选择的音频文件。有什么建议吗？

浏览 0提问于2015-06-25得票数 0

1回答

蔚蓝语翻译:如何激活识别只有当语音被检测到？

、、、、

我目前正在开发一个实时翻译网络应用程序，允许多个参与者使用，并以多种语言分享他们的转录。我不想被告知参加会议的人数x会议的持续时间。因此，问题是：，当检测到语音时，我如何才能激活识别？这样的话，我只会为目前说话的人付钱。我尝试使用来自的事件，但只有当识别器当前正在识别时(使用recognizeOnceAsync()或startContinuousRecognitionAsync())，此事件才会触发。，在Speech中有什么参数可以用来实现我想要的吗？如果没有，我的选择是什么？这可能是可能的观看音频dB水平，并激活连续识别相应，但我认为我会遇到一些问题，如果我尝试这样做。例句:一旦音频

浏览 5提问于2021-02-08得票数 1

1回答

谷歌语音识别是如何工作的？

我知道音频指纹识别音频文件，这是很棒的，但我真正想知道的是Google是如何制作语音识别API的，它们是如何获取音频和返回的单词的。我写了一个宝石来指纹wav音频文件并对它们进行比较，但是如果我用指纹将我的声音与充满指纹的数据库进行比较，可能要花费很长时间。谷歌是怎么做到的？用途：我真的很喜欢语音识别，我想要一个地方开始编码，但我不知道从哪里开始。DragonVoice是语音识别软件的另一个例子，所有这些软件都非常快。我想知道从音频记录到转换成文本的服务器流。

浏览 5提问于2014-02-27得票数 0

回答已采纳

1回答

Jelly bean离线语音识别可以在带仿真器的系统(PC)中使用吗？

、、、、

我想知道是否可以在系统中使用android jelly bean的离线语音识别功能？就像我安装android虚拟模拟器，然后安装jelly bean，下载离线语音识别，然后我可以通过任何方式在我的pc上使用它。就像我做一些代理工作一样，它可以与桌面应用程序的记事本/文本编辑器一起使用吗？我知道桌面应用程序不支持文本输入。但我只是想知道有什么方法可以把语音识别从那个模拟器中拿出来用在PC上?？谢谢你的回答!！

浏览 1提问于2013-04-29得票数 2

2回答

如何在windows7和eclipse上实现speech sphinx ?或者如何在android上使用java sphinx语音识别？

、、、

我想在java中使用sphinx4语音识别，我使用了sphinx4语音识别，并成功地实现了。但我的问题是pockesphinx是机器人的语音识别。我不能理解教程。我尝试了很多次来运行pocketsphinx，但都不成功，因为我不知道Linux命令。我想实现口袋狮身人面像与eclipse Helios和我的操作系统是Windows7。谁能给我一些步骤来实现口袋狮身人面像与Windows7和android.Its月食现在已经两个星期了，我只是访问教程，但没有任何我可以让it.So please.Can任何人帮助我out.Or，即使有任何东西，我可以导入我的sphinx4语音识别java到安卓应用

浏览 0提问于2012-09-03得票数 3

回答已采纳

1回答

WCAG2.0和语音识别，是A，AA还是AAA

、、

我想问你，语音识别软件站在哪里的网页可访问性。我的意思是，它是WCAG A，或AA，或AAA的一部分。我试着理解W3C在这里解释了什么：但我迷路了5次左右。我之所以问这个问题，是因为我的客户问我们是支持A级还是AA级，我觉得语音识别软件处于AAA级。如果有人能帮我，那就太好了:)

浏览 2提问于2015-08-06得票数 1

回答已采纳

3回答

谷歌语音识别源代码

、、

正如谷歌所说，新的安卓“果冻豆”将包含能够离线工作的语音识别引擎。随着新的android源代码的公开，我试图寻找并找到语音识别引擎的源代码，但没有成功。所以我的问题是:语音识别引擎的源代码是android 4.1.1源代码的一部分吗？或者它是一个独立的应用程序？提前感谢并为我的英语表达歉意。

浏览 3提问于2012-07-11得票数 4

1回答

在android软键盘上激活语音到文本时，会触发哪个事件？

、、

当默认语音识别按钮在android软键盘上被触摸时，我想在android应用程序中触发另一个事件。是否有任何方法捕捉此事件，或者语音识别按钮直接修改keyboard.xml的代码是什么？任何解决方案都将不胜感激，谢谢。

浏览 0提问于2014-07-15得票数 2

回答已采纳

1回答

开发一款听觉训练软件，用什么工具好？

想开发一款听觉训练的软件。有一关关的题目，文字加上声音，让受试者回答问题。答对给奖励积分，可累积。根据回答的情况来做数据收集和分析。得出分析报告。有些问题需要语音回答，需要识别语音来判断正误。这样一个软件用什么工具来开发好？

浏览 302提问于2018-09-10

1回答

Ubuntu中有用于电话的语音识别吗？

、

Ubuntu能够识别语音命令吗？什么类型的语音识别是内置的，它在Ubuntu桌面上是可用的吗？

浏览 0提问于2013-03-02得票数 3

15回答

您的交互式语音应答平台是什么？

、、、

对于那些在语音领域工作的人来说，你们使用什么作为IVR平台？我使用的是Microsoft Speech Server 2007。一些等价的包是什么？是否有人使用开源软件来处理入站或出站呼叫？请注意，我不仅仅是在谈论语音识别，它是一个综合软件包的一个组件。语音识别平台将包括语音识别、文本到语音转换、诸如VoiceXML之类的VUI技术，以及通过SIP或电话硬件的呼叫终止。

浏览 29提问于2008-08-14得票数 4

3回答

如何在iphone中通过编码识别人声？

、、、

我想在我的iPhone应用程序中集成语音检测功能。iPhone应用程序允许用户使用自己的语音搜索单词。但是，我对iPhone中的语音识别一无所知。你能为我提供任何想法，教程或示例代码吗？

浏览 2提问于2012-02-11得票数 0

回答已采纳

1回答

Chrome语音API和google语音API有什么区别？

、、、

我一直在尝试将语音识别stt集成到我的项目中，在尝试了其中的各种方法之后，我发现chrome的本地web语音API是最好的。与谷歌的语音API相比，它的性能和准确性如何？

浏览 4提问于2016-12-20得票数 3

回答已采纳

1回答

用基于java的逻辑编写TinyMCE自定义插件

、、

我是插件开发方面的新手，对于我正在从事的一个学校项目，我需要开发语音到语音功能，它允许用户将语音输入到文本编辑器中，在这种情况下，我只能使用TinyMCE编辑器。我得到了一个已经开发得很好的java语音识别库，我的名字是CMU Sphinx- sphinx4。所以现在我的问题。Sphinx4是一个java库，它包含了创建插件所需的所有逻辑。但是使用TinyMCE，我只能用javascript编写插件。我试着写了一个简单的演示，没有成功地让插件工作。下面是代码片段 Index.html <!DOCTYPE html> <html> <head>

浏览 1提问于2018-05-22得票数 0

2回答

关键词是否影响布鲁斯沃森语音识别？

、、

沃森的语音识别器支持作为参数的关键字列表，但我试图弄清楚这些关键字是否真的会影响识别。例如，如果您正在给Watson一个音频剪辑，其中包含可能无法正确识别的正确名称，那么将这些名称作为关键字提交会增加Watson正确识别它们的可能性吗？关键词与识别本身相互作用吗？

浏览 2提问于2016-04-12得票数 0

回答已采纳

1回答

为封闭词汇表构建语音识别

我可以使用下面的链接为我有限的单词集创建语音识别。但是，我如何向语言模型提供反馈，以便更好地训练我的声音。例如，.dic文件中的拼音值是针对美国口音的(我想将其训练为印度口音)。

浏览 3提问于2013-12-01得票数 1

1回答

为有声读物中的字幕创建时间戳

、、

我想添加时间戳到书籍句子，适合相关的有声读物。最好是用不同的语言。这里有一个例子：骄傲和偏见我的想法是找到一个语音识别工具，将时间戳放在句子上(步骤1)，然后使用levenshtein距离将杂乱的文本映射到原始文本(步骤2)。网站为第一步提供了一个解决方案，但它的字符输出是有限的。从理论上讲，我可以使用网络自动化来完成这项工作，每分钟开始一次新的录音，但它真的很脏。我在R中编写了第二步的脚本，并在我从语音记录器获得的一个样本上测试了它，它运行得很好，但是如果程序知道文本，就像你阅读来训练语音识别软件时，这一点可以得到很大的改进。我不是把我所有的信息都用在转录上。所以我的问题是，

浏览 4提问于2016-01-25得票数 1

回答已采纳

1回答

如何将丝绸音频文件从WeChat格式转换为amr格式？

、、、

当我开发WeChat小程序时，我想要实现语音控制。但是WeChat客户端提供的音频是丝绸的。我需要把丝绸文件转换成某种格式，才能被第三语音检测服务所识别。一些第三种服务支持amr格式。它真的很棒，因为它的尺寸可能很小。

浏览 3提问于2017-02-20得票数 3

回答已采纳

2回答

Windows语音识别软件，以音频文件为输入，输出文本文件

、、

我对用于Windows的语音识别软件感兴趣，它以一种标准格式(MP3、WAV、OGG等)获取播客的音频文件，并将语音的转录作为文本文件输出。其动机是帮助为官方wiki录制播客。我希望它能够教它，提高语音识别，或学习新单词。此外，它应该能够处理多人交谈，偶尔重叠的讲话，偶尔的音乐，或非说话的声音。我只需要这个软件来处理英语。

浏览 0提问于2014-04-14得票数 5

1回答

限制语音识别字典以实现更快的匹配和更好的准确性

、、、

我正在尝试制作一个基于android的应用程序，其中一个部分是语音识别。我有一个非常有限的语音命令，应用程序将在其上工作。因此，我想以某种方式限制字典或创建一个新的字典的单词将由应用程序使用，以便应用程序将具有非常好的准确性和更快的匹配。例如。如果我说"B"，结果可以是"B“、" be”或"Bee“，但我的应用程序应该只查找"B”，而不是任何其他类似的声音。如何在android中做到这一点？编辑:我是android的新手，到目前为止，我只是通过在网上阅读教程来应用基本的谷歌语音识别。认真地说，我需要一些提示来完成这项任务，这样我就不会浪费更多的

浏览 1提问于2013-11-25得票数 4

1回答

基于Sphinx4的mp3识别

、、、

我们可以在不使用wav文件的情况下使用mp3文件进行语音识别吗？或者我们可以从mp3生成wav文件，然后进行语音识别，而不会对准确性造成严重影响？问题是我需要最小化应用程序中通过网络传输的负载。转换过程中丢失的信息会成为影响准确性的重要因素吗？

浏览 4提问于2012-01-29得票数 0

回答已采纳

2回答

Android应用无需按键即可识别语音

、、、

我希望添加语音命令到Android应用程序，将在平板电脑上作为一个信息亭运行。我不希望用户必须按下按钮，因为用户正在做一些更重要的事情(例如，驾驶汽车、驾驶飞机或进行脑部手术)，而命令可以通过按一下按钮来完成。我看到一些教程描述了如何将语音添加到文本中，并让用户按下按钮获取文本，但没有任何教程允许唤醒单词“to，Google”启动语音识别(更不用说自定义唤醒单词了)。我考虑过使用Google Voice Actions以“on，Google”开始，然后发送一些东西到我的应用程序(注册一个意图)，但这必须针对一个特定的用户(至少对于我尝试过的平板电脑)。我每天都会有不同的用户(可能一天不止一

浏览 44提问于2018-02-16得票数 0

回答已采纳

2回答

基于Visual Basic 6的语音识别

有一种方法可以在Visual Basic 6项目中集成语音识别吗？

浏览 2提问于2010-05-22得票数 1

回答已采纳

2回答

将音频作为麦克风输入播放

、、

我要测试语音识别程序。有些是我有权访问代码的，有些是我没有的。可悲的是，我(优美的)声音并不完美，所以当我读一篇文章时，每次听起来都略有不同。这使得测试变得困难和耗时。鉴于此，我可以调整很多参数。所以我想知道有没有办法录下我自己的声音(已经录好了)。然后将其作为正常的麦克风输入播放，以便我正在测试的语音识别程序将其视为麦克风输入。如果可以在C#中以编程方式完成，这也会有很大帮助。所以我可以在我自己的代码中指定何时播放什么。从扬声器播放它并让语音识别程序收听麦克风是不可行的，因为它在不同的计算机/扬声器/麦克风上是不同的声音。谢谢。编辑:到目前为止，我所发现的是使用软件声卡模拟器。但

浏览 2提问于2013-12-13得票数 53

回答已采纳

3回答

C# System.Speech未找到！

、

我正在尝试使用与此相关的语音识别：但是系统找不到它的程序集。

浏览 1提问于2011-05-03得票数 8

回答已采纳

2回答

在Google应用程序上设置语音识别上下文？

、、

我有一个Google应用程序，它使用Google客户端Javascript库上的操作：语音识别效果非常好。但有时我会遇到一种认知环境，它有一些小麻烦。有没有办法告诉语音识别设施，以强调在每个用户交互的基础上特定短语的概率？例如，如果用户被要求指定一个日期，那么一年中的几个月的概率就会超过正常值吗？在一些语音识别引擎中，您可以提供词汇表(也称为语法等等)。到引擎上。有没有办法用谷歌应用程序的动作来做到这一点呢？我知道谷歌的语音识别API：但我不知道该API是公开的还是通过Google服务上的操作获得的，或者该API是否支持语法或上下文列表。

浏览 2提问于2017-10-13得票数 2

2回答

如何在Visual Studio 2019中添加语音识别

、、、

我想在visual studio 2019的C#中创建一个语音识别程序，但是当我单击添加引用时，我不知道如何添加语音库，它没有给我提供从程序集添加的选项。如何在添加引用时显示程序集选项卡？

浏览 0提问于2019-12-17得票数 0

2回答

语音识别接口SDK (Android)

、、

我需要做一个Android应用程序，可以识别我创建的某些声音文件，并在识别时执行操作。所以类似于Shazam/Soundhound的东西，但有我自己的声音文件。有没有什么API或者SDK之类的东西？我读过关于Echoprint的文章，但我知道它适用于Windows和iOS，这对我来说似乎相当困难。这样行得通吗？或者还有其他选择吗？ PS:为了清楚，我不想要语音识别，或者文本到语音转换。我的声音文件可以有音乐，失真的声音，效果等

浏览 2提问于2013-06-20得票数 11

回答已采纳

2回答

语音命令工具(没有语音识别)

我想要一个工具，可以执行一个行动时，获得声音命令通过麦克风。我不感兴趣的语音识别和能力，如听写或语音文字输入。我想要的要简单得多:我发出声音，工具向活动应用程序发送一个键笔画，或者执行控制台命令。声音可能是一个单词，或者是几个单词，但是这个工具不需要识别单词本身--而是将整个声音样本与其数据库中的其他声音样本进行比较，选择最接近的声音，并执行相关的操作(如果没有足够接近的话)。我说的这个词可能是IT术语，或者是游戏术语/项目/字符，有时发音不像英语，所以语音识别在这里不会有任何好处。我想到的主要用例是“我说”构建“，它按下了IDE中的那个Ctrl-Alt-Shift-Something热键，我

浏览 0提问于2021-06-30得票数 0

2回答

有没有语音认证库？

、

有没有人知道有没有好的语音认证库？或者我需要找到一个好的语音识别库并在此基础上构建？

浏览 1提问于2011-09-01得票数 15

回答已采纳

2回答

用于语音分配器的Python绑定在导入时失败(没有名为speech的模块)

、

我正在尝试使用一个程序，该程序将Python作为依赖项进行语音分发。代码在导入语音调度程序Python接口的行上失败： import speechd 我在Ubuntu 20 LTS上，并安装了语音调度器包，以及python3 3-话d。当使用python3 REPL时，没有找到模块，import speechd就会失败。如何成功地让Python识别语音分派程序的绑定？

浏览 7提问于2022-07-20得票数 -1

回答已采纳

1回答

使用PhoneGap或Sencha进行语音识别

、

我计划使用Sencha 2.0作为我的移动应用程序开发平台。我计划在应用程序中使用语音识别--有没有一个语音识别应用程序接口可以在iOS和安卓平台上很好地工作？

浏览 2提问于2012-04-04得票数 3

回答已采纳

5回答

MP3/WAV到文本(语音识别)

、

我正在寻找一个软件( Windows或Linux)，可以将MP3/WAV文件转换为文本。可以通过语音识别自动生成文本的内容，如YouTube上的自动字幕，但可以将这些字幕输出到文本文件中。

浏览 0提问于2015-06-28得票数 13

3回答

如何在Unity3D上集成语音识别？

、

我正在做一些研究，我找不到任何的例子，团结集成语音识别作为输入层。有人知道这方面的例子吗？

浏览 7提问于2015-10-18得票数 0

回答已采纳

3回答

异常是没有安装Google语音识别API的原因吗？

、、

目前，我正在用python进行语音识别。首先，我安装了以下… pip3 install SpeechRecognition pip install pipwin pipwin install pyaudio 我编写了以下几行代码… r = sr.Recognizer() with sr.Microphone() as source: print('Speak Anything') audio=r.listen(source) try: text=r.recognize.google(audio) print('Your spee

浏览 0提问于2019-12-20得票数 0

2回答

java语音识别Sphinx 4

我想使用sphinx4或HTK工具包来构建一个语音识别应用程序，该应用程序旨在从语音中估计一个人的年龄。我在更大程度上理解语音识别中涉及的统计模型。我对Mel频率倒谱系数和高斯混合模型感兴趣，因为这两个模型更适合我的问题领域。我是否必须使用神经网络，并从狮身人面像分类器派生的向量中输入训练数据？我不太确定从哪里开始使用sphinx或HTK工具包。我是第一次接触sphinx和语音识别，我的应用程序只是一个原型。请任何人在这方面提供一些形式的指导。致以亲切的问候。

浏览 1提问于2010-01-19得票数 1

回答已采纳