首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >将从MP3流中提取的m3u8音频发送到IBM语音到文本

将从MP3流中提取的m3u8音频发送到IBM语音到文本
EN

Stack Overflow用户
提问于 2018-11-14 07:22:32
回答 1查看 317关注 0票数 0

我正在从一个MP3 live中提取M3U8格式的音频,最后的目标是将实时音频流发送到IBM语音到文本。m3u8是通过进程调用外部脚本来获得的。然后我使用FFMPEG脚本在标准输出中获取音频。如果我将音频保存在一个文件中,但我不想保存提取的音频,我需要将数据直接发送到STT服务。到目前为止,我这样做:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
SpeechToTextService speechToTextService = new SpeechToTextService(sttUsername, sttPassword);
string m3u8Url = "https://something.m3u8";
char[] buffer = new char[48000];
Process ffmpeg = new ProcessHelper(@"ffmpeg\ffmpeg.exe", $"-v 0 -i {m3u8Url} -acodec mp3 -ac 2 -ar 48000 -f mp3 -");

ffmpeg.Start();
int count;
while ((count = ffmpeg.StandardOutput.Read(buffer, 0, 48000)) > 0)
{
    ffmpeg.StandardOutput.Read(buffer, 0, 48000);
    var answer = speechToTextService.RecognizeSessionless(
        audio: buffer.Select(c => (byte)c).ToArray(),
        contentType: "audio/mpeg",
        smartFormatting: true,
        speakerLabels: false,
        model: "en-US_BroadbandModel"
    );
    // Get answer.ResponseJson, deserializing, clean buffer, etc...
}

当请求转录的音频时,我得到了以下错误:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
An unhandled exception of type 'System.AggregateException' occurred in IBM.WatsonDeveloperCloud.SpeechToText.v1.dll: 'One or more errors occurred. (The API query failed with status code BadRequest: Bad Request | x-global-transaction-id: bd6cd203720a70d83b9a03451fe28973 | X-DP-Watson-Tran-ID: bd6cd203720a70d83b9a03451fe28973)'
 Inner exceptions found, see $exception in variables window for more details.
 Innermost exception     IBM.WatsonDeveloperCloud.Http.Exceptions.ServiceResponseException : The API query failed with status code BadRequest: Bad Request | x-global-transaction-id: bd6cd203720a70d83b9a03451fe28973 | X-DP-Watson-Tran-ID: bd6cd203720a70d83b9a03451fe28973
   at IBM.WatsonDeveloperCloud.Http.Filters.ErrorFilter.OnResponse(IResponse response, HttpResponseMessage responseMessage)
   at IBM.WatsonDeveloperCloud.Http.Request.<GetResponse>d__30.MoveNext()
   at System.Runtime.ExceptionServices.ExceptionDispatchInfo.Throw()
   at System.Runtime.CompilerServices.TaskAwaiter.HandleNonSuccessAndDebuggerNotification(Task task)
   at IBM.WatsonDeveloperCloud.Http.Request.<AsMessage>d__23.MoveNext()
   at System.Runtime.ExceptionServices.ExceptionDispatchInfo.Throw()
   at System.Runtime.CompilerServices.TaskAwaiter.HandleNonSuccessAndDebuggerNotification(Task task)
   at IBM.WatsonDeveloperCloud.Http.Request.<As>d__24`1.MoveNext()

ProcessHelper只是为了方便起见:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
class ProcessHelper : Process
{
    private string command;
    private string arguments;
    public ProcessHelper(string command, string arguments, bool redirectStandardOutput = true)
    {
        this.command = command;
        this.arguments = arguments;
        StartInfo = new ProcessStartInfo()
        {
            FileName = this.command,
            Arguments = this.arguments,
            UseShellExecute = false,
            RedirectStandardOutput = redirectStandardOutput,
            CreateNoWindow = true
        };
    }
}

我肯定我做错了,我希望有人能在这件事上发光。谢谢。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-11-20 06:08:42

我仍然不知道为什么我不能识别我的缓冲区(第二个ffmpeg.StandardOutput.Read(缓冲区,0,48000);是一个错误(顺便说一句),但是我设法使它与websockets一起工作,比如解释https://gist.github.com/nfriedly/0240e862901474a9447a600e5795d500

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53303499

复制
相关文章
python提取视频中的音频
一.安装模块 pip3 install moviepy 二.代码 from moviepy.editor import * video = VideoFileClip('1.mp4') #视频所在路径 audio = video.audio audio.write_audiofile('1.mp3') #音频所在路径
小小咸鱼YwY
2020/09/28
1.9K0
4K YouTube to MP3(Mac视频音频提取工具)
4K YouTube to MP3 for Mac是mac平台上一个简单易用的音频提取软件,专门用于从YouTube,VEVO,SoundCloud和Facebook以MP3,M4A,OGG进行音频提取。
用户10121095
2022/11/17
1.2K0
AVFoundation 文本转语音和音频录制 播放
现在你应该对AVFoundation有了比较深入的了解,并且对数字媒体的细节也有了一定认识,下面介绍一下 AVFoundation的文本转语音功能
iOSSir
2019/06/14
2.3K0
玩转音频、视频的利器:FFmpeg
腾讯云开发者社区
2017/06/13
6.4K0
将文件字节输出流写入到文本中
1 package DEMO; 2 3 import java.io.File; 4 import java.io.FileOutputStream; 5 import java.io.IOException; 6 import java.io.OutputStream; 7 import java.util.Scanner; 8 9 /* 10 * 文件字节输出流 2014-7-29 11 * 1.给出输出流的目的地 12 * 2.创建指向目的地的输出流 13
Gxjun
2018/03/22
2.6K0
将文件字节输出流写入到文本中
亚马逊宣布Transcribe支持实时音频转录功能
在新推出的Comprehend服务之后,亚马逊今天宣布其自动语音识别(ASR)服务Amazon Transcribe获得对实时转录的支持。
AiTechYun
2018/12/18
1.3K0
亚马逊宣布Transcribe支持实时音频转录功能
如何提取在线音频?在线音频提取工具推荐!
4K YouTube to MP3是一款强大好用的在线音频提取工具,专门用于从YouTube,VEVO,SoundCloud和Facebook以MP3,M4A,OGG进行音频提取。
啾咪啾咪
2022/09/11
6.4K0
音视频开发入门_视频制作基础知识
音视频涉及语音信号处理、数字图像处理、信息论、封装格式、编解码、流媒体协议、网络传输、渲染、算法等。在现实生活中,音视频扮演着越来越重要的角色,比如视频会议、直播、短视频、播放器、语音聊天等。因此,从事音视频是一件比较有意义的事情,机遇与挑战并存。本文将从几个维度进行介绍:音视频开发基础、音视频进阶成长、音视频工作方向、音视频开源库、流媒体协议与书籍。
全栈程序员站长
2022/10/02
3K0
音视频开发入门_视频制作基础知识
视频直播技术干货:一文读懂主流视频直播系统的推拉流架构、传输协议等
本文由蘑菇街前端开发工程师“三体”分享,原题“蘑菇街云端直播探索——启航篇”,有修订。
JackJiang
2022/05/31
5.2K1
视频直播技术干货:一文读懂主流视频直播系统的推拉流架构、传输协议等
快速学习-FFmpeg 的基本使用
详情参考 :https://baike.baidu.com/item/%E8%A7%86%E9%A2%91%E7%BC%96%E7%A0%81/839038 首先我们要分清文件格式和编码格式:
cwl_java
2020/01/14
1.4K0
快速学习-FFmpeg 的基本使用
使用ffmpeg提取视频文件中的音频
最近需要要提取视频音轨,结果一搜索发现好麻烦啊,还要装个会声会影,装个PR?我就觉得至于吗?我就提取一个音频而已啊。突然能想到了ffmpeg这玩意好像可干这个事情,看了下确实可以。正好博客好久没更新了,发出来凑个数吧,也算是一个备忘。
Balliol Chen
2022/04/22
4K0
用ffmpeg 提取MP3
:现在有个视频video.avi,有个音频 audio.mp3,将其合并成output.avi
py3study
2020/01/07
4.9K0
音频时域特征的提取
在音频领域中,我们可以使用深度学习提取和分析这些音频的频率和时域特征以了解波形的属性。在时域内提取特征时,通常将研究每个样本的幅度。我们如何操纵幅度为我们提供了有关信号的某些细节。
deephub
2021/03/24
1.8K0
PHP 提取富文本中的全部图片(提取文章中的全部图片)
未经允许不得转载:肥猫博客 » PHP 提取富文本中的全部图片(提取文章中的全部图片)
超级小可爱
2023/02/20
2.2K0
如何下载完整的HLS流视频
需要从某网页下载一个视频文件,查看之后发现视频文件是用HLS视频流的,HLS全称Http Live Streaming,是由Apple公司定义的用于实时流传输的协议,HLS基于HTTP协议实现,传输内容包括两部分,一部分是m3u8描述文件,另一部分是ts媒体文件
李俊鹏
2020/11/12
7.8K0
音频基础知识
Nyquist 采样率大于或等于连续信号最高频率分量的 2 倍时,采样信号可以用来完美重构原始连续信号。
Gnep@97
2023/09/06
3.1K0
音频基础知识
神经网络如何识别语音到文本
有专家预测,到2020年,企业将实现与客户对话的自动化。据统计,由于呼叫中心的员工要么没有接好电话,要么没有足够的能力进行有效沟通,公司损失了多达30%的来电。
程序你好
2019/11/06
2.1K0
神经网络如何识别语音到文本
Python批量提取PDF文件中的文本
首先需要执行命令pip install pdfminer3k来安装处理PDF文件的扩展库。 import os import sys import time pdfs = (pdfs for pdfs in os.listdir('.') if pdfs.endswith('.pdf')) for pdf1 in pdfs: pdf = pdf1.replace(' ', '_').replace('-', '_').replace('&', '_') os.rename(pdf1, pdf
Python小屋屋主
2018/04/16
6K0
早上起床后不想动,让 Python 来帮你朗读网页吧
之所以用 Python,就是因为 Python 有着丰富的库,网页正文识别也不在话下。这里我尝试了 readability、goose3。
abs_zero
2018/09/25
1.3K0
早上起床后不想动,让 Python 来帮你朗读网页吧
python音频文件中pcm格式提取
一.环境配置 https://ffmpeg.org/download.html#build-windows #选择对于系统 如果是windows直接访问一下连接 https://github.com/BtbN/FFmpeg-Builds/releases 选择xxx-shared.zip https://github.com/BtbN/FFmpeg-Builds/releases/download/autobuild-2020-09-27-12-31/ffmpeg-N-99395-ga3a6b56200-w
小小咸鱼YwY
2020/10/10
2.9K0

相似问题

实时流文本到语音音频

111

用必应语音API (语音到文本)转录MP3音频文件

12

GSM SIM800C文本到语音音频流

23

IBM语音到文本转换的输出

21

将mimeType“视频/webm”中的音频提取为“音频/wav”,用于语音到文本

19
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文