我正在制作一个语音线路+字幕系统,使用自定义检查器使它更容易使用。所有的一切都是完美的,直到我试图展示一个副标题EditorGUILayout.TextField类似于我是如何使用EditorGUILayout.ObjectField的声音音频剪辑。这是可行的(没有字幕功能):
showAudioClipList = EditorGUILayout.BeginFoldoutHeaderGroup(showAudioClipList, new GUIContent("Audio Clips", "Audio clips available to play when int
我一直在寻找一种方法来显示mp4文件的音频强度。我找到了很多关于如何处理wav文件甚至正在录制的音频的指南,但我找不到任何关于mp4s的东西。
我有一个C#窗口窗体,播放视频,并允许您为其添加字幕。我下一步要做的是添加音频强度的可视表示,这样用户就可以看到下一段语音的位置。要使用Windows Media Player播放视频
我想知道是否有一种方法使用演讲稿作为CC (字幕)时使用文字讲话。问题不在于具体的文本,它可以同时显示,而是在正确的时间显示CC。
我认为TTS队列可能会有所帮助,但不知道它是如何工作的。
蒂娅!米尔顿
编辑1我想用吐司作为字幕(CC)。显示相同的文本发送到tts,在吐司味精。
编辑2 Ok,让我解释一下这个想法:假设我有一个来自服务的文本,我将从该服务获得的所有文本排成队列,并对用户进行os语音。没关系,而且很管用。现在我想添加tts的字幕。假设我得到了来自服务["This is the first text", "This is the second text
我试图在播放音频的同时显示语音字幕。虽然我设法做到了这一点,但我觉得这并不是我应该做的事情,这就是为什么我必须寻求帮助的原因,因为我在互联网上没有发现任何类似的问题。
基本上,我想在非常特定的时刻显示17个句子,这就是为什么我创建了使用延迟的循环,如下文所示。这些句子只是放置在底部的一个标签(@IBOutlet弱var introDisplay: UILabel!),它每次延迟都会更改文本。我真的没有什么更好的主意,除了currentTime之外,我还没有找到任何特定的currentTime函数,但是当我尝试使用它时,它似乎没有效果。我创造的是:
for i in 1...17
这里我的谷歌语音设置给AI发短信
以下是语音到文本AI:的输出文件
以下是YouTube自动标题的输出文件:
这是视频链接:
这是提供给Google:的视频的音频文件。
这里我提供分配给SRT文件的时间。
YouTube的SRT:
Google to Text的SRT (由YouTube分配的时间):
我比较了一些句子,当然YouTube的自动翻译更好
例如
Google文字演讲: Represent the **doctor** representation is one of the hardest part of computer AI you will learn about