我有一个网页,它使用YouTube Javascript (iframe方法)播放视频。它在桌面和平板浏览器上工作得很好。但是,在Windows上,每当我使用YouTube API playVideo()方法启动视频时,我的页面就会被抛出,YouTube完全播放器将接管屏幕。这样我的页面就可以继续驻留了吗?
我的目标是使用一个语音到文本模型来处理几个视频。
令人困惑的是,谷歌有两款产品似乎都在做同样的事情。
这些产品的主要区别是什么?
Google语音到文本:
- Speech-to-Text has an "enhanced video" model for interpreting the audio.
谷歌视频智能:
- VI has the option to request a `SPEECH_TRANSCRIPTION` feature