我的目标是使用一个语音到文本模型来处理几个视频。
令人困惑的是,谷歌有两款产品似乎都在做同样的事情。
这些产品的主要区别是什么?
Google语音到文本:
- Speech-to-Text has an "enhanced video" model for interpreting the audio.
谷歌视频智能:
- VI has the option to request a `SPEECH_TRANSCRIPTION` feature
我(主要)是一名.NET开发人员,对于我的项目,我使用visual studio 2008。看完这段视频后:
此视频页面包括到开发实验室的链接,在那里我可以下载visual studio 2010和更高版本所需的资源:
从哪里可以获得visual studio 2008所需的资源?我现在知道了这个原理(在第9频道上清楚地解释了),但我不清楚如何在visual studio 2008中启用它。