我的目标是使用一个语音到文本模型来处理几个视频。
令人困惑的是,谷歌有两款产品似乎都在做同样的事情。
这些产品的主要区别是什么?
Google语音到文本:
- Speech-to-Text has an "enhanced video" model for interpreting the audio.
谷歌视频智能:
- VI has the option to request a `SPEECH_TRANSCRIPTION` feature
我读过兰达的论文,但是我不可能找到的第8篇论文,也就是斯蒂尔的论文,名为
G.L.Steele, Jr. "Compiler Optimization Based on Viewing LAMBDA as RENAME + GOTO".
AI: An MIT Perspective. 1980
有人能帮我找个地方买这份报纸吗?