我想知道是否有可能c++认知软件开发工具包提供语音到文本的服务,以将数字实体作为文本而不是数字返回。
当前响应“我想订购两杯可乐”预期响应“我想订购两杯可乐”
当然,我可以在翻译中实现一个功能。但我想知道这是不是服务已经提供的东西。尤其是西班牙语。
发布于 2019-03-20 03:33:52
查看https://github.com/Azure-Samples/cognitive-services-speech-sdk上的示例存储库
尤其是函数的speech_recognition_samples.cpp文件
启用‘detailed output’将会给出你想要的结果:
config->SetOutputFormat(OutputFormat::Detailed);然后,您需要查看详细的输出:
result->Properties.GetProperty(PropertyId::SpeechServiceResponse_JsonResult)这将创建如下所示的详细输出:
{"Duration":35500000,"NBest":[{"Confidence":0.7535948753356934,"Display":"I want to order 2 Cokes.","ITN":"I want to order 2 cokes","Lexical":"i want to order two cokes","MaskedITN":"I want to order 2 cokes"}],"Offset":17000000,"RecognitionStatus":"Success"}词法输出可能就是您想要的
沃尔夫冈
https://stackoverflow.com/questions/54917076
复制相似问题