前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >自动语音识别快速入门,远比你想象的更简单 | Q推荐

自动语音识别快速入门,远比你想象的更简单 | Q推荐

作者头像
深度学习与Python
发布2023-04-01 17:13:53
3880
发布2023-04-01 17:13:53
举报

对话式人工智能正在改变我们与计算机交互的方式。简单来说,对话式 AI 就是人与机器之间的交互,它识别语音和文本、意图以及各种语言,以模仿自然语言或人类对话。

我们可以看到,如今语音识别的应用远不止于“替代输入法”,手机中必备的语音助手、小屏的便携设备,乃至于智能家居、无人驾驶汽车语音指令交互等众多场景中,语音接入都扮演着不可或缺的角色。然而,当下基于深度学习的语音识别技术应用在实践场景下依然有着门槛偏高、难以快速普及的难题。

而 Nemo,一个基于 PyTorch 的开源工具包,正是为对「对话式人工智能」感到好奇的开发者而打造,它允许开发者快速构建、训练和微调对话式人工智能模型。在使用预训练模型基于自定义数据构建高精度模型的过程中,微调起到了重要作用,这属于一种迁移学习技术,通过垂直领域数据集与预训练模型的结合,可以简化训练并提升模型在作用场景的识别能力。

NVIDIA 联合 InfoQ,为广大有高性能计算和人工智能开发需求的开发者提供一系列 AI 开发相关的在线培训课程,从理论到实践,打破门槛,带你快速上手。

2021 年 4 月 7 日 20 点 - 21 点 30 分,NVIDIA 开发者社区经理李奕澎将为大家带来公开课第四期——使用 Nemo 快速完成自动语音识别中迁移学习的任务。

本次在线研讨会主要针对有语音语义和人工智能开发需求的开发者,通过本次在线研讨会,你可以:

  • 了解 ASR 的工作流程和系统架构
  • 获得 ASR 预训练模型 Quartznet 详解
  • 学习使用 Nemo 快速完成中文自动语音识别应用
  • 掌握适用于 Nemo 自定义数据集的建立方法及格式规范
  • 掌握结合自定义数据集和预训练模型完成迁移学习任务

...... 

扫描下方二维码或点击【阅读原文】即可免费报名。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-04-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 InfoQ 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档