开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

语音合成与语音识别

语音合成和语音识别是自然语言处理领域的重要技术，它们在云计算领域有着广泛的应用。

语音合成，也称为文本转语音，是将文本转换为自然流畅的语音输出的过程。它可以模拟人类的语音表达，实现计算机生成自然语音的能力。语音合成技术可以应用于多个领域，如智能语音助手、语音导航、语音广播等。

在语音合成领域，腾讯云提供了一款强大的产品，即腾讯云语音合成（Tencent Cloud Text to Speech，TTS）。TTS支持多种语言和声音风格，具有高度可定制化的特点。它提供了多种API接口和SDK，方便开发者在各类应用中集成语音合成功能。详细信息请参考腾讯云语音合成产品介绍：腾讯云语音合成

语音识别，也称为语音转文本，是将语音信号转换为文本的过程。它可以将人类的语音输入转化为计算机可处理的文本形式，实现语音与文本之间的互通。语音识别技术广泛应用于语音助手、语音搜索、语音翻译等场景。

腾讯云提供了一款强大的语音识别产品，即腾讯云语音识别（Tencent Cloud Automatic Speech Recognition，ASR）。ASR支持多种语言和领域的语音识别，具有高准确率和低延迟的特点。它提供了多种API接口和SDK，方便开发者在各类应用中集成语音识别功能。详细信息请参考腾讯云语音识别产品介绍：腾讯云语音识别

总结起来，语音合成和语音识别是云计算领域中重要的自然语言处理技术。腾讯云提供了强大的语音合成和语音识别产品，开发者可以根据具体需求选择合适的产品进行集成和开发。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

华为ICT——第五章语音处理理论与实践

01

GitHub 3.1K，业界首个流式语音合成系统开源！

智能语音技术已经在生活中随处可见，常见的智能应用助手、语音播报、近年来火热的虚拟数字人，这些都有着智能语音技术的身影。智能语音是由语音识别，语音合成，自然语言处理等诸多技术组成的综合型技术，对开发者要求高，一直是企业应用的难点。

01

GitHub 3.1K，业界首个流式语音合成系统开源！

大家好，我是崔庆才。想必大家在开发项目过程中可能或多或少用到语音识别、语音合成等相关技术，但又不知道哪家的服务好，而且有的收费还贼贵。尤其流式识别更是个难题。今天我给大家推荐一个流式语音合成库，现在在 GitHub 上已经开源，而且已经斩获 3.1k star，效果很不错，同时这也是业界首个流式语音合成系统，推荐给大家试试。具体详情大家可以了解下文哈，最后还有直播课，大家感兴趣欢迎扫码了解。智能语音技术已经在生活中随处可见，常见的智能应用助手、语音播报、近年来火热的虚拟数字人，这些都有着智能语音技术

01

GitHub 3.1K，业界首个流式语音合成系统开源！

智能语音技术已经在生活中随处可见，常见的智能应用助手、语音播报、近年来火热的虚拟数字人，这些都有着智能语音技术的身影。智能语音是由语音识别，语音合成，自然语言处理等诸多技术组成的综合型技术，对开发者要求高，一直是企业应用的难点。飞桨语音模型库 PaddleSpeech ，为开发者提供了语音识别、语音合成、声纹识别、声音分类等多种语音处理能力，代码全部开源，各类服务一键部署，并附带保姆级教学文档，让开发者轻松搞定产业级应用！ PaddleSpeech 自开源以来，就受到了开发者们的广泛关注，关注度持续上涨。

02

工业应用|AI语音技术应用场景及模型库概览

近年来AI技术发展速度迅猛，深入到生活中的方方面面，从手机APP到车载语音系统。今天小PP和大家一起仔细了解，AI技术中的语音技术在各场景的应用，并奉上对应模型~

01

智能语音客服方案设计

手机用户的普遍如何快速的应答与高质量的沟通是智能客服的关键问题。采用合理的分层结构流程与先进的中间组件（例如，语音识别、语音合成、智能对话、知识图谱等技术组建），建立客服热线自动语音应答系统。缓解人工忙线，客户问题简单，如法充分利用资源的情况。借用AI相关的技术，建立稳定、有效的智能语音应答系统的研究目标。

02

智能语音扩展数字化服务

广义上来讲智能语音技术有各种各样的定义，以上是常见的一些热门的场景。语音识别，刚才罗老师也分享了部分内容。语音合成是文字变成语音，这部分我们后面会详细展开。再往后看，声纹识别，在智能车里面有很多的功能需要人的发音媒介来控制命令的时候声纹就很重要。开一个车门，车上有一个小孩，突然哭闹，下一个不合适的指令，你区别不出来这个人，对语音控制来说不合适的。或者有一些不当的操作，可以通过声纹来做，通过声音来做对人的识别和认证的过程。声纹识别其实在未来的应用场景比较热门，实际应用当中遇到大的挑战点是什么？很多其他的生物识别靠人脸或指纹这类比较稳定的特征，可是声纹不稳定，人高兴的时候，第一天晚上唱了卡拉OK，第二天声音哑了，怎么能够在变化比较明显的生物特征上做识别是一个很大的挑战。

05

腾讯云语音产品：从技术到应用的全方位解读

随着人工智能技术的迅猛发展，语音技术作为其中的重要分支，正在逐步改变我们的生活和工作方式。腾讯云作为国内领先的云服务提供商，其语音产品在技术能力、应用场景和业务价值等方面均表现出色。本文将从语音产品科普解读、应用实践和行业案例三个方面，深入探讨腾讯云语音产品的技术原理、应用场景、业务价值及其在各行业中的实际应用。

01

倪捷：智能语音扩展数字化服务

广义上来讲智能语音技术有各种各样的定义，以上是常见的一些热门的场景。语音识别，刚才罗老师也分享了部分内容。语音合成是文字变成语音，这部分我们后面会详细展开。再往后看，声纹识别，在智能车里面有很多的功能需要人的发音媒介来控制命令的时候声纹就很重要。开一个车门，车上有一个小孩，突然哭闹，下一个不合适的指令，你区别不出来这个人，对语音控制来说不合适的。或者有一些不当的操作，可以通过声纹来做，通过声音来做对人的识别和认证的过程。声纹识别其实在未来的应用场景比较热门，实际应用当中遇到大的挑战点是什么？很多其他的生物识别靠人脸或指纹这类比较稳定的特征，可是声纹不稳定，人高兴的时候，第一天晚上唱了卡拉OK，第二天声音哑了，怎么能够在变化比较明显的生物特征上做识别是一个很大的挑战。

02

深度学习在语音识别方面的应用

语音识别是一项非常重要的技术，它可以将人类的语音转化为计算机可以理解的形式。深度学习是一种非常强大的机器学习技术，它在语音识别方面也有广泛的应用。本文将详细介绍深度学习在语音识别方面的应用。

02

腾讯云语音产品技术实践与行业应用案例分析，有两下子！

随着人工智能技术的飞速发展，语音识别（ASR）和语音合成（TTS）技术已经成为智能语音服务领域的核心技术。腾讯云语音产品，凭借其业界领先的技术优势和极具竞争力的价格，为各行业提供了从标准化到定制化的全方位智能语音服务，广泛应用于多个行业场景，极大地推动了企业服务、阅读、教育、游戏、金融、电商等行业的智能化升级。

01

技术与人文的交汇：腾讯云语音产品在提升用户体验中的应用

语音技术作为人工智能的一个重要分支，正在改变我们与设备和系统交互的方式。语音技术不仅提升了操作的便捷性，还增强了用户体验，使得各类应用更加智能化和人性化。腾讯云语音产品，包括语音合成（TTS，Text-to-Speech）和语音识别（ASR，Automatic Speech Recognition）技术，凭借其卓越的性能和广泛的应用场景，迅速赢得了市场的认可和青睐。

02

MoneyPrinterPlus:AI自动短视频生成工具-腾讯云配置详解

MoneyPrinterPlus可以使用大模型自动生成短视频，其中的语音合成和语音识别部分需要借助于一些第三发云厂商的语音服务。

02

每日进步，不了解人工智能？一篇文章看懂BAT布局的语音识别技术

本文介绍了人工智能语音交互的基本环节，包括语音识别、语音合成、语义理解和对话管理。文章还列举了一些著名的语音交互产品，如苹果的Siri、亚马逊的Echo和天猫魔盒等。最后，作者提醒读者，语音交互技术目前仍在不断发展中，尚未完全成熟，但未来具有广泛的应用前景。

09

2022年了，那些音频的新玩法你还没试过吗？

导语数据万象（Cloud Infinite，CI）处理平台涵盖图片处理、内容审核、音视频处理、智能语音、内容识别、文档预览等各项存储云原生能力，其中智能语音围绕“声音”提供多元化内容服务，在通勤导航、智能家居、网络K歌、虚拟社交各场景下为用户提供助力。上班路上，红灯之前，午饭时间，谁没有点张开小耳朵听听音频的需求呢？比如以小王的普通一天举例，这也是千千万万当代年轻人的现状，可以看到从早到晚都有丰富的音频活动，娱乐工作生活面面俱到，横跨数个产品，多个行业，软硬件之间来回跳跃，当然小王能在如此多的活

02

全新开源！业界首个声纹识别与音频检索系统，10分钟搭建产业级应用

飞桨语音模型库PaddleSpeech，为开发者提供了语音识别、语音合成、声纹识别、声音分类等多种语音交互能力，代码全部开源，各类服务一键部署，并附带保姆级教学文档，让开发者轻松搞定产业级应用！

02

重磅 | 从SwiftScribe说起，回顾百度在语音技术的七年积累

人与机器的自然交互一直是人类孜孜不倦的奋斗目标。随着移动互联网时代的发展，声音与图片成为了人机交互更为自然的表达方式。作为最核心的入口，语音技术就成为了科技巨头们争相攻下的堡垒。而人工智能的进步与发展也让语音技术的识别率突飞猛进，也使其有了产品化的机会。李彦宏曾在剑桥名家讲堂等多个公开场合说过，百度大脑涉及百度最为核心的人工智能内容，具体包括语音、图像、自然语言理解和用户画像等四个核心能力，此外还有机器学习平台；吴恩达也在公开场合演讲时表达了同样的观点。 3 月 14 日，百度硅谷研究院于推出了一款基

灵云上线语音云：在线语音转写、合成、识别等功能

捷通华声灵云语音云重磅上线灵云平台，为广大企业及个人提供专业级语音识别、语音合成等云服务，用灵云人工智能实现了便捷大众工作生活，同时标志着捷通华声在语音云服务领域迈向一个全新的高度。智能语音“云时代

AI时代，FreeSWITCH能做什么？

那么，智能时代跟FreeSWITCH什么关系呢？严格来说，其实没什么关系。你看，我今天又标题党了。

01

什么是语音识别的语音助手？

语音助手已经成为现代生活中不可或缺的一部分。人们可以通过语音助手进行各种操作，如查询天气、播放音乐、发送短信等。语音助手的核心技术是语音识别。本文将详细介绍语音识别的语音助手。

00

语音合成到了跳变点？深度神经网络变革TTS最新研究汇总

机器之心原创作者：李亚洲近年来，随着深度神经网络的应用，计算机理解自然语音能力有了彻底革新，例如深度神经网络在语音识别、机器翻译中的应用。但是，使用计算机生成语音（语音合成（speech synthesis）或文本转语音（TTS）），仍在很大程度上基于所谓的拼接 TTS（concatenative TTS）。而这种传统的方法所合成语音的自然度、舒适度都有很大的缺陷。深度神经网络，能否像促进语音识别的发展一样推进语音合成的进步？这也成为了人工智能领域研究的课题之一。 2016 年，DeepMind 提

05

现在 AI 这么先进了，你也可以玩

最近有个新闻说一个人毫无绘画能力靠AI作图，获得艺术比赛第一名，没想到现在AI 这么厉害了，今天分享几个AI 黑科技工具，在公众号后台回复黑科技获取软件地址。

03

AI语音交互领域常用的4个术语

语音合成标记语言的英文全称是Speech Synthesis Markup Language，这是一种基于XML的标记语言，可让开发人员指定如何使用文本转语音服务将输入文本转换为合成语音。与纯文本相比，SSML可让开发人员微调音节、发音、语速、音量以及文本转语音输出的其他属性。SSML可自动处理正常的停顿(例如，在句号后面暂停片刻)，或者在以问号结尾的句子中使用正确的音调。

00

专访俞栋：多模态是迈向通用人工智能的重要方向

随着语音识别、自然语言处理、计算机视觉等人工智能技术日益成熟，并逐渐落地到实际场景中，如何实现大规模应用落地或者说如何通往通用人工智能，越来越成为这些领域的研究者探索和思考的命题。

03

那些天籁之音，正在消亡

你知道吗？全球每2周就会有一种语言消失。语言的消亡意味着珍贵的多样性文化信息流失，与物种的灭绝毫无二致。现实情况是，濒危语言消亡的速度比濒危动物消亡的速度还要快，据测算，到本世纪末，世界上50%-90%的语言将会消亡。保护濒危语言是保护文化多样性的重要一步，那么，人工智能又能做什么呢？语音技术发展到今天，其应用能力已经媲美甚至超越人类平均水平。从历史视角看，不管是地理位置障碍还是语言障碍，它都将是促进和增强人与人、人与机器自然对话的强大工具。在濒危语言文化保护上，我们由此也看到了新的思路

03

干货 | 腾讯云智能语音行业落地探索与实践

倪捷，腾讯云高级产品经理。北京邮电大学硕士。现在腾讯云大数据与人工智能产品中心AI应用产品组担任高级产品经理，负责智能语音相关AI产品，拥有互联网、金融等行业人工智能落地的丰富经验。本文来自倪捷在“2018携程技术峰会”上的分享。

04

灵云平台上线藏、彝、蒙、朝鲜语音识别SDK

继推出维吾尔语、粤语识别，近期，捷通华声联合中国民族语文翻译局，推出藏、彝、蒙、朝鲜语语音识别技术，为藏族、彝族、蒙古族、朝鲜族同胞的日常办公、沟通交流提供语音识别服务。民族语言识别为企事业单位办公、民众交流提供便利灵云语音识别技术，已广泛应用于国内的企事业单位会议、公检法、医疗等领域。通过应用灵云藏、彝、蒙、朝鲜语语音识别技术，少数民族企事业单位可以应用语音识别技术，识别日常工作会议发言，快速生成会议记录;地区公安、检察、法院等政法机构可以应用语音识别来转写办案过程中的讯问发言，快速生成办案笔录;

04

专访 | 黄学东：微软TTS，第一款实时神经网络语音合成服务

一个月之前，微软发布了基于深度神经网络的文本到语音（text-to-speech，TTS）系统，并且做为 Azure 认知服务中的一项，提供面向客户的预览版本。

01

数据万象音视频处理 —— 打开对声音的想象，开启AI创作时代

“前方路口请直行”、“限速100”、“前方路段拥堵”等，是不是看到这些导航常用语句，脑海中已经有您常听的声音浮现了？导航播报所使用的TTS语音合成技术的商业化道路从有声听书、银行智能客服覆盖到虚拟人配音、残障人士辅助应用等，用户需求来源多样，应用场景逐步细化和专业，在这众多的行业所孕育出的应用场景中，TTS语音合成技术大幅减少文字转为语音的时间与企业用工成本的同时，也为用户带来由AI创作赋予的全新体验，语音合成模型经过长时间的发展，由最初的基于拼接合成，到参数合成，逐渐达到了感情充沛、高流畅度、个性化的现阶

01

【开源公告】面对面翻译小程序正式开源

免费开放微信AI团队在机器翻译，智能语音领域的业界领先成果，使开发者简便地在小程序中加入机器翻译，智能语音能力。

06

最佳实践 | 基于腾讯云MRCP-Server打造简单智能外呼系统

智能外呼在国内已发展多年，整体的技术早已非常成熟。那么一个简单的智能外呼系统应该包含哪些东西呢？

Springboot3+Vue3实现副业（创业）智能语音项目开发(官方同步)

随着人工智能技术的快速发展，智能语音项目成为了科技领域的一大热点。智能语音项目不仅涉及语音识别（ASR）技术，还涵盖语音合成（TTS）、自然语言处理（NLP）等多个方面。本文将探讨智能语音项目开发过程中的技术挑战以及未来的发展趋势。

01

腾讯AI Lab 8篇论文入选，从0到1解读语音交互能力 | InterSpeech 2018

AI科技评论按：Interspeech 会议是全球最大的综合性语音信号处理领域的科技盛会，首次参加的腾讯 AI Lab共有8篇论文入选，居国内企业前列。这些论文有哪些值得一提的亮点？一起看看这篇由腾讯 AI Lab供稿的总结文章。另外，以上事件在雷锋网旗下学术频道 AI 科技评论数据库产品「AI 影响因子」中有相应加分。

01

科大讯飞和Tizen-TTS语音合成引擎

最近在做一个文本转语音TTS(Text to Speech)的第三方软件封装，使用的是国内语音技术龙头安徽科大讯飞公司提供的离线引擎AiSound5.0，主要用于汽车导航用途。科大讯飞还提供了AiTalk用于语音识别，AiWrite用于手写识别服务等。另外还有针对6种平台的SDK和开发示例。

03

初音未来、洛天依、镜音......揭秘虚拟歌姬背后的大BOSS

提到虚拟歌姬，你的第一反应是谁？洛天依、初音未来、乐正绫、巡音、Gumi、言和、镜音、东方栀子......。（没上榜的记得评论区留言）在二次元的世界里，虚拟歌姬是一个特殊的存在，他们不是"活人"，但有粉丝、有流量、有作品，其影响力、待遇不亚于一个鲜活的网红IP。以洛天依为例，她是全世界第一款中文声库和虚拟形象，也是首位登上中国主流电视媒体的虚拟歌手，与杨钰莹、周华健、王源等一众明星在春晚同台合唱和歌舞表演。她们一步一步成长，不断给我们带来“一字一句的美妙体验”。而成就这种“美妙体验”的，正是得益于

04

重塑银幕声音：腾讯云语音在视频中的应用

近期，改编自金宇澄同名小说，知名导演王家卫执导的电视剧《繁花》的热播引起剧烈反响。原著小说以其细腻的笔触和丰富的上海风情，描绘了 20 世纪 60 年代至 90 年代上海市民的生活图景，是一部具有浓厚地域特色和时代感的作品。王家卫的影视作品以其独特的美学风格和深刻的情感表达著称。沪语版剧中使用上海话配音，字证腔圆让人耳目一新，相信后面肯定会有更多、更好的沪语影视作品呈现给观众，也会有更多的优秀专家深度参与，用沪语来叙述上海故事。

04

产品动态|腾讯云AI 8月产品更新

腾讯云AI团队联合腾讯优图、AILab、微信智聆、微信智言等实验室，帮助合作伙伴和客户高效打造针对性的解决方案，助力各行各业的数字化和智能化转型。 8月，腾讯云慧眼、腾讯云神图、语音识别、NLP自然语言处理、语音合成推出全新功能，语音识别、语音合成优化了核心性能。腾讯云慧眼银行卡基础信息查询慧眼人脸核身最新上线银行卡基础信息查询接口，该接口可以查询银行卡基础信息，包括开户行、银行卡性质等。可广泛应用于需要查询银行卡基础信息的业务场景。腾讯云神图人像动漫化基于用户上传的一张带人脸信息的图片，

C# 10分钟完成百度语音技术（语音识别与合成）——入门篇

我们现在就基于百度Ai开放平台进行语音技术的相关操作，demo使用的是C#控制台应用程序。

02

常用的语音芯片工作原理_分类为语音播报语音识别语音合成tts

关于声音的需求，从始至终，都是很刚需的需求。从语音芯片的演化就能看出很多的端倪，很多很多的产品他必须要有语音，才能实现更好的交互。而语音芯片的需求分类，其实也是很好理解的，从市场上常用的芯片产品特性，大概就能归类如下：

04

初音未来、洛天依、镜音......揭秘虚拟歌姬背后的大BOSS

提到虚拟歌姬，你的第一反应是谁？洛天依、初音未来、乐正绫、巡音、Gumi、言和、镜音、东方栀子......。（没上榜的记得评论区留言）在二次元的世界里，虚拟歌姬是一个特殊的存在，他们不是"活人"，但有粉丝、有流量、有作品，其影响力、待遇不亚于一个鲜活的网红IP。以洛天依为例，她是全世界第一款中文声库和虚拟形象，也是首位登上中国主流电视媒体的虚拟歌手，与杨钰莹、周华健、王源等一众明星在春晚同台合唱和歌舞表演。她们一步一步成长，不断给我们带来“一字一句的美妙体验”。而成就这种“美妙体验”的，正

03

基于树莓派的语音识别和语音合成

语音识别技术即Automatic Speech Recognition（简称ASR），是指将人说话的语音信号转换为可被计算机程序所识别的信息，从而识别说话人的语音指令及文字内容的技术。目前语音识别被广泛的应用于客服质检，导航，智能家居等领域。树莓派自问世以来，受众多计算机发烧友和创客的追捧，曾经一“派”难求。别看其外表“娇小”，内“心”却很强大，视频、音频等功能通通皆有，可谓是“麻雀虽小，五脏俱全”。本文采用百度云语音识别API接口，在树莓派上实现低于60s音频的语音识别，也可以用于合成文本长度小于1024字节的音频。此外，若能够结合snowboy离线语音唤醒引擎可实现离线语音唤醒，实现语音交互。

03

AI虚拟人多模态交互落地难题如何破解？我们在乐享A.I.技术沙龙成都站找到了答案

6 月 23 日，讯飞开放平台乐享 A.I. 技术沙龙“A.I. 虚拟人多模态创新交互”专场在成都圆满落幕。 35 秒带你回顾现场精彩瞬间↓↓↓ 近几年，随着图像处理、语音合成、语音识别、语义理解、多语种等多项人工智能技术不断发展，AI 虚拟人开始在各行各业落地应用，各大公司争相布局。这背后，其实是 AI 虚拟人多模态交互技术正在成为大趋势。多模态融合视觉、听觉、文本等多种模态信息，能够打破单模态输入输出限制，从而更贴近人类真实使用习惯。对于 AI 交互产品来说，只有综合利用多模态信息才能更准确地理解人类

01

灵云提供多维度人工智能SDK，让每家企业都拥有自己的AI

灵云全方位人工智能平台赋能合作伙伴，让合作伙伴可以用灵云AI技术打造更加智能的各种应用系统。捷通华声与产业伙伴互补优势、合作共赢，携手将AI技术推进千企万户，让每一家企业都能拥有人工智能。灵云全方位

05

最佳实践 | 用腾讯云智能语音打造智能对话机器人

在AI技术的推动下，智能对话机器人逐渐成为我们工作、生活中的重要效率工具，乃至是伙伴，特别是为企业带来最原始最直观的“降本增效”落地实现。

08

玩转AI新声态 | 玩转TTS/ASR/YuanQI 打造自己的AI助手

本次带来的是腾讯云玩转AI新声态语音产品应用实践,利用 TTS / ASR / 元器智能体打造一个《小朋友的故事屋》智能体 Bot 最近腾讯发布了元宝,那么我们就做一个专属讲故事的童话匠该 bot 可以实现语音和智能体交流达到和小朋友互动,在此之前我先介绍一下什么是 TTS、ASR 以及元器智能体(简单略过详细学习前往: 《继ChatGPT的热潮AI的新产物-智能体元器Agent平台》

【AIDL专栏】陶建华：深度神经网络与语音（附PPT）

“人工智能前沿讲习班”（AIDL）由中国人工智能学会主办，旨在短时间内集中学习某一领域的基础理论、最新进展和落地方向，并促进产、学、研相关从业人员的相互交流。对于硕士、博士、青年教师、企事业单位相关从业者、预期转行AI领域的爱好者均具有重要的意义。2018年AIDL活动正在筹备，敬请关注公众号获取最新消息。

03

微软语音AI技术与微软听听文档小程序实践 | AI ProCon 2019

【导语】9 月 7 日，在CSDN主办的「AI ProCon 2019」上，微软（亚洲）互联网工程院人工智能语音团队首席研发总监赵晟、微软（亚洲）互联网工程院 Office 365资深产品经理，Office 小程序负责人张鹏共同发表《微软语音AI与微软听听小程序实践》的主题演讲，分享微软人工智能语音的技术以及微软听听小程序的落地实践。

02

NVIDIA这个线上AI训练营开放免费旁听啦，只要有GPU卡就可以参加

第六届Sky Hackathon大赛已经报名结束，49支高校参赛队伍已经集结完毕。有开发者问：“我们不是高校学生，是否也能旁听线上训练营？” NVIDIA的答复是：安排！训练营的目标本次Hackathon活动以AI助力防疫——创建AI“大白”为主题。身着白色防护服的工作人员辛苦奋战在抗疫一线，我们可以通过AI的技术辅助防疫工作，例如口罩识别检测和口罩佩戴语音提醒，小区门禁二维码识别等场景的应用, 学习AI项目在疫情防控中的设计理念。场景描述：第一步：通过语音跟AI大白打招呼“你好大白，请让我进入

02

语音合成学习（一）综述

爱丁堡大学课程（全英文，有能力的推荐学习一遍）：https://speech.zone/courses/speech-synthesis/

02

Python语音交互的实现

在windows10上运行的测试内容。 Python版本：Python3.6.2。已经注册并添加了百度的'’语音识别'和'语音合成'应用。已经注册并创建了图灵机器人的'机器人'。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭