首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

重构出版:语音交互技术的冲击与机遇

重构出版:语音交互技术的冲击与机遇 1 摘要:语音交互技术是人工智能技术的重要分支,包括语音识别、语音合成和语义理解三个部分。语音交互技术不仅从出版实务上重构了出版业,而且重构了出版业的核心概念。出版机构面对语音交互技术的冲击要主动培养音频编辑人才,提前布局市场,在下一次知识服务转型的风口占得先机。 关键词:人工智能;语音交互技术;重构;出版业 2 人工智能将对人类社会产生重大影响,而语音是人工智能技术重要应用领域之一。近年来语音交互技术日趋成熟,数字出版领域有声读物快速发展,市场不断扩大。“国内已经先

011

最佳实践 | 用腾讯云AI语音识别零基础实现小程序语音输入法

先回顾下,生活、工作中你使用过哪些语音识别相关的产品或者服务? 培训/考试相关的小程序,使用语音识别来判断回答是否正确; 英语口语练习的小程序,使用语音识别来打分; 你画我猜类的小程序,使用语音识别来判断是否猜对; 活动营销类的小程序,比如口令识别、口令红包等; 直播/短视频类小程序,使用语音识别生成字幕; 客服类的小程序,使用语音识别、语音合成来实现智能客服。 可以看到,语音识别的应用场景越来越广泛,我们在做小程序开发的时候,也经常会遇到使用语音识别的场景;其中语音输入法是非常基础的功能场景,如果能实

03

用机器学习解码一颗“失声”15年的大脑,让它“开口说话”

大数据文摘作品 作者:Miggy 对于瘫痪患者来说,最大的苦楚来自无法与外界进行沟通。虽然大脑依然活跃并且希望表达,但是无法驱动发声肌肉,会让这类患者的语言机制逐渐蜕化。 来自加州大学旧金山分校神经外科主任Edward Chang正在为失去说话能力的人开发脑机接口技术。他的实验室致力于解码与声道命令相关的大脑信号,并通过神经植入物,将大脑的语言机能,通过计算机输出出来。该项目不仅需要当今最好的神经技术硬件,还需要强大的机器学习模型。 最近,这一技术也取得了长足的进步,让一位因瘫痪“失声”15年的患者利用电脑

02

如何迈出与腾讯产品合作的第一步?|腾讯产业加速器-毕加所·案例实战首期

“我应该如何与腾讯合作?” “我需要在哪里找到合作?” 随着腾讯产业生态队伍的不断丰富,在与合作伙伴接触过程中,产品合作方法、合作流程、合作渠道等具体内容成为合作伙伴的共性问题。 近期,针对腾讯与合作伙伴的业务合作需求,腾讯毕加所推出案例实战系列分享会,致力于复盘研讨腾讯与腾讯产业加速器成员合作的优秀案例,通过多维度解读合作案例,为合作伙伴提供行之有效的实战经验;同时定期发布腾讯内部业务需求,助力加速器成员企业与腾讯打造更多落地案例。 6月2日,腾讯毕加所·案例实战首期分享在腾讯会议举办。追一科技CE

03

Android使用webrtc实现检测用户是否在说话

我们在Android应用做语音识别的时候,一般是用户唤醒之后开始说话。当用户超过一定的时候没有说话,就停止录音,并把录音发送到语音识别服务器,获取语音识别结果。本教程就是解决如何检测用户是否停止说话,我们使用的是WebRTC架构的源代码中的vad代码实现的。 VAD算法全称是Voice Activity Detection,该算法的作用是检测是否是人的语音,使用范围极广,降噪,语音识别等领域都需要有vad检测。webrtc的vad检测原理是根据人声的频谱范围,把输入的频谱分成六个子带:80Hz——250Hz,250Hz——500Hz,500Hz——1K,1K——2K,2K——3K,3K——4K。分别计算这六个子带的能量。然后使用高斯模型的概率密度函数做运算,得出一个对数似然比函数。对数似然比分为全局和局部,全局是六个子带之加权之和,而局部是指每一个子带则是局部,所以语音判决会先判断子带,子带判断没有时会判断全局,只要有一个通过认为是语音。

04
领券