前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >[深度学习概念]·声纹锁与声纹识别技术原理解析

[深度学习概念]·声纹锁与声纹识别技术原理解析

作者头像
小宋是呢
发布2019-06-27 14:45:43
2.8K0
发布2019-06-27 14:45:43
举报
文章被收录于专栏:深度应用深度应用

声纹锁与声纹识别技术原理解析

声纹锁的工作原理是什么?声纹识别技术原理是怎样的?声纹锁也是智能门锁的新兴品种。利用声纹识别技术进行开锁,在门锁中也开锁得到了应用。声纹锁和指纹锁有着异曲同工之妙,与指纹锁基于指纹识别技术不同的是,声纹锁是对于声音的技术识别,本文将为大家解释声纹锁识别的技术原理。

图片6.jpg
图片6.jpg

什么是声纹锁

声纹锁将声纹识别应用于门禁系统,实现传说中芝麻开门的神话。声纹锁建立在声纹识别技术的基础之上,是声纹识别技术的一个具体的应用。据称,声纹锁在日本等国家的使用已经比较普遍,他们将声纹锁应用于室内,实现基本的隐私保护。

语音生物特征识别,又称说话人识别,俗称声纹识别,是根据说话人的发音生理和行为特征,自动识别说话人身份的一种生物识别方法。声纹识别所提供的安全性可与其他生物识别技术(如:指纹、掌形和虹膜)相媲美,而且语音采集装置造价低廉,只需电话/手机或麦克风即可,无需特殊的设备;它与说话语言无关,与方言腔调无关,不涉及隐私问题,适应人群范围很广;声音信号便于远程传输和获取,在基于电信和网络的身份识别应用中,声纹识别更为擅长,得天独厚。

图片5.jpg
图片5.jpg

声纹锁工作原理详细介绍

类似于人类的指纹和DNA,声纹也是人体独特的个性生物特征,很难找到两个声纹完全一样的人。

声纹识别,生物识别技术的一种。也称为说话人识别,有两类,即说话人辨认和说话人确认。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。声纹识别就是把声信号转换成电信号,再用计算机进行识别。

所谓声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官--舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。

每个人的语音声学特征既有相对稳定性,又有变异性,不是绝对的、一成不变的。这种变异可来自生理、病理、心理、模拟、伪装,也与环境干扰有关。尽管如此,由于每个人的发音器官都不尽相同,因此在一般情况下,人们仍能区别不同的人的声音或判断是否是同一人的声音。

声纹识别(Voiceprint Recognition, VPR),也称为说话人识别(Speaker Recognition),有两类,即说话人辨认(Speaker Identification)和说话人确认(Speaker Verification)。前者用以判断某段语音是若干人中的哪一个所说的,是“多选一”问题;而后者用以确认某段语音是否是指定的某个人所说的,是“一对一判别”问题。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可能需要辨认技术,而银行交易时则需要确认技术。不管是辨认还是确认,都需要先对说话人的声纹进行建模,这就是所谓的“训练”或“学习”过程。

声纹识别的主要任务包括:语音信号处理、声纹特征提取、声纹建模、声纹比对、判别决策等。

声纹识别可以说有两个关键问题,一是特征提取,二是模式匹配(模式识别)。

声纹锁在应用上所遇到的最大挑战在于,应用场合下的环境比较嘈杂时,会严重影响识别效果。因此,能否处理好环境噪音,已成为检验声纹锁成熟度的重要标准。

近几年,在国内也有数家企业开始或研究机构开始这方面的商业推广,由于某些技术瓶颈仍未突破,实际推广效果并不乐观。

声纹识别在国内范围来说,还是一项比较前沿的技术,所以基于声纹识别技术的应用更是比较少。

总结

目前声纹识别应用在门禁系统上并不成熟,但这也是智能锁的一个研究方向。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019年02月26日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 声纹锁与声纹识别技术原理解析
    • 什么是声纹锁
      • 声纹锁工作原理详细介绍
        • 总结
        相关产品与服务
        语音识别
        腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档