前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Sensory TSSV - TrulySecureSpeakerVerificatio

Sensory TSSV - TrulySecureSpeakerVerificatio

作者头像
用户6026865
发布2020-08-17 16:24:16
5670
发布2020-08-17 16:24:16
举报

TSSV-面向硬件设备和应用的嵌入式的和简单的安全验证(Secure Authentication)技术。

Technical Overview and Data Sheet

Sensory TSSV技术是与语种无关的(language independent),高度安全且方便的,设备端嵌入式的用户语音和密码短语(passphrase)身份验证技术。

TSSV构建于Sensory拥有强大技术优势的语音处理(speech processing),噪音消除(noise mitigation),语音特征提取(speech feature extraction)和机器学习技术。TSSV应用手机,平板或PC的普通麦克风,无需特殊的硬件。

TSSV所有的数据,运算处理均在设备端完成,因此最大程度的保障了用户个人数据的安全性。

TSSV支持简单和快速的用户录入(user enrollment),仅需重复3次密码短语(由用户自定义,或预设短语,pre-determined or user-defined)。TSSV在最大程度的保障了非授权侵入的安全性的同时,也保障了授权用户的便利性。同时TSSV拥有非常强健的抗环境噪音干扰性,专为复杂的真实环境应用打造。

TSSV同时包含对SoundID的支持,从而实现对各种环境声音(environmental sounds)的识别,包括Glass Breaking, Babies Crying, Dogs Barking, Home Security Alarms, Doorbells, Knocking, 也包含对人的Snoring和Coughing的声音的识别,这对于COVID-19后的公共卫生新常态非常有价值。

TSSV支持所有主流的操作系统,提供几乎无限的集成灵活性(limitless implementation flexibility)。TSSV可依据客户不同的需求场景而高度可定制化。

Fixed-Phrase Authentication

固定唤醒词短语,突出产品的品牌特征

User-Defined Passphrase Authentication

消费者可自主选择其独特的密码短语提供强化安全的生物识别安全性(enhanced biometric security)。此功能与语种无关因此适合各种语言和市场。

Text-Independent Authentication

识别用户语音特征而无论用户说什么,为应用交互设计提供了极大的灵活性。

Configurable Security Level

提供面向高安全性和较低安全性的两种生物安全模式。更为开发者提供多达5中的安全敏感度(sensitivity levels)以适应不同的引用安全需求。

Accuracy

在安静环境下EER(Equal Error Rates)低至0.2%,对应识别率高达99.8%。在中等噪音环境下识别率也高达99%。

Wake Word Detection

与特定用户无关的(speaker-independent)预设唤醒词识别,具有极佳的环境和用户发音适应性。

Seamless Enrollment

在预设的一段时长内可自动抓取和识别用户声音特征,从而为用户提供个性化的服务。

Sound Identification

赋予设备感知环境世界声音的能力

Incremental Enrollment

支持持续的用户录入特征识别自适应增强,提供强化的安全性和识别准确性

Tried & Tested

TSSV技术已在超过2千万的设备中广泛采用

Technical Overview and Data

Voice-Biometric Modes -

语音生物识别(voice biometric)能力包含语音录入和验证两个步骤。在语音录入过程中,感知激励的频谱和时间序列信息从用户提供的语音样本中被抽取(perceptually motivated spectral and temporal features are extracted from voice samples)。

SDK随后应用其专有的机器学习技术对用户独特的声音特征高效建模(applies proprietary machine learning techniques to efficiently model the user's unique voice characteristics)。

录入过程既可以是通过专有的录入工程,连续多次录入,或在一段时间内采用增量模式录入(perform incremental over time)。

在识别验证过程中,用户的语音经过分析确定是否与模型相符。验证过程将会对用户语音进行全面的频谱特征分析(spectral properties),同时也可以与预先录入的短语执行短语验证(phrase-verification)。TSSV SDK支持三种基本的验证场景(authentication scenarios)-

Fixed-Phrase - 与客户系统开发的品牌专用短语或预设短语(predetermined passphrase),如“Hey Google"。TSSV SDK内置 Sensory的三个固定唤醒词短语,"Hello Blue Genie", "Open Sesame"和"Voice Genie"。

Text-Dependent - 用户通过重复3次的方式录入其选定的固定短语。也被称为用户自定义短语模式(user-defined passphrase mode)。

Text-Independent - 用户在10到20秒的时长内,随意说出一系列短语或句子。此验证过程与特定的短语无关。

Enrollment过程

录入过程如下图 -

经麦克风进入的音频文件,经过频谱分析(spetrally analyzed)和噪音压缩模块(noise-suppression module)处理后,进入语音探测模块(speech-detection)将数据链断句(chunking)成为独立的短语(individual phrases),随后经特征提取模块(feature extraction module)分析各个短语的频域内容(frequency-domain content)提取参数特别优化用于验证(specifically optimized for authentication)。

在特定短语被发现和识别后,音频质量评估模块(audio quality accessment module)会分析输入音频的适合度(analyze the suitability of the input),被环境噪音过分污染的音频文件会被拒绝掉。最后经断句的特征流经处理来评估语音模型,此模型会经系统调整其通用背景模型,用以建立特定录入用户的模型。此最终语音模型会包含此特定录入用户的统计特征,以及录入短语的时序模型(temporal model)。

Authentication过程

验证模块对用户输入音频流,背景噪音模型和用户录入模型进行处理。输入的用户音频流经频谱分析和噪音压缩处理以减少缓慢变化(slowly-varying)环境噪音的影响。频谱分析框架(spectrally analyzed frames)及特征提取模型(feature extraction module)用于提取感知驱动特征(perceptually motivated features),最终进入生物识别引擎,用以判定输入信号特征与预先录入特征是否一致。

Advance Modes

TSSV还提供对唤醒词的支持。在用户唤醒词唤醒后,对随后的语音查询进行身份用户语音身份验证。

不仅如此,TSSV SDK也支持在唤醒词识别唤醒后支持Seamless User Enroloment。在此模式下,引擎可以在语音唤醒后持续识别不同用户的声音特征并加以标记。此功能对于面向多用户的语音助理服务非常有价值,可以在识别不同用户后提供个性化的服务(specific services on a per-user basis)。

Data Summary

以下测试数据来自于Raspberry Pi 3运行Raspbian Stretch(32-bit ARM Linux)。

* A real-time factor of 2x implies that 60 seconds of audio is processed in 30 seconds on-device using a single processor core.

Sensory SoundID支持第一阶段的声音探测(first-stage detector)和第二阶段的声音事件再验证(second-stage event revalidation)模型。

以下为TSSV SDK的规格书 -

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-08-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 SmellLikeAISpirit 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
多因子身份认证
多因子身份认证(Multi-factor Authentication Service,MFAS)的目的是建立一个多层次的防御体系,通过结合两种或三种认证因子(基于记忆的/基于持有物的/基于生物特征的认证因子)验证访问者的身份,使系统或资源更加安全。攻击者即使破解单一因子(如口令、人脸),应用的安全依然可以得到保障。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档