前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >哥大研究员开发实时语音隐藏算法以阻止麦克风监听

哥大研究员开发实时语音隐藏算法以阻止麦克风监听

作者头像
小柔
发布2023-10-14 17:06:44
1580
发布2023-10-14 17:06:44
举报
文章被收录于专栏:小柔博客园小柔博客园

背景

“语音隐私泄露在未来会是重灾区”

对于窃取用户语音隐私这件事,企业和用户基本上都是各执一词。有的企业表示,从技术上,目前声音信息的处理,远达不到通过麦克风去获取个人隐私的水平。

然而事实是 手机、智能音箱,包括一些车载的智能语音终端,完全可以做到每一分每一秒监听我们的谈话、聊天,这也使得隐私安全问题更加突出

现在手机系统越升越高,从按键输入密码到指纹解锁再到现在的刷脸。如果猜想与朋友不经意的对话都能被商家进行贩卖,那刷脸后凭证将传向何方,更是令人不寒而栗。

语音作为场景交互的入口,其存在的隐私安全隐患在很多时候更加令人难以防范,对涉及的一些隐私安全问题,平台开发者也缺少真诚的回应。我们固然要发展、要创新,但不代表在技术刚起步时就要忽视这些问题的存在。

哥大研究院的算法是什么

哥伦比亚工程公司的研究人员开发了一个人工智能新系统,它可以产生一种低音,人们可以在任何房间、任何情况下播放,从而阻止智能设备的窥视。而且它很容易在电脑和智能手机等硬件上下载,使人们有能力保护自己的声音隐私。

算法特点

该算法具有预测性。它会推断用户接下来要说什么,并实时产生干扰性的可听背景噪音(耳语)来掩盖声音。

算法效果

目前,该系统只适用于英语,成功率约为80%。噪音的音量相对较低,最大限度地减少对用户的干扰,并允许舒适的交谈。

该算法研究过程背后的故事

如今,几乎所有的电子设备都嵌入了麦克风,当用户收到私人谈话中提到的产品广告时,他们就会体验到高水平的自动窃听。

最初方案

许多研究人员以前曾试图通过使用白噪声来降低这种风险

白噪声可以在一定程度上欺骗自动语音识别系统。

然而,在实际情况下使用任何现有的实时声音隐藏方法都是不可能的,研究人员说:因为音频需要接近瞬时的计算,而这在当今的硬件上是不可行的

声音伪装

语音识别模型将考虑到每一个被训练来转录的口语单词,预测用户什么时候会说这些单词,并在适当的时候产生耳语。

image.png
image.png

他们的实验用各种语音识别系统测试了该算法,发现当耳语被使用时,总的诱导错误率为80%。

image.png
image.png

实验表明,像“the”、“our”和“they”这样较小的单词更难被屏蔽,而较长的单词通常更容易被算法攻击。

image.png
image.png

总结

语音识别所带来的隐私安全隐患更多的是和每个个体相关,与每个用户的切身利益相关,而不仅仅是存在于商业层面。所以,在目前阶段,一些法律、规则必须要即时跟上来,不能任其发展。“语音隐私泄露在未来会是一个重灾区,而且是一个要害区域。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2023-10-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 背景
    • “语音隐私泄露在未来会是重灾区”
    • 哥大研究院的算法是什么
    • 算法特点
    • 算法效果
    • 该算法研究过程背后的故事
      • 最初方案
        • 声音伪装
        • 总结
        相关产品与服务
        语音识别
        腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档