Lucille Estrella 發自 小愛的凝視下
NEXTTECH 報道 | 公眾號 TechMix
2017 年 7 月 2 日早上,美國新墨西哥州的一所住宅里,男主 Eduardo Barros 與女友爆發了一場激烈的家庭爭吵。正在氣頭上的 Eduardo 拔出手槍對準女友的頭部,大聲喊道:“你是不是報警了?!”
幾分鐘后,一輛警車??停在家門口,警察蜀黍控制住局面,并帶走了失去理智的 Eduardo,只留下了一臉懵逼的女友風中凌亂——我連電話都沒碰,警車怎么就來了,難道警察還有順風耳?
Eduardo Barros 照片 | 圖源:CNN
別躲了~智能音箱啥都知道
后續故事大家可能都知道了,
隔墻有耳的
不是警察,而
是角落里不起眼的 Google Home 智能音箱
。它誤將 Eduardo 質問里提到的“報警”識別成了語音命令,撥通了 911,才有了隨后的一幕——警方接線員聽到了電話中的爭吵聲,派來了警察蜀黍??。
這個案子里,Google Home 成為了解救母女的頭號功臣,但當大家從驚心動魄的故事情節中冷靜下來時,卻也發現了一個嚴重的問題——
即使在未喚醒的休眠狀態下,智能音箱依舊在監聽我們的一舉一動
。
關于智能設備監聽隱私安全的擔憂,已經是個老生常談的話題。電腦、手機、智能手表…前不久甚至還傳出被三星智能電視監聽的例子。誰也說不清這些無處不在的麥克風設備何時開啟,聽見了啥,又把我們的“大數據”告訴了誰。
去年,維基解密網站透露美國中央情報局曾利用黑客手段將三星智能電視轉變為竊聽器,并將錄音傳輸到中情局服務器上。
但與其無計可施地提心吊膽,就
不能利用音箱們“偷聽”的習慣,為我們創造些價值嗎?
比如,提醒健忘沒關手龍頭的你: 嗨,醒一醒!發大水了!起不來的話就直接幫你關掉,然后給你在亞馬遜上買條船讓你劃出門得了。(我沒有這個蠢主人!)
當然,這一切的前提,是
智能設備能夠正確識別環境中的聲音
。
“愚蠢的主人,還是乖乖聽我的吧”
現在的智能音箱能夠勝任這項工作嗎?
并不
…它們能聽得懂主人“關水龍頭”的指令,卻對“BGM”中的水流聲無動于衷。
為了給智能音箱加戲,美國卡耐基梅隆大學(CMU)的研究人員開發了一項新系統 Ubicoustics “即插即用的聽聲識別系統”。簡單來說,就是
使用內置麥克風,對活動和背景進行實時聲音辨識
,讓智能音箱知道史上三大難題的答案:我是誰?我在哪?誰在打我?
這個功能如何實現?
數據訓練自然是必不可少的。
為了提高識別的準確率,CMU 的團隊找來了高質量、復雜的好萊塢專業音效庫。它們清晰,標簽清楚,分割良好,也足夠多樣化。
用這個音效庫訓練出的模型,可比從網上不知道哪個犄角旮旯挖來的聲學數據訓練的模型準確多了。
團隊在 7 個場景中測試了模型:浴室、臥室、門廊、廚房、辦公室、戶外和工作室。最終結果相當驚人,
在某些場景中,模型的識別準確率甚至超過了我們人類
。
即使在嘈雜的環境中,
模型識別準確率也有 80.4%
。雖然離滿足人們日常生活需求有些差距,卻也和人類并駕齊驅了。
研究人員也對 Ubicoustics 的潛力信心十足。在他們設想中,有了 Ubicoustics 加持的智能生活應該是醬的:
“咕隆咕隆”的洗衣機停止工作后,音箱會立刻喊你去曬衣服;聽到周圍一堆病號頻繁咳嗽或打噴嚏,智能手表就能自動開啟跟蹤你的健康狀況,提醒你多洗手或者喝兩袋板藍根做預防。
論文已經在剛剛結束的 UIST (用戶界面軟件與技術大會)上發了,但 Ubicoustics 暫時還落不了地,目前模型會犯些讓人哭笑不得的錯誤。但他們認為,
在一年左右的時間內,Ubicoustics 的準確率就能達到 90% 至 95%
,那時,它就可以在日常生活中正常使用了。
暗中觀察的我可聽得一清二楚噢
同樣是感知判別背景聲音,早在 2012 年,就有一片叫做 
BodyScope: A Wearable Acoustic Sensor for Activity Recognition
 的論文亮相 ACM,聲稱能達到 71.5% 的識別率,與 Ubicoustics 不相上下,但它能聽出的聲音卻只局限于吞咽、喝水、講話、大笑和咳嗽,相當有限。
同樣是今年的 UIST,同樣是來自 CMU 的另一個團隊,Vibrosight 帶來了完全不同的解法。
Ubicoustics 用普通麥克風收集聲音,但這種方法天生就有嚴重的 bug——
判斷準確度很容易受到周圍雜音的影響,怎么辦?
Vibrosight 的解決方案是,用激光來“聆聽環境”,
通過測量物體表面的物理震動,來確定周圍環境中正在發生什么
。相比聲音,震動彼此干擾的可能性更小,所以在理想情況下,Vibrosight 的準確度甚至飆升至 98%。
別慌!有啥見不得人的…
看到現在,你最關心的恐怕還是隱私問題。想到隨時有只耳朵在監聽我們的生活,恐怕多數人都會不寒而栗。
確實,我們又回到了
是否要“以隱私交換便利度”
的討論中,畢竟,若用麥克風作為傳感器,這是不可避免的危險。
Ubicoustics 能讓我們放心嗎?
團隊研究人員在對待這個問題的態度上,著實有點詭異
。
一方面,他們解釋稱,自己的團隊其實相當重視潛在的隱私保護。他們
有技術保護措施
,將所有的現場音頻數據都轉化為低分辨率的梅爾頻譜圖,并將相位數據丟棄。這樣一來,語音數據壓根兒沒法恢復。而且,Ubicoustics 在本地設備上運行,根本不需要進行音頻數據的傳輸。
不過,隨后他們又補了一句:
又沒干見不得人的事兒,對只能音箱有啥好擔心的
…再說這年頭,誰家還沒個小愛天貓咋地?
隨著 AI 語音助手的能力越來越逆天,它的安全問題也勢必會得到企業和消費者的重視。
連《2001 太空漫游》的“哈爾 9000”電腦都能把人類丟出外太空,不好好在安全問題上把關的話,
說不準哪天你的小愛也要把你掃地出門咯
~
领取专属 10元无门槛券
私享最新 技术干货