【新智元导读】爱丁堡大学的研究人员通过《犯罪现场调查》系列电视剧的相关视频、音频和文本训练AI,测试AI能否准确识别每集中的罪犯。在每集电视剧结束前10分钟,AI达到了60%的识别准确率,而人类的准确率达85%。
马路的尽头竟然有一具尸体,凶手是谁?或许AI可以解决这个问题。
Lea Frermann是爱丁堡大学的一名博士后研究员,她所在的团队通过《犯罪现场调查》系列电视剧的相关视频、音频和文本训练AI学习识别每一集中的罪犯。
AI识别犯罪剧中罪犯,准确率达60%
研究人员将五季《犯罪现场调查》(共39集,59个案件)的录像、脚本和背景音映射成电脑可以读取的格式。数据被输入到一个计算机模型中,随着每个事件的展开,AI学习如何处理情节,并不断修正罪犯的身份。
在每集电视剧结束前10分钟,AI达到了60%的识别准确率,而人类的准确率达85%。
Frermann表示,“虽然人类识别犯罪者的准确率更高,但人类也更谨慎。”而团队设计的模型则能更大胆地进行识别。
Frermann解释了团队的研究目的:在给定足够数据的情况下是否可以训练一个AI系统来解决人类难以解决的问题。
10月底,团队在Transactionsof the Association for Computational Linguistics学术期刊上发表了他们的研究成果,并邀请其他学术界人士继续深入研究他们的发现。Frermann说,“我们希望我们的研究结果将有助于开发能实时接收大量信息的机器。”
根据Frermann所说,很大程度上,团队很满意他们通过《犯罪现场调查》训练AI系统所得到的结果。“对电脑来说,在电视节目中识别出罪犯,是一件非常艰巨的任务。但我们的模型表现得非常好。”
Frermann并不认为仅用更多数据便能提高预测准确率。她说,“我认为我们需要认真思考如何让这个模型可以访问其他信息。人类拥有如此多的世界知识,很难在一台机器上进行彻底编码。我们需要给模型配上更好的背景知识和更好的推理策略。我不认为只是抛出更多非结构化的数据能让我们走得更远。海量数据只能起一点点作用。
论文摘要
“在本文中,我们认为以《犯罪现场调查》为例的电视节目是一个理想的试验平台,可以接近真实世界的自然语言理解和与之相关的复杂推论。我们建议把犯罪剧当作一个新的推理任务,利用每个事件提出相同的基本问题(即“谁犯了罪?”),在罪犯被揭露时提供答案。我们开发了一个基于《犯罪现场调查》剧集的新数据集,将罪犯身份确定为序列标签问题,并开发了一个基于LSTM的模型,该模型可从多模态数据中学习。实验结果表明,增量推理策略是准确预测的关键,也是融合文本、视觉和声音输入的表征学习的关键。”
论文地址:https://arxiv.org/abs/1710.11601