专栏首页新智元【AI版狄仁杰】爱丁堡大学团队教AI识别犯罪剧中的罪犯,正确率达60%仍不及人类

【AI版狄仁杰】爱丁堡大学团队教AI识别犯罪剧中的罪犯,正确率达60%仍不及人类

作者:常佩琦

【新智元导读】爱丁堡大学的研究人员通过《犯罪现场调查》系列电视剧的相关视频、音频和文本训练AI,测试AI能否准确识别每集中的罪犯。在每集电视剧结束前10分钟,AI达到了60%的识别准确率,而人类的准确率达85%。

马路的尽头竟然有一具尸体,凶手是谁?或许AI可以解决这个问题。

Lea Frermann是爱丁堡大学的一名博士后研究员,她所在的团队通过《犯罪现场调查》系列电视剧的相关视频、音频和文本训练AI学习识别每一集中的罪犯。

AI识别犯罪剧中罪犯,准确率达60%

研究人员将五季《犯罪现场调查》(共39集,59个案件)的录像、脚本和背景音映射成电脑可以读取的格式。数据被输入到一个计算机模型中,随着每个事件的展开,AI学习如何处理情节,并不断修正罪犯的身份。

在每集电视剧结束前10分钟,AI达到了60%的识别准确率,而人类的准确率达85%。

Frermann表示,“虽然人类识别犯罪者的准确率更高,但人类也更谨慎。”而团队设计的模型则能更大胆地进行识别。

Frermann解释了团队的研究目的:在给定足够数据的情况下是否可以训练一个AI系统来解决人类难以解决的问题。

10月底,团队在Transactionsof the Association for Computational Linguistics学术期刊上发表了他们的研究成果,并邀请其他学术界人士继续深入研究他们的发现。Frermann说,“我们希望我们的研究结果将有助于开发能实时接收大量信息的机器。”

根据Frermann所说,很大程度上,团队很满意他们通过《犯罪现场调查》训练AI系统所得到的结果。“对电脑来说,在电视节目中识别出罪犯,是一件非常艰巨的任务。但我们的模型表现得非常好。”

Frermann并不认为仅用更多数据便能提高预测准确率。她说,“我认为我们需要认真思考如何让这个模型可以访问其他信息。人类拥有如此多的世界知识,很难在一台机器上进行彻底编码。我们需要给模型配上更好的背景知识和更好的推理策略。我不认为只是抛出更多非结构化的数据能让我们走得更远。海量数据只能起一点点作用。

论文摘要

“在本文中,我们认为以《犯罪现场调查》为例的电视节目是一个理想的试验平台,可以接近真实世界的自然语言理解和与之相关的复杂推论。我们建议把犯罪剧当作一个新的推理任务,利用每个事件提出相同的基本问题(即“谁犯了罪?”),在罪犯被揭露时提供答案。我们开发了一个基于《犯罪现场调查》剧集的新数据集,将罪犯身份确定为序列标签问题,并开发了一个基于LSTM的模型,该模型可从多模态数据中学习。实验结果表明,增量推理策略是准确预测的关键,也是融合文本、视觉和声音输入的表征学习的关键。”

论文地址:https://arxiv.org/abs/1710.11601

本文分享自微信公众号 - 新智元(AI_era)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-12-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 微软副总裁洪小文:AI+HI是终极智能形态 | 北大AI公开课第11讲

    【新智元导读】微软全球资深副总裁、亚太研发集团主席、微软亚洲研究院院长洪小文博士亲临北大 AI 公开课,就 AI 的感知与认知能力、AI (人工智能)与 HI ...

    新智元
  • 中国AI产业背后的富士康工人:拿低工资为硅谷巨头的数据贴标

    而如果数据是新的能源和宝藏,那么中国已经成为最大的生产国。这所工厂挤满了劳动者,他们正努力为机器学习标注图像和数据。

    新智元
  • 【中国战队包揽234却无缘冠军】OpenAI 的 Dota2 机器人强在哪?

    【新智元导读】DOTA2 经典赛事TI7国际邀请赛决出最后冠军,中国团队虽占据234名但无缘冠军。回顾本届比赛,Open AI 的机器人因为战胜了人类玩家而大放...

    新智元
  • Vue 3 条件渲染

    v-if 指令用于条件性地渲染一块内容。这块内容只会在指令的表达式返回 truthy 值的时候被渲染。

    公众号---人生代码
  • 京津冀今年开架“大数据走廊”

    大数据文摘
  • AI2想从常识测试开始让AI理解物理世界,数据集已公布

    到现在,智能音箱还是没能摆脱“智障”的魔咒。或许,人工智能需要一种全新的方法学习语言。

    量子位
  • 【解析】大数据环境下的数据库设计

    很多大数据应用的实施似乎都是在一个现有的数据仓库上,添加一个或多个新的大容量数据流,还有一些支持数据存储和业务分析的专业软硬件。数据存储问题通常是通...

    机器学习AI算法工程
  • Python 版 LeetCode 刷题笔记 #7 整数反转

    今天迎来了个简单难度的题目,在经历一番中等难度题目的洗礼后,情不自禁露出吊打小朋友的微笑,感觉今天可以多做几道。

    TTTEED
  • 干掉围棋九段后,可定制计算能让AI打败程序员和芯片工程师吗?

    导读:在2018人工智能计算大会上,丛京生发表“可定制计算与AI”的演讲。丛京生提出,计算能力的提高,让今天的AI无处不在。而当前计算的瓶颈是能耗和能效的问题。...

    华章科技
  • PHP中Smarty引擎的常用语法

    后天Date of the day after tomorrow (Day+2):

    Enjoy233

扫码关注云+社区

领取腾讯云代金券