深度学习识别10000物种,手机上的@博物杂志

【新智元导读】iNaturalist 推出一个识别动物和植物物种的app,使用TensorFlow训练神经网络,已经能够识别出超过10000种不同的物种,而且每1.7小时模型增加1个新的物种。

iNaturalist.org 推出了一个 Android 和 iOS 应用程序,可以在物种层面自动识别动物和植物。这个app使用 TensorFlow 进行训练,已经能够识别出超过10000种不同的物种,而且每1.7小时模型增加1个新的物种。

iNaturalist.org 是一个成立已久的受欢迎的网站,其使命是将专家和业余的“公民科学家”连接起来,激发人们对自然界的兴趣并鼓励参与自然世界,同时使用收集的数据帮助科学家检测生物多样性变化,甚至可以帮助发现新物种。网站由加州大学伯克利分校的学生成立于2008年,最近被加州科学馆收购,网站曾经依赖众包。当用户上传一张植物或动物的照片时,由科学家和博物学家进行识别。

iNaturalist 的联合主管斯科特·洛里(Scott Loarie)表示,众包的形式通常效果很好。用户上传的一半左右的神秘观察能在2天内被识别出来,假如上传的帖子就来自加利福尼亚州的话,识别的速度甚至更快,1小时就可以识别出来。这是因为iNaturalist的大量经验丰富的专家是以美国西海岸为基础的。但是,获得识别所需的平均时间是18天,这意味着一些用户需要等待很长时间才能知道自己拍摄的是什么物种。另一个问题是,随着网站越来越受欢迎,观察员(上传照片的用户)数量远远超过了鉴定员(告诉你照片中的生物是什么物种的志愿者专家)数量。

为了缓解志愿者专家的重担,iNaturalist 团队与康奈尔鸟类实验室(Cornell Lab of Ornithology),Merlin鸟类识别app的开发人员,以及Visipedia图像识别研究项目合作,使用机器学习技术更快地提供高质量的物种识别。

Visipedia 是 Visual Encyclopedia 的缩写,这是加州理工学院与康奈尔科技学院合作的一个项目,是一个人与机器联合的网络,旨在收集和处理视觉信息,并使任何人均可访问。

使用 TensorFlow 深度学习框架,Visipedia 团队对 iNaturalist 数据库上的专家社区标记过的图像训练神经网络模型。目前,iNaturalist拥有大约4,000,000可验证的观察结果,即具有所有必要的数据质量属性(例如照片,位置,非宠物,等等),并且已被专家审查,可以被认为是“研究级”的观察结果。这些观察结果代表了约100000的物种。

iNaturalist 的设计是,至少要有20个研究级的观察结果才能在其模型中包含1个物种。虽然上图显示有13730个物种,但这个数字可能是接近但还不到10000种,这是为了避免观察者的影响,必须确保每个物种有20个不同的观察者。

这个新的应用程序使用研究级的观察结果来对动物的物种给出自信的回答,并给出前10个可能的选项作为不确定建议。其最初给出的结果正确率是86%,在前10个建议项给出的结果正确率是77%。随着模型继续得到训练,这些正确率数字应该能提高,当然,这个应用程序本身对新的观察和新物种的识别也有帮助,平均每1.7小时能为模型增加1个新物种。

在demo中,app几秒内识别出牛科动物家族,虽然其识别的结果从濒危的蛮羊到大角羊都有。它给出的其他选项如下图:

右下方的是艾贝克斯山羊拉丁美洲亚种,西班牙东南部的北山羊,这似乎是完美契合的。App也会给出关于动物来源的信息,在上面的demo则是西班牙特有的野山羊。

iNaturalis 应用程序提供了一种快速简单的方式来以照片和GPS位置的方式记录用户观察到的动物和植物,并能够让世界各地的人访问其他人的观察,成为公民科学运动的一部分。

原文:http://www.i-programmer.info/news/105-artificial-intelligence/10848-inaturalist.html

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2017-06-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

【案例】浅谈医学大数据是怎么回事?

编者按:本文作者陈遵秋,美国俄勒冈州,健康科技大学,公共卫生预防系,美国统计协会认证统计分析师;陈漪伊,美国俄勒冈州,健康科技大学,公共卫生预防系,生物统计助理...

3073
来自专栏计算机视觉战队

人证核验系统解决方案

方案概述 随着各地平安城市建设的积极深入和依法治国战略方针的全面推进,中共中央办公厅、国务院办公厅于2015年印发了《关于加强社会治安防控体系建设的意见》。意...

6727
来自专栏ATYUN订阅号

Conservation Metrics通过声音分析帮助保护濒临灭绝的大象

根据联合国的统计,非洲每天有多达100头大象被参与非法象牙贸易的偷猎者屠杀。由于偷猎,每年大约有35000头大象被杀害。为了解决这个问题,加利福尼亚州圣克鲁斯的...

1323
来自专栏AI科技评论

业界 | 福布斯评出最热门的 10 大 AI 技术,以及面临的问题

AI科技评论按:Narrative Science 调查显示,去年已有 38% 的企业开始使用人工智能,而到 2018 年将增长至 62%。Forrester ...

3174
来自专栏机器学习人工学weekly

机器学习人工学weekly-12/17/2017

1. 第一当然是NIPS啦(注意看上一期NIPS在Facebook上的视频)。NIPS开完,各种资料分析就出来啦,对我们这种没有机会去现场的人来说是个福音。 t...

3216
来自专栏大数据文摘

数据中的城市,城市中的数据

1884
来自专栏量子位

萌新误入AI歧途怎么办?MIT博士小哥哥给你指条明路

做研究,特别是在AI领域做研究,时常挑战人类的智力极限和心理极限。来自MIT的汤姆,入坑已有两年,并在坑里向广大准同行们发来了倾心打造的攻略,帮助大家在漫漫夜路...

1113
来自专栏奇点大数据

如何看待人工智障?

在这之中,有很多人其实对人工智能是持有怀疑态度的,或是无神论者或是有神论者,持有这种观点的人都是大有人在。

1093
来自专栏FreeBuf

关于机器学习在网络安全中的五大误解

机器学习已经渗透到了人类活动的所有领域,它不仅在语音识别、手势识别、手写识别和图像识别上起着关键的作用,这些领域如果没有机器学习在现代医学、银行、生物信息和存在...

2105
来自专栏大数据文摘

关于机器学习在网络安全中的五大误解

2832

扫码关注云+社区

领取腾讯云代金券