专栏首页大数据文摘科学家运用大数据准确识别昆虫

科学家运用大数据准确识别昆虫

加利福尼亚Riverside大学研究人员宣布发现了一种昆虫分类的新方法,较之以往的方法更加准确、快速和实用,其成功关键在于:现成的激光指针结合和大数据应用。 研究人员表示,几十年来研究昆虫分类一直依赖麦克风捕捉昆虫飞过所发出的声音。遗憾的是麦克风所捕捉环境噪声嘈杂,除非昆虫在理想条件下飞过麦克风,要捕捉到有用数据是非常困难的。小的数据集结合非自然条件下数据,以最大限度提高数据收集,这有可能导致预测模型不准确(过度拟合)。 大数据出现,有助于缓解过度拟合。因为有更多数据,有多类型的数据,可供用于训练和测试模型,有助于检测真实的事物。想一想但我们试图判断某人关系模型时,只要研究Facebook有关数据,就可以建立已婚、单身或约会对象这样的关系,结合地缘、受教育程度和年龄因素等熟悉,可以很容易建立一个模型,很容进行预测。

我们用一个激光指针,配备一个光电晶体管和数字记录器,激光指示器提供一种新颖的方法,用于捕获昆虫飞过的声音,同时又不屈从于麦克风方法的缺点。他们捕捉昆虫翅膀飞过所引发激光束中断,并将其转成一个音频文件。利用这种方法,研究人员声称抓获了数千万的昆虫声音,在试验中为六大种类昆虫提供了一个准确的标签。

然而,该研究团队进一步分析了昆虫的昼夜节律(一天的时候,他们是活跃的),他们根据时间,而不仅仅是翅膀中断模型进行研究,让型更加精确。他们的模型也研究相同地理属性的,,因此可以进行正确的假设,例如,在撒哈拉以南非洲的蚊子,可能与在美国发现蚊子不是相同的物种,即使他们有着相似的昼夜节律和声音。

最终他们的模型可以准确区分79.44%的昆虫,期间包括10个不种类的昆虫(这包括来4~6项,关于雌雄性别的研究)。但研究两类昆虫时,模型准确率可以达到98.99%。其相同种类雌雄分辨的准确率可以到到99%。

如果结合分析哪些昆虫是有害的,哪些是无害的,并达到一定的准确率,那么这种新的激光结合大数据的分析方法,无疑也就具有了一定的实用性。

摘自:比特网

本文分享自微信公众号 - 大数据文摘(BigDataDigest)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2014-05-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 2014中国移动医疗调研报告

    大数据文摘
  • 由深度神经网络想到的人生意义和哲理

    大数据文摘
  • 你想成为医疗保健领域的黑马吗

    大数据文摘
  • 水电站为何需要卫星同步时钟系统?

    随着水电站的快速发展,分散的系统计算机监控系统、水情测报系统、视频监控系统、状态监测系统、生产信息管理系统……

    时钟系统分析专家
  • js实现截图并保存图片(html转canvas、canvas转image)

    从入门到进错门
  • HTML5---day3---之简单游戏(1)

    西门呀在吹雪
  • 基于 Vue.js 的移动端组件库mint-ui实现无限滚动加载更多

    通过多次爬坑,发现了这些监听滚动来加载更多的组件的共同点, 因为这些加载更多的方法是绑定在需要加载更多的内容的元素上的, 所以是进入页面则直接触发一次,当监听到...

    蓓蕾心晴
  • 一篇文章带你了解HTML语法

    在做web开发时,我们必不可少的要使用到Html,因为它包含了最基础的网页结构,虽然Html只能帮助我们构建静态网页,但是却是我们最不能缺少的部分,如果...

    前端皮皮
  • Web前端学习 第2章 网页重构8 网页结构

    在生活中,家谱就是一个最常见的树状结构,一个人可以有多个儿子,但是儿子只能有一个父亲,随着整个家庭一代代繁衍,整个家谱树也越来越根深叶茂。我们先看一个家谱的例子...

    学习猿地
  • 如何采用类比法和类推法估算软件项目工作量

      用于软件项目工作量估算的方法有以“估”为主的专家法和类推法,以“算”为主的类比法和方程法。在软件估算的实践中,类比法和类推法也是普遍使用的估算方法,但很多人...

    软件造价评估联盟

扫码关注云+社区

领取腾讯云代金券