大数据可以用来预测未来

科技正突飞猛进,社会日常运作的信息也随之突飞猛进。然而,需要对数据量进行组织、分析和交叉,以预测某些模式。这是“大数据”(Big Data)的主要功能之一。“大数据”是21世纪的一个水晶球,能够预测特定医疗条件下的反应、智能建筑的运行情况,甚至是基于某些变量的太阳行为。

科尔多瓦大学研究人员能够改进基于同一组输入变量同时预测多个变量的模型,从而减少预测所需数据的大小。其中一个例子是一种方法,它根据作物种植、耕作和杀虫剂使用等一系列变量预测与土壤质量相关的几个参数。在处理大量数据时,有两种解决方案。要么提高电脑的性能(这是非常昂贵的),要么就减少了正确完成这一过程所需的信息量。

在构建预测模型时,有两个问题需要处理:发挥作用的变量数量和系统中获得最可靠结果的示例数量。有了“少即是多”的理念,这项研究已经能够通过消除那些冗余或“嘈杂”的例子来减少例子的数量,因此对于创建更好的预测模型没有任何有用的信息。正如该研究的主要作者奥斯卡•雷耶斯(Oscar Reyes)所指出的那样:“我们开发了一种技术,可以告诉你需要哪组例子,这样预测不仅可靠,甚至可能更好。”在一些被分析的18个数据库中,他们能够在不影响预测性能的情况下减少80%的信息量,这意味着使用的原始数据不到一半。Reyes说,所有这些都“意味着在构建模型时节省能源和金钱,因为需要更少的计算能力。”此外,它还意味着节省时间,这对于实时工作的应用程序来说很有趣,因为“如果每隔5分钟就需要进行一次预测,那么模型运行半个小时是没有意义的。”

研究的作者指出,这些系统,同时预测多个变量(这可能与另一个),基于多变量(称为多输出回归模型,——是获得更显著的重要性由于广泛的应用程序”可以分析范式下的自动学习,“例如等相关医疗、水质、冷却系统为建筑与环境研究。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181113A14DAE00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券