【CIKM2018】从大数据到大信息和大知识教程(附PPT下载)

CIKM创办于1992年,是由美国计算机协会针对信息检索、知识管理以及数据库主办的全球顶尖学术会议。CIKM每年汇聚了最前沿的科研人员,探讨先进知识及信息系统面临的发展困惑及挑战,通过高质量、已实践的理论研究成果,确定未来的研究方向。

CIKM十分重视工业界的运用,除了CIKM Cup这样的面向实战的国际数据挖掘竞赛外, 还有很多的面向工业界的Tutorial、Workshop。今天给大家带来《从大数据到大信息和大知识:以地球观察数据为例

大数据和人工智能热潮之后,越来越多的专家开始思考未来的技术走向,中科院自动化所胡包钢,董未名,黄飞跃等人指出人工智能未来发展方向的“基于大数据+大知识的建模方法”。他们指出然而深度学习方法的局限性也是显而易见的。其中最为缺失的是关于知识的显式应用与更新。目前的深度学习方法没有应用演绎推理方式实现智能。 而”大知识”是一种以多学科为基础的、多领域为应用的、多种表达方式的一类知识库。 未来类人智能机器在利用已有知识与数据方面均会超过人类平均(AverageHuman-being)水平。其次,它也预示大数据利用下成功发展的深度学习模型必将依赖大知识利用方面取得突破性发展。而对于知识模型方法则需要采取大数据利用下的学习方式实现知识库的“自动/半自动”更新与扩展(这远不同于早期专家系统)。

参考文献:胡包钢,董未名,黄飞跃,基于大数据+大知识的建模方法 ——人工智能未来之路的探索,自动化学报通讯

摘要

一些特别重要的开放且免费的大型地理空间数据的丰富来源是各国的地球观测计划,如美国的Landsat计划和欧盟的哥白尼计划。地球观测数据是大数据的一个范例,从中提取的信息和知识也是如此。地球观测数据(卫星图像和现场数据)和所提取的信息和知识可用于许多对金融和环境产生影响的应用,比如应急管理,气候变化,农业和安全等领域。到目前为止,这种潜力尚未完全实现,因为地球观测数据和从中提取的信息“隐藏”在美国宇航局、欧洲航天局和国家航天机构操作的各种档案中。因此,想要开发应用程序的用户需要搜索这些档案,发现所需的数据和信息并将其集成到他的应用程序中。

在本教程中,作者将展示如何通过以RDF的形式发布数据来“打破这些孤岛”, 使现代搜索引擎能够发现它们,将其与其他相关数据连接起来,并使其在Web上免费可用,从而方便地开发地理空间应用程序。提供了一个完整的数据科学流程,该流程以各种格式的地球观测数据集开始,可以在ESA和NASA等空间机构的档案中免费获得,最后部署了一个交互式视觉应用程序,该应用程序使用地球观测数据和其他使用链接数据技术的抵押数据(例如,开放政府数据,封闭企业数据,模型数据等)。本教程将深入介绍在过去8年中,在5个欧洲项目的背景下,演示者开发的相关地球观测数据的技术,系统和应用。其他研究人员的相关工作也将深入讨论。最后,还将讨论该领域未来研究的开放性问题和方向。

教程概述

这是一个为期半天的教程,简要概述如下:

第1部分:简介。卫星图像。欧盟的哥白尼计划。哥白尼数据作为大数据的范例。

第2部分:卫星数据的数据库技术。在本教程的这一部分中,我们将介绍最新的数组DBMS:MonetDB / SciQL,paradigm4 / SciDB和rasdaman。我们将集中研究这些系统处理遥感数据的能力和现有应用。

第3部分:卫星图像的知识发现。在本教程的这一部分中,我们将介绍遥感文献,该文献研究模式识别和机器学习技术,以便从卫星图像中提取知识(例如,土地覆盖类)。PPT将展示这一部分

第4部分:地理空间和时间数据的RDF和SPARQL扩展。在本教程的这一部分中,我们将首先讨论RDF地理空间和时间扩展的数据模型和查询语言,重点关注数据模型stRDF和我们小组开发的查询语言stSPARQL,开放地理空间联盟(OGC)标准GeoSPARQL和RDF的扩展,用于表示不完整信息RDFi。 这些RDF的时空扩展可以使用本教程第3部分中介绍的技术以及其他附带数据(例如,某个国家的行政区划、OpenStreetMap数据等)对从卫星图像中提取的知识进行编码。

第5部分:时空RDF存储。在本教程的这一部分中,我们将介绍Strabon、Ontop-spatial和它们的竞争对手系统(Parliament、uSeekM、GraphDB、AllegroGraph、Virtuoso、Stardog和Oracle Spatial和Graph 12c),以及最近使用benchmark geographic对它们进行的功能和性能比较。我们还将讨论开放问题,比如如何将这些系统扩展到大数据,以及如何在关联数据范式中表示和查询栅格数据。

第6部分:互连地理空间和时间RDF数据。在本教程的这一部分中,我们将讨论有关地理空间实体解析的工作以及与Silk和Radon等系统发现地理空间关系的最新工作。

第7部分:搜索,浏览,探索和可视化遥感数据和链接的时空数据。在本教程的这一部分中,我们将首先讨论从卫星图像档案中进行基于内容的检索的遥感技术。我们还将展示我们的工具Sextant,用于可视化链接的时空数据,以及它在Copernicus App Lab项目的环境应用中的使用。

请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知)

  • 后台回复“CIKM2018BD” 就可以获取 最新PPT下载链接~

附PPT全文:

参考链接:

https://www.cikm2018.units.it/tutorial5.html

http://kr.di.uoa.gr/#cikm2018-tutorial

原文发布于微信公众号 - 专知(Quan_Zhuanzhi)

原文发表时间:2018-10-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

关于机器学习在网络安全中的五大误解

2832
来自专栏AI研习社

演员要失业了?AI 实时模拟面部表情,传神效果堪比真人克隆

两年以前,也就是 2016 年,我们提到过一篇论文,其内容主旨是有关面部模拟的——大家只要坐在照相机前,AI 能够把我们的面部动作表现在虚拟演员身上。这项工作叫...

1073
来自专栏PPV课数据科学社区

【学习】关于数据挖掘算法的反思

 写这篇文章,缘自于前几天部门内部成员们进行了一次部门内部现有涉及的一些算法的review以及整理。不过比较囧的就是,由于boss不在,我们讨论讨论着就成了吐槽...

3445
来自专栏数据科学与人工智能

【数据挖掘】这些年,这些挖掘机算法,这些反思

写这篇文章,缘自于前几天部门内部成员们进行了一次部门内部现有涉及的一些算法的review以及整理。不过比较囧的就是,由于boss不在,我们讨论讨论着就成了吐槽大...

2719
来自专栏新智元

【神经拟态计算】 有新灵魂的机器——模拟大脑的计算机

人们喜欢变着花样来形容大脑。以前,大脑被时髦地比作 17 世纪贵族花园中赏心悦目的喷泉背后的水力供应系统。随着技术的发展,大脑先后被形容为电报通信网和电话交换系...

3636
来自专栏PPV课数据科学社区

【黑科技】数据分析师的秘密-QQ聊天记录分析(二)

? 承接上一篇文章,在上一篇中主要对群活跃情况,和成员情况进行了分析,这一篇则主要是对聊天记录做一些浅显的文本分析。 文本挖掘是一个博大精深的领域,我们通常叫...

4068
来自专栏新智元

【Nature】机器学习实时读取大脑信息,超级计算绘制“思维地图”

【新智元导读】普林斯顿和英特尔合作,开发了一款脑成像分析套件(BrainIAK)的软件工具包,能通过互联网公开提供给任何想要处理fMRI数据的研究人员。他们的最...

36111
来自专栏AI科技评论

视频 | 演员要失业了?AI 实时模拟面部表情,传神效果堪比真人克隆

这里是,雷锋字幕组编译的 Two minutes paper 专栏,每周带大家用碎片时间阅览前沿技术,了解 AI 领域的最新研究成果。

1406
来自专栏AI科技评论

学界 | Facebook 最新研究:自主学习一个会和世界互动的智能体

AI 科技评论按:本文由来自 Facebook 人工智能研究院的研究员 Dhruv Batra 和 Devi Parikh 共同撰写,文中介绍了 Faceboo...

1202
来自专栏FreeBuf

关于机器学习在网络安全中的五大误解

机器学习已经渗透到了人类活动的所有领域,它不仅在语音识别、手势识别、手写识别和图像识别上起着关键的作用,这些领域如果没有机器学习在现代医学、银行、生物信息和存在...

2105

扫码关注云+社区

领取腾讯云代金券