DToN(Digital Twin of the News,数字孪生新闻)是欧空局资助项目,用于展示过去六个月五种不同的极端自然灾害事件,包括野火(wildfires)、火山爆发(volcanic eruptions)、洪水(floods)、干旱(droughts)和空气污染(air pollution)。
数字孪生指的是物理实体的虚拟表示,目的是在数字环境中模拟真实世界的行为。在DToN背景中,实体指的是地球和上述极端自然事件。
由于气候变化,上述事件在未来几年可能会变得更加频繁和强烈,因此人们迫切需要一种快速而简单的方法来探索它们。
DToN通过将地球观测(EO)数据与事件相关的新闻文章相结合提供了这样一种方法,从而为记者、政策制定者、分析人员、保护组织和感兴趣的公众提供了一个很好的切入点,可以快速获取高质量的背景材料。
以前发现和处理与事件相关的卫星图像至少需要几个小时的工作,并且需要对遥感数据有很好的理解,以自动化的方式开箱即用是向前迈出的一大步。
首先,一个自然事件(灾难)发生在世界上的某个地方,一些新闻媒体发布了相关文章。但你如何在海量的新闻中找到这些事件相关的新闻,并将它们链接到同一事件?这就是世界领先的新闻情报平台Event Registry的作用所在。每天,他们都会抓取成百上千的新闻页面,并使用自然语言处理模型提取“事件”。每个事件都带有一个摘要、元数据和相关文章列表。这些数据既可以直接被DToN(摘要、相关文章、新闻来源)使用,也可以作为进一步处理步骤(大致位置、日期、关键字)的输入,以找到最相关的卫星图像。
为了在应用程序中表示事件,我们需要将其链接到卫星数据。为此,有两项信息很重要——(确切的)地点和日期。在新闻文章中通常不会给出纬度和经度,我们需要包括一些额外的步骤获取与事件相关的位置信息。
目前,很多问题都是采用机器学习来解决,比如深度学习甚至生成对抗网络(GAN)等。然而,在我们的团队中,我们总是试图为挑战找到最简单的解决方案,而不一定是最新的技术,我们只在必要时才使用AI方法。
当一篇新闻文章谈到“Ventura附近爆发了两场独立的由风驱动的丛林大火”时,人们立即明白火灾不是发生在文图拉,而是发生在附近。然而,算法可能返回Ventura作为位置,因为在每篇文章中都提到过Ventura。即使火灾不在Ventura,也可以假定火灾发生在上述地点的几百公里范围内。这意味着我们可以将Ventura和从新闻文章中检索到的事件日期作为输入,使用卫星图像来精确定位事件的位置和日期。
使用欧洲森林火灾信息系统(EFFIS)来查找火灾事件的正确日期。EFFIS是欧盟哥白尼计划中应急管理服务的一部分,它提供从VIIRS获得的分辨率为375米的每日更新的活跃的火灾层。为了检测准确的事件日期,我们计算事件日期(新闻文章中提到)之前的时间范围(30天)内每天的活动火像素,并将最近的最大增长作为事件日期。
为了找到火灾的确切位置,处理过程将在准确日期(下图左图)之后的十天内累积所有火灾像素。然后移除孤立的小像素,只保留最大的簇(下图中)。最后,创建包围框来覆盖检测到的簇(下图)。
对于每个事件,我们决定了在区域覆盖、云覆盖和火像素的事件组合之前和期间/之后的最佳可视化日期。所选择的表示野火的可视化都是基于Sentinel-2的波段观测,并通过Sentinel Hub的处理API进行检索。
一旦检测到新的事件,将与所有新导出的信息一起存储,并准备在应用程序中显示。对于用户来说,DToN应用程序是整个过程的核心。它提供了简单直接的与事件相关的新闻和卫星图像的访问方式。
DToN利用来自全球的多源数据,通过AI分析和自动链接,可以为记者、决策者、分析师、保护组织以及感兴趣的公众提供附加价值。
DToN目前正处于测试阶段,但已对外发布,可以访问探索。通过事件过滤器可以查看指定事件。