IEEE VAST最佳论文奖首次由全华班获得

VAST 2018 Best Paper Award

TPFlow: Progressive Partition and Multidimensional Pattern Extraction for Large-Scale Spatio-Temporal Data Analysis

作者:刘东煜、徐盼盼、任骝

本文是大数据可视分析顶级会议IEEE VAST 2018的最佳论文, 也是史上该奖项第一次由全华班获得。第一作者刘冬煜本科毕业于浙江大学竺可桢学院,本科毕业后获得香港政府奖学金,进入香港科技大学计算机系攻读博士学位。

本文是他在访问硅谷的北美博世中央研究院(Bosch Research and Technology Center North America)做实习生时,在他的师姐徐盼盼,以及博世中央研究院在智能交互方向上的全球负责人兼首席科学家(Global Head and Chief Scientist)任骝博士的指导下完成。

(左起)徐盼盼、刘冬煜、任骝上台领奖

论文介绍

刘冬煜上台演讲

本文设计了一种分段的秩一张量分解算法,以此构建了支持逐渐划分与level-of-detail探索的多维时空数据可视分析框架,用于探索多维时空数据中的隐含模式。

系统界面

多维时空数据可视化常用的方式是在不同视图中对不同维度上的值做聚合,用户可以在不同的视图中,通过刷选、连线,实现查询、选择、高亮等操作。

通常这种方法一般只能用在二维时空数据,它的可扩展性往往受到数据维度及数据量的影响,解决方案有以数据立方体的形式存贮数据、GPU并行计算等等。但是,这种方法难以在子数据集上找到隐藏的模式,例如,工作日与双休日的数据模式可能是不同的,但在没有先验假设的情况下,这些视图很难将用户引导向某种数据子集的选择方式。此外,这种方法还需要数据分析员进行繁杂的手动工作。

因此,本文提出了一种基于张量分解的大规模时空数据的模式自动化提取与可视分析方法,并且第一次可以处理多于二维的时空数据。

本文的主要贡献如下:

-支持可视化同时支持高维时空数据的分段的秩一张量分解算法,而传统张量分解算法不支持可视化

-支持逐渐划分与level-of-detail探索的多维时空数据可视分析框架,支持智能推荐

-三个横跨多领域与分析任务的真实数据集案例包据零售业商店的销售分析和智慧城市中的交通数据方析等。

如何完成一篇高质量可视化论文

本文三位作者均是本科毕业于浙江大学的混合班又叫竺可桢学院。任骝博士也是第一位在全美顶尖的卡内基梅隆大学计算机系取得博士学位的浙大学生。他在博世位于硅谷的中央研究院领导博世全球在大数据可视分析,增強现实,语音交互,自然语言理解,地图可视化,智能穿戴设备,机器人等智能交互方向在自动驾驶,车载娱乐,智能家居,工业4.0等应用领域的创新。我们可视化小组也曾有多位同学前往博世北美研究院访学。博世北美研究院是大数据可视分析领域的世界一流实验室,研究有很强的卡内基梅隆风格-特别以出产有实际应用推广的高质量论文著称(该实验室早在2016年与我们可视化小组的合作论文就已获得IEEE VAST 2016年的最佳论文候选奖)。这次我们有幸与任骝博士共进晚餐,倾听任老师讲述如何完成一篇高质量的可视化论文投稿。

简单总结有如下3条:

1. 精确选题。一篇好的工作,需要能够有应用价值。好的文章在发表之后,并不会束之高阁,而是一定有其应用的场景跟价值存在。基本上所有博世研究院的论文发表后都投入了实际运用。所以,在开始做这项工作之前,一定要想好这篇工作是否有好的应用价值。

2.大创新。文章需要有大的创新点,要么开拓可视分析的新领域,要么去花时间去啃下技术上的硬骨头。

3.工匠精神。有了好的想法,并且开始实现该想法的同时,写作上也需要花很多精力,特别是对于我们非英语母语的同学。好的立意点和表达特别重要。要以德国的工匠精神为指导去打造精品-每个图片,每个描述,每段视频都要求尽善尽美。

来自VAG男神--

梅鸿辉、潘嘉铖

前线报道

输入

宽视 · 善知

| 宽视以博物 · 善知以致知 |

微信号

datavis

或长按识别上图

微博号

浙大可视分析小组

或长按识别上图

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181030G0FV5N00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券