时空大数据加速智慧城市落地

近年来,全国乃至全世界都掀起了智慧城市建设热潮。有数据显示,全球智慧城市相关产业市场规模预计从2017年的4246.8亿美元增至2022年的12016.9亿美元,年复合增长率达23.1%。近日在乌镇举行的2017世界互联网大会上,亦有众多企业发布自己的智慧城市云解决方案。

智慧城市要解决的是日益凸显的交通拥堵、环境恶化、能耗增加等城市问题。“在人工智能时代,城市计算是解决城市问题的必然选择,也很可能是最好的路径。”微软亚洲研究院首席研究员郑宇在12月2日于北京举办的2017人工智能前沿应用与人才发展论坛上说。

据介绍,城市计算包括城市数据的感知和获取、数据的管理、数据的分析和挖掘以及数据的服务和提供。“这四个层面连成一个环路,不断地、自动地在不干扰人生活的情况下,用大数据解决城市的大挑战。”郑宇说。

城市计算,预测未来

城市计算是一个交叉学科,是计算机科学以城市为背景,跟城市规划、交通、能源、环境、社会学和经济等学科融合的新兴领域。更具体地说,城市计算是一个通过不断获取、整合和分析城市中多种异构大数据来解决城市所面临的挑战的过程。按郑宇所述:“城市计算能帮助我们理解各种城市现象的本质,甚至预测城市的未来。”

任何计算都要以数据为基础,但在数据的感知和获取环节则面临多重挑战。“我们拿到的数据往往只是一个采样,某些属性在这个采样上的分布跟它在整体数据上的分布有很大差异。”郑宇表示,数据是否具有代表性是需要考虑的第一个问题。其次,数据的有限性、易缺失、使用的准确性等,都是城市计算在感知层面的挑战。

“城市发展是从数字化到信息化再到智慧化递进的过程,数据是智慧的基础。”山东大学计算机与软件学院院长陈宝权指出,从众多候选集中选出所需要的数据很重要,可以解决很多实际问题,比如在城市区域内确定设立充电桩的位置,规划空气质量检测站点的设置等等。

为了进一步说明数据感知与获取对城市公共设施配置的重要性,郑宇展示了天津市的救护车站布局图,“以前选救护车站点基本就是根据人口数量或者道路房屋密度决定。但是人的急救需求的影响因素很复杂,我们可以根据真实的120求救信号数据和救护车抢救病人的GPS轨迹等数据对站点进行重新布局,以优化平均抢救时间。”郑宇说。

另外,救护车辆如何在各个站点之间动态调度,使得系统运力最大化是第二步需要解决的问题。“就是要找到一个使得很多人到此的汇聚时间最优化的点。”郑宇建议,所有以速度优先级最高的应用都可以考虑这个选址模型。

城市大数据平台发挥效力

未来的智慧城市应该什么样?陈宝权认为,智慧城市有两个层面的含义:一是宏观层面,城市总体资源的分配是智慧的,特别是基础设施能合理满足市民需求,比如交通设计能完全按照人流的需求来考虑;二是微观层面,智慧城市下人人都能享受到更加便利、高效、安全和环保的服务,生活舒适度不断提高。

要达到以上目标,数据的管理不可或缺。城市中所有数据根据结构可分为两种:点数据与网络结构数据。一旦建成后任何属性都不会变动的是空间和时间都静态的点数据;位置不变,但是每个小时的读数不断变化的是空间不变但是时间属性在不停变化的结构数据。

“在摩拜单车使用中,不同时间有不同的人在不同地方发出请求,这就是一个时空多变的数据;网络结构中,路网就是一个静态的网络结构,把路网叠加了交通流量信息以后就变成空间不变、时间变化的数据。”郑宇说,最复杂的是轨迹数据,时间和空间都在变,并且点和点之间有连续的关系。

“定义好这些数据结构模型以后,我们就可以针对特定的模型设计特定的算法,提高系统的利用率。”郑宇说,“我们是给整个城市提供服务,对整个城域作推断、预测,运算量非常大,而且要求实时。因此,数据和应用之间就需要一个平台来连接。”

“很遗憾现在任何一家公司的云计算平台都不能很好地支持我们的时空大数据。”郑宇坦言,“城市大数据平台并不是云计算平台,后者并不能很好地支持上述运算。”

而郑宇主导的在贵阳落地的第一个城市大数据平台,把分布式计算环境跟索引方法结合在一起,可以使算法完成时间从几个小时变成几秒钟,“这就是平台强大的力量。”郑宇说。

把握时空数据

“城市计算处理的是时空数据,它跟视频、图像、语音是不同的。这也导致传统的深度学习模型不能直接拿来用。”郑宇解释说,时空数据有空间属性和时间属性,时间属性又包括时间的平滑性、周期性和趋势性。

据介绍,数据的应用是首先把相邻几个小时的数据放到一个深度卷积神经网络里面,来模拟相邻时间的时序的平滑性。然后把几天内同一时刻对应的数据输入到相同结构的深度卷积神经网络,来模拟周期性。再输入更大时间范围内同一时间点对应的数据,来模拟趋势性。因为三个因素的输出结果并不是在每个地方都一样,因此三个数据要先做融合,并引入权重系数。

为了解决这一问题,微软研究院引入深度残差神经网络,整个架构称为时空残差网络。“这个比较新的模型相对于以前LSTM的模型,不需要进行连续的数据输入,只需要抽取关键帧。”郑宇介绍说,这样的结构大大优化了网络结构,只需要用几十帧就能达到原先模型里几百帧、几千帧的效果,甚至更好。他表示,这种深度时空残差网络,在人口流动的预测上将会有很大的应用前景。

“随着人工智能能够完成的复杂任务越来越多,人们会越来越感受到其存在,享受更多的福利。”陈宝权说。

本文来自企鹅号 - 物联中国媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏理论坞

从时尚界学 制造出来的流行色(不信就不要看)

流行色是被制造出来的。 第一步,是由几个重要的流行色组织,有各国相关行业的大公司参与,通过委员会开讨论会的方法,来制定并发布未来一到三年的颜色趋势。参加制定者...

421
来自专栏灯塔大数据

数据告诉你:四十年来政府都在为何事“烧脑”?

? 3月5日,第十二届全国人民代表大会第五次会议在北京人民大会堂开幕。国务院总理李克强作政府工作报告。澎湃新闻整理了中国政府网上1978年至2017年共计40...

3526
来自专栏小白客

啤酒与尿布的故事

? 这是一个很老但很有意思的故事 我们去沃尔玛超市会发现一个很有趣的现象:货架上啤酒与尿布竟然放在一起售卖,这看似两者毫不相关的东西,为什么会放在一起售卖呢...

2705
来自专栏ATYUN订阅号

【学术】国外技术大神用机器学习来预测ICO的收益

加密货币是一种数字资产,它是一种交换媒介,使用密码学来保护其交易,控制额外单位的创建,并验证资产的转移。 关于加密货币,你还知道更多其他的吗?事实上,每天都有新...

2657
来自专栏数说工作室

量化投资之资本资产定价模型(CAPM)

量化投资之资本资产定价模型 (CAPM) 目录 一、前言 二、CAPM模型 1. 切点组合、分离定理与市场组合 2. 资本市场线 ...

39912
来自专栏DT数据侠

你踏破铁鞋想找的高性价比居住地,被他们用这个算法挖出来了 | DT Labo Online

上个月DT君空降深圳发布了《2017深圳城市大数据活跃报告》,发布现场可谓座无虚席。但由于现场时间有限,未能将报告更详尽地向大家解读,不少小伙伴对于整个报告的生...

520
来自专栏数据猿

【案例】某国际知名零售连锁企业:基于人工智能的选址解决方案

【数据猿导读】本篇案例涉及企业是一家国外顶级零售商,合作方在美国具有良好的数据支持,并已研发出成熟的选址模型,在美国表现效果非常良好,但当合作方将其模型拿到中国...

984
来自专栏数据猿

【案例】大拇哥财富——互联网金融个人评分模型

数据猿导读 随着互联网技术的不断发展,传统金融业务也从线下不断转移到线上,很多原先在线下的金融机构开始在互联网上开展经营活动。由于线上和线下的经营方式的差异,在...

3496
来自专栏全栈数据化营销

数据分析:研究奥迪、宝马、奔驰新能源汽车用户特点与差异

新能源汽车的推广是国家战略。中国新能源汽车市场已经起步,并且发展迅速。国内厂商已经争相争夺新能源车的市场份额。在国内有比亚迪、北汽新能源等引领者,传统上的强势进...

2846
来自专栏人称T客

SaaS估值新模型SANE的介绍| 报告

T客汇官网:tikehui.com 撰文 | 卿云 由于Twilio(NYSE:TWLO)当时IPO,将其从此分析中将其排除。为了减轻数据中的生存偏差,早期数据...

2325

扫码关注云+社区