首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

李栋:城市规划与管理中的数据分析和信息化建设

本文为北京清华同衡规划设计研究院技术创新中心常务副主任李栋博士所作同名主题报告,通过近几年的城市和数据工作,总结了数据在城市的应用及对未来发展的展望。

— 引子 —

大数据分析算不算是规划信息化?

对这个问题的理解我们自己也在不断变化中,最早在2013年刚开始组织北京城市实验室BCL时,我们更偏向认为大数据分析不是规划信息化。4、5年过去了,我发现在概念的认识上还是有很多误区。

首先是对“规划信息化”的理解太狭隘,过去的概念仅只是给规划管理部门做一些成果管理或展示平台;其次数据分析其实是密切依赖于各类信息化工作的,二者密切关联、相辅相成。这也是贯穿我近几年围绕城市和数据工作的最大反思。

来回顾当下数据发展的几个大趋势。

首先,全社会数据可用性极大增加。当前全球超30亿人、约170亿设备联网在线,这些设备无时无刻不在产生数据。据统计,人类从直立行走到2003年所创造数据量总计5艾字节,到2007年短短几年间数据量已超了300艾字节;而到了2015年,全球网络流量接连翻番,数据量达到接近1000艾字节;预测到2025年,全球数据总量将增长至现在的200倍到170,000艾字节。可以说展望未来,大数据时代其实还没有真正来临,数据发展将呈现更加富集的趋势。

其次,计算能力和算法挖掘手段全面提升。计算能力得到飞速强化,强大的计算机通过网络连接,大量数据的并行处理成为可能,硬件方面也有很大的提升。现在的手机计算能力已经远远超过了早期的电脑,而且所使用的算法获得了全面的更新。十余年机器学习发展基础上,可以将这些庞大的数据和算力用于算法的训练,开发新规则来执行日益复杂的任务。以深度学习为代表的新手段得到持续优化,启发新服务,刺激了对AI领域各方面的投资和研究。数据、设备、算法几个方面快速的发展,终将整个人类社会信息化的趋势逐渐推向一个又一个高潮。

1

— 信息化的两种场景 —

数据分析只是广义信息化的一个环节,我们可以简单做下分类。

☑一类是流程信息化(狭义信息化),指在既有机制下对业务的信息化改造,如政府委办局的办公OA等,流程和机制是预先规定好的。

☑另一类是决策智能化(广义信息化),比如说我们要对城市发展的信息化做整合,而城市管理的规则和机制是开放的、不断发展和变化的,我们的挑战是如何运用信息化的手段处理这种挑战。利用信息化对开放系统进行综合决策,需要采集整理决策所需信息、设计多种决策方案、对方案开展模拟与预评估、对方案进行比选优化,对方案实施开展周期性监控、方案实施后评估等等,这是一个值得开展长期探索的方向,也是数据应用高附加值所在之处。

流程信息化,规则相对清晰、条件相对封闭、目标相对明确;而决策智能化规则相对模糊、条件相对开放、目标不够明确,依赖更多、更复杂、非标准化信息输入作为基础。当面对决策智能化的时候,作为规划师会往往会感到信息焦虑以及对工具的渴求,会怀疑自己是不是遗漏了什么关键信息、从而对项目造成一些决定性影响,这是所有咨询者、决策者共同面对的一个很大挑战。

以规划编制为例,即使是同一个地区,即使是遵循相同的规划编制技术要求等规则,但由于每一次规划编制的背景不同、规划目标和实施手段也大相径庭,因此对规划内容本身(即待决策的方案)的评判标准也会存在很大的差异,更毋论如何对规划方案进行优化和持续改进了。

如果从一个更大的、数据的视角来看待这个问题,流程信息化指利用自有数据解决自己的问题,比如财务报销自动化等,而决策智能化则意味着要综合使用自有数据和他类数据(alternative data),一起来解决自己的问题。

他类数据是指全社会其他部门数字化、信息化之后的积累,例如原本用于运营商计费和网优的手机信令数据,原本用于公交系统计费的市政一卡通刷卡数据,原本用于网站和APP经营的移动互联网流量内容数据等等。我们现在之所以能够在城市规划中利用这些大数据,其实都要感谢早年其他部门所做的信息化基础工作,虽然这些数据出现的动机并非是服务规划师。推广而言,所以若想解决城市这类开放系统的决策智能化问题,就需要全社会每个部门都把自己的信息化工作做好。

2

— 建立基础“认知闭环” —

规划师扮演的是决策咨询的角色,为决策者出谋划策。因此,我们自己首先要建立一个逻辑闭环,按照了解、认识、见解、行动的顺序。一般规划师往往更关注感知、认知与决策这三个环节,但对于“行动”,或者说“实施”,则是规划或者咨询业者不太擅长的。规划信息化的工作其实在另一个层面就是在做“行动”或“实施”,在不断地修补、完善信息化系统。所以我也特别希望规划从业者能够再多走一步,将分析出来的好方案亲手实现出来,建立起完整的数据思维闭环。

数据思维体现为对数据应用的工作流程(workflow)。

☑一是感知:数据的清洗收集,对现实了解得更精细;

☑二是测度:数据的分析评价,对状况判断得更合理;

☑三是挖掘:数据的综合解读,对原因理解得更深入;

1、数据感知:对现实的精细了解

用精细化的数据感知来满足规划师对于信息渴求的状态。例如,去年做朝阳区人口统计时,数据分析的目的不仅想了解朝阳区的总人口规模,还想知道人口分布的具体位置、根据每个位置人口活动的24小时规律进行分类等等。

再进一步细化,比如了解CBD片区每个小建筑里面大致人口分布的多少,工作日与非工作日的变化。甚至包括对每一个网格,都想去了解人口构成的结构与信息等等。

多源数据耦合、交叉检验。当数据源不同时需要做一些检验,例如对一个地区的移动信令数据、滴滴出行数据、互联网定位数据做交叉对比,判断出哪个数据相对更合理。

2、数据测度:分析与评价

通过设计评价指标体系来联系物理世界与信息世界。将信息空间和物理空间联系起来就是信息—物理系统(Cyber-Physical System),二者通过指标体系相互反馈、调控。

通过算法工具对状况的合理判断。数据评价包括许多内容,包括评价方式。单纯把收集的数据落在图上,很难直观看出规律,需要模型、算法、工具来帮助形成一定的结构化指标,从而可得到诸如聚类、分析等结论。例如,右图中的方块是共享自行车骑行轨迹的时空热点,在相同时间空间,可以识别出哪里是骑行行为相对比较聚集的区域,并进一步分析聚集的原因和影响等。

自行车骑行轨迹热点时空分析

此外,还需要把非结构化数据(如街景图片)变成可计算的结构化指标,这是大数据很关键的核心问题,需要借助专门的工具或一些技术手段来实现。

街景图像的计算机视觉分析

数据评价:对状况的合理判断。在充分感知数据、分析评价数据之后,就加入结论判断环节了。例如我们可以根据骑行轨迹、街道状况等要素,对骑行环境做出综合评判。将结构化与非结构化数据叠合后,形成关键指标,根据问题和目标进行打分,最后得出好中差的观点。

基于街景图像数据的道路环节评价

围绕需求设计多源数据的关键评价指标体系

评价指标结果:某时段骑行热度空间分布(左);评价指标结果:某道路骑行热度时间曲线(右)

叠合分析的应用示例。比如,在对北京危险品运输风险的大数据分析工作中,通过将危险品车辆GPS和同一时段人口分布进行重叠,识别出重叠率高的危险路段。左边是进城的路段中重合较高的部分、右边是危险品有大量聚集并停留较长时间的区域,把这些路段与片区识别出来,可以较好地预防一些危险品的泄露、爆炸等事故,避免不必要的生命财产损失。

危险品车辆出入城时段高重叠区(左);危险品车集中地(右)

在设施评估案例里,我们对朝阳区32个2、3级医院开展了就诊人群分析,用医院的到访人口来源与分布情况,观测京内京外比重,看哪些医院是受外地人欢迎。

千人床位指标推算的理论覆盖范围(左);手机数据表示的实际覆盖范围(右)

传统医院的配给指标是以一个区域的千人床位数来确定的,那我们可以根据这个指标反推出一个医院的理论覆盖范围,如左上图;但用人流数据可以更直观的看到一个医院的实际覆盖范围,如右上图。

通过对比,我们可以得到一些初步结论:一是4环以外的人口聚集区缺乏医疗设施的覆盖;二是医院的就诊来源主要但不限于医院周边;三是某些外围的卫生设施如地坛医院存在覆盖范围重叠浪费的情况。

结合人口的本外地属性,可以看到,中国医学院肿瘤医院的外地患者最多,占到了44%,而其他的医院则逐次下降。

3、数据挖掘:现象背后的机制和规律

除通过数据分析了解现象本身,继续探索现象背后发生的原因规律及内在机制,在大量评价指标中找出隐藏的规律,简单的方式如线性回归,对于城市这样非线性的复杂系统,最基础但有效的包括随机森林等。

以骑行行为挖掘为例,随机森林模型展示了影响骑行轨迹分布权重较大的因素,主要包括道路长度、功能兴趣点POI 总数、道路适宜度水平、公交车站300 米覆盖路段长等。

以上海城市人口结构挖掘为例,随机森林模型所示,影响上海年轻人分布权重较大的因素主要包括外地人口比重、最近轨道站点距离等。

主要影响因素及其权重

最后,将利用仿真、模拟为主要手段,反向使用前述数据挖掘得到的结果,应用所获得的规律。通过改变某些指标(对应城市规划或管理措施),使得决策树的走向发生变化,也即开展了一次政策预演,反复试算,使得我们可以基于隐含的规律对城市发展进行大量的沙箱模拟,寻求政策工具的最佳组合。

因此,自然而然地会观察到,围绕数据流开展的这些工作,无论是处理非结构化数据还是剖析非线性关系时,我们都在严重的依赖算法作为工具。在数据时代,算法的价值怎么重视都不为过。

全社会广义信息化需求将越来越旺盛。如果把上述数据流过程拓展到整个社会来观察,会发现他们是相辅相成的,不同行业之间需要互相依赖彼此对数据的感知、测度、挖掘,最终实现整个社会的信息化和智能化。

3

— 城市规划与运行管理信息化 —

1、建设信息化系统

建设信息化系统体现为解决问题的创造性、实践性策略,主要强调三个原则:

☑一是以人为本:同理用户感触、贴近用户需求;

☑二是模糊推进:在知识和能力的范围上保留足够弹性、充分尝试;

☑三是原型迭代:由粗略简易的原型开始设计和实施,快速持续地进行修正;

在此分享案例的委托方是呼和浩特市新城区社区办,建设内容是呼市新城区居家养老服务体系,涵盖了政策法规、运作机制、引导监督机制、居家养老智慧管理平台等内容,以老年人需求为导向,社会服务力量整合,政府监管体系为目标,提供多元化、专业化、高品质的养老服务。

2、信息化系统实施

在空间环境整治规划方面,《文化产业区区域行动规划》提出CIQ内部的交通网络以步行道为主,保留和尊重原有肌理。同时,在原有基础上规划了两条东北—西南走向和一条东西走向的主要道路,对路面进行拓宽和整修。CIQ的对外交通联系以方便快捷的公交系统为主。

首先是需求分析。信息技术为养老精细化管理与精准服务提供新的方法和手段,主要用户面向政府、老人、服务单位。

其次是定位与策略。我们认为居家养老智慧管理平台应该实现连通政府各级部门、老人、服务单位等对象的基本能力,促使信息互通互联、养老业务全过程留痕、线上线下有效互动,实现老年事务的联动管理、服务单位的监督监管、智慧养老决策支持等核心功能。

实施中利用软硬件进行整合支撑。以养老卡为核心载体,利用手机APP、信息查询一体机、智能穿戴设备等各类线上线下手段,采集老人基本信息、为老交易、健康状况等各类数据,联动卫计、民政等多个政府部门的业务数据,实现老人数据的全面覆盖和联动更新,在此基础上合理实施技术架构,通过统一的底层数据库支撑上层各类应用系统,采用模块化的方式,后期可按照需求进行功能的增减调整。

上线运行、迭代维护。信息系统建设交付其实只是一个开始,更加重要的是提供长期的线上线下运维服务。目前平台初步实现了国家及各地的相关公开数据的整合,为新城区居家养老服务体系建设提供参考;融合本地老年人各类健康数据,全方位实时掌握老人健康信息;实现服务商信息的统计、审核、以及监管,对服务商相关数据收集、分析;为政府部门对养老事业相关决策提供科学、客观的数据支撑。

社区指挥中心系统运行现场情况

4

— 展望智能化的远景 —

我们重新把视角聚焦在城市规划与管理上,未来远景目标是在规划师个体认知闭环的基础上,完善城市发展相关业务智能化的闭环。

以决策咨询为视角,有两个关键支撑点:

☑一方面是必须整合多源大数据,数据可获得性、维度、属性决定了数据分析、信息化工作的基本面;

☑另一方面是必须熟悉业务领域需求,应该说数据分析和挖掘的视角是多样化的,而城市问题又是如此复杂,需要识别并紧密围绕领域内的关键需求来工作,科学设计指标体系,指导实施措施,在有限的数据分析结论中催生最大化的现实价值。

最后一点个人感受,数据思维与实施思维并非是割裂的,更好的做法是把二者有机的结合在一起。数据思维可能比较“阳春白雪”,进行大数据分析,做各种酷炫的展示,属于脑力劳动;但其实真正发挥作用的也许是一些不起眼的信息化项目、实干项目,姑且称之为“下里巴人”。我正试图在二者之间建立一种能够相互促进的正向反馈模式,未来肯定还需要大量的探索和完善。

李栋,博士,现任北京清华同衡规划设计研究院技术创新中心常务副主任。研究领域为城市可持续发展建模、空间数据挖掘与信息化系统研发实施,近年来致力于在城市研究和规划中利用多源数据开展精细化分析,重点关注政务数据与新型大数据融合、智慧城市项目研发与实施等工作,负责或参与重大咨询项目40余项、国际和国内研究课题10余项、撰写各级内参20余份,成果数次获省部级以上奖励。发表中英文相关论文40余篇,其中SCI和SSCI收录论文8篇,并任JEMA、CEUS、IJGIS、GeoJournal等期刊审稿人,同时还担任中国城市科学研究会大数据专委会委员、中国城市科学研究会生态城市研究专委会委员、担任中国生态学会城市生态专委会委员、中关村新型城镇化大数据技术服务联盟专委会副秘书长、清华大学中国新型城镇化研究院特聘研究员、中关村大数据产业联盟智库专家等、北京城市实验室(Beijing City Lab,BCL)共同发起人、新旅游30人论坛共同发起人等社会职务。

文中配图由李栋提供,头图来源于网络

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180301B0VCND00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券