《ArcGIS 地理信息系统教程》概念笔记

之前研究了 GIS,接触到了很多 GIS 的概念。因此找了《 ArcGIS 地理信息系统教程(第 4 版)》来看。书的版本比较老了,不过一些基本概念还是想通的,因为我重点在于 GIS 概念整理,而不是 ArcGIS。

以下以教材章节为顺序整理。本文目的主要是备查,因此有点流水账化:


第零章——简介

GIS 数据

GIS 实际上是采用地图数据进行工作的一种数据库

非空间数据

非空间数据指的与位置信息不直接相关的数据。

比如需要寄送给客户的账单信息、客户的电话号码之类的。这些数据和客户的空间位置相关,但是不必一定需要知道具体位置。

空间数据

空间数据指的是对应精确位置的数据,对于空间数据而言,位置信息是最重要的。比如:

某一个区域发生了停电事件,那么服务部门要第一时间确定影响范围,定位出停电事故精确的发生地点,然后给维修服务人员规划前往维修的最短路径等等。

GIS 组成

计算机硬件平台

传统意义上,GIS 的组成也应当是包含硬件的。由于 GIS 涉及大量运算,以前的 GIS 只能在工作站上使用,不过现在可以用于 PC,所以对计算机硬件的关注就不用太多了。

GIS 软件

作为 GIS 软件,不同的 GIS 软件提供的功能并不相同。不过 GIS 软件至少应当提供一些最低要求的基本功能:

  • 从不同数据源输入数据、并且输出到其他程序的方法
  • 数据管理工具
    • 数据集构建工具
    • 空间要素及其属性编辑工具
    • 坐标系统和投影管理工具
  • 专题制图功能
    • 以地图形式显示数据
    • 采用不同方法对地图要素进行符号化处理
    • 组合地图图层以用于表达
  • 数据分析功能
    • 探索地图涂层内部和图层之间的空间关系
  • 地图布局功能

其他

教材中,对于 GIS 组成还列出了以下内容:

  • 数据存储:也就是数据库之类的,后文会说明
  • 数据输入/输出硬件:除了鼠标键盘之外,还包含了一些专业的数据采集工具(无人机、卫星、etc),我们可以不用关注
  • GIS 数据:这里关注的是数据的专业性、格式化和用途方面。从 IT 的角度出发,我们可以不用太关注。
  • GIS 从业者:GIS 从业者也是整个 GIS 的组成部分

GIS 用途

GIS 用途其实多种多样,而且视乎对 GIS 概念外延大小的定义不同,也有很多不同的说法。参考材料中的解释是:提供数据采集、数据管理和数据分析方法,并据此生成可以辅助决策的信息。

GIS 项目管理

这里讲的是针对 GIS 项目的流程管理,包括以下部分:

  • 了解需求——规定要采用哪些图层,同时在文档中规定图层的精度
  • 建立合适的模型——这里主要是 GIS 数据模型(参见下文第一章),而不是采集数据之后执行的数学建模(比如海绵城市中用到的水力模型,不在这个阶段,而是在后面的 “执行分析” 阶段)
  • 数据采集——数据采集不是我们需要关注的问题,这主要是地理专业的问题。GIS 数据被存储为图层,每个图层代表一种信息类型
  • 执行分析——对采集到的数据进行分析处理,包括展示,也包括数学建模分析

第一章——GIS 数据

这一章节主要说明 GIS 数据中的一些重要概念。

概念

矢量模型

矢量模型指的是 GIS 中的数据以点、线、面(多边形)的形式存在,采用一个或多个 x-y 坐标对数据进行表达的空间要素。每一个要素通过要素识别码(FID)链接到数据库中的对应这一数据的其他属性数据。每个要素对应于表中的一行记录

空间要素本身,举例有:

  • 点:比如地图上的一个城市就是一个点
  • 线:地图上的一条河流,则对应这一条(不合并的)线
  • 面:面以一个区域的方式存在,用多边形的方式定义了这个区域的边界。比如一个行政区的边界、比如国界,这些是封闭的曲线,一般不会归类于线,而是归类于 “面” 中

需要注意的是,同一个对象,在不同的比例尺下,其存在的形式可能是不一样的。比如城市,在国际级的比例尺中,往往只是一个点,但是在省市级的比例尺下,则往往是一个多边形。

属性数据,则是针对对应模型数据的一些属性值。每个空间要素可以存储成百上千个属性值。比如一个城市,可以对应以下要素属性:

  • 城市名
  • 人口
  • 工业产值
  • ……

栅格模型

栅格模型将空间数据表示为一系列 cell 或 pixel 的小方格组成,这种很像一些城市建设游戏中的地形方格,但往往精度高很多。栅格模型的分类有:

  • 离散栅格:比如数字栅格图和分类数据
  • 连续栅格数据集:连续栅格数据集能够从一个位置平滑地过渡到另一个位置的大范围数值集,整个完整的数据集可以形成一个表面或者地域。比如:数字高程模型

栅格模型的定义比较虚,可能要搭配实际案例。

栅格模型的缺点有:

  • 数据多,需要占用大量的存储空间和网络传输流量(如果采用 web GIS 的话)
  • 每个栅格单元只有一个数值,不能额外存储属性值,因为单一的一个栅格单元本身是没有意义的,它需要搭配邻接的多个栅格单元。

坐标系统

地球不是纯球形,所以需要使用专门设计的坐标系统对空间地理信息进行描述。教材中并没有清晰地列出常用的坐标系统。实际上其中一个常见的就是 WGS1984。

要素的拓扑建模(矢量模型)

这一段主要是讲矢量模型要素之间的拓扑关系

无位相模型

这种模型中,文件要素为独立对象,彼此之间不相关联。比如1⃣以点的形式存在的各个城市,那么彼此之间就没什么联系。

拓扑模型

这种模型中,要素在空间范围内是彼此相关。比如一个城市地图中的各行政区之间、各条道路之间,就包含了关系。这些关系包括以下内容:

  • 邻近性
  • 连通性
  • 叠加性
  • 相交性

这些性质在需要的时候,可以通过计算得出。但如果一些性质频繁存取的话,专门存储会更有效

以上性质也可以可用于分析要素之间的一致性,后文有专门章节讲

ArcGIS

由于近年来 web GIS 的发展,现在的 ArcGIS 大致分为 Desktop 和 Server 两部分了。不过教材成文时,web GIS 还不是很普及,所以教材中并没有专门说明 web GIS。现在的 ArcGIS Desktop 已经变成 ArcGIS Pro,各组件还有,只是更多更强。

下文说明 ArcGIS Desktop(在当年)的组成。

ArcGIS Desktop

  • ArcMap:显示、分析、编辑空间数据和数据表
  • ArcCatalog:查看和管理空间数据文件

数据文件

  • shapefile:非常古老、传统但仍然很流行的矢量数据存储文件格式,扩展名为 .shp,但实际上包含许多其他扩展名的文件,是一个总集合
  • 地理数据库:Geodatabase
  • Coverage:矢量数据格式——不过对此了解不多,好像不是很流行
  • 栅格数据
  • 基于网络的关系型数据库——不过在 ArcGIS Desktop 年代,用得并不多
  • 互联网服务器——其实就是基于互联网发布的地理信息数据。这一部分本教材中并没有详细说明

第二章——GIS 数据制图

本章主要说明一些基本概念:

比例尺

比例尺分为大比例尺和小比例尺。比例尺就是我们在地图中常见的 1:1000,000 这样的比例。大比例尺的坟墓比较小,显示的地图细节比较多;而小比例尺分母比较大,显示的地图范围比较大。

地图分类

这里讲的是各种 GIS 地图,可以按照什么来分类——

命名数据和分类数据

按照展示的数据信息类型来分类:

  • 命名数据:比如——州名、省名、要素名
  • 分类数据:比如——土壤类型、民族分布
  • 次序数据:这种数据类似于分类数据的呈现,但通过不同颜色表示同一类型数据的不同值域,比如分不同的颜色,展现出不同区域的人口密度;又比如六边形热点图,如下:

数值数据

比如:省/市人口信息图,采用不同直径的符号表示,如下图:

img

数值数据的表现方式有:

  • 点:
    • 不同直径的圆形、圆饼
    • 不同密度的点
  • 线:
    • 不同粗细的线
  • 多边形
    • 不同颜色,类似于次序数据

图表地图

  • 饼图
  • 条形图
  • 多层条形图

第三章——GIS 数据展示

开始一个 GIS 项目,文中建议按照如下工作流程开展:

  • 明确地图设计目标
  • 确定要包含的数据涂层
  • 规划合理布局,包含所需的全部数据框和其他地图元素(图例等)
  • 选择创建效果正确和具有最大化可读性的颜色和符号
  • 创建地图

第四章——属性数据

还记得前面的空间要素数据吗?本章节说明和空间要素数据相关联的属性数据。属性数据存储在数据表中,数据表是一种数据结构,用于存储关于位置或者对象的多个属性。

组成

  • 行:每一行也就对应这一个空间要素,称为一个 “记录” ,record
  • 列:数据表的每一列成为称为 “字段”,Field;也称为称为 “属性字段” ,Attribute Field

数据文件类型

数据文件类型有两种,如下:

  • 属性表
    • 采用 Feature ID 唯一标识每个要素
    • 采用对象 ID(OID)唯一标识每个要素
  • 独立表
    • 仅采用表格格式来包含一个或更多对象的相关信息,独立表中只有 OID

第六章——空间连接

本章讲的是使用 ArcGIS,将空间要素之间按照指定的条件,进行筛选并合并的功能。空间连接之后,会创建新的数据表,原油数据表并不会被修改。

  • 距离连接:基于一个要素是否最接近于另一个要素,从而将一个要素及其属性连接到另一个要素。比如将机场和邻近城市信息连接
  • 内部连接:判断一个要素是否位于另一个要素的内部(全部或部分),连接不同要素类的多个记录

这个功能其实很简单,具体可以去看书。


第七章——地理处理

本章是第一种中 “要素的拓扑建模” 中 “分析要素之间的一致性” 展开的第一部分。其实就是数据的集合处理,这里只需要简单说明一下即可,都是些理所当然的功能。

地图叠加

将两个地图进行数据集处理:

  • 合并属性:提取 Extraction,其实就是集合的减法
    • 裁剪 Clip
    • 排除 Erase
  • 不合并属性
    • 交集 Intersece
    • 并集 Union

其他空间分析功能

  • 融合 Dissolve——比如:将拥有同一名称的所有街道编程同一个元素,对分离的道路进行合并
  • 建立缓冲区 Buffer——比如:机场管制范围周围建立 100 米的警戒区
  • 追加 Append,合并两个或更多图层的要素,从而创建已有图层的单一要素。这对属性字段有要求,要求不同图层必须有相同的定义和顺序的属性字段
  • 合并 Merge,类似于追加,但属性表可以不匹配

第八章——栅格分析

本章节列举的是基于栅格数据(基于栅格模型的数据)所做的数据分析功能

栅格坐标系统

本小节解释了栅格坐标系统,简单理解即可。栅格坐标系统包含了投影基准面两个概念。

栅格分析

  • 地图代数:意思就是相同区域但是不同属性的栅格中的数值可以进行代数相加,这与前文的空间连接类似
  • 布尔叠加:AND 和 OR
  • 距离功能:计算最佳行驶路程
  • 栅格插值:栅格是二维的,这里讲的就是二维上的数值插值运算
  • 邻域统计:计算一个像元及其周边九宫格的平均值。当然也可以是5x5、7x7等等
  • 区域统计:类似于邻域统计,但范围不是九宫格,而是给定的实际区域,比如一个海绵的汇水分区
  • 重(chong)分类和重采样:重新生成栅格数据

第九章——网络分析

概念

网络,其实就是现实生活中的各种网状架构,比如河流、道路、官网等等。对这些在 GIS 中抽象了之后的网络状的数据对象进行分析,就是网络分析。

网络的组成

网络由 “边线”(edge)和 “交汇点”(juction)组成

网络的状态

网络有可运行和不可运行两种状态,个人理解就是 enabled 和 disabled 两种状态

网络类型

  • 传输网络 Transportation Network
  • 定向网络 Utility Network

个人理解就是双向和单向两种网络。

网络分析

在 ArcGIS 中,采用 ArcMap 里的 Solvers 套件进行分析。


第十章——地理编码

本章节可以不用关注,主要是偏向地理方面。指的是所谓的 “地址标准化”(Address Standardization),是数据编制角度的概念,也就是将现实生活中的地址,提取标准元素,然后转换成可以在计算机语言中识别的地理位置特性信息。这些特性信息不见得就是地理定位,也可能是一系列的属性,甚至这些属性是一定程度上的 human readable。


第十一章——坐标系统

本章讲的有三个概念,重点是通过这些概念,了解为什么需要存在坐标系统。

几个概念,需要知道一下:

  • 地理坐标系 Geographic Coordinate System,GCS
  • 椭球和基准面
  • 地图投影

地图投影

地图投影是三维 GCS 的二维表达。ArcGIS 参考资料为:http://desktop.arcgis.com/zh-cn/arcmap/10.3/guide-books/map-projections/what-are-map-projections.htm

投影类型有以下几种:

圆柱投影

我国处于中纬度,圆柱投影是最常用的。

按方向分类,有:

  • 圆柱筒底面在两极的,称为圆柱投影
  • 圆柱筒底面在赤道的,称为横轴圆柱投影
  • 斜轴圆柱投影

按照切割位置分类,有:

  • 切圆柱(切字可省略)
  • 割圆柱

圆锥投影

常用于高纬度地区

  • 切圆锥
  • 割圆锥

方位投影

南极地图就是典型的方位投影;最适宜于具有圆形轮廓的地区


第十二、十三章——编辑

本章节讲的是 ArcGIS 中编辑地图要素时的一些操作。简单了解即可:

  • 捕捉要素:自动将两个元素相交的功能,有点像 Photoshop 中的套索。
  • 创建邻接多边形:将两个邻接多边形共享便捷,消除缝隙的功能
  • 拓扑
  • 组合要素
    • 合并
    • 联合
    • 相交
    • 裁剪
  • 建立要素缓冲区
  • 流数字化

本文章采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。

原文发布于:https://cloud.tencent.com/developer/article/1193510

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏高性能服务器开发

一个Sqrt函数引发的血案

好吧,我承认我标题党了,不过既然你来了,就认真看下去吧,保证你有收获。 我们平时经常会有一些数据运算的操作,需要调用sqrt,exp,abs等函数,那么时候你...

3295
来自专栏灯塔大数据

探秘 | Python 求职 Top10 城市,来看看是否有你所在的城市

导读:从智联招聘爬取相关信息后,我们关心的是如何对内容进行分析,获取用用的信息。本次以上篇文章“5分钟掌握智联招聘网站爬取并保存到MongoDB数据库”中爬取的...

3123
来自专栏大数据挖掘DT机器学习

使用fasttext实现文本处理及文本预测

因为参加datafountain和CCF联合举办的大数据竞赛,第一次接触到文本预测。对比了一些模型,最终还是决定试一下fasttext。上手fasttext的...

3.6K6
来自专栏机器之心

教程 | 如何优雅而高效地使用Matplotlib实现数据可视化

2895
来自专栏玩转全栈

机器学习-数据清洗(二)

如果接触到我上面的那篇文章,机器学习-入门,应该很清楚本文意欲为何。如果不知道为什么,请阅读一下那篇文章,以便打下基础,ok,废话不多说了,进入正题。

3201
来自专栏CDA数据分析师

3个步骤彻底学透Excel

本文为简书作者数据充电宝原创,CDA数据分析师已获得授权 目录 Excel函数学习常见的误区和问题及解决办法 ● 苦恼 ● 原因 ● 解决办法 学习3步法 (重...

2078
来自专栏专知

【最新PyTorch0.4.0教程01】PyTorch的动态计算图深入浅出

8454
来自专栏PPV课数据科学社区

电商评论情感分析

? 随着网上购物的流行,各大电商竞争激烈,为了提高客户服务质量,除了打价格战外,了解客户的需求点,倾听客户的心声也越来越重要,其中重要的方式 就是对消费者的文...

8157
来自专栏数据小魔方

地图可视化之——移花接木

本文所使用的代码是之前一篇关于航线图的数据,之所以要从新写一遍,是为了让大家体会借助在线地图制作地图可视化在代码效率上的便利(当然,也会有损失,你不能像操纵sh...

3556
来自专栏杨建荣的学习笔记

字符画,你可能未知的美 (76天)

在平时的工作中,如果接触字符界面时间比较长的时候,都会无意识的感觉到单调,认为字符只能表达一些抽象复杂的东西,对于图形的那种简单和清晰,显得有些力不从心。 今天...

2905

扫码关注云+社区