首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >全国航班数据与可视化分析

全国航班数据与可视化分析

作者头像
牛老师讲GIS
发布2018-10-23 10:45:47
发布2018-10-23 10:45:47
4K00
代码可运行
举报
运行总次数:0
代码可运行

概述

本文通过爬取全国航班的数据,并对行数据进行可视化展示与分析。

数据来源

数据是从哪儿也不想去的去哪网抓过来。为了能够获取到数据,抓取了下请求的地址,抓取的地址如下:

代码语言:javascript
代码运行次数:0
运行
复制
https://flight.qunar.com/touch/api/domestic/wbdflightlist?departureCity=%E5%8C%97%E4%BA%AC&arrivalCity=%E6%B7%B1%E5%9C%B3&departureDate=2018-06-12&ex_track=&__m__=09de50bb5812f2686e2db9b0f49185d0&sort=

返回后的数据格式如下:

有了上面的URL和结果,并添加了百度地图的地理编码接口,最终得到数据如下:

数据处理

1. 数据入库

为了更好地服务于我,首先将数据做了入库(此处我用的是Postgres库),表结构如下:

代码语言:javascript
代码运行次数:0
运行
复制
CREATE TABLE domestic_flight
(
  departure_city character varying(30),
  departure_cy double precision,
  departure_cx double precision,
  landing_city character varying(30),
  landing_cy double precision,
  landing_cx double precision,
  mileage character varying(255),
  flight_schedules character varying(255),
  airlines character varying(255),
  aircraft_models character varying(255),
  departure_time character varying(255),
  landing_time character varying(255),
  departure_airport character varying(255),
  departure_y double precision,
  departure_x double precision,
  landing_airport character varying(255),
  landing_y double precision,
  landing_x double precision,
  punctuality_rate character varying(255),
  average_delayed character varying(255),
  is_mon smallint,
  is_tue smallint,
  is_wed smallint,
  is_thr smallint,
  is_fri smallint,
  is_sat smallint,
  is_sun smallint
)

说明: 1、departure为起飞,landing为落地; 2、is_sat为“sat”是否有班次,”sat”为星期几的简写;

2. 提取城市和机场数据

城市和机场数据是类似的,此处以机场数据为例说明。

2.1 新建机场表

代码语言:javascript
代码运行次数:0
运行
复制
CREATE TABLE flight_airport
(
   id serial, 
   name character varying(30), 
   province character varying(30), 
   airport_x numeric, 
   airport_y numeric, 
   CONSTRAINT pkey_air_airporty PRIMARY KEY (id)
) 

2.2 插入数据

由于机场包含起飞和落地两个类型的,所以索性将两个数据做个union。

代码语言:javascript
代码运行次数:0
运行
复制
INSERT INTO flight_airport (NAME, airport_x, airport_y)(
    SELECT DISTINCT
        departure_airport AS airport,
        departure_x AS airport_x,
        departure_y AS airport_y
    FROM
        domestic_flight
)
UNION
    (
        SELECT DISTINCT
            landing_airport AS airport,
            to_number(landing_x, '999.999999999') AS airport_x,
            to_number(landing_y, '999.999999999') AS airport_y
        FROM
            domestic_flight
    )

说明: 1、在入库的时候,没注意,将landing_x和landing_y字段类型设成了String,所以此处做了一个转换;

2.3 更新省属性

省属性是通过空间表‘province’和flight_airport 表做空间关联而得的。

代码语言:javascript
代码运行次数:0
运行
复制
UPDATE flight_airport
SET province = (
    SELECT
        NAME
    FROM
        province
    WHERE
        st_within (
            st_point (
                flight_airport.airport_x,
                flight_airport.airport_y
            ),
            province.geom
        )
)

ok, 大工告成,最后的数据如下:

数据展示与分析

数据的地图展示是在geohey云平台上实现。

1.位置分布

1.1 有机场的城市的位置分布

1.2 机场的位置分布

2.数据统计

2.1 省机场数排名

代码语言:javascript
代码运行次数:0
运行
复制
SELECT
    province,
    COUNT (1) AS airport_num
FROM
    flight_airport
GROUP BY
    province
ORDER BY
    airport_num DESC

省名称

机场个数

内蒙古

16

新疆

15

云南

13

江苏

11

四川

11

山东

11

甘肃

10

广东

9

黑龙江

9

贵州

8

辽宁

8

浙江

8

湖南

7

湖北

6

西藏

6

福建

6

广西

6

安徽

6

江西

5

上海

5

陕西

5

山西

5

北京

5

吉林

4

河北

4

宁夏

4

河南

3

青海

3

重庆

2

海南

2

天津

1

2.1 航空公司航班数排名

代码语言:javascript
代码运行次数:0
运行
复制
SELECT
    airlines as name,
    COUNT (1) AS num
FROM
    domestic_flight
GROUP BY
    airlines
ORDER BY
    num DESC

航空公司

航班数

南方航空

2552

东方航空

1862

中国国航

1440

深圳航空

1183

厦门航空

1000

海南航空

982

山东航空

779

华夏航空

565

四川航空

468

天津航空

463

祥鹏航空

332

春秋航空

298

河北航空

292

吉祥航空

278

首都航空

268

昆明航空

239

成都航空

219

上海航空

214

西藏航空

212

幸福航空

195

长龙航空

167

东海航空

133

北部湾航空

111

西部航空

92

奥凯航空

90

福州航空

68

澳洲航空

67

九元航空

60

多彩航空

52

新西兰航空

52

大新华航空

50

瑞丽航空

46

扬子江航空

42

青岛航空

40

乌鲁木齐航空

30

英国航空

26

全日空航空

18

重庆航空

17

中国香港航空

17

红土航空

13

日本航空

13

联合航空

8

桂林航空

4

江西航空

4

夏威夷航空

3

酷航

3

长安航空

2

北欧航空

2

2.3 飞机机型排名

代码语言:javascript
代码运行次数:0
运行
复制
SELECT
    aircraft_models as name,
    COUNT (1) AS num
FROM
    domestic_flight
GROUP BY
    aircraft_models
ORDER BY
    num DESC

机型名称

个数

波音737(中)

6243

空客320(中)

3697

空客319(中)

1278

JET

987

空客321(中)

787

ERJ-190(中)

678

庞巴迪CRJ900

547

其他机型

457

新舟60(小)

145

空客330(宽体机)

108

空客321(窄体机)

37

波音787(大)

30

CRJ(小)

24

ERJ(小)

20

波音777(大)

15

波音757(中)

10

空客380(大)

5

波音747(大)

2

波音767(大)

1

数据下载地址:链接:https://pan.baidu.com/s/1FQW1OkNtALIvfoxFbcn4vw 密码:m1k2
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018年06月10日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 概述
  • 数据来源
  • 数据处理
    • 1. 数据入库
    • 2. 提取城市和机场数据
  • 数据展示与分析
    • 1.位置分布
    • 2.数据统计
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档