首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

高级SQL查询-(聚合查询,分组查询,联合查询

by 1,分组查询 2,分组条件查询having 3,SQL查询关键字执行顺序 三,联合查询(多表查询) 1,前置知识-笛卡尔积 2,内连接 2.1内连接语法 2.2示例分析 2.3内连接查询的问题...查询以下数据: 查询姓名重复的员工信息 3,SQL查询关键字执行顺序 SQL查询关键字执行顺序 group by>having>order by>limit 三,联合查询(多表查询) 1...,前置知识-笛卡尔积 笛卡尔积是联合查询也就是多表查询的基础,那什么是笛卡尔积呢?...t2 [on 连接条件]; 右连接以右边的表为主查询数据 示例分析 查询所有人的成绩 1,使用左连接查询,student表为主表 2,使用右连接查询,score_table表为主表...,因为这个语句就 是内连接的查询语句 5,子查询查询是指嵌⼊在其他 sql 语句中的 select 语句,也叫嵌套查询 示例 查询计算机或英语的成绩 select * from score_table

3.9K10

爱数科案例 | 共享单车使用量回归建模与分析

本案例使用K近邻回归算法对共享单车使用量进行回归预测。所采用的数据集是共享单车使用量数据集,该数据集共有16个字段,731条数据,记录了不同日期、节假日、天气条件下的共享单车使用情况。...此外,记录当日单车使用总量的字段cnt=未注册用户使用量casual+注册用户使用量registered。 2....4. cnt字段异常值检测 对目标字段cnt进行异常值检测,查看单日共享单车使用量有无不合理的情况。...结果如下: 检测到的异常值行数为:0 得到数据输出预览: cnt字段无异常值,认为数据表中的共享单车使用量信息没有超出合理范围。 5....单车使用量折线图 接下来绘制cnt字段的折线图,观察随着时间的变化,共享单车的使用量的变化趋势。

1.6K20

【Spark手机流量日志处理】使用SparkSQL按月统计流量使用量最多的用户

它允许用户使用SQL语句或DataFrame API来查询和操作数据,同时还支持使用Spark的分布式计算引擎进行高效的并行计算。...Spark SQL还支持将SQL查询结果写入到外部数据源,如Hive表、JSON文件、Parquet文件等。...David| 32| M| 9000| +---+----+---+------+-----+ 手机流量日志数据格式与处理要求 日志字段与字段说明如下 1.需要实现的需求1.按月统计流量使用量最多的用户...//2020-03-10 15707126156 QK-X7-7N-G2-1N-QZ:CMCC 212.188.187.220 33 40 67584 81920 200 //使用量...=上+下 手机号码就是用户 RDD处理方式->((月,号码),(上行+下行)) //1.下载手机流量日志 //2.按月统计流量使用量最多的用户 //3.将结果数据持久化到硬盘 object LogPhone

55930
领券