查看英文原文 :https://hackernoon.com/python-tricks-101-2836251922e0
题目介绍: 按日期分组销售产品 group-sold-products-by-the-date
上一篇文章一场pandas与SQL的巅峰大战中,我们对比了pandas与SQL常见的一些操作,我们的例子虽然是以MySQL为基础的,但换作其他的数据库软件,也一样适用。工作中除了MySQL,也经常会使用Hive SQL,相比之下,后者有更为强大和丰富的函数。本文将延续上一篇文章的风格和思路,继续对比Pandas与SQL,一方面是对上文的补充,另一方面也继续深入学习一下两种工具。方便起见,本文采用hive环境运行SQL,使用jupyter lab运行pandas。关于hive的安装和配置,我在之前的文章MacOS 下hive的安装与配置提到过,不过仅限于mac版本,供参考,如果你觉得比较困难,可以考虑使用postgreSQL,它比MySQL支持更多的函数(不过代码可能需要进行一定的改动)。而jupyter lab和jupyter notebook功能相同,界面相似,完全可以用notebook代替,我在Jupyter notebook使用技巧大全一文的最后有提到过二者的差别,感兴趣可以点击蓝字阅读。希望本文可以帮助各位读者在工作中进行pandas和Hive SQL的快速转换。本文涉及的部分hive 函数我在之前也有总结过,可以参考常用Hive函数的学习和总结。
-- 行转列 SELECT * from ( SELECT tt1.SAP_ID,TT1.dt,TT1.EFF from ( SELECT t1.SAP_ID,T1.DT,nvl(T2.EFFECTIVE,0) eff from ( SELECT A1.SAP_ID,mr.dt from (SELECT DISTINCT SAP_ID from DATA_EMP_ATTENDANCE) a1, (SELECT TO_DATE('2018-11-01','YYYY-MM-DD')+ROWNUM - 1 DT FROM DUAL CONNECT BY LEVEL <=(TO_DATE('2018-11-15','YYYY-MM-DD')-TO_DATE('2018-11-01','YYYY-MM-DD')+1)) mr ) t1 LEFT JOIN ( SELECT SAP_ID,BEGIN_DATE,1 effective from DATA_EMP_ATTENDANCE ) t2 ON T2.SAP_ID = T1.SAP_ID AND T2.BEGIN_DATE = T1.DT ORDER BY t1.dt DESC ) tt1 ) pivot (max(eff) for dt in (to_date('2018-11-05','yyyy-mm-dd') d1,to_date('2018-11-12','yyyy-mm-dd') d2,to_date('2018-11-12','yyyy-mm-dd') d3)); ```
在python中列表用[]来表示,逗号分隔元素, 例如cars = [1,2,3]
ETL (Extract-Transform-Load 的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种ETL工具的使用,必不可少。
预告: 下一次培训主要面向DBA, 讲一下ora工具的用法与用途,大概需要一天时间.
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/79008881
在很多笔试的程序员中会有很多写SQL的情况,其中很多时候会考察行转列。那么这个时候如果能写出来几种行转列的SQL,会给面试官留下比较好的印象。
比如event_value是一个json格式的字段,然后想获取里面的id作为单独一列
在Python中,split()函数是一个非常常用的字符串方法,它可以将一个字符串按照指定的分隔符拆分成多个子串,并返回一个包含子串的列表。
那9个字,犹如一声惊雷,在这个热情的群里炸开了锅...
注意:返回结果为连接参数产生的字符串,如果有任何一个参数为 NULL,则返回值为 NULL。
字典的每个键值 key=>value 对用冒号 : 分割,每个对之间用逗号(,)分割,整个字典包括在花括号 {} 中
在讲解中我们需要贯串一个例子,所以需要设计一个情景,对应还要有一个表结构和填充数据。如下:有 3 个字段,分别为 personId 标识某一个人,company 标识一家公司名称,money 标识该公司每年盈利收入(单位:万元人民币)
需求描述 实现的sql 案例演示 字符串拆分: SUBSTRING_INDEX(str, delim, count) 替换函数:replace( str, from_str, to_str) 获取字符串长度:LENGTH( str ) 实现的原理解析 实现sql 正式的原理解析 Step1:首先获取最后需被拆分成多少个字符串,利用 help_topic_id 来模拟遍历 第n个字符串。 Step2:根据“,”逗号来拆分字符串,此处利用 SUBSTRING_INDEX(str, delim, count) 函数,最后把结果赋值给 num 字段。 扩展:判断外部值是否在 num列值中 find_in_set instr 字符串转多列
前两天朋友提了一个和SQL有关的问题,准确地说,是和字符串转换有关的,首先我们创建测试表,用模拟数据进行说明,
1.概述2.通用序列操作2.1索引2.2 切片2.3 字符串合并2.4 乘法2.5 成员资格2.6 长度、最小值和最大值
大数据的 ETL(Extract-Transfer-Load) 过程的 Transfer 阶段,需要对 json 串数据进行转换“拍平”处理。
6.使用group_concat_max_len系统变量,你可以设置允许的最大长度。 程序中进行这项操作的语法如下,其中 val 是一个无符号整数:
一、字符串拆分: SUBSTRING_INDEX(str, delim, count)
返回结果为连接参数产生的字符串。如有任何一个参数为NULL ,则返回值为 NULL。
📝前言: 这篇文章主要讲解一下python中常见的数据容器之一——列表 本文主要讲解列表的创建以及我们常用的列表操作方法
Atlas下载地址: https://github.com/Qihoo360/Atlas/releases
原标题:oracle的wm_concat()和mysql的group_concat()合并同列变成一行的用法以及和concat()合并不同列的区别
MySQL是一款常用的关系型数据库,广泛应用于各种类型的应用程序和数据存储需求。在MySQL中,我们经常需要对表格进行行转列或列转行的操作,以满足不同的分析或报表需求。本文将详细介绍MySQL中的行转列和列转行操作,并提供相应的SQL语句进行操作。
docker搭建环境 请自己安装好docker,然后使用ubuntu:14.04的镜像 docker pull ubuntu:14.04 以下是pcat提供的Dockerfile和start.sh,请把这2个文件放在同一个文件夹下 (如果不懂docker的话,可以借此机会学习学习下) Dockerfile: FROM ubuntu:14.04 MAINTAINER pcat@chamd5.org ENV REFRESHED_AT 2017-11-14 ENV LANG C.UTF-8 # chang
问题归纳起来就是:在MySQL里面update一条记录,语法都正确的,但记录并没有被更新…
本篇文章主要介绍了MySQL中concat函数的用法(连接字符串),在命令行模式下进行测试。
问题归纳起来就是: 在MySQL里面update一条记录,语法都正确的,但记录并没有被更新...
上一篇文章 跨表更新,看到自己写的SQL像个憨憨 写了关于跨表个更新的内容。一年过的很快,文中后来的两位员工 馮大 和 馮二 也要面对无情的 KPI 考核了,他们工作干的很不错,performance 分别是 4 和 5
问题归纳起来就是:在MySQL里面update一条记录,语法都正确的,但记录并没有被更新...
Atlas是由 Qihoo 360, Web平台部基础架构团队开发维护的一个基于MySQL协议的数据中间层项目。 它是在mysql-proxy 0.8.2版本的基础上,对其进行了优化,增加了一些新的功能特性; 360内部使用Atlas运行的mysql业务,每天承载的读写请求数达几十亿条;
Windows 跳转列表是自 Windows 7 时代就带来的功能,这一功能是跟随 Windows 7 的任务栏而发布的。当时应用程序要想用上这样的功能需要调用 shell 提供的一些 API。
想把手上的Sqlite数据库导入到MySql,想来应该很简单,结果发现非常麻烦。 1、工具直接导入。试着找了几个软件,都不行。网上有人开发的,但是要收费,也不能用。 2、用各自支持的方式,中转。我用的是sqlitestudio和Navicat for MySQL,都挺好用。sqlite可以把表导出,mysql可以导入,想来比较容易,却无数的坑: 1)最好用的是dbf,双方都支持,而且带表结构。但是——dbf对中文支持稀烂。导出来的打开就已经是乱码了,想各种招都不行。 2)xml,导入时列识别不了 3)jso
列表是由一系列按特定顺序排列的元素组成, 是 Python 中使用最频繁的数据类型。列表可以完成大多数集合类的数据结构实现。列表中元素的类型可以不相同,它支持数字,字符串甚至可以包含列表、字典(即嵌套)。
在数据库操作中,我们经常会遇到需要处理以逗号分隔的字符串,并且需要根据这些字符串进行查询的情况。MySQL提供了一个非常实用的函数FIND_IN_SET()来处理这种特定的查询需求。本文将深入解析FIND_IN_SET()函数的使用方法,并通过具体的应用场景来展示其强大功能。
前提得配置好主从参考:http://www.cnblogs.com/super-d2/p/4802990.html
MySQL复制是一个非常强大的特性,它允许我们将一个MySQL数据库服务器(主服务器)的数据复制到一个或多个其他MySQL数据库服务器(从服务器)。但在某些场景下,我们可能不希望所有的数据都被复制。例如,可能有些数据库或表我们想要在主服务器上保留,而不想让它们被复制到从服务器。MySQL提供了几个配置选项,可以帮助我们实现这个目的。这些选项包括Replicate_Ignore_DB,Replicate_Ignore_Table,Replicate_Wild_Ignore_Table和Replicate_Ignore_Server_Ids。在本文中,我们将详细介绍这些配置选项的作用和如何使用它们。
Atlas是由 Qihoo 360公司Web平台部基础架构团队开发维护的一个基于MySQL协议的数据中间层项目。它在MySQL官方推出的MySQL-Proxy 0.8.2版本的基础上,修改了大量bug,添加了很多功能特性。目前该项目在360公司内部得到了广泛应用,很多MySQL业务已经接入了Atlas平台,每天承载的读写请求数达几十亿条。
👨🎓作者:Java学术趴 🏦仓库:Github、Gitee ✏️博客:CSDN、掘金、InfoQ、云+社区 💌公众号:Java学术趴 🚫特别声明:原创不易,未经授权不得转载或抄袭,如需转载可联系小编授权。 🙏版权声明:文章里的部分文字或者图片来自于互联网以及百度百科,如有侵权请尽快联系小编。 👋大家好!我是你们的老朋友Java学术趴。我今天又来喽!!今天继续给大家分享Python语言干货知识。 第六章 列表及常用方法 6.1 列表的概述 list是Python中非常重要的数据结构,是一种有序的数
最近在做的业务场景涉及到了数据库的递归查询。我们公司用的 Oracle ,众所周知,Oracle 自带有递归查询的功能,所以实现起来特别简单。
需求: 使用一条SQL获得tb_user表中每个人持有的剑名(剑名用“|”分隔),即得到如下结果
Python3的基本数据类型 变量不需要提前声明 每个变量使用前必须赋值,赋值之后能会被建立 Python中,变量是没有类型的,这里所说的“类型”是指内存中所存储的对像的类型。 Python中有六种标准数据类型 Number (数字) String (字符串) List (列表) Tuple (元组) Dictionary (字典) Sets (集合) 不可变:Number(数字)、String(字符串)、Tuple(元组) 可变:List(列表)、Dictionary(字典)、Set(集合) ----
Atlas是由 Qihoo 360公司Web平台部基础架构团队开发维护的一个基于MySQL协议的数据中间层项目。它在MySQL官方推出的MySQL-Proxy 0.8.2版本的基础上,修改了大量bug,添加了很多功能特性。目前该项目在360公司内部得到了广泛应用,很多MySQL业务已经接入了Atlas平台,每天承载的读写请求数达几十亿条。同时,有超过50家公司在生产环境中部署了Atlas,超过800人已加入了我们的开发者交流群,并且这些数字还在不断增加。
首先举个例子来说: 有个文章表里面有个type字段,它存储的是文章类型,有 1头条、2推荐、3热点、4图文等等 。 现在有篇文章他既是头条,又是热点,还是图文,type中以 1,3,4 的格式存储。那我们如何用sql查找所有type中有4的图文类型的文章呢?? 这就要我们的 find_in_set 出马的时候到了。以下为引用的内容:
前几天在才哥交流群里边遇到一个叫【上海-数据分析-小粒】的粉丝提了一个小问题,如下:
所谓的行转列操作,就是将一个表的行信息转化为列信息,说着可能比较笼统,这里先举个例子,如下:
领取专属 10元无门槛券
手把手带您无忧上云