首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas三百题

片名 列全部重复值 df[df['片名'].duplicated()] 20-删除重复值 删除全部重复值 df.drop_duplicates() 21-删除重复值|指定 删除全部重复值,但保留最后一次出现值...'].isin(['中国','美国','英国','日本','巴西']))&(df['金牌数']<30) 36 -筛选|条件(包含指定值) 提取 国家奥委会 列,所有包含 df[df['国家奥委会...均值与总和」数据透视表,并在最后追加一『合计』 pd.pivot_table(df,values = ['销售额','数量'],index = ['省/自治区','类别'],aggfunc = ['...(left, right, on='k', suffixes=['_l', '_r']) join - 组合 25 - join|左对齐 合并 left 和 right,并按照 left 索引进行对齐...|值 将 df1 索引设置为日期,将 df1 数据向后移动一天 df1.set_index(['日期']).shift(1) 25 - 日期重采样|日 -> 周 周对 df1 进行重采样,保留每周最后一个数据

4.6K22

DML和DQL

数据锁定 支持 不支持 外键约束 支持 不支持 全文索引 不支持 支持 表空间大小 较大,约2倍 较小 (3)适用场合 使用MyISAM: 不支持事务,空间小,以查询访问为主 使用InnoDB: 多删除...、更新操作,安全性高,事务处理及并发控制 (4)查看当前默认存储引擎 语法: SHOW VARIABLES LIKE ‘%storage_engine%’;//模糊查询,查询mysql环境变量字段包含...,执行速度比DELETE语句快(delete from 表名:清除表所有数据,使用之后自增列不会还原为1,而是跟随删除之前索引继续增长,如原来是6,那么就从6开始增长;truncate table...(); 返回:19:19:26 NOW() 获取当前日期和时间 SELECT NOW(); 返回:2016-08-08 19:19:26 WEEK(date) 返回日期date为一年第几周 SELECT...-- 使用union all 是将两个字段数量相等查到所有信息合并在一列,不会去重; --只使用union的话,就是将两个表查到信息合并到一个表,并且将重复字段去除 select *

88410
您找到你想要的搜索结果了吗?
是的
没有找到

ClickHouse学习-建表和索引优化点(一)

例如,主键是 (CounterID, Date) 时,片段数据首先按 CounterID 排序,具有相同 CounterID 部分 Date 排序。...颗粒是 ClickHouse 中进行数据查询时最小不可分割数据集。ClickHouse 不会对或值进行拆分,所以每个颗粒总是包含整数个。...每个颗粒第一通过该行主键值进行标记,ClickHouse 会为每个数据片段创建一个索引文件来存储这些标记。对于每列,无论它是否包含在主键当中,ClickHouse 都会存储类似标记。...颗粒行数在 [1, index_granularity] 范围,这取决于大小。...总结 建表优化,创建字段时候尽量不要使用nullable 日期尽量都使用date类型 索引存储规则 创建索引尽量选择基数大,也就是重复相对较多(因为是稀疏索引)在mysql中正好是相反他需要创建索引时候基数相对较大

3.2K20

一文读懂mysql索引

MySQL 索引类似于书籍索引,通过存储指向数据指针,可以快速定位和访问表特定数据。...拿汉语字典目录页(索引)打比方,我们可以拼音、笔画、偏旁部首等排序目录(索引)快速查找到需要字。 索引分单列索引和组合索引:单列索引,即一个索引包含单个列,一个表可以有多个单列索引。...下面是一个实例,我们要创建一个名为 students 表,并在 age 列上创建一个普通索引。...二、唯一索引在 MySQL ,你可以使用 CREATE UNIQUE INDEX 语句来创建唯一索引。唯一索引确保索引值是唯一,不允许有重复值。...请注意,如果表已经有重复 email 值,那么添加唯一索引将会失败。在创建唯一索引之前,你可能需要确保表 email 列没有重复值。

8310

Python~Pandas 小白避坑之常用笔记

=0, usecols=None) print(sheet1.head(5)) # 控制台打印前5条数据 三、重复值、缺失值、异常值处理、列剔除 1.重复值统计、剔除: import pandas...) 2.缺失值统计、剔除: dropna()参数介绍: axis:0(对行数据进行剔除)、1(对列数据进行剔除),默认为0 how:any(中有任意一个空值则剔除), all(全部为空值则剔除..., inplace=True) print("异常值处理后:") print(sheet1['Age'].head(5)) 4.列剔除 import pandas as pd sheet1...'].dt.year # 根据日期字段 新增年份列 sheet1['季度'] = sheet1['日期'].dt.quarter # 根据日期字段 新增季度列 # 年度分组,指定销售额列进行求和计算...使用,而pandas提供了大量能使我们快速便捷地处理数据函数和方法,续有常用pandas函数会在这篇博客持续更新。

3.1K30

数据分析与数据挖掘 - 07数据处理

它不仅仅包含各种数据处理方法,也包含了从多种数据源读取数据方法,比如Excel、CSV等,这些我们后边会讲到,让我们首先从Pandas数据类型开始学起。...= pd.read_sql(sql, con=conn) print(r) print(type(r)) 三 日期处理 日期格式数据是我们在进行数据处理时候经常遇到一种格式,让我来看一下在Excel...日期数据我们该如何处理?...Excel不是对应,根据返回结果我们可以看出,第9重复,这里重复数据指的是每一个字段都重复数据。...参数data,指的是你数据集。 参数values,指的是要用来观察分析数据值,就是Excel值字段。 参数index,指的是要索引数据值,就是Excel字段。

2.6K20

sql server之数据库语句优化

OUTER(join):如果指定了 OUTER JOIN保留表(preserved table)未找到行将作为外部添加到vt2,生成t3,如果from包含两个以上表,则对上一个联结生成结果表和下一个表重复执行步骤和步骤直接结束...GROUP BY:GROUP BY子句中列列表对vt4分组生成vt5 6. CUBE|ROLLUP:把超组(supergroups)插入vt6,生成vt6 7....DISTINCT:将重复从vt8去除产生vt9 10. ORDER BY:将vt9order by子句中列列表排序生成一个游标vc10 11....所以我建议是,在并发系统,尽量使用CREATE TABLE + INSERT INTO,而大数据量单个语句使用,使用SELECT INTO。...A、多表连接时候,连接条件必须写全,宁可重复,不要缺漏。

1.5K70

SQL Server优化之SQL语句优化

OUTER(join):如果指定了 OUTER JOIN保留表(preserved table)未找到行将作为外部添加到vt2,生成t3,如果from包含两个以上表,则对上一个联结生成结果表和下一个表重复执行步骤和步骤直接结束...GROUP BY:GROUP BY子句中列列表对vt4分组生成vt5 6. CUBE|ROLLUP:把超组(supergroups)插入vt6,生成vt6 7....DISTINCT:将重复从vt8去除产生vt9 10. ORDER BY:将vt9order by子句中列列表排序生成一个游标vc10 11....所以我建议是,在并发系统,尽量使用CREATE TABLE + INSERT INTO,而大数据量单个语句使用,使用SELECT INTO。...A、多表连接时候,连接条件必须写全,宁可重复,不要缺漏。

3.5K34

MySQL 【进阶查询】

拿汉语字典目录页(索引)打比方,我们可以拼音、笔画、偏旁部首等排序目录(索引)快速查找到需要字。 索引分单列索引和组合索引。...单列索引,即一个索引包含单个列,一个表可以有多个单列索引,但这不是组合索引。组合索引,即一个索引包含多个列。...一般情况下,查询重复值,请执行以下操作: 确定哪一列包含值可能会重复。 在列选择列表使用COUNT(*)列出那些列。 在GROUP BY子句中列出列。 HAVING子句设置重复数大于1。...INDEX(索引) 和 PRIMAY KEY(主键)这种简单方法来删除表重复记录。...) DATE_FORMAT(d,f) 表达式 f要求显示日期 d SELECT DATE_FORMAT('2011-11-11 11:11:11','%Y-%m-%d %r') -> 2011-11

12.4K10

SQL养成这8个好习惯是一笔财富

vt2 3.OUTER(join):如果指定了 OUTER JOIN保留表(preserved table)未找到行将作为外部添加到vt2 生成t3如果from包含两个以上表则对上一个联结生成结果表和下一个表重复执行步骤和步骤直接结束...4.WHERE:对vt3应用 WHERE 筛选器只有使 为true才被插入vt4 5.GROUP BY:GROUP BY子句中列列表对vt4分组生成vt5...8.SELECT:处理select列表产生vt8 9.DISTINCT:将重复从vt8去除产生vt9 10.ORDER BY:将vt9order by子句中列列表排序生成一个游标vc10...2010 AND月=10 B、 不要对索引字段进行格式转换 日期字段例子: WHERE CONVERT(VARCHAR(10), 日期字段,120)='2010-07-15' 应该改为 WHERE日期字段...A、多表连接时候,连接条件必须写全,宁可重复,不要缺漏。

10710

ClickHouse在大数据领域应用实践

实际使用过程,查询一条记录与多条连续记录有时候时间相似(底层逻辑都是从磁盘IO一个磁盘页数据)。 2、(列)存储 通过简单示例比较存储与列存储对查询影响,主要以磁盘IO最为技术指标。...集合查询由于查询条件非连续,需要单独索引并完成磁盘IO,集合中有N个元素(随机)需要索引N次,以页为单位磁盘IO (3)通过id查询整行数据 列存储通常比存储查询效率要高,对于宽表(几十列以上聚合表...通过id查询name或者批量id查询name,借助于哈希索引存储可能具有O(1)时间复杂度。...当设置有主键时,主键字段必需包含在排序属性,且从左到右依次展开。 3、默认值 Null类型几乎总是会拖累性能,原因如下:空值无法被索引;需要使用额外特殊占位符单独处理。...1、MergeTree MergeTree引擎能够实现较大数据量查询需求,由于主键没有唯一索引约束,存在重复情况。

2.2K80

使用R或者Python编程语言完成Excel基础操作

输入数据:直接在单元格输入数据。 2. 删除数据 删除或列:右键点击行号或列标,选择“删除”。 清除内容:选中单元格,Delete键或右键选择“清除内容”。 3....使用查找和替换:Ctrl+F或Ctrl+H,进行查找和替换操作。 4. 查询数据 使用公式:在单元格输入公式进行计算。 查找特定数据:Ctrl+F打开查找窗口,输入要查找内容。 5....模板 使用模板:快速创建具有预定义格式和功能表格。 高级筛选 自定义筛选条件:设置复杂筛选条件,如“大于”、“小于”、“包含”等。 错误检查 追踪错误:找出公式错误来源。...以下是一些基础操作在R实现方式,以及一个实战案例。...通过dplyr和tidyr包,我们可以轻松地对数据进行复杂操作。 在R语言中,即使不使用dplyr和tidyr这样现代包,也可以使用基础包函数来完成数据操作。

13310

SQL谓词 %STARTSWITH(二)

%STARTSWITH不会忽略数字、日期或列表子字符串尾随空格。 在下面的示例,%STARTSWITH将结果集限制为以“M”开头名称。...' 在下面的示例,%STARTSWITH从结果集中删除所有,因为对于数值,子字符串末尾空格不会被忽略: SELECT Name,Age FROM Sample.Person WHERE Age %...STARTSWITH '6 ' 在下面的示例,%STARTSWITH从结果集中删除所有,因为对于列表值,子字符串末尾空不会被忽略: SELECT Name,FavoriteColors...%EXTERNAL(FavoriteColors) %STARTSWITH 'Blue'||CHAR(13)||CHAR(10) 下标的范围 当从下标检索标量表达式时,%STARTSWITH可以用作一个索引限制范围条件...示例 下面的示例使用WHERE子句选择以字母“R”或“r”开头Name值。

1.1K10

SQL好写法

vt2     3.OUTER(join):如果指定了 OUTER JOIN保留表(preserved table)未找到行将作为外部添加到vt2 生成t3如果from包含两个以上表则对上一个联结生成结果表和下一个表重复执行步骤和步骤直接结束...    4.WHERE:对vt3应用 WHERE 筛选器只有使 为true才被插入vt4     5.GROUP BY:GROUP BY子句中列列表对vt4...分组生成vt5     6.CUBE|ROLLUP:把超组(supergroups)插入vt6 生成vt6     7.HAVING:对vt6应用HAVING筛选器只有使 为true组才插入vt7     8.SELECT:处理select列表产生vt8     9.DISTINCT:将重复从vt8去除产生vt9     10.ORDER BY:将vt9... AND月=10   B、 不要对索引字段进行格式转换 日期字段例子: WHERE CONVERT(VARCHAR(10), 日期字段,120)='2010-07-15'  应该改为  WHERE

91420

理解SQL原理SQL调优你必须知道10条铁律

vt2 OUTER(join):如果指定了 OUTER JOIN保留表(preserved table)未找到行将作为外部添加到vt2 生成t3如果from包含两个以上表则对上一个联结生成结果表和下一个表重复执行步骤和步骤直接结束...WHERE:对vt3应用 WHERE 筛选器只有使 为true才被插入vt4 GROUP BY:GROUP BY子句中列列表对vt4分组生成vt5...SELECT:处理select列表产生vt8 DISTINCT:将重复从vt8去除产生vt9 ORDER BY:将vt9order by子句中列列表排序生成一个游标vc10 TOP...AND月=10 B、 不要对索引字段进行格式转换 日期字段例子: WHERE CONVERT(VARCHAR(10), 日期字段,120)='2010-07-15' 应该改为 WHERE日期字段...多表连接时候,连接条件必须写全,宁可重复,不要缺漏。

1.3K50

8个能提升工作效率SQL好习惯

vt2 3.OUTER(join):如果指定了 OUTER JOIN保留表(preserved table)未找到行将作为外部添加到vt2 生成t3如果from包含两个以上表则对上一个联结生成结果表和下一个表重复执行步骤和步骤直接结束...4.WHERE:对vt3应用 WHERE 筛选器只有使 为true才被插入vt4 5.GROUP BY:GROUP BY子句中列列表对vt4分组生成vt5...8.SELECT:处理select列表产生vt8 9.DISTINCT:将重复从vt8去除产生vt9 10.ORDER BY:将vt9order by子句中列列表排序生成一个游标vc10...2010 AND月=10 B、 不要对索引字段进行格式转换 日期字段例子: WHERE CONVERT(VARCHAR(10), 日期字段,120)='2010-07-15' 应该改为 WHERE日期字段...A、多表连接时候,连接条件必须写全,宁可重复,不要缺漏。

21920

SAP 深入理解销售订单

R/3 SD销售处理可以提供: □询价、报价和销售订单处理和监控 □广泛拷贝功能可以将在订单输入误差和重复劳动减至最少 □客户定义凭证类型用于所有销售订单 □可用性检查(ATP) □交货计划...对每项交货可以日、周、月来规定发货日期。    组件供应商交货协议     组件供应商像汽车制造厂商一样对贸易和数据处理具有特定需求。...为适用这些需求,R/3 SD对交货协议处理包含若干个特点。     在规定期限内,与组件供应商交货协议将规定交货数量和交付日期。通过交货可以下达这些物料。...部分交货     如果交货计划和可用性检查确定货物不能要求日期交货时,该系统将能根据客户接受部分交货方案作出不同程度反应: □R/3系统确定货物数量,如果有,将客户要求交货日期交货。...更新延迟订单     由于缺乏货物可用性,订单项目客户要求交货日期不能得到确认时,订单项目可以应用延迟订单处理功能来加以更新。该系统可以重复检查可用性并显示目前状况。

32311

SQL养成这8个好习惯是一笔财富

vt2 3、OUTER(join):如果指定了 OUTER JOIN保留表(preserved table)未找到行将作为外部添加到vt2 生成t3如果from包含两个以上表则对上一个联结生成结果表和下一个表重复执行步骤和步骤直接结束...4、WHERE:对vt3应用 WHERE 筛选器只有使 为true才被插入vt4 5、GROUP BY:GROUP BY子句中列列表对vt4分组生成vt5...8、SELECT:处理select列表产生vt8 9、DISTINCT:将重复从vt8去除产生vt9 10、ORDER BY:将vt9order by子句中列列表排序生成一个游标vc10...AND月=10 B、 不要对索引字段进行格式转换 日期字段例子: WHERE CONVERT(VARCHAR(10), 日期字段,120)='2010-07-15' 应该改为 WHERE日期字段〉=...A、多表连接时候,连接条件必须写全,宁可重复,不要缺漏。

73910

Python报表自动化

将单位字段放在透视表区域。 ? 当处理到单位字段时我们会发现,表每一笔贷款都有三家网点进行业绩分成。我们需要将分成比例也考虑进去。所以透视表区域及值区域不能简单放入单位1和贷款金额。...此时大部分人都会想到先在数据源表格添加三列分成比例分成以后贷款金额。 ?...3.2日期筛选 个人贷款信息表包含该银行所有的历史数据,而我们每日报表只需要统计当年投放情况。所以计算投放金额前,我们需要将合同生效日期不符合要求贷款记录排除掉。...纵向追加使用concat()函数,并使用参数ignore_index重置索引。...然后下图所示点击 Run All 执行以上代码就可以一键完成我们每天需要日报了。 ? 其实以上模型处理除了可以计算年累计投放数据以外,我们还可以通过修改日期筛选范围。

4.1K41
领券