Python按照某些列去重,可用drop_duplicates函数轻松处理。本文致力用简洁的语言介绍该函数。...subset:用来指定特定的列,根据指定的列对数据框去重。默认值为None,即DataFrame中一行元素全部相同时才去除。...导入数据处理的库 os.chdir('F:/微信公众号/Python/26.基于多列组合删除数据框中的重复值') #把路径改为数据存放的路径 name = pd.read_csv('name.csv...原始数据中只有第二行和最后一行存在重复,默认保留第一条,故删除最后一条得到新数据框。 想要根据更多列数去重,可以在subset中添加列。...但是对于两列中元素顺序相反的数据框去重,drop_duplicates函数无能为力。 如需处理这种类型的数据去重问题,参见本公众号中的文章【Python】基于多列组合删除数据框中的重复值。 -end-
我们在对比系统目前存在的生日与身份证的时候会问,怎么只取其中值的特定位置,获得对比结果。 例如我们有一个值是123456789,那么我们怎么只显示4567呢?...= RBD AND table2.ResidentialID like '__________________' 我们可以参考w3schools 的介绍。 也就是,从身份证第7位起,长度为8位。...注意,他和程序中的index不一样,开始第一个字符就是1,而不是0。
最近公司在做关联图谱的项目,想挖掘团伙犯罪。在准备关系数据时需要根据两列组合删除数据框中的重复值,两列中元素的顺序可能是相反的。...本文介绍一句语句解决多列组合删除数据框中重复值的问题。 一、举一个小例子 在Python中有一个包含3列的数据框,希望根据列name1和name2组合(在两行中顺序不一样)消除重复项。...import numpy as np #导入数据处理的库 os.chdir('F:/微信公众号/Python/26.基于多列组合删除数据框中的重复值') #把路径改为数据存放的路径 df =...由于原始数据是从hive sql中跑出来,表示商户号之间关系的数据,merchant_r和merchant_l中存在组合重复的现象。现希望根据这两列组合消除重复项。...numpy as np #导入数据处理的库 os.chdir('F:/微信公众号/Python/26.基于多列组合删除数据框中的重复值') #把路径改为数据存放的路径 name = pd.read_csv
pandas.core.frame.DataFrame; 生成一个随机数数组; 将这个随机数数组与 DataFrame 中的数据列合并成一个新的 NumPy 数组。...numpy 是 Python 中用于科学计算的基础库,提供了大量的数学函数工具,特别是对于数组的操作。pandas 是基于 numpy 构建的一个提供高性能、易用数据结构和数据分析工具的库。...在这个 DataFrame 中,“label” 作为列名,列表中的元素作为数据填充到这一列中。...结果是一个新的 NumPy 数组 arr,它将原始 DataFrame 中 “label” 列的值作为最后一列附加到了随机数数组之后。...运行结果如下: 总结来说,这段代码通过合并随机数数组和 DataFrame 中特定列的值,展示了如何在 Python 中使用 numpy 和 pandas 进行基本的数据处理和数组操作。
4)、使用多线程提取数据 一、数据库连接类 cx_Oracle是一个Python 扩展模块,相当于python的Oracle数据库的驱动,通过使用所有数据库访问模块通用的数据库 API来实现Oracle...=None) sql:要执行的sql脚本,文本类型 con:数据库连接 index_col:选择返回结果集索引的列,文本/文本列表 coerce_float:非常有用,将数字形式的字符串直接以float...params:向sql脚本中传入的参数,官方类型有列表,元组和字典。用于传递参数的语法是数据库驱动程序相关的。...chunksize:如果提供了一个整数值,那么就会返回一个generator,每次输出的行数就是提供的值的大小 read_sql_query()中可以接受SQL语句,DELETE,INSERT INTO...cx_Oracle是一个Python 扩展模块,相当于python的Oracle数据库的驱动,通过使用所有数据库访问模块通用的数据库 API来实现Oracle 数据库的查询和更新。
2)sql 语句集合模块,将待执行的业务 sql 语句统一存放到这里 3)数据处理函数工厂 4)使用多线程提取数据 一、数据库连接类 cx_Oracle 是一个 Python 扩展模块,相当于 python...=None) sql:要执行的sql脚本,文本类型 con:数据库连接 index_col:选择返回结果集索引的列,文本/文本列表 coerce_float:非常有用,将数字形式的字符串直接以float...params:向sql脚本中传入的参数,官方类型有列表,元组和字典。用于传递参数的语法是数据库驱动程序相关的。...chunksize:如果提供了一个整数值,那么就会返回一个generator,每次输出的行数就是提供的值的大小 read_sql_query()中可以接受SQL语句,DELETE,INSERT INTO...cx_Oracle 是一个 Python 扩展模块,相当于 python 的 Oracle 数据库的驱动,通过使用所有数据库访问模块通用的数据库 API 来实现 Oracle 数据库的查询和更新。
在数据库运维的过程中,Shell 脚本在很大程度上为运维提供了极大的便利性。而shell 脚本参数作为变量传递给SQL以及SQL脚本也是DBA经常碰到的情形之一。...本文主要讨论了如何将shell脚本的参数传递到SQL脚本之中并执行SQL查询。 ...SQL脚本 b、方式1的用法是直接将shell变量跟在脚本之后, sqlplus userid/pwd @script_name $para1 $para2 c、方式2是启动sqlplus后在SQL提示符下来传递参数..., SQL>@script_name $para1 $para2 d、方式3则是将shell变量的值先传递给define定义的变量,然后再传递给SQL脚本 SQL>@script_name var1 var2...e、注意方式3中SQL脚本的替代变量与define定义的变量名相同
Pandas是一个用于数据操作和分析的Python库。它建立在 numpy 库之上,提供数据帧的有效实现。数据帧是一种二维数据结构。在数据帧中,数据以表格形式在行和列中对齐。...它类似于电子表格或SQL表或R中的data.frame。最常用的熊猫对象是数据帧。大多数情况下,数据是从其他数据源(如csv,excel,SQL等)导入到pandas数据帧中的。...列值也可以作为列表传递,而无需使用 Series 方法。 例 1 在此示例中,我们创建了一个空数据帧。...然后,通过将列名 ['Name', 'Age'] 传递给 DataFrame 构造函数的 columns 参数,我们在数据帧中创建 2 列。...然后,我们在数据帧后附加了 2 列 [“罢工率”、“平均值”]。 “罢工率”列的列值作为系列传递。“平均值”列的列值作为列表传递。列表的索引是列表的默认索引。
这个想法是,该字符串包含在另一个 Python 脚本中重构对象所需的所有信息。 我们使用read_pickle方法读取我们的 PICKLE 文件,如以下代码所示。...并使用过滤器列中的值创建了一个新的数据帧。...我们还将看到如何将字符串值列转换为datetime数据类型。...将函数应用于 Pandas 序列或数据帧 在本节中,我们将学习如何将 Python 的预构建函数和自构建函数应用于 pandas 数据对象。...接下来,我们了解如何将函数应用于多个列或整个数据帧中的值。 我们可以使用applymap()方法。 它以类似于apply()方法的方式工作,但是在多列或整个数据帧上。
开发环境 操作系统:CentOS 7.4 Python版本 :3.6 Django版本: 1.10.5 操作系统用户:oms 前面介绍了如何利用Python获取TOP SQL数据并在前端展现出来...对于Oracle数据库的运维,我们首先需要知道系统的整体运行状况,例如物理读,逻辑读,解析,命中率等 这节就讲如何将这些数据获取 获取原理 我们通过查询v$sysstat 等视图来获取信息 关于redis...新建MySQL表存放监控数据 我们无需事先建立redis的key值 2....设置自动运行 这里我们设置每小时执行一次,并重定向所有日志至一个文件 这样我们可以通过检查该日志文件判断脚本是否正常运行 0 * * * * /usr/bin/python /home...主页查看源码 https://github.com/bsbforever/oms_django 好了,这节介绍了如何利用自定义命令获取Oracle数据库的性能指标并保存在redis数据库中 下节介绍如何将这些数据展示在一个页面上
image.png 其它常见问题如下表所示: 问题 答案 Oracle中哪个包可以获取环境变量的值? 可以通过DBMS_SYSTEM.GET_ENV来获取环境变量的当前生效值。...DBMS_ALERT能让数据库触发器在特定的数据库值发生变化时向应用程序发送报警。报警是基于事务的并且是异步的(也就是它们的操作与定时机制无关)。...DBMS_APPLICATION_INFO是一个非常有用的程序包,它提供了通过V$SESSION跟踪脚本运行情况的能力,该包可以填充V$SESSION中的CLIENT_INFO、MODULE和ACTION...这3列的值。...在CLIENT_INFO列中存放程序的客户端信息;MODULE列存放主程序名,如包的名称;ACTION列存放程序包中的过程名。该包不仅提供了设置这些列值的过程,还提供了返回这些列值的过程。
问题 答案 Oracle中哪个包可以获取环境变量的值? 可以通过DBMS_SYSTEM.GET_ENV来获取环境变量的当前生效值。 如何让程序等待60秒钟后继续运行?...DBMS_ALERT能让数据库触发器在特定的数据库值发生变化时向应用程序发送报警。报警是基于事务的并且是异步的(也就是它们的操作与定时机制无关)。...DBMS_APPLICATION_INFO是一个非常有用的程序包,它提供了通过V$SESSION跟踪脚本运行情况的能力,该包可以填充V$SESSION中的CLIENT_INFO、MODULE和ACTION...这3列的值。...在CLIENT_INFO列中存放程序的客户端信息;MODULE列存放主程序名,如包的名称;ACTION列存放程序包中的过程名。该包不仅提供了设置这些列值的过程,还提供了返回这些列值的过程。
这个专题讲述如何讲这些监控数据保存在MySQL中为日后所用 上节讲到如何利用Python获取Oracle已使用过的索引名称 这节讲如何将他们存入MySQL数据库中 环境设置 Linux系统为 Centos...6.8 Python环境为 Python 3.6 MySQL版本 MySQL 5.7 (GA) 连接Oracle模块:cx_Oracle 连接MySQL模块:PyMySQL 存入MySQL脚本内容 将上节获取...Oracle索引的脚本增加存入MySQL数据库的代码 脚本名称依然为:checkindex.py #!...中的索引名称保存至变量data try: oracle = cx_Oracle.connect(username+'/'+password+'@'+ipaddress+':'+port...MySQL数据库中 经过一段时间的运行即可知道哪些索引未被使用过 运行结果 运行完脚本后我们查看MySQL数据库,应该可以看到表里应该有数据,而且没有重复数据 由于v$sql_plan中的数据可能被刷出内存空间
对于唯一值相对较少的对象列很有用。 准备 在此秘籍中,我们将显示数据帧中每一列的数据类型。 了解每一列中保存的数据类型至关重要,因为它会从根本上改变可能进行的操作的类型。...二、数据帧基本操作 在本章中,我们将介绍以下主题: 选择数据帧的多个列 用方法选择列 明智地排序列名称 处理整个数据帧 将数据帧方法链接在一起 将运算符与数据帧一起使用 比较缺失值 转换数据帧操作的方向...许多秘籍将与第 1 章,“Pandas 基础”中的内容类似,这些内容主要涵盖序列操作。 选择数据帧的多个列 选择单个列是通过将所需的列名作为字符串传递给数据帧的索引运算符来完成的。...所得的序列本身也具有sum方法,该方法可以使我们在数据帧中获得总计的缺失值。 在步骤 4 中,数据帧的any方法返回布尔值序列,指示每个列是否存在至少一个True。...Oracle,Microsoft,IBM 等公司提供了许多不同的 SQL 实现。 尽管语法在不同的实现之间不兼容,但其核心看起来几乎相同。
异常的分类 Oralce中的异常分为如下三类: 预定义的ORACLE数据库异常:有异常名,有错误代码,有异常信息 非预定义的ORACLE数据库异常:无异常名有错误代码,有异常信息。...PL/SQL 程序不能用OPEN 语句重复打开一个游标。 提取游标数据 就是检索结果集合中的数据行,放入指定的输出变量中。...如果在游标查询语句的选择列表中存在计算列,则必须为这些计算列指定别名后才能通过游标FOR 循环语句中的索引变量来访问这些列数据 --获取emp表中所有员工的信息 declare cursor...主要有四类:过程:执行特定操作,无返回值;函数:执行复杂操作,有返回值包:逻辑上相关的过程和函数的组合体触发器:事件触发,执行相应的操作 ORACLE 提供可以把PL/SQL 程序存储在数据库中,并可以在任何地方来运行它...过程和函数的唯一区别是函数总向调用者返回数据,而过程则不返回数据。 存储过程的参数特性: 函数 函数将处理从程序的调用部分传递给它的信息,然后返回单个值。
上个专题提到了如何利用Python操作Oracle数据库并监控想要的指标 这个专题讲述如何讲这些监控数据保存在MySQL中为日后所用 ---- 上节讲到如何利用Python获取Oracle已使用过的索引名称...,这节讲如何将他们存入MySQL数据库中 环境设置 Linux系统为 Centos 6.8 Python环境为 Python 3.6 MySQL版本 MySQL 5.7 (GA) 连接Oracle...模块:cx_Oracle 连接MySQL模块:PyMySQL ---- 将上节获取Oracle索引的脚本增加存入MySQL数据库片段 脚本名称依然为:checkindex.py 思路为先获取索引信息,...再遍历每个索引,针对不在MySQL的数据库的存入MySQL数据库中 经过一段时间的运行即可知道哪些索引未被使用过 ?...,而且没有重复数据 由于v$sql_plan中的数据可能被刷出内存空间,我们需要较为频繁的运行该程序 我在实际监控中是每隔十五分钟,大家可以使用crontab 来设定 这样经过一段时间(半年甚至一年),
在应用系统开发初期,由于开发数据库数据比较少,对于查询SQL语句,复杂视图的编写,刚开始不会体会出SQL语句各种写法的性能优劣,但是如果将应用系统提交实际应用后,随着数据库中数据的增加,系统的响应速度就成为目前系统需要解决的最主要的问题之一...IS NULL 与 IS NOT NULL 不能用null作索引,任何包含null值的列都将不会被包含在索引中。即使索引有多列这样之情况下,只要这些列中有一列含有null,该列就会从索引中排除。...http://hovertree.com/menu/oracle/ 2. 联接列 对于有联接的列,即使最后的联接值为一个静态值,优化器是不会使用索引的。...可以使用一个函数,将变量name中的姓和名分开就可以了,但是有一点需要注意,这个函数是不能作用在索引列上。下面是SQL查询脚本: 3. ...Order by语句 ORDER BY语句决定了Oracle如何将返回的查询结果排序。Order by语句对要排序的列没有什么特别的限制,也可以将函数加入列中(象联接或者附加等)。
4.oracle 8.1.7怎么创建数据库? dbassist 5.oracle 9i 怎么创建数据库? dbca 6.oracle中的裸设备指的是什么? 裸设备就是绕过文件系统直接访问的储存空间。...select username from v$session; 17.数据表中的字段最大数是多少? 表或视图中的最大列数为 1000。 18.怎样查得数据库的SID ?...20.unix 下怎么调整数据库的时间? su -root date -u 08010000 21.在ORACLE TABLE中如何抓取MEMO类型栏位为空的资料记录?...49.如何改变WIN中SQL*Plus启动选项? SQL*PLUS自身的选项设置我们可以在$ORACLE_HOME/sqlplus/admin/glogin.sql中设置。...设置方法:把这个变量的值设置为这个系统上的所有Oracle的实例的init.ora中的最 大的那个processes的那个值加10。
---- 关于Python Python可以说是目前运维领域最火的一门语言 在看文章之前最好对Python的语法及数据结构有所了解,具体可在网上搜索Python简明教程或廖雪峰的Python教程观看,暂时不需要了解其高级功能...这部分会和Oracle awr 报告穿插着写 ---- 上节讲了如何利用Python连接Oracle数据库并执行SQL语句 这节的内容较多,分别是: 1.使用sys用户连接Oracle数据库 2.通过函数执行...SQL语句 3.通过读取文件内的内容来执行SQL语句 4.使用Python 捕获程序异常 ---- 使用cx_Oracle获取oracle表空间的使用率 我们新建一个文件,命名为tablespace.sql...可以看出已经捕获成功 我们是利用fetchall方法来获取数据的,返回的是一个列表(list),我们可以使用i[0]的方式只取感兴趣的列,如下图我们只获取表空间的名称 只需将代码最后一行改成:print...---- 至此cx_Oracle模块连接oracle(高级篇)已经讲完,下期介绍一些实用的日常运维方面的命令。 后续会讲述如何将得到的数据存入MySQL数据库供日后分析
接下来我们说的是如何通过Django创建的网站来监控Oracle的TOP SQL 注意事项 前面的内容我使用的是CentOS 6.8+ Python 2.7 的环境 从这期开始已经改成了CentOS...---- 上节我们介绍了如何新建一个自定义命令,这节讲述如何使用其获取Oracle常见的性能指标,如物理读,逻辑读,CPU Time,等待事件等并保存在MySQL数据库中 1....以上就完成了表的创建,一些字段的解释如下: ipaddress:Oracle数据库的IP地址 tnsname:Oracle数据库的TNS名称 sql_time:该语句获取到的时间 sql_id:Oracle...SQL语句的SQL ID,由于我这有9i的库,所以实际捞取的是hash_value的值 executions:Oracle SQL 语句的执行次数 elapsed_time:Oracle SQL 语句执行的时间...,这节介绍了如何利用自定义命令获取Oracle数据库的性能指标并保存在MySQL数据库中 下节介绍如何将这些数据展示在一个页面上
领取专属 10元无门槛券
手把手带您无忧上云