首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas基础知识

['a']t.loc['a',:] 取a对应的一整行 t.loc[['a','c'],['b','d']] 多行多 iloc 通过为止(即行索引)取值 t.iloc[3]t.iloc[3,:...] 取第四行 t.iloc[:,2] 取第三 t.iloc[:,[2,1]] 取第3和第2 t.iloc[[0,2],[2,1]] 取第1行和第3行对应的第3和第2 t.iloc[1:,:2]...缺处理 pd.isnull(t) 返回的数组中NaN为True,否则为False pd.notnull(t) 返回的数组中NaN为False,否则为True t.dropna(axis=0) 删除包含...NaN的行 t.dropna(axis=0, how='all', inplace=True) how的为all时,某行全为NaN时才删除,为any时存在NaN删除整行 inplace为True时,...', how='inner')内连接(默认) 交集 df1.merge(df2, on='a')方法会将df1中a和df2中a进行比较,然后将相等的对应的整行进行合并,而且返回的结果中只包含具有可以合并的行

69810

2022-06-20:一个二维矩阵,上面只有 01,只能上下左右移动, 如果移动前后的元素相同,耗费 1 ,否则耗费 2。 问从左上到右下的最小耗费。

2022-06-20:一个二维矩阵,上面只有 01,只能上下左右移动,如果移动前后的元素相同,耗费 1 ,否则耗费 2。问从左上到右下的最小耗费。来自网易。3.27笔试。...答案2022-06-20:1.网上非常流行的方法,但这是错误的。这道题动态规划是做不了的。因为上下左右四个方向都可能走,而不是右下两个方向。2.要用dijskra+小根堆才能实现。....len() as i32; // 小根堆:[代价,行,] // 根据代价,谁代价小,谁放在堆的上面 let mut heap: Vec> = vec!...[0, 0, 0]); let mut ans = 0; while heap.len() > 0 { // 当前弹出了,[代价,行,],当前位置 heap.sort_by...// int n, int m :边界,固定参数// map: 每一个格子的,都在map里// boolean[][] poped : 当前位置如果是弹出过的位置,要忽略!

61920
您找到你想要的搜索结果了吗?
是的
没有找到

MySQL插入数据与更新和删除数据

插入的几种形式, 1. 插入完整行; 2. 插入行的部分数据; 3. 插入多行; 4.插入某些查询的结果; - 注意,由于MySQL的安全机制,需要注意权限。 插入完整的行 需要指定插入的表名和行。...所以,纵使与表中的次序不同,也可以完成插入操作。因此当比给出列名的时候,必须正确的给出每如果表的定义允许,可以选择在操作时忽略某些。忽略的必须满足如下条件, 1....更新数据的两种方式, 语句由三部分组成, 例子,更新单列, 分析:总是以要更新的表的名字开始,为赋值命令 例子,使用多更新时,只需要一次命令即可 分析: 1如果更新,并且在一行多行赋值时出现错误...2、为了删除,可以赋值为。 删除数据 使用语句,进行删除操作,形式如下 - 从表中删除特定行; - 从表中删除所有的行。...不需要列名通配符。语句删除整行不是整列,若删除整列需要使用操作(在不使用语句前提下,更新数据)。 若需要删除所有数据,不需要使用语句,使用速度更快的。操作原理为,删除原表格,并创建新表。

2.4K60

Pandas光速入门-一文掌握数据操作

Serise Serise表示一维数据,可以理解位一维数组,。...DataFrame DataFrame表示二维数据,即二维数组,表格。是由若干Series组成的,每的数据类型可以不同。...空 对于空,我们可以使用dropna()函数进行删除,或者使用fillna()函数对空进行填充,比如可以填充平均数mean()、中位数median()、众数mode()自定义等。...DataFrame.dropna(axis, how, thresh, subset, inplace)其中axis默认为0,表示逢空删除整行,置为1删除整列;how默认为 ‘any’ 如果一行(...)有任何一个 NA 就去掉整行,置为’all’ 一行()都是 NA 才去掉这整行;subset:指定要检查的;inplace默认False,表示返回一个新的DataFrame,否则返回None并覆盖原数据

1.9K40

工作再忙,都要学会这36个Excel经典小技巧!

2、同时冻结第1行和第1 选取第一和第一行交汇处的墙角位置B2,窗口 - 冻结窗格 ? 3、快速把公式转换为 选取公式区域 - 按右键向右拖一下再拖回来 - 选取只保留数值。 ?...6、删除重复 选取数据区域 - 数据 - 删除重复 ? 7、显示重复 选取数据区域 - 开始 - 条件格式 - 显示规则 - 重复 ?...14、输入分数 先后输入 0 ,再输入 空格, 再输入分数即可 15、强制换行 在文字后按alt+回车键即可换到下一行 16、删除空行 选取A - Ctrl+g打开定位窗口 - 定位条件:空 - 整行删除...23、复制时保护行高宽不变 整行选取复制,粘贴后选取“保持宽。 ? 24、输入以0开始的数字超过15位的长数字 先输入单引号,然后再输入数字。先设置格式为文本再输入。 ?...30、不打印错误 页面设置 - 工作表 - 错误打印为:空 ? 31、隐藏0 文件 - 选项 - 高级 - 去掉“显在具有零的单元格中显示零” ?

2.3K30

重中之重的数据清洗该怎么做?

出现这种情况时,通常有三个选项:保持原样、填充空删除如果保持这些不变,则可能会损害创建的数据模型,并降低模型的预测有效性。...如果缺少的数据为试图预测的结果提供了至关重要的见解,那么保持现状肯定会导致不完美的预测。因此建议填充删除如果可以合理地确定应该在空单元格中输入的,那么这是最好的解决方案。...例如,如果知道“score”中具有null意味着不记录任何分数,那么可以简单地将其替换为null0。通过这样做,可以保持数据集的完整性,并保障预估的准确性。这种情况使用fillna函数即可。...如果存在重复行的正当原因,删除重复行不会改善数据集,而是会通过删除经常发生的度量来降低数据集的质量。为了避免这个问题,使用某种类型的唯一(如时间戳或用户ID)将确保重复的度量仍然在唯一中。...如果有一为“Paid”、“notpaid”,直接替换为二进制10表示即可。

1K10

Excel去除空行的各种方法_批量删除所有空行

1、选中数据区域中除空行外没有其他空单元格的任一的数据区域——“开始”工具栏之“查找和选择”按钮,选择“定位条件”,打开定位条件对话框——选择“空”,并“确定”,定位选中该中的空单元格; 2、在定位选中的任意单元格点击鼠标右键...,选择“删除”快捷菜单——“删除”框中选择“整行”,“确定”之。...方法三:排序删除法 此法适用于:允许改变数据的排列顺序的情形。 1、选中所有区域中的数据单元格,点击“数据”工具栏中的排列顺序“A-Z”逆序“Z-A”按钮,将空行排至最后的几行。 2、删除空白行。...应用方法三时,不改变数据的排列顺序时:辅助+排序删除1、在表格中插入任一,用从上到下填充序列,如1-N。 2、选中包括辅助的所有区域中的数据单元格,用“排序删除法”删除空行。...1、在最后的下一单元格中输入函数“=COUNTA(A2:F2)”,计算出整行有数据的单元格的数量。 2、用筛选法选出为0的行,删除之。 3、删除辅助公式的

5.4K30

MySQL(九)插入、更新和删除

如果某个没有,应使用null(假定表允许对该项指定空); 各个必须以它们在表定义中出现的次序填充;缺点在于;高度依赖表中的定义次序,如果表结构出现变动,难免出现问题。...insert使用注意事项: ①无论使用哪种insert语法,都必须给出values的正确数目,如果不提供列名,必须给每个表列提供一个如果提供列名,必须对每个列出的给出一个; ②如果表定义允许...,则可以在insert操作中省略某些必须满足这两个条件(1.改定义为允许null;2.在表定义中给出默认如果不给出使用默认】); ③数据库被多个用户访问,一般检索是最重要的,可以通过在...PS:如果用update更新多个行,且更新中一行多行出现错误,update操作将被取消(错误发生前执行的动作将被回滚到最初状态。...PS:delete不需要列名或者通配符,delete删除整行不是整列,为了删除指定的,可使用update语句(delete从表中删除行甚至表中所有行,但不删除表本身);    如果删除表中所有行,

2K20

MySQL 的B+树索引.

平衡二叉树(AVL树),任何节点的两个子树的高度最大差为 1。平衡二叉树的查询速度很快,但是维护一棵平衡二叉树的代价是非常大的。通常来说,需要 1多次左旋和右旋来得到插入更新后树的平衡性。...B+ 树是为磁盘其他直接存取辅助设备设计的一种平衡查找树,B+ 树中的 B 不是代表二叉(binary),而是代表平衡(balance)。...,B+ 树索引总是 A,即排序的;Sub_part 是否是的部分被索引,如果是整个该字段显示为 NULL;Packed 关键字如何被压缩;Null 是否索引中的含有 NULL ;Index_type...这个不是实时更新的,如果需要实时更新 Cardinality 的信息,可以使用 ANALYZE TABLE 命令。...此外,在通常情况下,诸如(a,b)的联合索引,一般是不可以选择 b 作为查询条件。但是如果是统计操作,并且是覆盖索引的,优化器会进行选择。 ?

98220

HBase面试题汇总

计算表中的逻辑行数 delete 删除表中的数据 4、请描述HBase的布隆过滤器 答: 布隆过滤器可以用于快速判断一个数据是否存在一个集合中。...比如,字符串"hbase"经过哈希计算后,为3,那么将原数组[0,0,0,0,0]更改为[0,0,0,1,0]。...比如,h1、h2、h3,这样会得到3个不同的位置,同时将其置为1如果在查询数据时,同时发现这3个位置均为1说明很大的概率可以在当前集合中找到期望的数据,否则一定不在当前集合中。...当然HBase除了默认的行级别(row)的布隆过滤器,也支持行+级别(row+column)的。 如果经常扫描整行数据,可以使用row方式的布隆过滤器,此时也可以加快行+的查询速度。...如果经常查询某行某的数据,可以使用row+column方式的布隆过滤器,但它不会加快对整行数据的查询效率。而且除非这一行只有一,否则row+column的布隆过滤器会占用较多的存储空间。

21530

「干货」数据分析必备的Excel常用10大应用技巧『Excel系列2』

步骤二:在第二相同位置右键→选择性粘贴→点击「减」,如下图。 步骤三:如果第二结果均为0结果一致。...技巧五:隔行插入数据 【背景】 有时我们需要将类似左下图的2019/2021成绩,补充到左上图黄色的位置。如果粘贴,当遇到数较多时,效率会比较低。...【操作】 步骤一:如果同时需要对行/求和,选中数据区域及延后一行/一,点击「ALT+=」即可。 技巧七:快速删除行/ 【背景】 在删除整行/整列时,常用的方法是:选中行/→右键→删除。...【操作】 步骤一:选中行/→快捷键「CTRL+-」即可。 技巧八:快速删除行 【背景】 在做数据分析的时候,有时需要将有空的行剔除掉,而如果一行行删除,效率会非常低,如下图。...【操作】 步骤一:选中数据区域→按下快捷键「F5」→点击「定位条件」→选择「空」。 步骤二:右键空位置→点击「删除-整行」即可。

1.1K10

Python数据分析笔记——Numpy、Pandas库

上述语句选出的是元素(1,0)、(5,3)、(7,1)、(2,2)。 上述语句按0、3、1、2的顺序依次显示1、5、7、2行。下述语句能实现同样的效果。...DataFrame既有行索引也有索引,其中的数据是以一个多个二维块存放的,而不是列表、字典别的一维数据结构。...如果指定了序列、索引,DataFrame的会按指定顺序及索引进行排列。 也可以设置DataFrame的index和columns的name属性,这些信息也会被显示出来。...也可以给某一赋值一个列表数组,其长度必须跟DataFrame长度相匹配。如果赋值的是一个Series,对应的索引位置将被赋值,其他位置的被赋予空。...(2)填充缺失数据 通过调用函数fillna,并给予这个函数一个该数组中所有的缺失都将被这个填充。df.fillna(0)——缺失都将被0填充。

6.4K80

MySQL查询优化-基于EXPLAIN

除非您特意打算从表中提取检查所有行,否则如果 Extra 不是Using where 并且表连接类型为 ALL index,查询可能会出错。...考虑基数(同一个中的不重复的的数量),基数越大,效果越好,即区分度越高。 索引的数据类型尽可能的短,如果tinyint可以实现,就不要用Int 使用最左前缀。 不要建立过多的索引。...3.索引类型 在创建索引时,可以规定索引能否包含重复如果不包含,索引应该创建为 PRIMARY KEY UNIQUE 索引。对于单列惟一性索引,这保证单列不包含重复的。...如果没有创建 PRIMARY KEY 索引,但表具有一个多个 UNIQUE 索引, MySQL 将删除第一个 UNIQUE 索引。 如果从表中删除了某索引会受到影响。...对于多组合的索引,如果删除其中的某也会从索引中删除如果删除组成索引的所有整个索引将被删除

1.6K20

在Python中进行探索式数据分析(EDA)

数据形状 数据集中共有11914行和16 数据集的简明信息 现在,检查数据类型以及数据集中所有变量的摘要。它包括存在的非空的数量。 ? 如果变量中存在字符串,数据类型将作为对象存储。...另外,如果数据分别具有数值和十进制它将为intfloat。MSRP(汽车价格)存储为int数据类型,而Driven_wheels存储为对象数据类型。...有许多方法可以处理这些缺失的1. 删除 2. 插补 我们可以删除存在缺失的行,也可以将缺失替换为平均值,中位数众数等值。 由于丢失的数据百分比非常少,我们可以从数据集中删除那些行。 ?...默认情况下,如果任何变量的缺失,drop函数将删除整行删除缺失之后,现在缺失的计数为0。这意味着数据集中不存在缺失删除缺失后,检查存在的行数。 ?...如果数据集中存在大量异常值,必须对异常值进行处理。像地板,封盖之类的方法可用于估算离群。 相关图 计算相关系数,找出两个变量之间的关系强度。相关范围从-11

3.2K30

Linux的文本处理工具浅谈-awk sed grep

如果分隔符没提供,则按当前FS进行分割 length 返回记录的字符数 match 返回在字符串中正则表达式位置的索引,如果找不到指定的正则表达式返回0。...]+"}NR==2{print $(NF-1)}' /etc/passwd awk 'BEGIN{RS="/"} {print $0}' /etc/passwd 5、以一个多个/为行的分割符,打印第二行的第二...,的分隔符为默认的空格,并打印行号 awk 'BEGIN{RS="[/]+"} NR==2{print NR,$2}' test awk支持正则: 6、以:为分隔符,打印第5以s开头的一整行 awk...) { if (user_map[$1] < $2) print $0; } }' b.txt 注意:如果a.txt不存在,getline会返回-1,导致死循环。...例子3: 【技巧例子】 消除文件空行: grep -v '^$' test.txt egrep -o "^[^:]+" xxx.txt       #匹配开头以非:的行,并输出匹配的内容(-o不是整行输出

3.5K41

精通Excel数组公式14:使用INDEX函数和OFFSET函数创建动态单元格区域

INDEX:查找行的公式 创建动态单元格区域的最基本的公式类型是基于条件来查找整行整列,可以使用INDEX函数实现。...如果要获取整列,那么只需要给INDEX函数指定代表列号的参数column_num的,忽略参数row_num(为空)或者指定其0。...通过指定参数row_num为空0,告诉Excel返回所选的所有行。 同理,想要获取整行,则需要指定参数row_num的代表行号,将参数column_num指定为空0。...2.如果想要传递多个到多个单元格,必须使用Ctrl +Shift + Enter。...此时,你在图5的数据区域中添加删除记录,创建的动态单元格区域会自动更新。 下面是创建动态单元格区域公式的关键点: 1.足够的行以容纳所有潜在数据。

8.8K11

Linux指令入门-文本处理

x 删除前一个字符 X 删除整行 dd 删除一个单词 dwdaw 删除至行尾 d$D 删除至行首 d^ 删除到文档末尾 dG 删除至文档首部 d1G 删除n行 ndd 删除n个连续字符 nx 将光标所在位置字母变成大写小写...u{n} 撤销当前行的所有修改 U 恢复撤销操作 Ctrl+r 整行将向右缩进 >> 整行将向左退回 << 若档案没有更动,则不储存离开,若档案已经被更动过,储存后离开 ZZ 输入模式 在命令模式下按...在Shell脚本中,grep通过返回一个状态来表示搜索的状态: 0:匹配成功。 1:匹配失败。 2:搜索的文件不存在。 命令格式:grep [参数] [正则表达式] [文件]。...注意: sed命令不会修改原文件,例如删除命令只表示某些行不打印输出,而不是从原文件中删去。 如果要改变源文件,需要使用-i选项。 命令格式:sed [参数] [动作] [文件]。...val 内置变量: 变量 用途 FS 字段分隔符 $n 指定分隔的第n个字段,如$1、$3分别表示第1、第三 $0 当前读入的整行文本内容 NF 记录当前处理行的字段个数(数) NR 记录当前已读入的行数

3.5K20

有向图的拓扑排序

他可用于表示一种情况,即某些项目事件必须按照某种顺序排列发生。...调用noSuccessor找到任意一个没有后继的顶点 * 2、如果找到这样一个顶点把它放到数组sortedArray中,并且从图中删除 * 3、如果没有这样的顶点此图必然存在环 * */ public...方法使用邻接矩阵找到没有后继的的顶点,在外层循环中,沿着每一行考察每个顶点 * 在每一行中,用内层循环扫描1如果找一个就说明顶点后面有后继,然后跳出内层循环考察下一个顶点 * 只有一整行都没有找到...同样的,顶点的行列从邻接矩阵中删除 * 下面的行和右面的移动来填补空位。...= nVert -1){//如果不是最后的顶点 //从数组中删除,后面的顶点向前移 for(int j=delVert;j<nVert-1;j++)

1.2K20

awk工具详解

,不会默认输出 如果没有定义匹配条件默认是匹配所有数据行,awk隐含循环,条件匹配多少次动作就会执行多少次 工作原理(2): 逐行读取文本,默认以空格tab键为分隔符进行分隔,将分隔所得的各个字段保存到内建变量中...awk命令格式 awk选项 ‘模式条件{操作}’ 文件1文件2 … awk -f 脚本文件文件1文件2 .....$0:当前处理的行的整行内容。 $n:当前处理行的第n个字段(第n)。 FILENAME:被处理的文件名。 RS:行分隔符。...预设是’ \n’ 简说:数据记录分隔,默认为\n,即每行为一条记录 案例 awk常用内置变量:1、2、NF、NR、 1:代表第一2:代表第二以此类推 $0:代表整行 NF:一行的数 NR...$3:$4三元运算符,如果第3个字段的大于等于第4个字段的把第3个字段的赋给max,否则第4个字段的赋给max awk -F “:” ‘$7~”bash”{print $1}’ zz

3K20
领券