首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

手把手教你做一个“渣”数据师,用Python代替老情人Excel

1、查看列 包括以下三种主要方法: 使用点符号:例如data.column_name 使用方括号和列名称:数据[“COLUMN_NAME”] 使用数字索引和iloc选择器:data.loc [:,'column_number...注意,索引从0开始而不是1。 ? 4、同时分割行和列 ? 5、在某一列中筛选 ? 6、筛选多种数值 ? 7、用列表筛选多种数值 ? 8、筛选不在列表或Excel中的值 ?...9、用多个条件筛选多列数据 输入应为列一个表,此方法相当于excel中的高级过滤器功能: ? 10、根据数字条件过滤 ? 11、在Excel中复制自定义的筛选器 ?...五、数据计算 1、计算某一特定列的值 输出结果是一个系列。称为单列数据透视表: ? 2、计数 统计每列或每行的非NA单元格的数量: ? 3、求和 按行或列求和数据: ? 为每行添加总列: ?...默认方法; outer——当左侧或右侧DataFrame中存在匹配时,返回所有记录。 ? 以上可能不是解释这个概念的最好例子,但原理是一样的。

8.4K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    R语言学习笔记-Day 2

    =字符型;数值型+逻辑型=数值型(TRUE=1,FALSE=0,NULL=空,NA=NA);转换原则:尽可能保留内容。...*数据类型的判断和转换is族函数,判断,返回值为TRUE或FALSEis.numeric(4) - TRUEis.character(a) - FALSEis.logical()格式和内容都很重要as族函数实现数据类型之间的转换...as.numeric/logical/character():将数据转换为数字/逻辑/字符型*多个数据如何组织?...,数字+字母报错;“_”“.”可用,“ ”“-”为特殊字符,不被允许;不可用中文做变量名称两句或多句代码写在同一行使用“;”(2) 简单数值计算:x+1/log(x)/sqrt(x)(3) 比较运算,生成逻辑值向量...(取子集)x 逻辑值筛选#按位置筛选:x4 11x2:4 9 10 11xc(

    14300

    RNA-seq 差异分析的点点滴滴(4)

    sum(res$padj na.rm=TRUE) ## [1] 1069 结果函数提供了多种参数,用于定制生成的结果表格。你可以通过查询?results 来获取这些参数的详细信息。...需要注意的是,结果函数会自动根据每个基因的标准化计数均值进行独立筛选,以优化在给定的假发现率(FDR)阈值,即 α 下,拥有调整后 p 值低于该阈值的基因数量。独立筛选的更多细节将在后文讨论。...默认情况下,参数 α 被设定为 0.1。如果调整后的 p 值阈值不是 0.1,那么应该将 α 设置为那个特定的值。...你可以通过基因名称或数字索引来选择要绘制的基因。...plotCounts(dds, gene=which.min(res$padj), intgroup="condition") 对于自定义绘图,参数 returnData 指定该函数应仅返回用于使用

    8110

    python df 列替换_如何用Python做数据分析,没有比这篇文章更详细的了(图文详情)...

    查看空值  Isnull 是 Python 中检验空值的函数,返回的结果是逻辑值,包含空值返回 True,不包含则返回 False。可以对整个数据表进行检查,也可以单独对某一列进行空值检查。  ...这里不包含对数据间的逻辑验证。  处理空值(删除或填充)  我们在创建数据表的时候在 price 字段中故意设置了几个 NA 值。...对于空值的处理方式有很多种,可以直接删除包含空值的数据,也可以对空值进行填充,比如用 0 填充或者用均值填充。还可以根据不同字段的逻辑对空值进行推算。  ...1#使用数字 0 填充数据表中空值  2df.fillna(value=0)  我们选择填充的方式来处理空值,使用 price 列的均值来填充 NA 字段,同样使用 fillna 函数,在要填充的数值中使用...mean 函数先计算 price 列当前的均值,然后使用这个均值对 NA 进行填  充。

    4.5K00

    R语言学习(瑞士军刀)

    2.2变量的定义   R 语言的有效的变量名称由字母,数字以及点号 . 或下划线 _ 组成。 变量名称以字母或点开头。   ...用'demo()'来看一些示范程序,用'help()'来阅读在线帮助文件,或 用'help.start()'通过HTML浏览器来看帮助文件。 用'q()'退出R....逻辑非运算符,返回向量每个元素相反的逻辑值,如果元素为TRUE则返回FALSE,如果元素为FALSE则返回TRUE && 逻辑与运算符,只对两个向量对一个元素进行判断,如果两个元素都为TRUE,结果为TRUE...,否则为FALSE || 逻辑或运算符,只对两个向量,对第一个元素进行判断,如果两个元素中一个为TRUE,则结果为TRUE,如果都为FALSE则返回FALSE > v = c(3,1,TRUE,2+3i...4的话round函数 5、数据类型(数字、逻辑、文本) 数字常量:一般型、科学计数法   逻辑类型:常量值只有 TRUE和FALSE   区分大小写。

    7110

    R语言—02数据类型和向量

    从“表格”看数据类型 数据类型: 数值型(1.3;2)、 字符型(“1”;‘2’;‘n;’可以是单引号或双引号,但前后必须一致)、 逻辑型(TRUE,T;FALSE,F;NA(数据可能存在但找不到,不知道...=”判断两个数值是否不相等 逻辑运算 多个逻辑条件链接 与"&"、或"|"(可以连接多个数据而并非两个) 非! !...(4>5) TRUE 数据类型的判断和转换 is族函数,判断,返回值为TRUE或FALSE as族函数实现数据类型之间的转换 多个数据如何组织 数据结构 向量 数据框 矩阵 列表 1.数据框约等于“表格...() (3)比较运算,生成逻辑值向量 x>3 x==3 (4)初级统计 max(x) #最大值 min(x) #最小值 mean(x) #均值 median(x) #中位数 var(x) #方差 sd(...(取子集) [] (中括号):将TRYE对应的值挑选出来,FALSE丢弃 (1)根据逻辑值筛选 中括号外面是谁(x)代表对谁(x)取TURE值 (2)根据位置筛选 2.5 如何修改向量中的某个/某些元素

    9610

    R语言入门系列之一

    R语言不用事先声明对象或变量,对象在赋值时同步创建。对象或变量名以字母开头,可由字母、数字、“.”、“_”组成。...(这个参数必须是函数具有的),而使用“不是参数存在。...mean()返回对象元素的均值var()返回对象元素的方差sd()返回对象元素的标准差median()返回对象元素的中位数nchar()返回标量或向量元素的字符长度(包含空格)paste()paste(...当向量含有缺失值时,若是计算向量的均值、方差等,需要在函数内设置参数na.rm=TRUE来去除缺失值。对于函数的使用方法可以使用?function来查询。...可以看到对于数值变量age会计算最大值、最小值、平均值等,但是对于因子变量,只会计算频数。变量类型不同,在统计中其处理方法也不同(例如RDA、CCA等),结果也不相同。

    4.2K30

    【生信技能树培训笔记】R语言基础(20230112更新)

    (4>5)[1] TRUE(二)数据类型的判断和转换is族函数,判断数据类型,返回值为逻辑值is.numeric()是否为数值型数据is.logical() 是否为逻辑型数据is.character()...表示“存在但未知”,as.numeric("jimmy")返回NA,意思是可以将Jimmy这个字符串转换成数值类型,但是这个这个值是未知的?...R转换了类型,但不知道是个啥,所以返回了NA。NA也有数值型NA和字符型NA。...:from,to 指定序列的起始值和最大结束值by 指定序列的增量也可以有length.out参数指定输出向量的长度,则by通过指定的长度计算得出。...逻辑值取相反用叹号![1] 8 9 10 12> x[-(2:4)][1] 8 12Tips:-(减号)表示除了该位置的其他元素都取出来,只支持数字,不支持逻辑值。逻辑值取相反用!

    4.1K51

    2023.4生信马拉松day2-数据类型

    本节思维导图 图片 图片 1.数据类型 -数值型numeric -字符型character 要有引号,单引号双引号都行 -逻辑型logical 三种取值:TRUE(T) FALSE(F) NA(不知道...判断数据类型 class():判断数据类型/数据结构 is族函数:判断某个数据是否是某个类型的数据,返回T或F(注:形式大于内容) is.numeric() is.logical() is.character...-多个逻辑条件的连接用 与& 或| 非!...#(2)简单数学计算 x+1 log(x) sqrt(x) -(3)根据某条件进行判断,生成逻辑型向量 #(3)根据某条件进行判断,生成逻辑型向量 x>3 x==3 -(4)初级统计 #(4)初级统计...x == y y == x #以上两行返回结果完全一致,不做区分 #(2)数学计算 x + y #(3)连接 paste(x,y,sep=",") x>10 #paste与paste0的区别 paste

    72230

    35. R 数据整理(七:使用tidyr和dplyr处理数据框 2.0)

    | 12.57601| |M | 12.40139| |M | 11.68051| |F | 12.09003| 2. dplyr/tidyr 数据管理 2.1 filter 使用逻辑条件对行筛选...,后续的参数是条件,这些条件是需要同时满足的,另外,条件中取 缺失值的观测自动放弃,这一点与直接在数据框的行下标中用逻辑下标有所不同,逻辑下标中有缺失值会在结果中 产生缺失值。...2.8 mutate 可以为数据框计算新变量,返回含有新变量以及原变量的新数据框: mutate(test, new = Sepal.Length * Sepal.Width) > head(test,...使用统计相关参数计算列表内相关内容。如sum, mean, median, min, max。...比如,需要对 cancer 数据集中 v0 和 v1 两个变量同时计算平均值和标准差: 显然,如果有许多变量要计算不止一个统计量,就需要人为地将每一个变量的每一个统计量单独命名。

    10.9K30

    R2向量

    函数都可以用于将数据转换为复数类型或数字类型。...但是,它们的主要区别在于:as.complex函数只能将字符串或数值向量转换为复数类型,而as.numeric函数可以将任何数据类型(如字符型、逻辑型等)转换为数字类型。...当传入的参数无法转换为所需的类型时,as.complex函数会返回NA(缺失值),而as.numeric函数则会报错。...这里还有一些其他的区别:paste函数可以接受多个参数,并将它们连接起来,而paste0只接受两个或多个参数。paste函数的默认分隔符是空格,但是你可以使用sep参数来指定自己想要的分隔符。...,包括重复元素,则应使用 %in% 操作符或者 duplicated()函数 #####2.4.向量筛选(取子集)--看ppt##### x <- 8:12 #根据逻辑值取子集,中括号里是逻辑值T/F

    1.4K00

    R语言中的循环函数(Grouping Function)

    函数有一个参数na.rm,我们可以将这个参数带人到apply函数中,作为第4个参数: apply(m,1,sum,na.rm=TRUE) [1] 9 8 需要注意的是如果是Data Frame,那么系统会将其转为...Matrix,如果所有Column不是数字类型或者类型不一致,导致转换失败,那么apply是运算不出任何一列的结果的。...我们建立一个学生名字,年龄和成绩的Data Frame,然后统计平均年龄和平均成绩,由于name列不是数值类型,所以无法算平均值,所以我们可以对非数值的数据只取count数量。...函数可以是匿名函数,也可以是之前定义好的函数,由于这里逻辑简单,我们可以用匿名函数解决。...= TRUE,USE.NAMES = TRUE) 比如我们自定义一个函数m3,接受3个数值参数,然后将3个数字相乘返回结果: m3<-function(a,b,c){a*b*c} 然后我们构建3个向量

    1.5K20

    python数据分析——数据的选择和运算

    代码和输出结果如下所示: (3)使用“how”参数合并 关键技术:how参数指定如何确定结果表中包含哪些键。如果左表或右表中都没有出现组合键,则联接表中的值将为NA。...用于其他(n-1)轴的特定索引,而不是执行内部/外部设置逻辑。 【例】使用Concat连接对象。 关键技术: concat函数执行沿轴执行连接操作的所有工作,可以让我们创建不同的对象并进行连接。...()函数实现行/列数据均值计算,语法如下: mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs) 相关参数定义与...:仅数字,布尔型,默认值为True interpolation:内插值,可选参数,用于指定要使用的插值方法,当期望的分位数为数据点i~j时。...较低:i 较高:j 最近:i或j二者以最近者为准 中点:(i+j)/2 返回值.返回Series对象或DataFrame对象。 【例55】通过分位数确定被淘汰的35%的学生。

    19310
    领券