前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >DataFrame(7):DataFrame运算——逻辑运算

DataFrame(7):DataFrame运算——逻辑运算

作者头像
朱小五
发布2020-07-17 15:17:11
2.4K0
发布2020-07-17 15:17:11
举报
文章被收录于专栏:凹凸玩数据

1、DataFrame逻辑运算

  • 逻辑运算符号:> >= < <= == !=
  • 复合逻辑运算符:& | ~
  • 逻辑运算函数:query()、isin()、between()
  • 逻辑运算的作用:利用逻辑运算,用于筛选数据(很重要)

2、原始数据文件

下载链接:

https://alltodata.cowtransfer.com/s/b8aa2f26ca0947

读取数据:

代码语言:javascript
复制
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)

结果如下:

3、逻辑运算符的案例说明

1)筛选出“数学成绩大于等于60并且英语成绩大于等于70”的记录

代码语言:javascript
复制
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)

x = (df["数学"]>=60) & (df["英语"]>=70)
display(x)

df1 = df[(df["数学"]>=60) & (df["英语"]>=70)]
display(df1)

结果如下:

2)筛选出“语文成绩小于60或者数学成绩大于80”的记录

代码语言:javascript
复制
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)

x = (df["语文"]<60) | (df["数学"]>80)
display(x)

df1 = df[(df["语文"]<60) | (df["数学"]>80)]
display(df1)

结果如下:

3)筛选出“语文成绩里面的非空记录”的记录

(这种方式很重要)

代码语言:javascript
复制
# 自己在原始数据中,任意删除三个值,重新读取即可
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)

x = df["语文"].isnull()
display(x)
y = ~df["语文"].isnull()
display(y)

df1 = df[~df["语文"].isnull()]
display(df1)

结果如下:

注意:isnull()判断某个值是否为空,如果是返回True,否则返回False。

4、逻辑运算函数:query()、isin()、between()

1)query()函数:能够简化查询代码,很好用

代码语言:javascript
复制
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)

df1 = df.query("语文>=60")
df1

df1 = df.query("语文>=60 & 数学>=60")
df1

结果如下:

2)isin()函数:查看df中是否某含某个值或者某些值

① isin()函数说明

使用isin()函数,不仅可以针对整个df操作,也可以针对df中的某一列(Series)操作,但是针对Series的操作才是最常用的。

② 利用isin()判断整个df中是否包含某个值或某些值(了解)
代码语言:javascript
复制
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)

df.isin(["60","70"])

结果如下:

③ 利用isin()判断df中的某列是否包含某个值或某些值(掌握)
代码语言:javascript
复制
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx")
display(df)

df["语文"].isin(["37","97"])

df1 = df[df["语文"].isin(["37","97"])]
display(df1)

结果如下:

④ 利用isin(),利用df1中的某一列,来对df2中的数据进行过滤(很重要)
代码语言:javascript
复制
df1 = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx",sheet_name=0)
display(df1)

df2 = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx",sheet_name=1)
display(df2)

x = df1["name"].isin(df2["name"])
display(x)

df1[df1["name"].isin(df2["name"])]

结果如下:

3)between()函数:返回一个布尔值,即如果在该范围内,返回True,否则返回False。

代码语言:javascript
复制
df = pd.read_excel(r"C:\Users\黄伟\Desktop\test.xlsx",sheet_name=0)
display(df)

df["数学"].between(50,70)
df[df["数学"].between(50,70)]

结果如下:

注意:此函数范围是左闭右闭区间。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-07-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 凹凸数据 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1、DataFrame逻辑运算
  • 2、原始数据文件
  • 3、逻辑运算符的案例说明
    • 1)筛选出“数学成绩大于等于60并且英语成绩大于等于70”的记录
      • 2)筛选出“语文成绩小于60或者数学成绩大于80”的记录
        • 3)筛选出“语文成绩里面的非空记录”的记录
        • 4、逻辑运算函数:query()、isin()、between()
          • 1)query()函数:能够简化查询代码,很好用
            • 2)isin()函数:查看df中是否某含某个值或者某些值
              • ① isin()函数说明
              • ② 利用isin()判断整个df中是否包含某个值或某些值(了解)
              • ③ 利用isin()判断df中的某列是否包含某个值或某些值(掌握)
              • ④ 利用isin(),利用df1中的某一列,来对df2中的数据进行过滤(很重要)
            • 3)between()函数:返回一个布尔值,即如果在该范围内,返回True,否则返回False。
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档