首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

涨姿势!看骨灰级程序员如何玩转Python

本文为大家带来10个玩转Python的小技巧,学会了分分钟通关变大神! ? 1. read_csv 每个人都知道这个命令。...选择具有特定ID的行 在SQL中,我们可以使用SELECT * FROM ... WHERE ID('A001','C022',...)来获取具有特定ID的记录。...Percentile groups 你有一个数字列,并希望将该列中的值分类为组,例如将列的前5%,分为组1,前5-20%分为组2,前20%-50%分为组3,最后50%分为组4。...# or <= cut_points[i] 这个指令使计算机运行的非常快(没有使用应用功能)。 10. to_csv 这也是每个人都会使用的命令。这里指出两个技巧。 第一个是 1....print(df[:5].to_csv()) 你可以使用此命令准确地打印出写入文件的前五行数据。 另一个技巧是处理混合在一起的整数和缺失值。

2.3K20

10招!看骨灰级Pythoner如何玩转Python

,并使用apply函数将其应用于列 c1 和 c2 。...选择具有特定ID的行 在SQL中,我们可以使用SELECT * FROM ... WHERE ID( A001 , C022 ,...)来获取具有特定ID的记录。...Percentile groups 你有一个数字列,并希望将该列中的值分类为组,例如将列的前5%,分为组1,前5-20%分为组2,前20%-50%分为组3,最后50%分为组4。...10. to_csv 这也是每个人都会使用的命令。这里指出两个技巧。 第一个是 print(df[:5].to_csv()) 你可以使用此命令准确地打印出写入文件的前五行数据。...另一个技巧是处理混合在一起的整数和缺失值。如果列同时包含缺失值和整数,则数据类型仍将是float而不是int。导出表时,可以添加float_format = %。0f 将所有浮点数舍入为整数。

2.4K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Python数据分析作业二:Pandas库的使用

    然后,它从这些行中的 “交易额” 列中提取数值,并使用.sum()方法计算这些值的总和。...161393.0 7、使用df中的数据分组统计每个人的交易额平均值(保留2位小数),将统计结果放入dff变量中并显示该结果 dff = df.groupby('姓名')['交易额'].mean().round...', columns='柜台', values='交易额', aggfunc='sum') 使用pivot_table方法创建一个透视表,其中 “姓名” 列作为行索引,“柜台” 列作为列索引,“交易额”...10、统计df中缺失值的个数 df.isnull().sum().sum() 使用.isnull()方法检查 DataFrame 中的每个单元格是否为空,并返回一个布尔值的 DataFrame,其中 True...最后,使用groupby方法将合并后的 DataFrame 按照 “姓名” 和 “职级” 进行分组,并计算每个组中 “交易额” 列的总和。

    10500

    高逼格使用Pandas加速代码,向for循环说拜拜!

    Pandas是为一次性处理整个行或列的矢量化操作而设计的,循环遍历每个单元格、行或列并不是它的设计用途。所以,在使用Pandas时,你应该考虑高度可并行化的矩阵运算。...更准确地说,.iterrows() 为DataFrame中的每一行生成(index, Series)的对(元组)。...当你想要处理一个庞大的列表时,比如10亿个浮点数,问题就出现了。使用for循环,在内存中创建了大量的内存huge列表,并不是每个人都有无限的RAM来存储这样的东西!...Python中的range()函数也做同样的事情,它在内存中构建列表 代码的第(2)节演示了使用Python生成器对数字列表求和。生成器将创建元素并仅在需要时将它们存储在内存中。一次一个。...为我们提供此功能的Pandas功能是 .apply() 函数。apply()函数接受另一个函数作为输入,并沿着DataFrame的轴(行、列等)应用它。

    5.5K21

    手把手教你做一个“渣”数据师,用Python代替老情人Excel

    我希望用Python取代几乎所有的excel功能,无论是简单的筛选还是相对复杂的创建并分析数据和数组。 我将展示从简单到复杂的计算任务。强烈建议你跟着我一起做这些步骤,以便更好地理解它们。...二、查看的数据的属性 现在我们有了DataFrame,可以从多个角度查看数据了。Pandas有很多我们可以使用的功能,接下来将使用其中一些来看下我们的数据集。...1、从“头”到“脚” 查看第一行或最后五行。默认值为5,也可以自定义参数。 ? 2、查看特定列的数据 ? 3、查看所有列的名字 ? 4、查看信息 查看DataFrame的数据属性总结: ?...11、在Excel中复制自定义的筛选器 ? 12、合并两个过滤器的计算结果 ? 13、包含Excel中的功能 ? 14、从DataFrame获取特定的值 ?...有四种合并选项: left——使用左侧DataFrame中的共享列并匹配右侧DataFrame,N/A为NaN; right——使用右侧DataFrame中的共享列并匹配左侧DataFrame,N/A为

    8.4K30

    HBase实战 | HBase在人工智能场景的使用

    这些场景我们都需要处理海量的数据,处理完的数据一般都需要存储起来,这些数据的特点主要有如下几点: 大:数据量越大,对我们后面建模越会有好处; 稀疏:每行数据可能拥有不同的属性,比如用户画像数据,每个人拥有属性相差很大...,可能用户A拥有这个属性,但是用户B没有这个属性;那么我们希望存储的系统能够处理这种情况,没有的属性在底层不占用空间,这样可以节约大量的空间使用; 列动态变化:每行数据拥有的列数是不一样的。...目前该公司的业务场景里面有很多人脸相关的特征数据,总共3400多万张,每张人脸数据大概 3.2k。这些人脸数据又被分成很多组,每个人脸特征属于某个组。...比如某个人脸组id对应的人脸特征数为1W,那么需要在 MySQL 里面存储 1W 行。...250GB 的 SSD 磁盘,并写入 100W 行,每行有1W列,读取一行的时间在100ms-500ms左右。

    1.2K30

    PostgreSQL 使用advisory lock或skip locked消除行锁冲突, 提高几十倍并发更新效率

    背景 通常在数据库中最小粒度的锁是行锁,当一个事务正在更新某条记录时,另一个事务如果要更新同一条记录(或者申请这一条记录的锁),则必须等待锁释放。...在一个事务中更新需要更新的记录,很显然时间可能很长,因为没有了并发。 2. 在多个事务中更新不同的记录,使用高并发来缩短更新的时间,但是就需要解决并发更新时存在的行锁冲突的问题。...USERID,每条记录代表某个属性的人群数据,这个属性的人群数据不断的在变化,因此会不断的需要更新。...使用扫描式的获取advisory lock,保证不会重复获取即可。...使用PostgreSQL提供的skip locked 或者advisory lock特性,消除行锁冲突,提高并行度,从而提高更新效率,发挥机器的最大能力。

    2.2K60

    快速解释如何使用pandas的inplace参数

    它似乎被假定为知识或自我解释的概念。不幸的是,这对每个人来说都不是那么简单,因此本文试图解释什么是inplace参数以及如何正确使用它。...创建一个示例DataFrame 为了说明inplace的用法,我们将创建一个示例DataFrame。...当您使用inplace=True时,将创建并更改新对象,而不是原始数据。如果您希望更新原始数据以反映已删除的行,则必须将结果重新分配到原始数据中,如下面的代码所示。...这样就可以将dataframe中删除第二个name和age列中值为空的行。...记住,当你使用inplace=True时,什么也不会返回。因此,这段代码的结果是将把None分配给df。 总结 我希望本文为您揭开inplace参数的神秘面纱,您将能够在您的代码中正确地使用它。

    2.4K20

    数据分析利器 pandas 系列教程(二):强大的 DataFrame

    创建 dataframe 其实有 N 种方法,没必要一一掌握,毕竟常用的不过两三种,我也不打算把所有的创建方式都说一遍,那样有炫技的嫌疑,按照自己的理解,我把这些创建方式统一分为两大类:按列的方式创建、...按行的方式创建,只讲这两大类下各自最具代表性的创建方式。...以创建上面那个 dataframe 为例,后同。...dataframe 的基本属性和整体描述 属性 含义 df.shape df 的行数、列数 df.index df 的行索引 df.columns df 的列索引(名称) df.dtypes df 各列数据类型...series 上次漏说了一个重要的操作 apply():对列上的数据作处理,它可以使用 lambda 表达式作为参数,也可以使用已定义函数的函数名称(不需要带上())作为参数,比如我们让每个人的每门课成绩加减

    1.2K30

    pandas_VS_Excel统计纵向与横向统计总分最大最小

    pandas_VS_Excel统计纵向与横向统计总分最大最小 【问题】 【要求】 1.在表格的右边插入列“总分”“平均分”“最高”“最低”,横向计算每个人的各项指标 2.在格格的下面插入行“合计”“最高分...,如果要横向我们要加axis=1 2.计算的过程中,先把要统计的数据的列存入到一个temp中,再用相关的函数进行计算 3.pandas.append用法 DataFrame.append(other,ignore_index...=False, verify_integrity=False, sort=None) 功能说明:向dataframe对象中添加新的行,如果添加的列名不在dataframe对象中,将会被当作新的列进行添加...other:DataFrame、series、dict、list这样的数据结构 ignore_index:默认值为False,如果为True则不使用index标签 verify_integrity :...默认值为False,如果为True当创建相同的index时会抛出ValueError的异常 sort:boolean,默认是None,该属性在pandas的0.23.0的版本才存在。

    79730

    无需训练 RNN 或生成模型,快速编写一个 AI “讲故事”项目

    4.寻找最具有代表性的情节:该项目的第一部分,使用K-Means选择用户最感兴趣的情节。 5.总结图:使用基于图表的总结来获取每个情节的摘要,这是UI的组成部分。...如果你喜欢某个谋杀和警察的故事节选,并给出了“1”作为响应,那么程序就会开始学习,并朝着这个方向推荐越来越多的故事。 ?...总结会让文本的内容过于简短。 如果文本只有一个句子,则genism 无法处理,因为它只能选择文本中的重要句子。我们将使用TextBlob对象,该对象具有.sentences属性,可将文本分成多个句子。...现在,所有数据均已完成One-Hot编码,我们知道,unknown列的值为1的行需要设置类型。...接下来,模型会向用户推荐最有可能受到喜爱的故事,并记录用户对该故事的评分,最后还会将该故事添加到训练数据列表中。 ? 至于训练数据,我们仅使用每部电影中数据的属性。 ?

    1.3K40

    Maven

    Ant只是一个工具箱,而Maven则是关于模式的应用,以实现显示可见性,可重用性,可维护性和可理解性的基础结构。         如果没有这些特征,多个人将很有可能在项目上一起高效地工作。...没有可见性,个人不太可能知道另一个人已经完成了什么,因此很有可能有用的代码不会被重用。如果不重用代码,则很难创建可维护的系统。...这样做几种缺陷,如果在开发过程中,发现B中的bug,则必须将B项目修改好,并重新将B打包并对A项目进行重编译操作,在完成A项目的开发后,为了保证A的正常运行,就需要依赖B(就像在使用某个jar包时必须依赖另外一个...等等类似问题我们需要搞清楚,如果需要使用pom.xml来获取jar包,那么首先该项目就必须为maven项目,maven项目可以这样去想,就是在java项目和web项目的上面包裹了一层maven,本质上java...所以,在每个创建的maven项目时都会要求写上这三个属性值的。 ? 看完上面这些再看看我绘制的图,估计能理解个八九不离十: ?

    1K20

    pandas DataFrame的创建方法

    pandas DataFrame的增删查改总结系列文章: pandas DaFrame的创建方法 pandas DataFrame的查询方法 pandas DataFrame行或列的删除方法 pandas...pd.Index(range(3),就会生成三行一样的,是因为前面的dict型变量只有一组值,如果有多个,后面的Index必须跟前面的数据组数一致,否则会报错: pd.DataFrame({'id':[...3.1 添加列 此时我们又有一门新的课physics,我们需要为每个人添加这门课的分数,按照Index的顺序,我们可以使用insert方法,如下: new_columns = [92,94,89,77,87,91...,需要注意的是DataFrame默认不允许添加重复的列,但是在insert函数中有参数allow_duplicates=True,设置为True后,就可以添加重复的列了,列名也是重复的: ?...当然也可以把这些新的数据构建为一个新的DataFrame,然后两个DataFrame拼起来。

    2.6K20

    Git | 一文带你零基础快速上手Git

    老王是另一位项目经理,每次因为项目进度挨骂之后,他都不知道该扣哪个程序员的工资!就拿这次来说吧,有个Bug调试了30多个小时才知道是因为相关属性没有在应用初始化时赋值!...将提交信息显示为一行 –abbrev-commit 使得输出的commitId更简短 –graph 以图的形式显示 4.5、版本回退 命令行有记录的情况 作用:版本切换 git reset --...checkout 分支名 直接切换到一个不存在的分支(创建并切换) git checkout -b 分支名 5.4、*合并分支(merge) 一个分支上的提交可以合并到另一个分支 注:合并前切换到 要被合并到的分支上...、切换分支及其他分支相关操作 7.2.10、IDEA集成GitBash作为Terminal 7.3、开发场景分析 当前的开发环境如下,我们每个人都对这个项目已经开发一段时间,接下来我们要切换成团队开发模式...组员B可以直接从远程仓库获取最新的代码。 4、组员A和组员B修改了同一个文件的同一行,提交到本地没有问题,但是推送到远程仓库时,后一个推送操作就会失败。

    56910

    AI全栈工程师的新舞台:Coze(扣子)

    利用Coze的低代码开发环境,即使是非专业开发者也能通过简单的拖拽操作和属性设置,快速为AI应用搭建精美的显示界面,并实现数据绑定,大大降低了AI应用的开发门槛,加速创意变为现实的过程。...用它的低代码开发环境,来一场速度和创意的碰撞! 首先我们打开Coze平台 www.coze.cn/home 注册并登陆(用抖音号便可登陆) 接着,我们点击创建bot。...Coze的低代码模式正是在这一块得以体现 再然后,我们给这个新闻Bot赋予他的生命,它需要知道自己是谁,自己是干什么的 我们便在人设与回复逻辑中这样编写: 你是一个专业的新闻机器人,能够及时准确的为用户查询各类新闻信息...我们回到最开始的界面点开:个人空间->卡片 点击创建卡片,在组件中创造一个单列布局,再将组件里的文本以这种形式排列: 这三行我们分别放置:新闻标题、发布时间、新闻内容 接着我们再来获取AI提供的新闻的各项元素...试着使用它 Coze作为最火的AI应用平台,正在引领一场AI应用开发的革命。

    62210

    Pandas数据处理1、DataFrame删除NaN空值(dropna各种属性值控制超全)

    Pandas数据处理——渐进式学习 ---- 目录 Pandas数据处理——渐进式学习 前言 环境 DataFrame删除NaN空值 dropna函数参数 测试数据 删除所有有空的行 axis属性值...删除NaN空值 在数据操作的时候我们经常会见到NaN空值的情况,很耽误我们的数据清理,那我们使用dropna函数删除DataFrame中的空值。...axis属性值 这里的dropna只填写了【axis】一个参数,其中0的值代表行,1的值代表列。...df = df.dropna(thresh=2) print(df) 有2个nan就会删除行 subset属性值 我这里清除的是[name,age]两列只要有NaN的值就会删除行 import pandas...如果为True,则在原DataFrame上进行操   作,返回值为None。 limit:int,default None。

    4.1K20

    Java基础(四)Java 对象和类

    例如,一条狗是一个对象,它的状态有:颜色、名字、品种;行为有:摇尾巴、叫、吃等。 类:类是一个模板,它描述一类对象的行为和状态 下图中男孩女孩为类,而具体的每个人为该类的对象: ?...如果没有显式地为类定义构造方法,Java编译器将会为该类提供一个默认构造方法。 在创建一个对象的时候,至少要调用一个构造方法。构造方法的名称必须与类同名,一个类可以有多个构造方法。...在Java中,使用关键字new来创建一个新的对象。创建对象需要以下三步: · 声明:声明一个对象,包括对象名称和对象类型。 · 实例化:使用关键字new来创建一个对象。...("tommy"); /* 通过方法来设定age */ myPuppy.setAge(2); /* 调用另一个方法获取age */ myPuppy.getAge(); /*你也可以像下面这样访问成员变量...例如:源文件中public类的类名是Employee,那么源文件应该命名为Employee.java。 · 如果一个类定义在某个包中,那么package语句应该在源文件的首行。

    48530

    Pandas数据处理2、DataFrame的drop函数具体参数使用详情

    Pandas数据处理2、DataFrame的drop函数具体参数使用详情 ---- 目录 Pandas数据处理2、DataFrame的drop函数具体参数使用详情 前言 环境 基础函数的使用 drop...,因为我发现没有Pandas处理基本上想好好的操作图片数组真的是相当的麻烦,可以在很多AI大佬的文章中发现都有这个Pandas文章,每个人的写法都不同,但是都是适合自己理解的方案,我是用于教学的,故而我相信我的文章更适合新晋的程序员们学习...labels, axis=0, level=None, inplace=False, errors='raise') 参数说明: axis:指定按照行进行删除,还是按照列进行删除,如果设置为0,那么则删除行...编码测试 这里先创建一个测试数据 import pandas as pd import numpy as np df = pd.DataFrame( {'name': ['张丽华', '李诗诗...axis=0.删除行标为【1,2,3】的行。

    1.4K30

    20个能够有效提高 Pandas数据分析效率的常用函数,附带解释和例子

    对于行标签,如果我们不分配任何特定的索引,pandas默认创建整数索引。因此,行标签是从0开始向上的整数。与iloc一起使用的行位置也是从0开始的整数。...Melt Melt用于将维数较大的 dataframe转换为维数较少的 dataframe。一些dataframe列中包含连续的度量或变量。在某些情况下,将这些列表示为行可能更适合我们的任务。...我们也可以使用melt函数的var_name和value_name参数来指定新的列名。 11. Explode 假设数据集在一个观测(行)中包含一个要素的多个条目,但您希望在单独的行中分析它们。...我们要创建一个新列,该列显示“person”列中每个人的得分: df['Person_point'] = df.lookup(df.index, df['Person']) df ? 14....例如,我们可以使用pandas dataframes的style属性更改dataframe的样式。

    5.7K30
    领券