首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

用Python执行SQL、Excel常见任务?10个方法全搞定!

使用一行代码,我们已经将这些数据分配并保存到 Pandas dataframe 中 —— 事实证明是这种情况,字典是要转换为 dataframe 的完美数据格式。 ?...这个方便的教程将分解 Python 中不同数据类型之间的差异,以便你需要复习。 在 Excel 中,你可以右键单击并找到将列数据转换为不同类型的数据的方法。...现在我们已经删除了逗号,我们可以轻易地将列转换为数字。 ? 现在我们可以计算这列的平均值。 ?...有12个国家的 GDP 超过 50000! 选择属于以 s 开头的国家的行。 现在可以显示一个新 dataframe,其中只包含以 s 开头的国家。...现在过滤以「S」开头 或人均 GDP 超过 50000 的国家。 ? ? 我们正在努力处理 Pandas 中的过滤视图。

8.3K20

如何用 Python 执行常见的 Excel 和 SQL 任务

使用一行代码,我们已经将这些数据分配并保存到 Pandas dataframe 中 - 事实证明是这种情况,字典是要转换为 dataframe 的完美数据格式。 ?...这个方便的教程将分解 Python 中不同数据类型之间的差异,以便你需要复习。 在 Excel 中,你可以右键单击并找到将列数据转换为不同类型的数据的方法。...现在我们已经删除了逗号,我们可以轻易地将列转换为数字。 ? 现在我们可以计算这列的平均值。 ?...有12个国家的 GDP 超过 50000! 选择属于以 s 开头的国家的行。 现在可以显示一个新 dataframe,其中只包含以 s 开头的国家。...现在过滤以「S」开头 或人均 GDP 超过 50000 的国家。 ? ? 我们正在努力处理 Pandas 中的过滤视图。

10.8K60
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Python数据分析实战之数据获取三大招

    如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。...rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。 r+ 打开一个文件用于读写。文件指针将会放在文件的开头。 w+ 打开一个文件用于读写。如果该文件已存在则将其覆盖。...header参数可以是一个list例如:[0,1,3],这个list表示将文件中的这些行作为列标题(意味着每一列有多个标题),介于中间的行将被忽略掉(例如本例中的2;本例中的数据1,2,4行将被作为多级标题出现...,第3行数据将被丢弃,DataFrame的数据从第5行开始。)。...converters : dict, optional 字典, 选填, 默认为空, 用来将特定列的数据转换为字典中对应的函数的浮点型数据。

    6.1K20

    Python数据分析实战之数据获取三大招

    如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。...rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。 r+ 打开一个文件用于读写。文件指针将会放在文件的开头。 w+ 打开一个文件用于读写。如果该文件已存在则将其覆盖。...header参数可以是一个list例如:[0,1,3],这个list表示将文件中的这些行作为列标题(意味着每一列有多个标题),介于中间的行将被忽略掉(例如本例中的2;本例中的数据1,2,4行将被作为多级标题出现...,第3行数据将被丢弃,DataFrame的数据从第5行开始。)。...converters : dict, optional 字典, 选填, 默认为空, 用来将特定列的数据转换为字典中对应的函数的浮点型数据。

    6.6K30

    强烈推荐Pandas常用操作知识大全!

    数据分析函数 df #任何pandas DataFrame对象 s #任何pandas series对象 从各种不同的来源和格式导入数据 pd.read_csv(filename) # 从CSV..., connection_object) # 从SQL表/数据库中读取 pd.read_json(json_string) # 从JSON格式的字符串,URL或文件中读取。...pd.DataFrame(dict) # 从字典中,列名称的键,列表中的数据的值 导出数据 df.to_csv(filename) # 写入CSV文件 df.to_excel(filename)...家庭住址"].str.contains("广") 3.startswith/endswith 判断某个字符串是否以…开头/结尾 # 第一个行的“ 黄伟”是以空格开头的 df["姓名"].str.startswith...4) 11.replace 将指定位置的字符,替换为给定的字符串 df["身高"].str.replace(":","-") 12.replace 将指定位置的字符,替换为给定的字符串(接受正则表达式

    15.9K20

    1w 字的 pandas 核心操作知识大全。

    数据分析函数 df #任何pandas DataFrame对象 s #任何pandas series对象 从各种不同的来源和格式导入数据 pd.read_csv(filename) # 从CSV文件...connection_object) # 从SQL表/数据库中读取 pd.read_json(json_string) # 从JSON格式的字符串,URL或文件中读取。...pd.DataFrame(dict) # 从字典中,列名称的键,列表中的数据的值 导出数据 df.to_csv(filename) # 写入CSV文件 df.to_excel(filename) #...家庭住址"].str.contains("广") 3.startswith/endswith 判断某个字符串是否以…开头/结尾 # 第一个行的“ 黄伟”是以空格开头的 df["姓名"].str.startswith...4) 11.replace 将指定位置的字符,替换为给定的字符串 df["身高"].str.replace(":","-") 12.replace 将指定位置的字符,替换为给定的字符串(接受正则表达式

    14.8K30

    pandas处理字符串方法汇总

    向量化操作字符串 使用字符串的str属性 Pandas中内置了等效python的字符串操作方法:str属性 df = pd.DataFrame(["Python Gudio 1991","Java Gosling...2 None 3 Mckinney Name: Language, dtype: object 将分割后的数据进行展开,列属性名是0,1,2…等自然数 # 使用expand参数,将返回的列表进行展开...: Language, dtype: object str.replace:正则表达式中的替换功能 # 将字母J和Python整个字符串替换成?...str.len:计算字符串长度 str.strip:去除字符串开头和结尾处的空格(默认) str.lstrip:去除字符串左边的空格(默认)或者指定字符 str.rtrip:去除字符串结尾处的空格(默认...str.index:查找指定字符在字符串中第一次出现的位置(索引号) str.rindex:查找指定字符在字符串中最后一次出现的位置(索引号) str.capitalize:将字符串中的单词的第一个字母变成大写

    46120

    Python数据科学(七)- 资料清理(Ⅱ)1.资料转换2.处理时间格式资料3.重塑资料4.学习正则表达式5.实例处理

    使用匿名函式 df['物业费'].map(lambda e: e.split('元')[0]) Apply:将函数套用到DataFrame 上的行与列 eg: df = pandas.DataFrame...# 以列进行计算 df.apply(lambda e: e.max() - e.min()) ?...0~9或者字母或者下划线的字符 r = “\W”:表示任意一个特殊字符 r = “\s”:表示匹配一个空白字符 r = “\S”:表示匹配一个非空白字符 r = “^”:匹配字符串的开头位置 r = “...:表示前面匹配的字符出现了0次或者1次 r =”\d+”:表示前面匹配的字符出现了1次或者多次 #范围匹配 分组匹配方式:将多个匹配字符当成一个完整的匹配公式 (abc):用于在目标字符串中查询abc...从指定的字符串中直接进行查询,查询到的第一个结果作为匹配结果 pattern.findall(str):从指定的字符串中,查询符合匹配规则的字符,将所有符合的字符存放在一个列表中 pattern.finditer

    1.1K30

    50个Pandas的奇淫技巧:向量化字符串,玩转文本处理

    一、向量化操作的概述 对于文本数据的处理(清洗),是现实工作中的数据时不可或缺的功能,在这一节中,我们将介绍Pandas的字符串操作。...方法 说明 len() 计算字符串长度 strip() 等价于str.strip,去除字符串开头和结尾处指定的字符 rstrip() 等价于str.rstrip ,删除字符串末尾的指定字符(默认为空格)...将拆分的字符串展开为单独的列。 如果 True ,返回 DataFrame/MultiIndex 扩展维度。 如果 False ,则返回包含字符串列表的系列/索引。 regex:布尔值,默认无。...将拆分的字符串展开为单独的列。 如果 True ,返回 DataFrame/MultiIndex 扩展维度。 如果 False ,则返回包含字符串列表的系列/索引。...str.slice()方法用于从Pandas系列对象中存在的字符串中分割子字符串。

    6K60

    这里有一个简单实用的清洗代码集

    删除列中的字符串 def remove_col_str(df): # remove a portion of string in a dataframe column - col_1 df...在字符串的开头有一些空格是很常见的。因此,当你想要删除列中字符串开头的空格时,这种方法很实用。 7....例如,你希望当第一列以某些特定的字母结尾时,将第一列和第二列数据拼接在一起。根据你的需要,还可以在拼接工作完成后将结尾的字母删除掉。 8....转换时间戳(从字符串类型转换为日期「DateTime」格式) def convert_str_datetime(df): ''' AIM -> Convert datetime(...这意味着我们可能不得不将字符串格式的数据转换为根据我们的需求指定的日期「datetime」格式,以便使用这些数据进行有意义的分析和展示。 ?

    74720

    干货:手把手教你用Python读写CSV、JSON、Excel及解析HTML

    将数据存于pandas DataFrame对象意味着,数据的原始格式并不重要;一旦读入,它就能保存成pandas支持的任何格式。在前面这个例子中,我们就将CSV文件中读取的内容写入了TSV文件。...to_csv(…)方法将DataFrame的内容转换为可存储于文本文件的格式。你要指定分隔符,比如sep=‘,’,以及是否保存DataFrame的索引,默认是保存的。...用索引可以很方便地辨认、校准、访问DataFrame中的数据。索引可以是一列连续的数字(就像Excel中的行号)或日期;你还可以设定多列索引。...原理 这段代码与前一节的类似。首先,指定JSON文件的名字——我们将其存于r_filenameJSON字符串中。...read_xml方法的return语句从传入的所有字典中创建一个列表,转换成DataFrame。

    8.4K20

    Python 数据分析(PYDA)第三版(三)

    表 6.1:pandas 中的文本和二进制数据加载函数 函数 描述 read_csv 从文件、URL 或类似文件的对象中加载分隔数据;使用逗号作为默认分隔符 read_fwf 以固定宽度列格式读取数据(...);等同于使用选择该表中的所有内容的查询使用read_sql read_stata 从 Stata 文件格式中读取数据集 read_xml 从 XML 文件中读取数据表 我将概述这些函数的机制,这些函数旨在将文本数据转换为...这些函数的可选参数可能属于几个类别: 索引 可以将一个或多个列视为返回的 DataFrame,并确定是否从文件、您提供的参数或根本不获取列名。...JSON 对象或对象列表转换为 DataFrame 或其他数据结构以进行分析将取决于您。...实现了一个特殊的 Series 方法str.get_dummies(以str.开头的方法将在字符串操作中更详细地讨论),处理了将多个组成员身份编码为分隔字符串的情况: In [124]: dummies

    33200

    数据科学 IPython 笔记本 7.13 向量化字符串操作

    在本节中,我们将介绍一些 Pandas 字符串操作,然后使用它们来部分清理从互联网收集的,非常混乱的食谱数据集。...Pandas 字符串方法的表格 如果你对 Python 中的字符串操作有很好的理解,那么大多数 Pandas 字符串语法都足够直观,只需列出一个可用方法表即可。...(),返回布尔值 extract() 在每个元素上调用re.match(),返回作为字符串的每个分组 findall() 在每个元素上调用re.findall() replace() 将模式串的每次出现替换为一些其它字符串...1 John 2 Terry 3 Eric 4 Terry 5 Michael dtype: object ''' 或者我们可以做一些更复杂的事情,比如查找所有以辅音开头和结尾的名字...,利用字符串开头(^)和字符串结尾($)正则表达式字符: monte.str.findall(r'^[^AEIOU].

    1.6K20

    数据处理 | 在学这几个pandas函数,继续加快你数据处理的速度

    上次我们介绍了几个pandas函数,如nlargest()、pct_change()和explode(),《学会这些好用的pandas函数,让你的数据处理更快人一步》让大家可以更快的求取前N组数据、计算数据之间变化率以及将列表元素数据展开为一列等等...为Dataframe新增数据列 新增数据列其实是很常见的操作,一般情况下我们可以采用直接赋值法,也就是在原来的Dataframe数据上进行直接操作,比如: >>> import pandas as pd...数据微调 这里介绍的是replace()方法,将原有数据中特定的数据用指定的数据进行替换。...'B': ['abc', 'bar', 'xyz']}) >>> df A B 0 bat abc 1 foo bar 2 bait xyz # 将ba开头的元素替换为...new 2 bait xyz # 将A列中ba开头的元素替换为 new >>> df.replace({'A': r'^ba.$'}, {'A': 'new'}, regex=True)

    1.4K30

    盘点66个Pandas函数,轻松搞定“数据清洗”!

    此外,isnull().any()会判断哪些”列”存在缺失值,isnull().sum()用于将列中为空的个数统计出来。...df["编号"].replace(r'BA.$', value='NEW', regex=True, inplace = True) 输出: 在Pandas模块中, 调⽤rank()⽅法可以实现数据排名...df["gender"].unique() df["gender"].nunique() 输出: 在数值数据操作中,apply()函数的功能是将一个自定义函数作用于DataFrame的行或者列;applymap...函数方法 用法释义 cat 字符串的拼接 contains 判断某个字符串是否包含给定字符 startswith/endswith 判断某个字符串是否以...开头/结尾 get 获取指定位置的字符串 len...split 分割字符串,将一列扩展为多列 strip、rstrip、lstrip 去除空白符、换行符 findall 利用正则表达式,去字符串中匹配,返回查找结果的列表 extract、extractall

    3.8K11
    领券