首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas & python:根据包含子字符串的列值将dataframe拆分成多个dataframe

Pandas是一个基于Python的数据分析工具库,它提供了丰富的数据结构和数据分析函数,可以方便地进行数据处理和分析。

在Pandas中,可以使用字符串的contains方法来判断某一列中的值是否包含指定的子字符串。根据包含子字符串的列值将DataFrame拆分成多个DataFrame的方法如下:

代码语言:txt
复制
import pandas as pd

# 创建一个示例DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
        'Age': [25, 30, 35, 40, 45],
        'City': ['New York', 'London', 'Paris', 'Tokyo', 'Sydney']}
df = pd.DataFrame(data)

# 根据包含子字符串的列值拆分DataFrame
substrings = ['ar', 'on']
dfs = []
for substring in substrings:
    df_subset = df[df['City'].str.contains(substring)]
    dfs.append(df_subset)

# 打印拆分后的DataFrame
for i, df_subset in enumerate(dfs):
    print(f"DataFrame {i+1}:")
    print(df_subset)
    print()

上述代码中,我们首先创建了一个示例的DataFrame,包含了Name、Age和City三列。然后,我们定义了一个包含要匹配的子字符串的列表substrings。接下来,我们使用contains方法对City列进行筛选,将包含指定子字符串的行提取出来,形成一个新的DataFrame df_subset。最后,我们将每个df_subset添加到一个列表dfs中,并打印出拆分后的每个DataFrame。

这种方法可以根据包含子字符串的列值将DataFrame拆分成多个DataFrame,方便进行进一步的数据处理和分析。

推荐的腾讯云相关产品和产品介绍链接地址:

  • 腾讯云服务器(CVM):提供弹性计算能力,满足各类业务需求。产品介绍链接
  • 腾讯云数据库(TencentDB):提供稳定可靠的数据库服务,支持多种数据库引擎。产品介绍链接
  • 腾讯云对象存储(COS):提供安全可靠的云端存储服务,适用于各类数据存储需求。产品介绍链接
  • 腾讯云人工智能(AI):提供丰富的人工智能服务,包括图像识别、语音识别、自然语言处理等。产品介绍链接
  • 腾讯云物联网(IoT):提供全面的物联网解决方案,支持设备接入、数据管理和应用开发。产品介绍链接
  • 腾讯云区块链(BCS):提供安全高效的区块链服务,支持快速搭建和管理区块链网络。产品介绍链接
  • 腾讯云视频处理(VOD):提供强大的视频处理能力,包括转码、截图、水印等功能。产品介绍链接
  • 腾讯云音视频通信(TRTC):提供稳定可靠的音视频通信服务,支持实时音视频通话和互动直播。产品介绍链接
  • 腾讯云云原生应用平台(TKE):提供全面的云原生应用管理平台,支持容器化应用的部署和管理。产品介绍链接

以上是腾讯云提供的一些相关产品,可以根据具体需求选择适合的产品进行云计算和开发工作。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

DataFrame Pandas DataFrame 类似于 Excel 工作表。虽然 Excel 工作簿可以包含多个工作表,但 Pandas DataFrames 独立存在。 3....在 Pandas 中,索引可以设置为一个(或多个)唯一,这就像在工作表中有一用作行标识符一样。与大多数电子表格不同,这些索引实际上可用于引用行。...我们可以用多种不同方式构建一个DataFrame,但对于少量,通常将其指定为 Python 字典会很方便,其中键是列名,是数据。...If/then逻辑 假设我们想要根据 total_bill 是小于还是大于 10 美元,来创建一个具有低和高。 在Excel电子表格中,可以使用条件公式进行逻辑比较。...tips["time"].str.len() tips["time"].str.rstrip().str.len() 结果如下: 请注意,这仍然会在字符串包含多个空格,因此不是 100% 等效

19.5K20

数据科学家私藏pandas高阶用法大全 ⛵

() 类似于上例,如果你想把一个DataFrame中某个字符串字段()展开为一个列表,然后列表中元素拆分成多行,可以使用str.split()和explode()组合,如下例: import pandas...如下例,我们可以使用pandas.melt()(“Aldi”、“Walmart”、“Costco”)转换为一(“store”)。...combine_first()方法根据 DataFrame 行索引和索引,对比两个 DataFrame 中相同位置数据,优先取非空数据进行合并。...中 我们可以根据名称中字符串过滤 pandas DataFrame ,具体是使用 pandas DataFrame.filter功能。...DataFrame 在我们处理数据时候,有时需要根据某个进行计算得到一个新,以便后续使用,相当于是根据已知得到新,这个时候assign函数非常方便。

6K30

这些pandas技巧你还不会吗 | Pandas实用手册(PART II)

通过这样方式,pandas 让你可以放心地对原始数据做任何坏坏事情而不会产生任何不好影响。 字符串切割成多个 在处理文本数据时,很多时候你会想要把一个字符串栏位拆成多个栏位以方便后续处理。...你可能会想把这个DataFramefeature栏分成不同栏,这时候利用str字串取出,并通过expand=True字符串切割结果扩大成(expand)成一个DataFrame: ?...注意我们使用df[columns] = ...形式字串切割出来2个新栏分别指定成性格与特技。 list切割成多个 有时候一个栏位里头Python list: ?...选择任一栏有空样本 一个DataFrame 里常会有多个栏位(column),而每个栏位里头都有可能包含。 有时候你会想把在任一栏位(column)出现过空样本(row)全部取出: ?...而你当然也可以利用exclude参数来排除特定类型栏位: ? pandas函数使用上都很只管,你可以丢入1个包含多个元素Python list或是单一str作为参数输入。

1.1K20

Pandas入门2

image.png 5.5 排序和排名 使用DataFrame对象sort_valuse方法,需要两个参数:第1个参数by是根据哪一行或排序; 第2个参数axis为0或1,默认为0,0为按排序,...Python字符串处理 对于大部分应用来说,python字符串应该已经足够。 如split()函数对字符串拆分,strip()函数对字符串去除两边空白字符。...复习字符串对象4个方法:join方法连接字符串、 find方法寻找字符串出现索引位置、count方法返回字符串出现次数、 replace方法用来替换。...7.1 Python标准库 包含用于日期(date)和时间(time)数据数据类型,而且还有日历方面的功能。主要使用datetime、 time、 calendar模块。...方法返回数据类型是字符串。 另外,其实time模块中有strftime方法,需要1个参数,参数为字符串格式。可以现在时间转换为字符串。 ?

4.1K20

Python之数据规整化:清理、转换、合并、重塑

Python之数据规整化:清理、转换、合并、重塑 1. 合并数据集 pandas.merge可根据一个或者多个不同DataFrame行连接起来。...pandas.concat可以沿着一条轴多个对象堆叠到一起。 实例方法combine_first可以重复数据编接在一起,用一个对象中填充另一个对象中缺失。 2....数据风格DataFrame合并操作 2.1 数据集合并(merge)或连接(jion)运算时通过一个或多个行链接起来。如果没有指定,merge就会将重叠列名当做键,最好显示指定一下。...4.1 重塑层次化索引 层次化索引为DataFrame数据重排任务提供了良好一致性方式。主要两种功能: stack:数据“旋转”为行。...字符串操作 6.1 字符串对象方法 split以逗号分割字符串可以拆分成数段。 字符串“::”jion方法以冒号分隔符形式连接起来。

3K60

数据可视化干货:使用pandas和seaborn制作炫酷图表(附代码)

你可以从其基本组件中组装一个图表:数据显示(即绘图类型:线、条、框、散点图、轮廓等)、图例、标题、刻度标记和其他注释。 在pandas中,我们可能有多个数据,并且带有行和标签。...方法参数 DataFrame拥有多个选项,允许灵活地处理;例如,是否绘制到同一个图中,或为各生成独立图。...参数 描述 subplots DataFrame每一绘制在独立图中 sharex 如果subplots=True,则共享相同x轴、刻度和范围 sharey 如果subplots=True,则共享相同...在DataFrame中,柱状图每一行中分组到并排柱子中一组。...因为day中有多个观测,柱子是tip_pct平均值。柱子上画出黑线代表是95%置信区间(置信区间可以通过可选参数进行设置)。

5.3K40

数据分析篇 | PyCon 大咖亲传 pandas 25 式,长文建议收藏

~ 按行 用多个文件建立 DataFrame ~ 按 从剪贴板创建 DataFrameDataFrame 分割为两个随机子集 根据多个类别筛选 DataFrame 根据最大类别筛选 DataFrame...操控缺失字符串分割为多 把 Series 里列表转换为 DataFrame多个函数聚合 用一个 DataFrame 合并聚合输出结果 选择行与 重塑多重索引 Series 创建透视表...用多个文件建立 DataFrame ~ 按 上个技巧按行合并数据集,但是如果多个文件包含不同,该怎么办? 本例 drinks 数据集分为了两个 CSV 文件,每个文件都包含 3 。 ?...把 Series 里列表转换为 DataFrame 创建一个 DataFrame 示例。 ? 这里包含了两,第二包含Python 整数列表。...年龄列有 1 位小数,票价列有 4 位小数,如何这两显示小数位数标准化? 用以下代码让这两只显示 2 位小数。 ? 第一个参数是要设置选项名称,第二个参数是 Python 字符串格式。

7.1K20

Pandas 25 式

~ 按行 用多个文件建立 DataFrame ~ 按 从剪贴板创建 DataFrameDataFrame 分割为两个随机子集 根据多个类别筛选 DataFrame 根据最大类别筛选 DataFrame...操控缺失字符串分割为多 把 Series 里列表转换为 DataFrame多个函数聚合 用一个 DataFrame 合并聚合输出结果 选择行与 重塑多重索引 Series 创建透视表...用多个文件建立 DataFrame ~ 按 上个技巧按行合并数据集,但是如果多个文件包含不同,该怎么办? 本例 drinks 数据集分为了两个 CSV 文件,每个文件都包含 3 。 ?...把 Series 里列表转换为 DataFrame 创建一个 DataFrame 示例。 ? 这里包含了两,第二包含Python 整数列表。...年龄列有 1 位小数,票价列有 4 位小数,如何这两显示小数位数标准化? 用以下代码让这两只显示 2 位小数。 ? 第一个参数是要设置选项名称,第二个参数是 Python 字符串格式。

8.4K00

整理了 25 个 Pandas 实用技巧,拿走不谢!

你可以查看到Pythonpandas, Numpy, matplotlib等版本信息。 2. 创建示例DataFrame 假设你需要创建一个示例DataFrame。...但是如果数据集中每个文件包含信息呢? 这里有一个例子,dinks数据集被划分成两个CSV文件,每个文件包含: ? 同上一个技巧一样,我们以使用glob()函数开始。...一个字符串分成多个 我们先创建另一个新示例DataFrame: ? 如果我们需要将“name”这一划分为三个独立,用来表示first, middle, last name呢?...一个由列表组成Series扩展成DataFrame 让我们创建一个新示例DataFrame: ? 这里有两,第二包含Python由整数元素组成列表。...我们现在隐藏了索引,Close最小高亮成红色,Close最大高亮成浅绿色。 这里有另一个DataFrame格式化例子: ?

3.2K10

最全面的Pandas教程!没有之一!

下面这个例子里,创建一个 Series 对象,并用字符串对数字列表进行索引: ? 注意:请记住, index 参数是可省略,你可以选择不输入这个参数。...DataFrames Pandas DataFrame(数据表)是一种 2 维数据结构,数据以表格形式存储,分成若干行和。通过 DataFrame,你能很方便地处理数据。...索引 类似地,我们还可以用 .set_index() 方法, DataFrame某一作为索引来用。...当你使用 .dropna() 方法时,就是告诉 Pandas 删除掉存在一个或多个行(或者)。删除是 .dropna(axis=0) ,删除行用是 .dropna(axis=1) 。...删除: ? 类似的,如果你使用 .fillna() 方法,Pandas 将对这个 DataFrame 里所有的空位置填上你指定默认。比如,表中所有 NaN 替换成 20 : ?

25.8K64

Python常用小技巧总结

小技巧 pandas生成数据 导入数据 导出数据 查看数据 数据选择 数据处理 数据分组 数据合并 数据替换--map映射 数据清洗--replace和正则 数据透视表分析--melt函数 分类中出现次数较少归为...others Python合并多个EXCEL工作表 pandas中Series和Dataframe数据类型互转 相同字段合并 Python小技巧 简单表达式 列表推导式 交换变量 检查对象使用内存情况...(dropna=False) # 查看Series对象唯⼀和计数 df.apply(pd.Series.value_counts) # 查看DataFrame对象中每⼀唯⼀和计数 df.isnull...对象中⾮空,并返回⼀个Boolean数组 df.dropna() # 删除所有包含⾏ df.dropna(axis=1) # 删除所有包含 df.dropna(axis=1,thresh....append(df2) # df2中⾏添加到df1尾部 df.concat([df1,df2],axis=1,join='inner') # df2中添加到df1尾部,为空对应⾏与对应列都不要

9.4K20

pandas处理字符串方法汇总

使用字符串str属性 Pandas中内置了等效python字符串操作方法:str属性 df = pd.DataFrame(["Python Gudio 1991","Java Gosling 1990...2 None 3 Mckinney Name: Language, dtype: object 分割后数据进行展开,属性名是0,1,2…等自然数 # 使用expand参数,返回列表进行展开...None 3 Pandas Mckinney 2008 指定最大属性:n=1表示分割split之后最大索引为1: df["Language"].str.split(" ", expand=True...: Language, dtype: object str.replace:正则表达式中替换功能 # 字母J和Python整个字符串替换成?...)或者指定字符 str.lower:所有字符串字母转成小写 str.uppper:所有字符串字母转成大写 str.find:查找字符串中指定字符串第一次出现位置 str.rfind:查找字符串中指定字符串最后一次出现位置

27820

pythonPandasDataFrame基本操作(二),DataFrame、dict、array构造简析

DataFrame简介:   DataFrame是一个表格型数据结构,它含有一组有序,每可以是不同类型(数值、字符串、布尔等)。...其实,DataFrame数据是以一个或多个二维块存放(而不是列表、字典或别的一维数据结构)。...:列表或数组赋值给某个时,其长度必须跟DataFrame长度相匹配!!...:第一种是两个不同列表转换成一个数据框,第二种是一个包含不同列表列表转换成为数据框。...7 3 4 8 第二种:包含不同列表列表转换为数据框 from pandas.core.frame import DataFrame a=[[1,2,3,4],[5,6,7,8]]#包含两个不同列表

4.3K30

Python数据分析-pandas库入门

Series 中单个或一组,代码示例: obj2[['a', 'b', 'c']] obj2['a']=2 obj2[['a', 'b', 'c']] [‘a’,’b’,’c]是索引列表,即使它包含字符串而不是整数...使用 NumPy 函数或类似 NumPy 运算(如根据布尔型数组进行过滤、标量乘法、应用数学函数等)都会保留索引链接,代码示例: obj2*2 np.exp(obj2) 还可以 Series...数据结构 DataFrame 是一个表格型数据结构,它含有一组有序,每可以是不同类型(数值、字符串、布尔等)。...DataFrame 既有行索引也有索引,它可以被看做由 Series 组成字典(共用同一个索引)。DataFrame数据是以一个或多个二维块存放(而不是列表、字典或别的一维数据结构)。...例如,我们可以给那个空 “debt” 赋上一个标量值或一组(数组或列表形式),代码示例: frame2.debt = np.arange(6.) frame2 注意:列表或数组赋值给某个时,

3.7K20

python数据分析——数据分类汇总与统计

第一个阶段,pandas对象中数据会根据你所提供一个或多个键被拆分(split)为多组。拆分操作是在对象特定轴上执行。...首先,根据day和smoker对tips进行分组,然后采用agg()方法一次应用多个函数。 如果传入一组函数或函数名,得到DataFrame就会以相应函数命名。...具体办法是向agg传入一个从列名映射到函数字典: 只有多个函数应用到至少一时,DataFrame才会拥有层次化 2.3.返回不含行索引聚合数据 到目前为止,所有例中聚合数据都有由唯一分组键组成索引...Apply函数会将待处理对象拆分成多个片段,然后对各片段调用传入函数,最后尝试各片段组合到一起。 【例13】采用之前小费数据集,根据分组选出最高5个tip-pct。...: 行名称 margins : 总计行/ normalize:所有除以总和进行归一化,为True时候显示百分比 dropna :是否刪除缺失 【例19】根据国籍和用手习惯对这段数据进行统计汇总

14410

Python】这25个Pandas高频实用技巧,不得不服!

多个文件中构建DataFrame 上一个技巧对于数据集中每个文件包含行记录很有用。但是如果数据集中每个文件包含信息呢?...一个字符串分成多个 我们先创建另一个新示例DataFrame: df = pd.DataFrame({'name':['John Arthur Doe', 'Jane Ann Smith'],...':[[10, 40], [20, 50], [30, 60]]}) df 这里有两,第二包含Python由整数元素组成列表。...我们回到stocks这个DataFrame: stocks 我们可以创建一个格式化字符串字典,用于对每一进行格式化。...='red') .highlight_max('Close', color='lightgreen') ) 我们现在隐藏了索引,Close最小高亮成红色,Close最大高亮成浅绿色

6.4K40

python数据科学系列:pandas入门详细教程

自然毫无悬念 dataframe:无法访问单个元素,只能返回一、多或多行:单或多值(多个列名组成列表)访问时按进行查询,单访问不存在列名歧义时还可直接用属性符号" ....isin/notin,条件范围查询,即根据特定是否存在于指定列表返回相应结果 where,仍然是执行条件查询,但会返回全部结果,只是将不满足匹配条件结果赋值为NaN或其他指定,可用于筛选或屏蔽...loc和iloc应该理解为是series和dataframe属性而非函数,应用loc和iloc进行数据访问就是根据属性访问过程 另外,在pandas早些版本中,还存在loc和iloc兼容结构,即...需注意是,这里字符串接口与python中普通字符串接口形式上很是相近,但二者是不一样。...;sort_values是按排序,如果是dataframe对象,也可通过axis参数设置排序方向是行还是,同时根据by参数传入指定行或者,可传入多行或多并分别设置升序降序参数,非常灵活。

13.8K20
领券