如果现有列的值包含特定子字符串，则创建新的pd.DataFrame列

。

答案：

在Python中，可以使用pandas库来处理数据。要创建新的pd.DataFrame列，可以使用pandas的apply函数结合lambda表达式来实现。

首先，假设我们有一个名为df的DataFrame，其中包含一个名为column的列，我们想要检查每个值是否包含特定的子字符串。我们可以使用apply函数和lambda表达式来创建一个新的列。

import pandas as pd

# 创建一个示例DataFrame
df = pd.DataFrame({'column': ['abc', 'def', 'ghi', 'jkl']})

# 定义一个函数来检查值是否包含特定子字符串
def check_substring(value, substring):
    return substring in value

# 使用apply函数和lambda表达式创建新的列
df['new_column'] = df['column'].apply(lambda x: check_substring(x, 'c'))

# 打印结果
print(df)

输出结果：

  column  new_column
0    abc        True
1    def       False
2    ghi       False
3    jkl       False

在上面的代码中，我们首先定义了一个名为check_substring的函数，该函数接受一个值和一个子字符串作为参数，并返回一个布尔值，表示该值是否包含该子字符串。

然后，我们使用apply函数和lambda表达式将该函数应用于df['column']列的每个值。lambda表达式将每个值作为输入传递给check_substring函数，并将结果赋给新的列df['new_column']。

在这个例子中，我们检查每个值是否包含子字符串'c'，并将结果存储在新的列df['new_column']中。

这是一个简单的示例，你可以根据实际需求来修改check_substring函数和lambda表达式来适应不同的情况。

腾讯云相关产品和产品介绍链接地址：

腾讯云官网：https://cloud.tencent.com/
腾讯云云服务器（CVM）：https://cloud.tencent.com/product/cvm
腾讯云云数据库 MySQL 版：https://cloud.tencent.com/product/cdb_mysql
腾讯云云原生容器服务（TKE）：https://cloud.tencent.com/product/tke
腾讯云对象存储（COS）：https://cloud.tencent.com/product/cos
腾讯云区块链服务（BCS）：https://cloud.tencent.com/product/bcs
腾讯云人工智能（AI）：https://cloud.tencent.com/product/ai
腾讯云物联网（IoT）：https://cloud.tencent.com/product/iot
腾讯云移动开发（MPS）：https://cloud.tencent.com/product/mps
腾讯云音视频处理（MPS）：https://cloud.tencent.com/product/mps

相关·内容

Python数据分析-pandas库入门

Series 中的单个或一组值，代码示例： obj2[['a', 'b', 'c']] obj2['a']=2 obj2[['a', 'b', 'c']] [‘a’,’b’,’c]是索引列表，即使它包含的是字符串而不是整数...，它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔值等）。...() 如果指定了列序列，则 DataFrame 的列就会按照指定顺序进行排列，代码示例： pd.DataFrame(data,columns=['state','year','pop']) 如果传入的列在数据中找不到...two', 'four','five']) frame2.debt = val frame2 为不存在的列赋值会创建出一个新列。...另一种常见的数据形式是嵌套字典，如果嵌套字典传给 DataFrame，pandas 就会被解释为：外层字典的键作为列，内层键则作为行索引，代码示例： #DataFrame另一种常见的数据形式是嵌套字典

3.7K2 0

1w 字的 pandas 核心操作知识大全。

: [1.0, 2.0] * 3}) print('df:', df) # 输出包含 bool 数据类型的列 print('输出包含 bool 数据类型的列:', df.select_dtypes(include...='bool')) # 输出包含小数数据类型的列 print('输出包含小数数据类型的列:', df.select_dtypes(include=['float64'])) # 输出排除整数的列 print...('输出包含小数数据类型的列:', df.select_dtypes(exclude=['int64'])) # 某列字符串截取 df['Time'].str[0:8] # 随机取num行 ins_...) # 所有列的唯一值和计数数据选取使用这些命令选择数据的特定子集。...df[col] # 返回带有标签col的列 df[[col1, col2]] # 返回列作为新的DataFrame s.iloc[0]

14.8K3 0

强烈推荐Pandas常用操作知识大全！

) # 所有列的唯一值和计数数据选取使用这些命令选择数据的特定子集。...df[col] # 返回带有标签col的列 df[[col1, col2]] # 返回列作为新的DataFrame s.iloc[0]...df.dropna(axis=1) # 删除所有包含空值的列 df.dropna(axis=1,thresh=n)...# 返回每列中的最高值 df.min() # 返回每一列中的最小值 df.median() # 返回每列的中位数 df.std() # 返回每列的标准偏差...(df) df 1.cat函数用于字符串的拼接 df["姓名"].str.cat(df["家庭住址"],sep='-'*3) 2.contains 判断某个字符串是否包含给定字符 df["

15.8K2 0

通宵翻译Pandas官方文档，写了这份Excel万字肝货操作！

让我们首先基于上面示例中的数据框，创建一个新的 Excel 文件。 tips.to_excel("....可以以相同的方式分配新列。DataFrame.drop() 方法从 DataFrame 中删除一列。...If/then逻辑假设我们想要根据 total_bill 是小于还是大于 10 美元，来创建一个具有低值和高值的列。在Excel电子表格中，可以使用条件公式进行逻辑比较。...如果找到子字符串，则该方法返回其位置。如果未找到，则返回 -1。请记住，Python 索引是从零开始的。 tips["sex"].str.find("ale") 结果如下： 3....；如果匹配多行，则每个匹配都会有一行，而不仅仅是第一行；它将包括查找表中的所有列，而不仅仅是单个指定的列；它支持更复杂的连接操作；其他注意事项 1.

19.5K2 0

猿创征文｜数据导入与预处理-第3章-pandas基础

2.如果再发布的只是二进制类库/软件，则需要在类库/软件的文档和版权声明中包含原来代码中的BSD协议。 3.不可以用开源代码的作者/机构名字和原来产品的名字做市场推广。...如下所示： "二维数组"Dataframe：是一个表格型的数据结构，包含一组有序的列，其列的值类型可以是数值、字符串、布尔值等。...参数可以增加和减少现有列，如出现新的列，值为NaN # index在这里和之前不同，并不能改变原有index，如果指向新的标签，值为NaN （非常重要！）...pandas中使用reindex()方法实现重新索引功能，该方法会参照原有的Series类对象或DataFrame类对象的索引设置数据：若该索引存在于新对象中，则其对应的数据设为原数据，否则填充为缺失值...colums：表示新的列索引。

13.9K2 0

如何利用维基百科的数据可视化当代音乐史

电影中最具标志性的场景可能是乌玛•瑟曼和约翰•特拉沃尔塔在杰克兔子餐厅的舞池跳扭扭舞的那段。...#从wikipediaScrape.p文件中加载数据框，创建新的列，边抓取信息边填充 dfs =cPickle.load(open('wikipediaScrape.p', 'rb')) subjects...#创建流派字典，比如，对于“folk”和“country”范围的分析则认为是相同的音乐流#派 genreList= { 'electronic': ['electronic'], 'latin...# 添加“dirty”列，名单包括HTML元素 # “ dirty”列包含的错别字、引用等记录都会导致异常发生，但是我们感兴趣的是从 # 混乱的字符串中抽取相关的关键字，通过简单匹配所有的小写实例...for keyin genreList.keys(): df[key] = 0 dfs =df.copy() # 对于genreList字典中每个流派匹配字符串，如果能匹配，则标志指定列，以便能够在后面输出布尔结果

1.7K7 0

python使用pandas的常用操作

： import pandas as pd import numpy as np # 创建一个包含缺失值的 DataFrame data = { 'A': [1, 2, np.nan, 4],...(df.isna()) # 检查每列的缺失值总数 print(df.isna().sum()) # 删除包含缺失值的行 df_dropped_rows = df.dropna() print(df_dropped_rows...) # 删除包含缺失值的列 df_dropped_cols = df.dropna(axis=1) print(df_dropped_cols) # 使用常数填充缺失值 df_filled_constant...) # 使用每列的均值填充缺失值 df_filled_mean = df.fillna(df.mean()) print(df_filled_mean) # 使用每列的中位数填充缺失值 df_filled_median..., 'City': ['木星', '海王星'] } new_df = pd.DataFrame(new_data) # 追加新数据到现有 DataFrame updated_df = pd.concat

1191 0

基于pandas数据预处理基础操作

df1.values #3.describe()函数对于数据的快速统计汇总 df1.describe() #4.对数据的转置 df1.T #5.按轴进行排序(如果按行则使用axis = 0) df1....(新列为Series则必须设置和原DataFrame一致的索引) s1 = pd.Series(range(1,7),index = pd.date_range('20170302',periods =...6)) df1['F'] = s1 #2.通过标签和索引设置新的值 df1.at[dates[0],'A'] = 0 df1.iat[0,1] = 0 #3.通过一个numpy数组设置一组新值 df1....loc[:,'D'] = np.array([5]*len(df1)) #4.通过where操作来设置新的值 df4 = df1.copy() df4[df4>0] = -df4 #四、缺失值处理...(index = dates[0:4],columns = list(df1)+['E']) df5.loc[dates[0]:dates[1],'E'] = 1 #2.去掉包含缺失值的行(axis=1

7172 1

Pandas的apply方法的应用练习

data = {'column1':[1, 2, 15, 4, 8]} df = pd.DataFrame(data) 请创建一个新的列'new_column'，其值为'column1'中每个元素的两倍...，当原来的元素大于10的时候，将新列里面的值赋0 import pandas as pd # 自定义函数 def process_data(x): if x > 10: return...函数用来两列之和，并将最终的结果添加到新的列'sum_columns'当中 import pandas as pd # 创建一个示例 DataFrame data = {'column1'...，将DataFrame中的字符串列中的所有数字提取出来并拼接成一个新的字符串列。 ...假设有一个名为data的DataFrame，其中包含以下列： name：字符串类型，表示姓名 age：整数类型，表示年龄 gender：字符串类型，表示性别 score：浮点数类型，表示分数请自定义一个函数

841 0

PySpark SQL——SQL和pd.DataFrame的结合体

以及对单列进行简单的运算和变换，具体应用场景可参考pd.DataFrame中赋值新列的用法，例如下述例子中首先通过"*"关键字提取现有的所有列，而后通过df.age+1构造了名字为(age+1)的新列。...：删除指定列最后，再介绍DataFrame的几个通用的常规方法： withColumn：在创建新列或修改已有列时较为常用，接收两个参数，其中第一个参数为函数执行后的列名（若当前已有则执行修改，否则创建新列...），第二个参数则为该列取值，可以是常数也可以是根据已有列进行某种运算得到，返回值是一个调整了相应列后的新DataFrame # 根据age列创建一个名为ageNew的新列 df.withColumn('...select等价实现，二者的区别和联系是：withColumn是在现有DataFrame基础上增加或修改一列，并返回新的DataFrame（包括原有其他列），适用于仅创建或修改单列；而select准确的讲是筛选新列...，仅仅是在筛选过程中可以通过添加运算或表达式实现创建多个新列，返回一个筛选新列的DataFrame，而且是筛选多少列就返回多少列，适用于同时创建多列的情况（官方文档建议出于性能考虑和防止内存溢出，在创建多列时首选

10K2 0

图解pandas的assign函数

在我们处理数据的时候，有时需要根据某个列进行计算得到一个新列，以便后续使用，相当于是根据已知列得到新的列，这个时候assign函数非常方便。下面通过实例来说明函数的的用法。...Pandas文章本文是Pandas文章连载系列的第21篇，主要分为3类：基础部分：1-16篇，主要是介绍Pandas中基础和常用操作，比如数据创建、检索查询、排名排序、缺失值/重复值处理等常见的数据处理操作...**kwargs: dict of {str: callable or Series} 关于参数的几点说明：列名是关键字keywords 如果列名是可调用的，那么它们将在DataFrame上计算并分配给新的列...如果列名是不可调用的（例如：Series、标量scalar或者数组array），则直接进行分配最后，这个函数的返回值是一个新的DataFrame数据框，包含所有现有列和新生成的列导入库 import...，那么这个现有列的值将会被覆盖： df.assign(col1=df["col1"] / 2) # col1直接被覆盖 .dataframe tbody tr th:only-of-type

3722 0

Python 数据处理：Pandas库的使用

，它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔值等）。...如果没有显式指定索引，则各Series的索引会被合并成结果的行索引由字典组成的字典各内层字典会成为一列。...(pop1) print(frame3.values) 如果DataFrame各列的数据类型不同，由于 NumPy 数组存储的数据类型需要一致，则值数组的dtype就会选用能兼容所有列的数据类型：...计算并集 isin 计算一个指示各值是否都包含在参数集合中的布尔型数组 delete 删除索引i处的元素，并得到新的Index drop 删除传入的值，并得到新的Index insert 将元素插入到索引...---- 2.基本功能 2.1 重新索引 Pandas对象的一个重要方法是reindex，其作用是创建一个新对象，它的数据符合新的索引。

22.7K1 0

高手系列！数据科学家私藏pandas高阶用法大全 ⛵

（包含缺失值）我们知道可以通过value_counts很方便进行字段取值计数，但是pandas.value_counts()自动忽略缺失值，如果要对缺失值进行计数，要设置参数dropna=False。...如果调用combine_first()方法的 df1 中数据非空，则结果保留 df1 中的数据，如果 df1 中的数据为空值且传入combine_first()方法的 df2 中数据非空，则结果取 df2...中的数据，如果 df1 和 df2 中的数据都为空值，则结果保留 df1 中的空值(空值有三种：np.nan、None 和 pd.NaT)。...DataFrame 在我们处理数据的时候，有时需要根据某个列进行计算得到一个新列，以便后续使用，相当于是根据已知列得到新的列，这个时候assign函数非常方便。...在以下示例中，创建了一个新的排名列，该列按学生的分数对学生进行排名： import pandas as pd df = pd.DataFrame({'Students': ['John', 'Smith

6.1K3 0

Python3快速入门（十四）——Pan

index_col：字符串或字符串列表，可选，默认值：None，要设置为index的列（MultiIndex）。...chunksize：int，默认None，如果指定，则返回一个迭代器，其中chunksize是要包含在每个块中的行数。...：将新值插入现有表。...，则产生新的列（行），未赋值的位置用NaN填充。...通过位置设置新的值。

3.7K1 1

在Pandas中更改列的数据类型【方法总结】

理想情况下，希望以动态的方式做到这一点，因为可以有数百个列，明确指定哪些列是哪种类型太麻烦。可以假定每列都包含相同类型的值。...解决方法可以用的方法简单列举如下：对于创建DataFrame的情形如果要创建一个DataFrame，可以直接通过dtype参数指定类型： df = pd.DataFrame(a, dtype='float...对于多列或者整个DataFrame 如果想要将这个操作应用到多个列，依次处理每一列是非常繁琐的，所以可以使用DataFrame.apply处理每一列。...在这种情况下，设置参数： df.apply(pd.to_numeric, errors='ignore') 然后该函数将被应用于整个DataFrame，可以转换为数字类型的列将被转换，而不能(例如，它们包含非数字字符串或日期...例如，用两列对象类型创建一个DataFrame，其中一个保存整数，另一个保存整数的字符串： >>> df = pd.DataFrame({'a': [7, 1, 5], 'b': ['3','2','1

20.1K3 0

私藏的5个好用的Pandas函数！

对year列进行唯一值计数： df.year.nunique() 输出：10 对整个dataframe的每一个字段进行唯一值计数： df.nunique() ?...object类型包括字符串和混合值（数字及非数字）。 object类型比较宽泛，如果可以确定为具体数据类型，则不建议用object。...； deep：如果为True，则通过查询object类型进行系统级内存消耗来深入地检查数据，并将其包括在返回值中。...首先创建一个df，共2列，1000000行。...5. replace 顾名思义，replace是用来替换df中的值，赋以新的值。

1.1K7 3

pandas应用整理

sr3.index = range(1,5) Series运算四则运算时会根据index的值对相应的数据进行运算，结果是浮点数 sr1 = pd.Series([1,2,3,4],['a','b',...df2['str1'] = ['a1', 'b1', 'c1', 'd1'] # 增加一列会改变df2的内容如果使用df2.xx操作，则不会改变df2的内容,因为并没有对df2进行赋值；如果使用...(['a3','b3','c3'],index = ['a','b','c'])#未指定的位置是NaN 从现有的列创建新列 df2['str4'] = df2['ints'] + df2['floats...4.0 7 1 2.0 NaN 8 2 NaN 6.0 9 把包含NaN的行或列丢弃 df.dropna() #默认是把包含NaN的行丢弃 >> A B C 0 1.0...，打开也会发现新导出的文件多了一列。

1.6K2 0

Pandas 2.2 中文官方教程和指南（十七）

获取如果切片操作返回 DataFrame 或 Series 类型的列，则 category dtype 会被保留。...与 R 的 factor 函数相反，将分类数据作为唯一输入来创建新的分类系列不会删除未使用的类别，而是创建一个与传入的相等的新分类系列！...：第一个重命名类别，因此Series中的个别值也会被重命名，但如果第一个位置被排序为最后一个，则重命名的值仍将被排序为最后一个。...唯一的区别是返回类型（用于获取）和只有已在categories中的值才能被赋值。获取如果切片操作返回DataFrame或类型为Series的列，则category dtype 将被保留。...与 R 的factor函数相反，将分类数据作为创建新分类系列的唯一输入将不会删除未使用的类别，而是创建一个等于传入的新分类系列！

3301 0

高效的5个pandas函数，你都用过吗？

1.2K2 0

高效的5个pandas函数，你都用过吗？

比如说dataframe中某一行其中一个元素包含多个同类型的数据，若想要展开成多行进行分析，这时候explode就派上用场，而且只需一行代码，非常节省时间。...object类型包括字符串和混合值（数字及非数字）。 object类型比较宽泛，如果可以确定为具体数据类型，则不建议用object。...； deep：如果为True，则通过查询object类型进行系统级内存消耗来深入地检查数据，并将其包括在返回值中。...首先创建一个df，共2列，1000000行。...5. replace 顾名思义，replace是用来替换df中的值，赋以新的值。

1.1K4 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如果现有列的值包含特定子字符串，则创建新的pd.DataFrame列

相关·内容

Python数据分析-pandas库入门

1w 字的 pandas 核心操作知识大全。

强烈推荐Pandas常用操作知识大全！

通宵翻译Pandas官方文档，写了这份Excel万字肝货操作！

猿创征文｜数据导入与预处理-第3章-pandas基础

如何利用维基百科的数据可视化当代音乐史

python使用pandas的常用操作

基于pandas数据预处理基础操作

Pandas的apply方法的应用练习

PySpark SQL——SQL和pd.DataFrame的结合体

图解pandas的assign函数

Python 数据处理：Pandas库的使用

高手系列！数据科学家私藏pandas高阶用法大全 ⛵

Python3快速入门（十四）——Pan

在Pandas中更改列的数据类型【方法总结】

私藏的5个好用的Pandas函数！

pandas应用整理

Pandas 2.2 中文官方教程和指南（十七）

高效的5个pandas函数，你都用过吗？

高效的5个pandas函数，你都用过吗？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐