通过对包含另一列中字符串值的子集的字典进行映射来创建dataframe列。作为它的关键

通过对包含另一列中字符串值的子集的字典进行映射来创建dataframe列，可以使用pandas库中的map函数来实现。

map函数可以将一个字典或者一个Series对象应用于DataFrame的某一列，将该列中的每个元素替换为字典中对应的值或者Series中对应的值。

下面是一个示例代码：

import pandas as pd

# 创建一个包含字符串的DataFrame
df = pd.DataFrame({'fruit': ['apple', 'banana', 'orange', 'apple']})

# 创建一个字典，将字符串映射为对应的颜色
fruit_color = {'apple': 'red', 'banana': 'yellow', 'orange': 'orange'}

# 使用map函数将fruit列中的字符串映射为颜色
df['color'] = df['fruit'].map(fruit_color)

print(df)

输出结果为：

    fruit   color
0   apple     red
1  banana  yellow
2  orange  orange
3   apple     red

在这个例子中，我们创建了一个包含水果名称的DataFrame，并创建了一个字典fruit_color，将水果名称映射为对应的颜色。然后使用map函数将fruit列中的水果名称映射为颜色，并将结果存储在新的color列中。

对于这个问题，腾讯云没有特定的产品或者链接地址与之相关。

相关·内容

Python数据分析-pandas库入门

Series 中的单个或一组值，代码示例： obj2[['a', 'b', 'c']] obj2['a']=2 obj2[['a', 'b', 'c']] [‘a’,’b’,’c]是索引列表，即使它包含的是字符串而不是整数...数据结构 DataFrame 是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔值等）。...DataFrame 既有行索引也有列索引，它可以被看做由 Series 组成的字典（共用同一个索引）。DataFrame 中的数据是以一个或多个二维块存放的（而不是列表、字典或别的一维数据结构）。...虽然 DataFrame 是以二维结构保存数据的，但你仍然可以轻松地将其表示为更高维度的数据（层次化索引的表格型结构，这是 pandas中许多高级数据处理功能的关键要素）创建 DataFrame 的办法有很多...另一种常见的数据形式是嵌套字典，如果嵌套字典传给 DataFrame，pandas 就会被解释为：外层字典的键作为列，内层键则作为行索引，代码示例： #DataFrame另一种常见的数据形式是嵌套字典

3.7K2 0

Python 数据处理：Pandas库的使用

('b' in obj2) print('e' in obj2) 如果数据被存放在一个Python的字典中，也可以直接通过这个字典来创建Series： import pandas as pd sdata...DataFrame是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔值等）。...另一种常见的数据形式是嵌套字典，如果嵌套字典传给DataFrame， Pandas 就会被解释为：外层字典的键作为列，内层键则作为行索引： import pandas as pd pop1 = {'...时，你可能希望根据一个或多个列中的值进行排序。...：方法描述 isin 计算一个表示“Series各值是否包含于传入的值序列中”的布尔型数组 match 计算一个数组中的各值到另一个不同值数组的整数索引；对于数据对齐和连接类型的操作十分有用 unique

22.8K1 0

Pandas 25 式

创建 DataFrame 创建 DataFrame 的方式有很多，比如，可以把字典传递给 DataFrame 构建器，字典的 Key 是列名，字典的 Value 为列表，是 DataFrame 的列的值...rename()方法改列名是最灵活的方式，它的参数是字典，字典的 Key 是原列名，值是新列名，还可以指定轴向（axis）。 ? 这种方式的优点是可以重命名任意数量的列，一列、多列、所有列都可以。...还可以使用 exclude 关键字排除指定的数据类型。 ? 7. 把字符串转换为数值再创建一个新的 DataFrame 示例。 ?...把 DataFrame 分割为两个随机子集把 DataFrame 分为两个随机子集，一个占 75% 的数据量，另一个是剩下的 25%。以 Movies 为例，该数据有 979 条记录。 ?...把字符串分割为多列创建一个 DataFrame 示例。 ? 把姓名列分为姓与名两列，用 str.split() 方法，按空格分割，并用 expand 关键字，生成一个新的 DataFrame。 ?

8.4K0 0

数据分析篇 | PyCon 大咖亲传 pandas 25 式，长文建议收藏

7.2K2 0

整理了25个Pandas实用技巧

类似地，你可以通过mean()和isna()函数找出每一列中缺失值的百分比。 ? 如果你想要舍弃那些包含了缺失值的列，你可以使用dropna()函数： ?...一个字符串划分成多列我们先创建另一个新的示例DataFrame: ? 如果我们需要将“name”这一列划分为三个独立的列，用来表示first, middle, last name呢？...该DataFrame包含了与MultiIndexed Series一样的数据，不同的是，现在你可以用熟悉的DataFrame的函数对它进行操作。...但是，一个更灵活和有用的方法是定义特定DataFrame中的格式化（style）。让我们回到stocks这个DataFrame: ? 我们可以创建一个格式化字符串的字典，用于对每一列进行格式化。...我们可以通过链式调用函数来应用更多的格式化： ? 我们现在隐藏了索引，将Close列中的最小值高亮成红色，将Close列中的最大值高亮成浅绿色。这里有另一个DataFrame格式化的例子： ?

2.8K4 0

整理了 25 个 Pandas 实用技巧，拿走不谢！

类似地，你可以通过mean()和isna()函数找出每一列中缺失值的百分比。 ? 如果你想要舍弃那些包含了缺失值的列，你可以使用dropna()函数： ?...将一个字符串划分成多个列我们先创建另一个新的示例DataFrame: ? 如果我们需要将“name”这一列划分为三个独立的列，用来表示first, middle, last name呢？...该DataFrame包含了与MultiIndexed Series一样的数据，不同的是，现在你可以用熟悉的DataFrame的函数对它进行操作。 22....让我们回到stocks这个DataFrame: ? 我们可以创建一个格式化字符串的字典，用于对每一列进行格式化。然后将其传递给DataFrame的style.format()函数： ?...我们现在隐藏了索引，将Close列中的最小值高亮成红色，将Close列中的最大值高亮成浅绿色。这里有另一个DataFrame格式化的例子： ?

3.2K1 0

整理了25个Pandas实用技巧（下）

一个字符串划分成多列我们先创建另一个新的示例DataFrame: 如果我们需要将“name”这一列划分为三个独立的列，用来表示first, middle, last name呢？...我们将会使用str.split()函数，告诉它以空格进行分隔，并将结果扩展成一个DataFrame: 这三列实际上可以通过一行代码保存至原来的DataFrame: 如果我们想要划分一个字符串，但是仅保留其中一个结果列呢...一样的数据，不同的是，现在你可以用熟悉的DataFrame的函数对它进行操作。...但是，一个更灵活和有用的方法是定义特定DataFrame中的格式化（style）。让我们回到stocks这个DataFrame: 我们可以创建一个格式化字符串的字典，用于对每一列进行格式化。...我们可以通过链式调用函数来应用更多的格式化：我们现在隐藏了索引，将Close列中的最小值高亮成红色，将Close列中的最大值高亮成浅绿色。

2.4K1 0

Python 数据分析（PYDA）第三版（二）

它包含了专为在 Python 中快速方便地进行数据清洗和分析而设计的数据结构和数据操作工具。...DataFrame 表示数据的矩形表，并包含一个有序的、命名的列集合，每个列可以是不同的值类型（数值、字符串、布尔值等）。...del关键字将像字典一样删除列。...将单个元素或列表传递给[]运算符将选择列。另一个用例是使用布尔 DataFrame 进行索引，比如通过标量比较生成的 DataFrame。...进行排序时，可以使用一个或多个列中的数据作为排序键。

2930 0

《利用Python进行数据分析·第2版》第5章 pandas入门5.1 pandas的数据结构介绍5.2 基本功能5.3 汇总和计算描述统计5.4 总结

] Out[20]: c 3 a -5 d 6 dtype: int64 ['c', 'a', 'd']是索引列表，即使它包含的是字符串而不是整数。...Python字典中，也可以直接通过这个字典来创建Series： In [26]: sdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah...DataFrame是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔值等）。...: 1.7, 2002: 3.6}} 如果嵌套字典传给DataFrame，pandas就会被解释为：外层字典的键作为列，内层键则作为行索引： In [66]: frame3 = pd.DataFrame...时，你可能希望根据一个或多个列中的值进行排序。

6.1K7 0

【数据处理包Pandas】数据透视表

补充：reindex用法 reindex的作用是创建一个符合新索引的新对象（默认不会修改原对象df2），它的一个用途是按新索引重新排序。...df2.reindex([(2017,1),(2017,2),(2016,1),(2016,2)]) reindex的另一个用途是取部分子集，可以起到切片的效果。...margins：是否在结果中包含边际汇总，默认为 False。 margins_name：如果 margins 为 True，则指定边际汇总列的名称，默认为 ‘All’。...columns：要在列上进行分组的序列、数组或DataFrame列。 values：可选参数，要聚合的值列。如果未指定，则将计算所有剩余列的计数/频率。...df 注意：（1）交叉表只能以pd而不能以 DataFrame 对象作为crosstab方法的前缀（2）crosstab方法没有data参数，index和columns参数不能用列名字符串，而需要用

740 0

Python科学计算之Pandas

如果你想要多个索引，你可以简单地在列表中增加另一个列名。 ? 在上面这个例子中，我们把我们的索引值全部设置为了字符串。这意味着我们不可以使用iloc索引这些列了。这种情况该如何？我们使用loc。...那么，如果loc是字符串标签的索引方法，iloc是数字标签的索引方法，那什么是ix呢？事实上，ix是一个字符串标签的索引方法，但是它同样支持数字标签索引作为它的备选。 ?...然而必须指出的是，ix要比loc和iloc更快。通常我们都希望索引是整齐有序地。我们可以在Pandas中通过调用sort_index来对dataframe实现排序。 ?...例子中，我们可以得到90年代的均值。 ? 你也可以对多行进行分组操作: ? ? 接下来的unstack操作可能起初有一些困惑。它的功能是将某一列前置成为列标签。我们最好如下看看它的实际效果。...上述代码为我们创建了如下的dataframe，我们将对它进行pivot操作。 ? pivot实际上是在本文中我们已经见过的操作的组合。

2.9K0 0

python数据分析万字干货！一个数据集全方位解读pandas

我们可以DataFrame通过在构造函数中提供字典将这些对象组合为一个。字典键将成为列名，并且值应包含Series对象： >>> city_data = pd.DataFrame({ ......四、访问DataFrame元素由于DataFrame由一系列对象组成，所以可以使用相同的上面的方法来访问它的元素。关键的区别是DataFrame还有一些附加维度。...使用索引运算符如果我们将 DataFrame的值看成Series字典形式，则可以使用index运算符访问它的列 >>> city_data["revenue"] Amsterdam 4200 Tokyo...五、查询数据集现在我们已经了解了如何根据索引访问大型数据集的子集。现在，我们继续基于数据集列中的值选择行以查询数据。例如，我们可以创建一个DataFrame仅包含2010年之后打过的比赛。...仅包含其中列中的值"year_id"大于的行2010。

7.4K2 0

【Python】这25个Pandas高频实用技巧，不得不服！

有很多种实现的途径，我最喜欢的方式是传一个字典给DataFrame constructor，其中字典中的keys为列名，values为列的取值。...类似地，你可以通过mean()和isna()函数找出每一列中缺失值的百分比。...将一个字符串划分成多个列我们先创建另一个新的示例DataFrame: df = pd.DataFrame({'name':['John Arthur Doe', 'Jane Ann Smith'],...']).Survived.mean().unstack() 该DataFrame包含了与MultiIndexed Series一样的数据，不同的是，现在你可以用熟悉的DataFrame的函数对它进行操作...我们回到stocks这个DataFrame: stocks 我们可以创建一个格式化字符串的字典，用于对每一列进行格式化。

6.6K5 0

python数据科学系列：pandas入门详细教程

所以从这个角度讲，pandas数据创建的一种灵活方式就是通过字典或者嵌套字典，同时也自然衍生出了适用于series和dataframe的类似字典访问的接口，即通过loc索引访问。...切片形式访问时按行进行查询，又区分数字切片和标签切片两种情况：当输入数字索引切片时，类似于普通列表切片；当输入标签切片时，执行范围查询（即无需切片首末值存在于标签列中），包含两端标签结果，无匹配行时返回为空...get，由于series和dataframe均可以看做是类字典结构，所以也可使用字典中的get()方法，主要适用于不确定数据结构中是否包含该标签时，与字典的get方法完全一致 ?...（通过axis参数设置对行还是对列，默认是行），仅接收函数作为参数 ?...例如，以某列取值为重整后行标签，以另一列取值作为重整后的列标签，以其他列取值作为填充value，即实现了数据表的行列重整。

14.9K2 0

pandas教程（一）Series与DataFrame

其由两部分组成：实际的数据、描述这些数据的元数据此外小编为你准备了：Python系列开始使用pandas，你需要熟悉它的两个重要的数据结构： Series：是一个值的序列，它只有一个列，以及索引。...Python字典中，你可以通过传递字典来从这些数据创建一个Series： In [16]: sdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000...一个Datarame表示一个表格，类似电子表格的数据结构，包含一个经过排序的列表集，它们每一个都可以有不同的类型值（数字，字符串，布尔等等）。...在底层，数据是作为一个或多个二维数组存储的，而不是列表，字典，或其它一维的数组集合。...中的一列可以通过字典记法或属性来检索： In [7]: frame2['state'] Out[7]: one Ohio two Ohio three Ohio four

9332 0

Pandas全景透视：解锁数据科学的黄金钥匙

它由两部分组成：索引（Index）和值（Values）。索引（Index）：索引是用于标识每个元素的标签，可以是整数、字符串、日期等类型的数据。...索引提供了对 Series 中数据的标签化访问方式。值（Values）：值是 Series 中存储的实际数据，可以是任何数据类型，如整数、浮点数、字符串等。...了解完这些，接下来，让我们一起探索 Pandas 中那些不可或缺的常用函数，掌握数据分析的关键技能。①.map() 函数用于根据传入的字典或函数，对 Series 中的每个元素进行映射或转换。...具体来说，map()函数可以接受一个字典或一个函数作为参数，然后根据这个字典或函数对 Series 中的每个元素进行映射或转换，生成一个新的 Series，并返回该 Series。...如果传入的是一个字典，则 map() 函数将会使用字典中键对应的值来替换 Series 中的元素。如果传入的是一个函数，则 map() 函数将会使用该函数对 Series 中的每个元素进行转换。

1171 0

10个快速入门Query函数使用的Pandas的查询示例

PANDAS DATAFRAME（.loc和.iloc）属性用于根据行和列标签和索引提取数据集的子集。因此，它并不具备查询的灵活性。...在后端pandas使用eval()函数对该表达式进行解析和求值，并返回表达式被求值为TRUE的数据子集或记录。所以要过滤pandas DataFrame，需要做的就是在查询函数中指定条件即可。...请Query（）表达式已经是字符串。那么如何在另一个字符串中写一个字符串？将文本值包装在单个引号“”中，就可以了。...示例5 想获得即状态“未发货”所有记录，可以在query（）表达式中写成如下的形式： df.query("Status == 'Not Shipped'") 它返回所有记录，其中状态列包含值 - “未发货...日期时间列过滤使用Query（）函数在日期时间值上进行查询的唯一要求是，包含这些值的列应为数据类型dateTime64 [ns] 在示例数据中，OrderDate列是日期时间，但是我们的df其解析为字符串

4.4K2 0

10快速入门Query函数使用的Pandas的查询示例

PANDAS DATAFRAME（.loc和.iloc）属性用于根据行和列标签和索引提取数据集的子集。因此，它并不具备查询的灵活性。...它返回了数量为95的所有行。如果用一般查询的方式可以写成： df [df [“Quantity”] == 95] 但是，如果想在同一列中再包含一个条件怎么办？...最简单的答案是在条件之前使用not关键字或否定操作符〜 df.query("not (Quantity == 95)") 结果它包含数量不是95的所有行。...请Query（）表达式已经是字符串。那么如何在另一个字符串中写一个字符串？...日期时间列过滤使用Query（）函数在日期时间值上进行查询的唯一要求是，包含这些值的列应为数据类型dateTime64 [ns] 在示例数据中，OrderDate列是日期时间，但是我们的df其解析为字符串

4.5K1 0

Pandas知识点-缺失值处理

数据处理过程中，经常会遇到数据有缺失值的情况，本文介绍如何用Pandas处理数据中的缺失值。一、什么是缺失值对数据而言，缺失值分为两种，一种是Pandas中的空值，另一种是自定义的缺失值。 1....自定义缺失值的判断和替换 isin(values): 判断Series或DataFrame中是否包含某些值，可以传入一个可迭代对象、Series、DataFrame或字典。...to_replace和value不仅支持Python中的整型、字符串、列表、字典等，还支持正则表达式。...如果数据很多，我们不可能肉眼观察返回结果中的布尔值，所以需要借助numpy中的any()函数或all()函数，进一步对结果进行判断。...subset: 删除空值时，只判断subset指定的列(或行)的子集，其他列(或行)中的空值忽略，不处理。当按行进行删除时，subset设置成列的子集，反之。

4.9K4 0

Python可视化数据分析05、Pandas数据分析

Series Series是一种类似于一维数组的对象，它由一组数据以及一组与之相关的数据标签（索引）组成，创建Series对象的语法如下： #导入Pandas模块中的Series类 from Pandas...对Series对象进行NumPy数组运算，都会保留索引和值之间的连接。将Series看成是一个定长的有序字典，因为它是一个索引值到数据值的一个映射。 ...它包含一个经过排序的列表集，列表集中的每个数据都可以有不同的类型值（数字、字符串、布尔等）。...返回Index中唯一的数组 Series对象和DateFrame对象中的索引值不只是整数，还可以是字符串。...() # 对Series数组进行排序 print(uniques) # 计算Series数组各值出现的频率 print(obj.value_counts()) # obj各值是否包含于["b","c"

2.5K2 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云