如何在多个pandas数据帧中编码标签？_如何在现有pandas数据帧中应用编码_检查pandas数据帧中的列编码 - 腾讯云开发者社区

python、pandas

我有两个数据帧df1和df2 两者都有3列： c1, c2, c3 但是在df1的c3列中，我有这些独特的标签： l1, l2, l3, l4 在df2的c3列中，我有这些唯一的标签： l2, l3,l4, l5 我想对这些标签进行编码，这样df1的最后一个列值就会变成这样： 1, 2, 3, 4 和df2： 2, 3, 4, 5 因此编码后的标签在两个数据帧中应

浏览 9提问于2019-10-03得票数 0

4回答

将单热编码的数据帧列转换为一列

python、pandas、numpy、dataframe

在pandas数据帧中，一热编码向量以列的形式出现，即：1 0 0 1 0 03 0 0 0 1 04 0 0 0 0 1Row

浏览 3提问于2020-08-01得票数 8

1回答

使用Dask map_partitions将日期和时间从两列转换为单个datetime列

date、datetime、type-conversion、dask、dask-dataframe

如何转换此类型的两个日期和时间列：1/01/1990 10553/01/1990 10555/01/1990 1729

浏览 3提问于2020-05-13得票数 2

1回答

从pandas数据框列中查找相交或最近的地理坐标

python、pandas、geospatial

我有一个熊猫数据帧中的经纬度，经度和地址。用户输入一个地址，我想根据最后的long从pandas数据帧中查找相关的详细信息。下面是我的代码： &

浏览 32提问于2021-11-22得票数 0

2回答

发生这种情况是因为存在NaN吗？

python、pandas

我有一个浮点数列表，当我尝试将其转换为序列或数据帧时 code000002.SZ 1.771655 000004.SZ 2.649862

浏览 12提问于2020-12-23得票数 0

1回答

对多个dataframe使用mplcursor

python、pandas、matplotlib、hover、mplcursors

from matplotlib import pyplot as pltfrom pandas import DataFrame df = DataFrame；我想在使用多个数据帧和多个散点图时显示一个点的标签。当我使用多个数据帧和多个散点图时，即使当悬停在属于其他数据帧的其他点上时，它也只显示来自一个数据帧</e

浏览 9提问于2020-07-23得票数 2

回答已采纳

2回答

如何在“应用(pd.Series)”之后向原始熊猫数据框架插入新列

python、pandas

我有很多栏的熊猫数据框架。一个具有字典值的列。I需要将这些结果列插入原始df.。我不知道怎么做。

浏览 1提问于2021-09-22得票数 0

回答已采纳

1回答

处理标签编码的未知值

python、pandas、scikit-learn、dummy-variable、one-hot-encoding

如何在sk-学习中处理标签编码的未知值？标签编码器只有在检测到新标签的例外情况下才会爆炸。我的问题是，在我的管道交叉验证步骤中，未知标签会出现。基本的单热编码器可以选择忽略这种情况。先验pandas.getDumm

浏览 2提问于2016-10-29得票数 17

回答已采纳

7回答

Sklearn标签编码多列pandas数据帧

python、encoding、scikit-learn

我尝试在一个大型pandas数据帧中对包含分类数据("Yes"和"No")的多个列进行编码。完整的数据帧包含400多列，因此我在寻找一种方法来编码所有所需的列，而不必逐个编码。我使用Scikit-learn LabelEncoder对分类数据进行编码。数据帧的第一部分不一定要编码

浏览 3提问于2017-06-10得票数 16

8回答

熊猫按标签选择有时返回序列，有时返回DataFrame

python、pandas、dataframe、slice、series

在Pandas中，当我选择一个在索引中只有一个条目的标签时，我会得到一个Series，但是当我选择一个包含多个条目的条目时，我会得到一个数据框架。O

浏览 5提问于2013-12-04得票数 133

回答已采纳

1回答

如何使用Azure databricks在第二代ADLS的多张工作表中读写excel数据

python、pyspark、databricks、azure-databricks

我想使用pyspark在Azure databricks中实现以下逻辑。我有一个下面的文件，其中有多张纸。我想将所有工作表的数据读入一个不同的文件中，并将该文件写入到ADLS2中的某个位置。注意:所有工作表都有相同的模式( Id，名称)

浏览 4提问于2021-10-27得票数 0

1回答

Spark -评估问题

apache-spark、evaluation、anomaly-detection

该模型在输出中给出了ids及其对应错误结构(分数)的列表，ids根据此分数进行排序。比方说，分数越高，id越可疑。suspicious: c1,d5有什么想法吗？如果你能在spark中实现，你会很慷慨！

浏览 1提问于2017-08-12得票数 0

2回答

从dataframe中选择几列具有相同值而另一列具有不同值的行

python、pandas、dataframe

我有一个包含四个特征列和一个标签列的pandas数据帧。数据集有一些问题。有些行具有相同的特征值，但标记方式不同。我知道如何查找多个列的重复项 df[df.duplicated(keep=False)] 但是，如何找到标签冲突的重复特征？例如，在数据帧中，如下所示 a b c label1 1 1 2 x 2 1

浏览 92提问于2020-04-10得票数 2

回答已采纳

1回答

在spark数据帧上实现pythonic统计函数

pandas、apache-spark、pyspark、statistical-test

我在spark数据帧中有非常大的数据集，它们分布在节点上。我可以使用spark库pyspark.sql.functions进行简单的统计，如mean、stdev、skewness、kurtosis等。但为了做到这一点，我必须将spark数据帧转换为pandas，这意味着将数据强制到主节点中，如下所示： import scipy.stats as statsJBtest=st

浏览 30提问于2020-09-13得票数 0

1回答

一次热编码-将多列编码为一列

python、pandas

我想编码一个数据帧，它有多个相同“类型”的列，例如：1 Italy Frankfurt France Naples 如何通过传入应视为一列的索引，使用一种热编码对此数据</em

浏览 22提问于2018-02-08得票数 3

2回答

matplotlib中的自动缩放非数字轴

python、matplotlib、plot

如中所述，plt.margins非常适用于包含整型或浮点值形式的数据的自动缩放轴。但是，在绘制其他值时，例如字符串标签或pandas数据框索引，它似乎不起作用：ax = df.plot(marker='o', ls='')0,3,2,6])ax.margins(0.05) ax.set_xlim(-0.

浏览 2提问于2016-12-06得票数 1

1回答

使用dataframe和ndarray进行回归有什么区别？

pandas、numpy、scikit-learn

我想知道为什么在进行回归时需要将数据帧转换为ndarray，因为当我不转换数据帧时，截取和coef得到了相同的结果？import matplotlib.pyplot as pltimport pylab as plfrom sklearn

浏览 35提问于2020-04-13得票数 0

1回答

如何使用gzip模块打开csv文件

python、pandas、gzip

我希望读入一个与我的python脚本位于同一目录中的.csv.gz文件，只使用gzip和pandas模块。到目前为止，import pandas as pd如何在不使用csv模块的情况下将此文件转换/读取为数据帧，如类似回答的问题所示？

浏览 1提问于2021-03-16得票数 2

1回答

Python中dataframe列的多个IF条件

python、if-statement、dataframe

我有一个简单的数据，有两栏：“性”和“活着”。我想要做的是统计每种性别中有多少存活下来(由文件中的1表示)。

浏览 4提问于2015-12-17得票数 2

回答已采纳

1回答

逐行高效地构建pandas数据帧

python、pandas、dataframe

我最近一直在通过迭代多个文件、行等来构建pandas数据帧。我一直在通过在字典中附加项目，然后转换为数据帧来构建它们：据我所知，还有其他工具，如apply()和interrows()，用于逐行应用或筛选数据。这不是这个问题的主题。我还没有把它和pandas.DataFrame.append做比较。关于append，我有两个想法。一方面，创建一个(单行的)数据帧或序列只是为了追加它

浏览 0提问于2017-02-23得票数 5

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云