使用数据集替换使用Python或pandas的另一个数据集中的值

、、、、

我有一个巨大的数据集'A‘，用于汽车的价格预测，其中包含某些列。其中一列是“城市”，我想给每个城市排名，以便将其用于ML算法。这些城市超过50个，所以在运行时替换并不会使代码看起来很好。我想创建一个包含“城市”和“排名”的.csv，并替换和使用数据集“A”中的“排名”。我如何在python或pandas中做到这一点？任何示例或<

浏览 24提问于2019-10-26得票数 0

1回答

PYTHON:使用熊猫库将转换的连续属性(转换为分类)附加到原始数据集中

、

我对python很陌生，我想用熊猫库来实现朴素的Bayes分类器。为此，我希望将所有连续属性转换为范畴属性，反之亦然。现在，我将连续属性转换为方法。我使用了等宽的</

浏览 1提问于2015-04-05得票数 1

回答已采纳

4回答

在Python数据集中只保留每行的最低值

、

在Pandas数据集中，我只想保持每行的最低值。所有其他值都应删除。我需要完整的原始数据集。只需删除不是最小值的所有值(用NaN替换)即可。谢谢罗伯特

浏览 2提问于2014-11-11得票数 1

回答已采纳

1回答

是否有一个python函数可以在时间序列数据集中找到一行中多个相同的值？

、、、

我正在处理2020年每分钟汇总的大型时间序列数据集。该数据集是从监测热电厂设备的传感器获取的值。传感器测量温度、压力、电流等值，并在每次读数时更新数据集。我希望检测由传感器引起的数据集中的错误。当来自传感器的输入被固定在某个值上时，来自传感器的一种错误类型发生。例如，其中一个温度传感器连续2

浏览 37提问于2021-01-26得票数 0

1回答

用于提供类别概率统计信息的SAS操作

我有一个名义值的向量，我需要知道每个名义值出现的概率。基本上，我需要它们来获得观察到标称值的概率的min, max, mean, std，并获得Class Entropy值。例如，假设有一个数据集，其中目标预测0、1或2。在训练数据集中。我们可以计算目标为1的记录的数量，并将其称为n_1，类似地，我们可以定义n_0和n_2。然后

浏览 15提问于2020-02-12得票数 0

回答已采纳

1回答

获取训练和测试数据的假人

我是否应该将pd.get_dummies()应用于培训和测试数据？会不会导致数据泄漏？

浏览 0提问于2022-01-08得票数 1

1回答

如何准备熊猫的纵向数据，然后从学习算法中使用？

、、

我正在使用Pandas清理和准备我的数据集，以供学习算法使用，例如用于分类的随机森林或用于聚类的K-means。我曾经有过这样的数据集(举例说明)：然而，在我的数据集中，我面对的是一种不同的类型:纵向数据，如下图所示：正如您所看到的，对于每个单独<em

浏览 3提问于2015-03-29得票数 1

2回答

如何在R中加速tryCatch函数？

、

我正在尝试从R中的模型预测测试数据集，因为缺少一些因素，所以我想在创建输出时只跳过或替换这些因素。替换该值，甚至使用另一个模型。问题是，这需要永远的时间。我有一个6米长的数据集，它看起来需要大约7天的时间才能运行(基于较小数据集的计算)。运行同样的命令只需要不到一个小时<em

浏览 1提问于2014-09-14得票数 3

1回答

如何使用熊猫dataframe向基于另一个df中匹配列的数据标记为1或0的dataframe添加列

、、

我正在为机器学习算法标记一些医疗保险数据集，使用Pandas数据作为欺诈性或非欺骗性数据。标签包括将DMPOES数据集中的NPI编号与LEIE数据集中的NPI编号相匹配。每个数据集都包含一个名为"NPI“的列。我需要能够找出DMEPOS数据集中的每

浏览 4提问于2021-03-28得票数 0

3回答

在SAS上，合并、追加和合并有什么区别？

我试图在SAS上运行代码来连接、追加和合并，但无法理解它们之间的区别。寻找一些人来帮助我理解同样的例子。

浏览 3提问于2016-03-23得票数 0

2回答

如何处理数据集中的缺失值

、、

我有一个简单的分类问题，我正试图通过使用keras的神经网络来解决这个问题。有一个数值数据集，大小为26000 *17。但问题是，数据集中有很多缺失值(空值)。数据是非常敏感的，所以我既不能忽略所有包含空值的行，也不能用average、mean或任何标准数字替换数据中的空值。

浏览 0提问于2018-12-27得票数 4

1回答

比较变量的水平

是否有方法将数据集中的变量级别与另一个数据集进行比较，以检查编码是否已更改？寻找一种在R或Python中实现这一功能的方法。谢谢!编辑:我正在寻找一种方法来寻找数据集编码中的差异(例如，变量可以采取的变量/值的级别-它们是否报告不同)。我想用Python或R来做这件事，我希望这能澄清

浏览 2提问于2022-03-23得票数 -1

2回答

Pandas:如何拆分和读取值

、

在我的数据集中，有一列包含学生选修的课程的名称。它有多个值我的数据集是这样的：current dataset 我希望将其更改为如下所示的数据集：wantDatasetLikethis 我希望将这些值(课程名称)分开，分别为每门课程创建列，并根据学生所选的课程分配值1或0。我如何使用<

浏览 23提问于2021-09-28得票数 0

回答已采纳

1回答

ValueError:输入包含NaN、无穷大或对于dtype('float64')来说太大的值。如何处理这个错误？

、、、、

首先，在数据集中，我使用均值策略将所有缺少的值替换为计算机类，但它已将其替换为数据集中的大值，这导致了此错误。这个问题的解决方案是什么，或者我如何将值四舍五入到小数点后两位。由于数据集包含浮点值，将它们四舍五入到小数点后2位或3位对我来说是可行的。代码： import num

浏览 9提问于2020-06-09得票数 1

回答已采纳

2回答

使用替换对R中的数据帧的随机行进行采样

、、

我希望能够使用bootstrapping为一些测试统计数据生成一些置信区间。我希望能够做的是使用原始数据集的采样和替换来绘制引导数据集。我假设这将是一个大小为n的数据集(其中n小于原始数据集的大小)，它从具有替换的完整数据集中采样观察<em

浏览 0提问于2018-09-11得票数 0

1回答

通过检查大熊猫中的条件动态创建列

、

我有如下所示的数据集：它需要根据下面的master数据集进行检查：这里的条件是检查Group及其值与主数据集的关联值，并从主数据集中选择S2SFlag列值，并在数据集中创建S2SFlag通过使用AWS Lambda查询数据库返回原始数据</em

浏览 4提问于2022-02-08得票数 0

回答已采纳

1回答

如何比较列子集上的两个数据格式之间的所有行匹配？

、、、、

我有两个数据集，input和output，在输入上进行了一些数据转换，以获得结果输出，其中没有。对于具有列标题的行和列，则保持不变。我需要比较并确保所有非转换(58)列的输入和输出之间的所有行和列数据匹配(忽略两个转换的列)。到目前为止，我所做的(<em

浏览 0提问于2021-02-02得票数 0

1回答

大量数据，试图在一列中替换分隔符字符，但不是所有分隔符字符。

、、、、

我试图用Pandas分析一个数据集(200 by，~3mil行)，但是这个数据集包含一个由随机用户填充的列，其中允许所有字符。这造成了分隔符字符(\t)也经常出现在最后一列中的问题。在GVIM中，我尝试搜索和替换所有的'\t's，但是这也取代了实际的分隔符(在GVIM中没有显示)。有没有人知道如何在大数据集中的某一列中具体替换字符？例如，我所拥

浏览 8提问于2016-04-11得票数 2

回答已采纳

1回答

训练和测试数据集作为4个不同的数据集给出

、

我是python的新手，非常希望能得到一些帮助。数据集如下：我将非常感谢任何建议或解决方案。

浏览 0提问于2019-10-15得票数 0

1回答

如何为给定列添加行和值？

、、

因此，我现在有以下DataFrame，其值如下：+-------+--------++-------+--------++-------+--------+ 其中时间没有值(或为空)。稍后，我将在我的程序中添加更多的行，并且需要为值和时间列添加/追加值。我该怎么做？

浏览 5提问于2017-06-26得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

PYTHON:使用熊猫库将转换的连续属性(转换为分类)附加到原始数据集中

在Python数据集中只保留每行的最低值

是否有一个python函数可以在时间序列数据集中找到一行中多个相同的值？

用于提供类别概率统计信息的SAS操作

获取训练和测试数据的假人

如何准备熊猫的纵向数据，然后从学习算法中使用？

如何在R中加速tryCatch函数？

如何使用熊猫dataframe向基于另一个df中匹配列的数据标记为1或0的dataframe添加列

在SAS上，合并、追加和合并有什么区别？

如何处理数据集中的缺失值

比较变量的水平

Pandas:如何拆分和读取值

ValueError:输入包含NaN、无穷大或对于dtype('float64')来说太大的值。如何处理这个错误？

使用替换对R中的数据帧的随机行进行采样

通过检查大熊猫中的条件动态创建列

如何比较列子集上的两个数据格式之间的所有行匹配？

大量数据，试图在一列中替换分隔符字符，但不是所有分隔符字符。

训练和测试数据集作为4个不同的数据集给出

如何为给定列添加行和值？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐