在foor循环中为数据集创建新列- Pandas Python_在for循环中为pandas数据帧创建新列_基于不同的数据集在循环中创建新列 - 腾讯云开发者社区

python、pandas

我有一个包含前一年学生出勤数据的数据框架。它看起来像这样，有许多列显示不同的日期，数字显示他们是否参加了该日期。因此，我尝试在数据集中创建另一个名为'StartDate‘的列，它显示孩子第一次参加会议的日期-因此他们要么收到0、1或2，要么代表出席。但我似乎不能列一列，并在其中添加每个学生的开始日期。上面注释掉的代码行给出了以下错误- KeyError：'StartDate‘ 有人知道怎么做吗？提前感谢

浏览 13提问于2020-05-01得票数 0

回答已采纳

1回答

Pandas中HDF文件帧中列的附加

python、csv、pandas、hdf5

我正在处理一个CSV格式的大型数据集。我正在尝试一列一列地处理数据，然后将数据附加到HDF文件中的框架中。所有这些都是用Pandas来完成的。我的动机是，虽然整个数据集比物理内存大得多，但列大小是可管理的。在稍后阶段，我将一个一个地将列加载回内存并对它们进行操作，从而执行按特性进行的逻辑回归。我能够创建一个新的HDF文件，并使用第一列</

浏览 3提问于2013-12-06得票数 10

回答已采纳

1回答

串联成数据帧时创建的NaN列

python-3.x、pandas、dataframe

我已经创建了一个输出变量'a = pd.Series()'，然后使用一个for循环运行多个模拟，该循环使用以下代码将临时存储在'x‘中的模拟结果附加到连续列中的'a’，每个列都重命名为与模拟编号一致，从第0个位置开始： a = pandas.concat([a, x.rename(sim_count)], axis=1) 由于某种原因，结果数据帧在我的第一列模拟结果的左侧包含了一列"N

浏览 33提问于2019-04-02得票数 0

回答已采纳

1回答

在for循环中为pandas数据帧创建新列

pandas

有一个包含3列A、B和C的pandas数据帧9497 2017-03-03 44.149147 -70.230300914 2017-02-27 38.832256 -104.761086 我想遍历dataframe并在for循环中创建一个新列。我试着用下面的代码，但我得到了错误“列未定义”。任何建议都会很有帮助。

浏览 4提问于2017-03-16得票数 1

回答已采纳

1回答

Python Pandas在循环中创建新列

python、loops、pandas

我正在尝试通过划分两列来为每一列创建一个新列。df是一个熊猫数据帧...for column_1 in columns: df[new_column] = df[column_1] / df[column_2] 获取

浏览 0提问于2015-09-12得票数 3

1回答

如何编码具有大量值的CATEGORICAL_COLUMNS？

pandas、tensorflow、machine-learning、scikit-learn

我正在使用Tensorflow、python、Pandas创建一个类似于此的logistic回归模型。我使用的不是MNist数据集，而是我自己的数据集。我使用Pandas创建数据格式，将nulls替换为填充it函数，然后使用from_tensor_slices将其转换为张量数据集。但问题是，我的分类列有很大的词汇表(Ex: Zipcode.我的数据中有数千个邮政

浏览 2提问于2020-03-30得票数 0

回答已采纳

2回答

使用Pandas将groupby聚合应用于原始数据框

python、pandas、group-by

我想做一些在电子表格中看起来很简单的事情，但是我不能理解pandas中的语法。我有一个可以分组的数据集。我想要确定每个组的聚合统计信息，然后使用聚合在原始数据框中创建一个新列。例如，如果我的数据框看起来像这样： d = pandas.dataframe({'class', : ['f1', 'f2', 'f3', 'f1

浏览 0提问于2017-10-15得票数 2

2回答

如何使用python* pandas或networkx lib对两个依赖列进行分组并生成新的唯一键？*

python、pandas、pandas-groupby、data-science、networkx

我们正在尝试创建新的标识号(唯一密钥)，用于使用python pandas或python网络图(Networkx Lib)查找唯一客户：两列相互依赖(反之亦然)，需要按这两列分组并生成新的唯一键。下面是python pandas dataframe中的示例数据列表。输入数据集： r_vid d_ph_nm d_flg DQLA853 6

浏览 27提问于2020-01-23得票数 4

回答已采纳

2回答

使用csv文件的一些数据创建数据集

python、pandas、csv

早上好，我试着用另一个数据集(实际上是csv文件)创建一个新的数据格式。在下面的代码中，我将df[1]和df[3]放在一起，因为我打算创建一个新的数据集，其中只有csv文件的这两列(第二和第四列) P.S:原始数据集包含75列** import pandas as pddf = pd.read_csv(r'C:\Use

浏览 6提问于2022-09-14得票数 0

回答已采纳

1回答

将行值解析为列，并使用查找值

python、pandas

我希望将行值解析为列，并使用它们在pandas数据帧中查找值import pandas as pd if sys.version_info[0] < 3: else:构建玩具数据集20;

浏览 1提问于2019-08-27得票数 1

1回答

将模式分配给pa.Table.from_pandas()

python、pandas、parquet、pyarrow

我在使用pyArrow将pandas.DF转换为parquet时遇到此错误：为了找出哪一列是问题所在，我在for循环中创建了一个新的df，首先是第一列</e

浏览 2提问于2018-03-30得票数 5

回答已采纳

1回答

pandas to_csv写入会一直消耗更多的内存，直到崩溃

python、python-3.x、pandas、memory-management、out-of-memory

更新:我已经意识到每次新的运行都会创建一个新的Python控制台，这会导致更多的内存消耗。我必须关闭为每次运行创建新控制台的设置。由于某些原因，当我升级到Pycharm pro时，这个功能会自动启用。我的项目创建了一个名为'pressure_drop‘的csv，我想使用下面的代码创建一个新的pandas数据帧。本例中的pressure_drop.csv有10150行和12

浏览 2提问于2020-04-27得票数 0

1回答

使用Python脚本根据PowerBI中的当前数据集创建新表

python、powerbi、powerbi-datasource

我有一个csv文件作为源数据集。目前在表中有一列，我想使用Python循环并从每个单元格的字符串中提取数据。例如，在单元格中：数量变化了10，价格变化了90。我想使用Python并提取"Quantity，Price“和"10，90”来创建具有这些属性和值的新表。然后使用Python创建视觉效果，而不是使用PowerBI视觉效果。我该怎么做呢？我想遍历Prope

浏览 18提问于2021-03-07得票数 0

3回答

pandas-gbq目前是否支持参数化查询？

python、pandas、google-bigquery

我需要使用Pandas/ Pandas -gbq在Python语言中创建一个简单的ETL管道，每天将给定日期范围内的数据从BigQuery读取到Pandas数据帧中，并根据查询结果创建单独的日表(写回BigQuery尽管可能有更好、更有效的方法(注意:我不是软件工程师)，但我目前正在研究BigQuery中的来参数化日期列，并在Python中的for循环中迭代这一过程。有人

浏览 2提问于2019-12-17得票数 2

1回答

Spark Dataframe在性能上如何优于Pandas* Dataframe？*

python、apache-spark、dataframe、pyspark、databricks

谁能解释一下为什么Spark Dataframe在执行时间上比Pandas Dataframes更好。我正在处理中等容量的数据，并进行python函数供电的转换import

浏览 0提问于2019-04-30得票数 3

2回答

SQLite中的上插/合并表

python、database、pandas、sqlite、merge

我在python中使用sqlite3创建了一个有数千个表的数据库。这些表中的每一个包含数千行和10列。其中一列是事件的日期和时间:它是一个格式化为YYYY-mm-dd HH:MM:SS的字符串，我将其定义为每个表的主键。我经常为这些表收集一些新的数据(数百行)。每个新数据集都从服务器中提取，并作为pandas数据帧直接加载或存储

浏览 0提问于2020-02-14得票数 0

回答已采纳

2回答

Python Panda错误TypeError:不支持/的操作数类型：'str‘和'int’

python、pandas

我正在学习如何在Python中使用Pandas。我对我的Panda数据帧进行数学运算时遇到了问题。现在我的数据帧看起来像这样： 0 1 2 3 4 5 6这会产生错误 TypeError: unsupported operand type(s) for /: 'str' and 'i

浏览 1提问于2016-11-22得票数 1

回答已采纳

1回答

滚动时间窗口功能-与Pandas的数据角力

python、pandas、feature-engineering

我有一个数据集，其中每条记录都包含比赛级别的数据，例如MATCH_DATE | PLAYER1 | PLAYER2 |锦标赛|表面| PLAYER1_SERVE% | PLAYER2_SERVE% 09DEC2020|迈克|吉姆|罗马公开赛|克莱| 65% | 70% 我正在尝试为每个“播放器和表面”创建基于滚动时间窗口的新列，例如LAST90DAYS_PLAYER1_CLAYSERVE%和LAST5MATCHES_PLAYER1然后，我需要将这些新<

浏览 20提问于2020-12-11得票数 0

1回答

检查Python中两个字符串列是否相互包含

python-3.x、pandas、string、dataframe

给定一个小的数据集如下：0 1 lol lolec2 3 ki pio3 4 iloc loc5 6 lambda lambda如果a等于b或的子字符串(反之亦然)，则创建一个具有值1的新列c，否则将其保持为

浏览 1提问于2021-08-02得票数 0

回答已采纳

1回答

如何根据列的值更改将Pandas数据分割为多个csvs

python-3.x、pandas、dataframe

因此，我有一个带有三维点云数据(X，Y，Z，Color)的数据：基本上，我需要根据颜色列(它的值为0、0.5和1)对数据进行分组。然而，我不需要一个整体分组(这很容易)。每当值发生变化时，我都需要它来创建新的数据格式。也就是说，我希望为每一组后面跟着并前面有5个零的行提供一个新的数据格式(因为单个零有时错误地出现在我感兴趣的数据块中)。

浏览 1提问于2022-10-24得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云