反规范化Pandas中的数据:如何创建col_1、col_2等并将现有值添加到列？

pandas

我有一个数据帧，看起来像这样： key file1 1235 ghi.pdf3 1235 jkl.pdf 4 1235 lmn.pdf与每个键相关联的文档数量是可变的。lmn.pdf 如果我尝试使用df.pivot，我会得到一个为每个文档名称命名的新列，这不是我想要的。我已经查看了Reshaping and pivot tables — pandas 1.1.0 documentation，但没有找到

浏览 32提问于2020-08-20得票数 1

回答已采纳

1回答

使用Python，我如何对符合条件的所有行(不包括当前行)进行分组和获取值。

python-3.x、pandas、dataframe、group-by

我有一个Pandas，包含2列，都有连续整数。在逐行的基础上，通过将col_1中的所有相等值分组，我试图在col_2中创建所有值的列表，不包括所讨论的行，并将其存储在一个新列(col_3)中。以下是完整的例子：col_1 col_2

浏览 6提问于2022-10-30得票数 0

回答已采纳

1回答

将列附加到Pandas Dataframe

python、pandas

在Pandas Dataframe上附加额外的列def dataSerialize(TagModel): test = """Month; Col_1; Col只有在.csv文件中，"Col_1“中的数据才从”月份“移动到数据。来自"Col_2“的数据移动

浏览 0提问于2020-04-09得票数 1

回答已采纳

2回答

用不同的标量多列熊猫数据

python、pandas、dataframe

我有一只熊猫DataFrame df和col_1, col_2, ..., col_n栏。我想把熊猫的每一栏数据乘以一个不同的标量，基于该栏。例如，将col_1中的每个元素乘以n_1，将col_2中的每个元素乘以n_2等等。，做这件事最简洁的方法是什么？目前，我的解决方案包括创建字典{col_1</e

浏览 3提问于2021-08-09得票数 0

2回答

awk集团&“减少”

awk、json、jq

假设我有如下数据：table_name col_1another_table_name id如何使用awk按第一列分组，并将第二列缩小为逗号分隔的列表？根据这个例子，输出应该是：another_table_name id,

浏览 0提问于2021-01-25得票数 1

回答已采纳

1回答

星火scala dataframe群

scala、apache-spark

我有这个dataframe，我想创建另一个类似于预期的数据。问题是，我想取同一组col_2的col_1 'a‘的值，并将它们放在不同的列中。有办法吗？#+-----+-----+-----+-#+-----+-----+-----+#| a|

浏览 4提问于2022-07-26得票数 0

回答已采纳

1回答

基于其他列值的Pyspark列

apache-spark、pyspark、apache-spark-sql

下面是我的数据col_1,col2 | x | y |...|n我想要在我的col_list列值中存在的concat列col_list | col_1| col_2 |..

浏览 3提问于2021-04-19得票数 0

回答已采纳

2回答

如何检查pandas数据帧中的每一列是否为浮点型或是否可以转换为整数

python、pandas

我正在将csv文件加载到pandas数据帧中，编辑它们并再次将其导出为csv (随着时间的推移，对许多不同的csv重复此过程)。有时，数据帧包含浮点值，而浮点值应该是整数，这导致我的导出最终无法使用。在下面的示例中，col_1只包含整数(并且只包含0和1)。col_2也只包含0和1，但作为浮点数。no col_1 col_2

浏览 273提问于2021-01-19得票数 0

回答已采纳

1回答

熊猫-对于每一组，如果一列中的字符串在另一列中，则添加到列中。

pandas、string、group-by

在组级别，如果另一列(col_2)中的字符串存在于原始列(Col_2)中的其他任何位置，那么如何将缺失字符串添加到列(col_2)？下面的示例数据显示了问题。import pandas as pd'ID': {0: 1, 1: 1, 2: 1, 3: 1, 4: 2,

浏览 3提问于2022-11-17得票数 1

回答已采纳

1回答

如何使用具有相同列名的向量设置某些行值？

python-3.x、pandas

我想要一个快速和有效的方法来设置列'col_1‘和列'col_2’的值在每一行与'id‘在'b'，'c’的基础上在另一个数据框中的值。下面是一个简单的例子，展示了我是如何使用df.update做到这一点的。data = {'id': ['a

浏览 14提问于2019-03-15得票数 2

回答已采纳

1回答

如何在一个混合了字符串和字符串列表的特定列中分隔包含列表的单元格？

python、pandas、dataframe、rows

我正在尝试用python组织一个pandas数据框，它具有以下伪结构(为了便于理解，我更改了变量名)： Initial_df 什么代码能够拆分col_1中的列表，使得该列只剩下单独的字符串，并且COL2中存在的这些单独字符串的计数根据从包含列表的行中获得的值进行调整。最终的数据框应如下所示： output_df

浏览 11提问于2020-10-11得票数 0

回答已采纳

2回答

如果值是整数，则如何将前导零添加到Dataframe列，条件是另一列的值？

python、pandas、dataframe、conditional-statements

在以下情况下，是否有一种向Dataframe列添加前导零的有效方法：col_2是整数值(即不是"text"或"text2")col_1 == "A" )。初始Dataframe： <e

浏览 4提问于2022-09-06得票数 -1

2回答

将数据帧从内部保存为循环

python、pandas、loops、for-loop

我有一个函数，它接受一个dataframe并返回一个(精简) dataframe，例如： ''' takes in df, groups col_1 accordingto col_2 and returns df &#

浏览 0提问于2019-05-22得票数 1

回答已采纳

3回答

我们能在德鲁伊进行改造吗？

scala、apache-spark、bigdata、druid、pydruid

我有一个场景，我将在csv文件中接收数据，在那里，我需要用现有的列生成一些列。示例：abc 1 No 123def1 Yes 345Col_1 Col_2 Col_3 Col_4 Col_5 Col_6 abc 1

浏览 6提问于2021-12-13得票数 3

3回答

如何使用来自另一个dataframe的新值更新？

python、pyspark

我有两个火花数据：|col_1 | col_2 | ... | col_n |和数据交换B： |col_1 |我想在spark中编写一个操作，其中我可以创建一个新的dataframe，其中包含来自dataframe A的行以及来自dataframe B的更新行和新行。首先，我创建了一个哈希列

浏览 3提问于2018-05-11得票数 4

回答已采纳

2回答

SQL用户定义函数的参数数量是否不确定？

mysql、sql、oracle、user-defined-functions

在Oracle和MySQL中，我如何创建一个接受无限数量参数的函数，以便可以像GREATEST(value1，value2，...)那样调用它？通过某种标准比较两个值非常容易，但是将“较大”的值传递给另一个比较似乎是我在SQL中做不到的。编辑(在Mike的评论之后)：我正在寻找一种比较多列的解决方案。具体来说，我的问题是如何将GREAT

浏览 4提问于2011-11-14得票数 6

回答已采纳

2回答

如何更新多行，基于多个条件？

spring、postgresql、spring-batch

我正在尝试为多行更新表中的单个列，但根据其他两列的唯一where条件，每行将具有不同的更新日期值。我正在从csv中读取数据，并简单地更新根据其他两列中的值的组合找到的行中的date列。我见过这个但是设置的值不是静态的，

浏览 25提问于2019-10-21得票数 2

3回答

在R中计算类别特定变量

我有大数据，col_1是第一类，col_2是第二类。我附上了一个样本表格(请参阅下图)。数据具有前四列(col_1、col_2、ice、fd)。我想要为col_1的每个类别生成变量"ice_new“，方法是将列fd的和作为分母，将不同col_2的"ice”值作为分子并将它们相加。我尝试在R中使用"a

浏览 18提问于2019-11-27得票数 0

2回答

熊猫在加载数据之前声明dtype

python、pandas

我对内存的使用有一个问题--我从DB中获取了相当多的数据，并将其注入到一个熊猫DataFrame中，在那里我做groub_by来列出一些DB不太擅长的东西。问题是，由于我获得了大约40列，熊猫并不是很好地确定每一列的dtype。我希望为每一列分别指定dtype，这样熊猫就不会在任何地方使用object dtype来使用这么多内存。我知道，我可以在事后对数据进行转换，但这并不能解决R

浏览 4提问于2022-11-21得票数 1

2回答

SQL或R:从具有二进制数据类型的列中查找和显示所有'1's的索引，并存储在另一个或多个列中。

mysql、r、indexing、binary

我使用的是一个名为“data_1”的表，其中一列“col_1”具有二进制数据类型(Ex，1100000)。1)“col_2”存储值6和7，表示索引6和7处有'1's。2)或者我们可以将输出存储在多列'pos_ 1‘、

浏览 1提问于2019-05-17得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用Python，我如何对符合条件的所有行(不包括当前行)进行分组和获取值。

将列附加到Pandas Dataframe

用不同的标量多列熊猫数据

awk集团&“减少”

星火scala dataframe群

基于其他列值的Pyspark列

如何检查pandas数据帧中的每一列是否为浮点型或是否可以转换为整数

熊猫-对于每一组，如果一列中的字符串在另一列中，则添加到列中。

如何使用具有相同列名的向量设置某些行值？

如何在一个混合了字符串和字符串列表的特定列中分隔包含列表的单元格？

如果值是整数，则如何将前导零添加到Dataframe列，条件是另一列的值？

将数据帧从内部保存为循环

我们能在德鲁伊进行改造吗？

如何使用来自另一个dataframe的新值更新？

SQL用户定义函数的参数数量是否不确定？

如何更新多行，基于多个条件？

在R中计算类别特定变量

熊猫在加载数据之前声明dtype

SQL或R:从具有二进制数据类型的列中查找和显示所有'1's的索引，并存储在另一个或多个列中。

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐