我有一个数据框,其中一列(B列)可以包含字母、数字或根本不包含任何内容。假设数据帧是: A B C
1 2 Dog
3 C Bird
30 nan Cat
11 4.1 Wolf 我想根据列B中是否有数字,有条件地获取行: A B C
1 2 Dog
11 4.1 Wolf 我发现可以通过输入df.loc[df["B"].notnull()]将数据帧限制为只包含值的行。我想知道的是,是否有一个等效版本的.notnull()可以只选择列B包含数字的行?
我想把这个数据帧放在单独的数据场中,或者是基于动态名称的列表(S N,H H,L S,O S.....),我按groupby累了,但似乎没有任何方法可以在不同的帧中中断相同的行值。
NAME VALUES
0 S N 1.74
1 S N 24.97
2 S N 10.49
3 H H 11.17
4 S N 5.99
5 H H 2.95
6 H H 16.13
7 H H 2.06
8 H H 6.87
9 S N
我有一个熊猫数据框,在不同的行上列出了常见的婴儿名字。我需要遍历每行中的每个名字,并检索字母表中每个字母作为婴儿名字的最后一个字符出现的次数。然后,我需要返回一个键和值的字典,其中键是26个字母表字母,值是字母表字母作为数据帧中所有婴儿名称的最后一个字符出现的频率。
我是否将for循环与正则表达式一起使用?我要用柜台吗?在将列转换为序列后,我是否使用字符串方法?
关于for循环和正则表达式,到目前为止我已经尝试过了:
import re
for index, row in male_names.iterrows():
male_last_letter_freq = row[
我有一个原始数据帧,有4列(在本例中我们称它们为product_id、year_month、week、order_amount)和> 50,000行。有240个单独的product_id值,每个值在数据中的行为都不同,因此我想从基于单个product_id的原始数据帧创建单独的数据帧。我可以通过以下方式做到这一点: dict_of_productid = {k: v for k, v in df.groupby('product_id)} 这创建了一个字典,它的键是product_id,值是列: product_id、year_month、week、order_amount。字
我有八个数据帧,所有这些都包含一个id字段,我想知道在所有八个数据帧中是否有任何id值是通用的。
我并不是在寻找一个交集(在中所有数据帧中的值都是通用的);我只是想知道它们出现在中的那些实例--其他数据帧的任何。
假设其中一个数据框架如下所示:
id TestDay
1 66 m
2 90 t
3 71 w
4 59 th
5 38 f
6 84 sa
7 15 su
8 89 m
9 18 t
10 93 w
11 88 th
12 42
我有一个从Excel导入的数据帧。导入后,我检查了有很多 NAN 数据帧中的值。当我将dataframe列转换为Str对象时。没有剩余的NaN值。我的意思是,dataframe不能再计算NaN值了。那些 NAN 值显示为 nan 在数据帧中。我真的想要那些 NAN 数据框中的空单元格,如Excel。有什么建议吗?
我有一个数据帧,我想再添加一列
数据帧有29793行。因此,我希望新列继续到数据帧的末尾。
我尝试了一些东西。在乞讨中,声明列和类似于activity = ["sitting"]的值
然后,我尝试添加到现有的数据框架中。
a['activity'] = activity
但是我得到了以下错误
ValueError: Length of values does not match the length of the index
如何解决这个问题。有什么想法吗?
编辑:
是否有一种方法可以在数据帧(左侧)的乞讨中添加列,因为现在该列被追加在右侧。
如果数据帧的列在字段中具有相同的值,则尝试将它们连接起来。我会自己解释的。假设我有这样的数据框架:
peter brian peter mike brian
2 3 4 5 6
4 6 1 7 5
然后,考虑到第一行中重复的值,将这些列连接起来:
peter brian mike
2 3 5
4 6 7
4 6
1 5
必须澄清的是,我不能通过直接调用名称("peter“