我有一个数据帧“测试”。我已经根据嵌套的groupby规则对这样的数据帧进行了分组,这似乎工作得很好。如果我遍历新创建的组并简单地使用一条print语句: print(group) 我得到了: <pandas.core.groupby.generic.DataFrameGroupBy object at 0x7fdfb97b0710> 但是,如果我尝试: group.describe() 我得到以下错误: raise ValueError("Empty data passed with indices specified.")
ValueError: Empt
我想要处理我的excel文件tb.xlsx,并按名为“混合类型”的列对数据进行分组,然后将新数据帧存储回另一个excel文件中。 import numpy as np
import pandas as pd
df=pd.read_excel("D:\\tb.xlsx")
group=df.groupby("Hybrid type")
print(group)
df1=pd.DataFrame(columns=df.columns)
for Hybridtype,frame in group:
df2=pd.DataFrame(frame)
df
我想使用优先级和别名列的唯一值对此数据帧进行分组,以创建latex报告:
Alias Number Duration(h) priority
A 23834 8111.130497 120
B 16453 6773.243598 120
C 15988 8347.042753 120
A 19 113.475702 139
B 16 113.476042 139
所以我试着:
我将一个数据集从CSV文件导入到Python中的dataframe。我想从这个dataframe中删除一些特定的行,并将它们附加到一个空的dataframe。到目前为止,我已经尝试从名为df的“大”数据帧中删除第1行和第0行,并使用以下代码将它们放入dff中:
dff = pd.DataFrame() #Create empty dataframe
for x in range(0, 2):
dff = dff.append(df.iloc[x]) #Append the first 2 rows from df to dff
#How to remove appended
我有一个列表,其中包含大约45个8列的数据帧。现在,我想根据特定列中出现的特定值来设置数据帧的子集。代码: for z in list_dataframes:
if(z['Segmentation']=="FAST"):
list_fast.append(z) 给我一个错误,说明一个级数的真值是模棱两可的。有人能告诉我怎么解决这个问题吗?附注:另一个完全不同的问题是如何从包含空和非空数据帧的数据帧列表中删除空数据帧。
我有一个数据帧,看起来像这样 a b z
1 NULL NULL ... 1
2 NULL 1 ... NULL
3 1 NULL ... NULL 第一列始终是填充的,并且在它的右侧还有许多其他列。在列A到Z中,一列被填充,其余的不被填充。 我想把这个数据帧转换成一个两列的数据帧,在第二列中包含从a列到z列的标题。上面的例子将被转换成这样。 The_Column
1 z
2 b
3 a pandas.melt()函数接近于我所需要的,但它不处理空值。我只关心B到Z列中填充的一个单元格。 有没有一种优雅的方法来处理这个问题?
我有一个名为frames的字典,里面有数据帧,它根据不同的因素总结了我的数据源。
其中一些组合返回空摘要,这些数据帧也是空的。
我的问题是如何从我的字典中删除这些空的数据帧?我尝试了下面的方法,但它们仍然存在。
new_frames = {k:v for (k,v) in frames.items() if v is not None}
谢谢
我有数据帧,必须初始化为空数据帧。现在我只有可用的列,我想将它添加到空的数据帧中。我怎么能做到呢?我不知道预先列的长度是多少。
示例
df = data.frame(a= NA, b = NA, col1= NA)
....
nrow(col1) # Here I will know length of column, and I only have one column available here.
df$col1 <- col1
错误如下:
Error in `$<-.data.frame`(`*tmp*`, "a", value = c("1"
我已经创建了很多数据帧作为预处理的一部分。由于我限制了6 6GB的内存,我想从内存中删除所有不必要的数据帧,以避免在scikit-learn中运行GRIDSEARCHCV时耗尽内存。
1)是否有一个函数可以只列出当前加载到内存中的所有数据帧?
我尝试了dir(),但它提供了许多数据帧以外的其他对象。
2)我创建了一个要删除的数据帧列表
del_df=[Gender_dummies,
capsule_trans,
col,
concat_df_list,
coup_CAPSULE_dummies]
范围(&R)
for i in del_df:
del (i)
但它不会删
我是熊猫和蟒蛇的新手。 我尝试按一列对项目进行分组,并按组列出数据框中的信息。 我的数据帧: B C D E F
1 Honda USA 2000 Washington New
2 Honda USA 2001 Salt Lake Used
3 Ford Canada 2005 Washington New
4 Toyota US
我有一个从Excel导入的数据帧。导入后,我检查了有很多 NAN 数据帧中的值。当我将dataframe列转换为Str对象时。没有剩余的NaN值。我的意思是,dataframe不能再计算NaN值了。那些 NAN 值显示为 nan 在数据帧中。我真的想要那些 NAN 数据框中的空单元格,如Excel。有什么建议吗?
我希望从dataframe的右侧删除nan 空白列。样本数据结构:
nan A B C nan nan nan
nan Singh raj roy 1 nan nan
nan rax rqa 1 3 nan nan
我试图从数据帧的右侧移除完全为空的nan列。
预期产出:
nan A B C nan
nan Singh raj roy 1
nan rax rqa 1 3
有人能帮我取得成果吗。