我使用Pandas已经有一段时间了,现在我正盯着下面的两个命令,思考两者之间的区别。
df1['Col1'] #Shows only the values of 'Col1' from df1 dataframe.
df1[['Col1','Col2']] #Shows the values of both 'Col1' and 'Col2' from df1 dataframe.
我的问题是,当我们能够在单方括号(‘')的帮助下访问一个列时,为什么我们不能同样地访问多个列
函数,该函数创建带有群集号
列的DataFrame
def pd_centers(featuresUsed, centers):
colNames = list(featuresUsed)
colNames.append('prediction')
# Zip with a column called 'prediction' (index)
Z = [np.append(A, index) for index, A in enumerate(centers)]
# Convert to pandas data fra
我的dataframe有40+列。我想要生成一个列表,每个列表包含一个列的值。下面是我试着做的事情
cols= df.columns
cols = cols.tolist()
for col in cols:
col = df.col.tolist()
错误:
'DataFrame‘对象没有属性'col’
因此,循环似乎试图在dataframe中找到“cols”,而不是从“cols”列表中获取该项目。
使用
A = df.A.tolist()
所以我猜我在循环中犯了个错误?
我有一个带有列标题和数据的文本文件。我正在尝试将这些文件数据转换成熊猫DataFrame。
文件:
#Columns: TargetDoc|GRank|LRank|Priority|Loc ID
aaaaa|1|1|Slow|8gkahinka.01
aaaaa|1|0|Slow|7nlafnjbaflnbja.01
我编写了以下代码:首先,我将每一行和尝试列表转换为Dataframe:
import os
import pandas as pd
with open("DocID101_201604070523.txt") as raw_file:
full_file
我正在尝试测试一个列是否被命名为特定的名称(然后我想对行名执行相同的操作)。因此,是否可以遍历每个列名以查看它是否相等?
示例:
dataframe:
Jan Feb Mar
Jan 0 0 0
Feb 0 0 0
Mar 0 0 0
逻辑:遍历每一列以查找是否称为"Jan“,并遍历每一行以查看是否称为"Feb”。如果满足逻辑,则在等效的列/行中放1。例如。
Final dataframe:
Jan Feb Mar
Jan 0
我试图遍历dataframe标头名称,并将每个名称分配给相应的列值,以便打印每个标头的名称,从而打印分配给该标头名称的列数据。当前代码:
import pandas as pd
filepath = "...data"
df = pd.DataFrame.from_csv(filepath, header=0, index_col=None)
for i in list(df):
print i
i = str(i)
i = df[i]
print(cal_z)
结果:
C:\...TFS_plot.py"
wavelength (nm
我有一个有四列的DataFrame。我想将这个DataFrame转换为python字典。我希望第一列的元素是keys,而同一行的其他列的元素是values。
DataFrame:
ID A B C
0 p 1 3 2
1 q 4 3 2
2 r 4 0 9
产出应如下:
字典:
{'p': [1,3,2], 'q': [4,3,2], 'r': [4,0,9]}
在试图从我的dataframe中删除列后,我收到了一个错误。KeyError:“在axis中找不到‘列名’”的建议是放置axis=1,但是我这样做了,我仍然收到相同的错误。我不知道,有什么问题。
for i in range(1,len(file_list)):
data = pd.read_table(file_list[i], encoding='unicode_escape')
df = pd.DataFrame(data)
main_dataframe = pd.concat([main_dataframe, df], axis = 1)
ma
我想从dataframe访问特定列的min和max,但是我没有该列的标题,只有它的编号,所以我应该使用scala吗?
也许是这样的:
val q = nextInt(ncol) //we pick a random value for a column number
col = df(q)
val minimum = col.min()
对不起,如果这个问题听起来很傻,但我找不到关于这个问题的任何信息:/
我试图在dataframe上选择一个列,但是我需要保留它的列名。把它想象成一列数据。例如,这就是我需要完成的:
df <- data.frame(col_a = c(1,2,3), col_b = c(5,2,8))
x <- df$col_a
colnames(x)
col_a # THIS VALUE IS WHAT I NEED
如果您向R请求向量的colname,它只返回NULL。这是有意义的,但如果它是数据文件的列,而不是简单的向量呢?
为什么需要这个?,我正在用ggplot2编写一个函数,我需要在lab中指定它用来绘制结果的列。如果可能的话,我不希望在函数上使用字符串文