我一直在尝试一些for循环和函数,但我不能完全让它们工作。我生成了四列随机数,每列300行,并将它们收集到一个数据帧中。
numbers <- runif(300, min = 0, max = 250)
numbers <- as.data.frame(numbers)
numbers$numbers2 <- runif(300, min = 0, max = 300)
numbers$numbers3 <- runif(300, min = 0, max = 350)
numbers$numbers4 <- runif(300, min = 0, ma
有一个包含3列A、B和C的pandas数据帧
Id Date Latitude Longitude
9497 2017-03-03 44.149147 -70.230300
914 2017-02-27 38.832256 -104.761086
我想遍历dataframe并在for循环中创建一个新列。
我试着用下面的代码,但我得到了错误“列未定义”。任何建议都会很有帮助。
for index,row in df2.iterrows():
value = Geohash.encode(row['Latitude
我不确定如何才能在不出错的情况下做到这一点。这是我的问题的一个简化示例。
假设我有这个数据帧DF
a b c d
1 2 3 4
2 3 4 5
3 4 5 6
然后我有一个变量
x <- min(c(1,2,3))
现在我想做以下事情
y <- DF[a == x]
但是当我尝试引用像"x“这样的变量时,我得到了一个错误,因为R正在我的数据框中查找列"x”。我得到“未定义的列选择”错误
我如何在R中做我想做的事情?
我正在处理两个数据帧,A和B。数据帧A是用值填充的,而数据帧B是空的,除了报头结构。我想取数据帧A中的列的值,并将它们附加到数据帧B的相应列中。 我已经将dataframe A列的值放到了一个列表中。我尝试将目标列值设置为与起始列值列表相等,但出现了以下错误: dataframeB[x] = list(dataframeA[A]) 这会产生以下错误: ValueError: Length of values does not match length of index 我预期结果是Dataframe A的列A转移到Dataframe B的列x A B C D
1 2 3
我正在尝试使用rlm函数来创建一个线性模型来测试我的训练数据。具体来说,数据帧trainingData包含100个预测器(红外波长从852 to到1050 to)和1个观测值(Fat)。然而,当我试图创建一个稳健的线性模型(rlm)的数据,我得到以下错误。
“.data.frame(mf,xvars)中的错误:选定的未定义列”
我试图用Fat观测来模拟所有的红外波长,这些都包含在数据帧trainingData中。
#Loading the "Tecator" data into R
data(tecator)
#Naming columns for easier inter
我有一个数据帧,我想再添加一列
数据帧有29793行。因此,我希望新列继续到数据帧的末尾。
我尝试了一些东西。在乞讨中,声明列和类似于activity = ["sitting"]的值
然后,我尝试添加到现有的数据框架中。
a['activity'] = activity
但是我得到了以下错误
ValueError: Length of values does not match the length of the index
如何解决这个问题。有什么想法吗?
编辑:
是否有一种方法可以在数据帧(左侧)的乞讨中添加列,因为现在该列被追加在右侧。
我在一个循环中从一个大的数据帧中创建了子数据帧,并且我一直在尝试在循环中的那些子数据帧上创建一个列:
Partidas=data2['Partida'].unique()
Partida2=[w.replace(' ','_') for w in Partidas]
for i, j in zip(Partidas,Partida2):
globals()['%s' % j]=data2.loc[data2['Partida']==i]
for k in globals().items()
[
我有一个列表,其中包含大约45个8列的数据帧。现在,我想根据特定列中出现的特定值来设置数据帧的子集。代码: for z in list_dataframes:
if(z['Segmentation']=="FAST"):
list_fast.append(z) 给我一个错误,说明一个级数的真值是模棱两可的。有人能告诉我怎么解决这个问题吗?附注:另一个完全不同的问题是如何从包含空和非空数据帧的数据帧列表中删除空数据帧。
我有一个数据帧df,其中已经有多个数据列。我有一个向量,namevector,全是字符串。我需要用来自namevector的列名将空列添加到df。
我正在尝试使用这个for循环添加列,迭代namevector中的每个字符串。
for (i in length(namevector)) {
df[, i] <- NA
}
但是我留下了这个错误:
[<-.data.frame(*tmp*,,i, = NA)中的值错误:新列将在现有列之后留下空洞
或者,我想过创建一个具有正确名称的空数据帧,然后将两个数据帧cbind-ing在一起,但不确定如何进行编码。
我该如何着手解决这个问题呢
我正在通过列名列表选择数据帧的多个列。如果列表的所有元素都在数据帧中,则可以很好地工作。但是如果列表中的某些元素不在索引中,那么它将生成错误"not in DataFrame“。 有没有一种方法可以选择该列表中包含的所有列,即使列表中的所有元素都包含在数据帧中?以下是一些生成上述错误的示例数据: df = pd.DataFrame( [[0,1,2]], columns=list('ABC') )
lst = list('ARB')
data = df[lst] # error: not in index
考虑下面的数据帧和迭代:
pdata= {'col1': [1, 2], 'col2': [3, 4]}
pdata= pd.DataFrame(data=pdata)
for i in [pdata, vdata, odata]:
i.index = i.iloc[:, 0]
如果未定义pdata、vdata或odata中的任何一个,Python将抛出错误:
NameError: name 'vdata' is not defined
有时,我想在尚未定义vdata和odata时运行该命令。告诉python对列表中已定义的对象执行
不幸的是,我无法生成一个可复制的示例,但这是我遇到的问题-使用一个数据帧,我能够循环列并保存每列的唯一值计数。对于另一个数据帧,它与第一个数据帧具有完全相同的列和数据-唯一的区别是第二个数据帧都是对象数据类型,而第一个数据帧具有一些整数和浮点数-我遇到了一个'unhashable type:'dict'‘错误。 这是可行的: for col in olddf.columns:
unique = len(olddf[col].unique())
print(col, unique) 我得到一个不可散列的类型:'dict‘错误,如下所示: for
我有一个8450行16列的数组。我想将这些数据点输入到RNN中,每个50点是一个条目。因此,0-49是z=0,1-50是z=1,依此类推。列需要保持不变,这样我在每个z轴条目中仍然可以拥有相同的数据。所以基本上我把50个点的每一块都移到第三个轴上。有没有简单的方法来做这个python?我尝试了重塑,但我可能做得不正确。目前数据在pandas数据帧中。 points = 50
for i in range(len(data_prepped_dataframe)-points):
x_data = data_prepped_dataframe.iloc[i:i+points,:] 到目