我有一个数据框架, df = ( a = 1:0.1:10,
b = 1:0.2:20
) 我想对数据框元素进行操作,找出每个元素相对于列a and b中前一个元素的差异,并将结果存储在新的列da and db中。 示例 a b da db
1 1 Nan Nan
1.1 1.2 0.1 0.2
. . . .
. . . . 请针对此问题提出解决方案。 提前感谢!
是否有相当于dplyr的bind_cols和bind_rows的朱莉娅?具体来说,我正在寻找一个bind_rows函数,它将匹配列名,而不管顺序如何,并为不匹配的列填写NA
编辑:r两个方面的示例:
library(dplyr)
df1 = data.frame(a = 1, b = 1)
df2 = data.frame(b = 1, c = 1)
df3 = data.frame(c = 1, d = 1)
bind_rows(df1, df2)
a b c
1 1 1 NA
2 NA 1 1
bind_cols(df1, df3)
a b c d
1 1 1 1
我有这样的数据栏:
df = DataFrame(:num=>rand(0:10,20))
在df中,我想做另外两个数据文件:
df1 =计数器(df[!,:num)
拥有来自0 to 10的每个整数的频率。但是我需要排序的值从0到10:
0=>2
1=>3
2=>7
就这样..。
然后我想要一个新的dataframe df2,其中:
column_p = sum of occurrences of 9 and 10
column_n = sum of occurrences of 7 and 8
column_d = sum of occurrences of 0 t
我想使用PyJulia来加速代码的某些部分
import numpy as np
import julia
import pandas as pd
import random
from julia import Base
from julia import Main
from julia import DataFrames
n = 100000
randomlist = []
for i in range(0,n):
num = random.randint(1,100)
randomlist.append(num)
data = {
'Score'
我没有在R中使用DataFrame的经验,而且我实际上也不理解ModelMatrix。
我使用它将DataFrame对象转移到一个“矩阵”中,这个“矩阵”中有一个额外的列,它完全由1个值组成。这对于线性回归是有帮助的。然而,我发现Julia不支持ModelMatrix的矩阵乘法。
当我尝试的时候:
# feature is a DataFrames.ModelMatrix{Array{Float64,2}} object
println(feature' * feature)
我得到了以下错误:
ERROR: LoadError: MethodError: no method ma
我尝试使用for循环对一系列值进行计算。当这个循环结束时,我希望得到一个四行的csv文件,每行对应于每次迭代。 DD00 = readcsv(".../Output/y=0.0.csv")
DD0 = DD00[1,:]
for x in linspace(0.,π,4)
DD = readcsv(".../Output/y=$(x/π).csv")
writecsv(".../Output/DDD.csv", transpose(hcat(DD0,DD[1,:])))
end 我得到的是一个只有两行的csv文件。第一行是初
我正在构建一个数据框架,在其中一些列中,创建它们的明显方法涉及一个多步骤的过程。我想以具体和简洁的方式创建一个带有eltype Union{缺失,T}的列。然后,我可以使用多步过程填充该列(并在适当的情况下完成后不允许)。最干净的方法是什么?
我想做一些类似df[!, :col] :: Vector{Union{Int64, Missing}} .= missing的事情,但这给了"ArgumentError: column name :col not found in the data frame; ..."
如果我试着做df[!, :col] .= fill(missing
在我的例子中,我通过使用csv模块并像这样导入它来加载以下CSV数据(https://ourworldindata.org/coronavirus-source-data): using DataFrames
using CSV
raw = CSV.read("data.csv") 然后,我想通过索引来设置字符串列,如下所示: raw[1, :location] = "AA" 我得到了以下错误: setindex! not defined for CSV.Column{String,PooledString}
Stacktrace:
[1] error(