Julia中Dataframe列的向量

在Julia中，Dataframe是一种用于处理表格数据的数据结构。每个Dataframe对象由多个列组成，每个列可以看作是一个向量。

向量是一种有序的数据集合，可以包含不同的数据类型，如整数、浮点数、字符串等。在Julia中，可以使用Array类型来表示向量，也可以使用特定的数据结构，如Vector、AbstractVector等。

Dataframe中的每一列代表了数据表中的一列数据，可以通过列名或列索引来访问。可以对Dataframe进行各种操作，如添加、删除、修改和查询数据。常见的操作包括筛选数据、排序数据、计算列之间的关系等。

Dataframe的优势在于它提供了丰富的函数和工具，方便进行数据分析和处理。它可以与其他Julia的数据处理库和统计库无缝集成，如DataFramesMeta、StatsBase等。同时，Julia的高性能计算能力也使得对大规模数据进行高效处理成为可能。

在Julia中，有一些相关的包可以用于处理Dataframe，推荐的腾讯云相关产品包括Turing、DataFrames.jl等。Turing是一个用于概率编程和贝叶斯统计建模的包，可以与Dataframe一起使用。DataFrames.jl是Julia中用于数据处理和数据分析的核心包，提供了丰富的函数和工具，可用于处理Dataframe数据。

将表达式作为Julia函数中的参数

、

我正在尝试在Julia中实现OLS回归作为一种学习练习。我想要的一个特性是将公式作为参数(例如，'formula = Y ~ x1 + x2'，其中Y、x1和x2是DataFrame中的列)。这是一个。如何将公式/表达式“映射”到正确的DataFrame列？

浏览 2提问于2016-10-06得票数 2

2回答

我想将向量作为一列附加到空的DataFrame中。假设我定义了一个空DataFrame，如下所示： import DataFrames dataframe = DataFrames.DataFrame() 然后，我想将这个向量作为一列附加到dataframe中。 vec = [1,2,3] 我尝试了push!(dataframe , vec)，但是我得到了一个错误： DimensionMismatch("Length of `row` does not match `DataFrame` column count.") Stacktrace: [1] push!(df::

浏览 8提问于2022-04-12得票数 1

回答已采纳

2回答

在DataFrame中操作数据:如何计算列的平方

、、

我想要计算列A 1,2,3,4的平方，将其与其他计算一起处理存储在列C中 using CSV, DataFrames df = DataFrame(A = 1:4, B = ["M", "F", "F", "M"]) df.C = ((((df.A./2).^2).*3.14)./1000) 有没有更简单的方法来写它？

浏览 0提问于2020-07-09得票数 6

2回答

删除Julia中某列中的特定数据

我正在使用Julia分析我的数据，我的数据中有一些异常值，所以我想删除它们；有一些数据；例如，大于75的数字；我想排除它们。例如，使用DataFrames.jl时，df是一个数据集： julia> using DataFrames julia> df = DataFrame(A = 1:4, B = ["M", "F", "F", "M"]) 如何删除A列中的%1 这样做最好的代码是什么？谢谢

浏览 133提问于2019-05-10得票数 1

回答已采纳

1回答

具有特定列类型的Julia数据格式

、

我想要一个DataFrame，比方说大小N*K，我想要一些列是Float64，而其他列是Int64。是否有一种特定的方法来定义允许我这样做的DataFrame？这是我目前的做法： df = convert(DataFrame, zeros(Float64, (N, K))) df[:,K-2] = convert(Array{Int64,1}, df[:,K-2]) df[:,K-1] = convert(Array{Int64,1}, df[:,K-1])

浏览 6提问于2016-11-02得票数 2

回答已采纳

2回答

如何在Julia中按多列排序数据帧

我想按多列对数据帧进行排序。这是我制作的一个简单的数据框架。如何根据不同的排序类型对每一列进行排序？ using DataFrames DataFrame(b = ("Hi", "Med", "Hi", "Low"), levels = ("Med", "Hi", "Low"), x = ("A", "E", "I", "O"), y = (6, 3, 7, 2), z = (2,

浏览 6提问于2019-11-18得票数 3

回答已采纳

1回答

如何在Julia中将列数据类型从float更改为string？

、

我正在尝试从dataframe形式获取一个列-- float to string。我试过了 df = readtable("data.csv", coltypes = {String, String, String, String, String, Float64, Float64, String}); 但我被投诉了 syntax: { } vector syntax is discontinued 我也试过 dfB[:serial] = string(dfB[:serial]) 但也没用。因此，我想知道在Julia中更改列数据类型的正确方法是什么。 thx

浏览 3提问于2017-04-25得票数 2

回答已采纳

1回答

Julia DataFrame操作:连接数据行内容

、

我正在尝试连接与下面类似的DataFrame的行的内容： DataFrame(a=["aa","ab","ac"], year=[2015,2016,2017]) a year aa 2015 ab 2016 ac 2017 所需的输出将是转换为字符串的行单元格内容的串联 output aa2015 ab2016 ac2017 我发现这段代码在正确的方向上工作： df[:c] = map((x,y) -> string(x, y), df[:a], df[:year]) 但是，我的输入可以是

浏览 11提问于2019-03-14得票数 1

回答已采纳

1回答

朱莉娅DataFrames中有像熊猫一样的diff()函数吗？

、

我在朱莉娅中有一个DataFrame，我希望创建一个新列，它表示特定列中连续行之间的差异。在蟒蛇大熊猫中，我只会使用df.series.diff()。有相等的朱莉娅吗？例如： data 1 2 4 6 7 # in pandas df['diff_data'] = df.data.diff() data diff_data 1 NaN 2 1 4 2 6 2 7 1

浏览 6提问于2021-06-09得票数 8

回答已采纳

1回答

使用容器函数从Julia Dataframe中选择

我有一个名为"cond“的列的DataFrame df。该列中的值之一是"aer“。若要选择具有cond == "aer“的所有行，此代码工作如下： select(:(cond .== "aer"), df) 但这不是 select(:(contains(["aer"],cond)), df) 如果出现错误，它将失败：错误:在/Users/seanmackesey/.julia/DataFrames/src/dataframe.jl:1007的SubDataFrame中，所有的SubDataFrame索引必须大于0，在/Users/s

浏览 3提问于2013-10-10得票数 1

1回答

将Julia dataframe列标题更改为小写？

、

我正在寻找一个解决方案，将列的标题更改为小写。比方说，我有这个数据 df = DataFrame(TIME = ["2021-10-21","2021-10-22","2021-10-23"], MQ2= [-1.1, -2, 1], MQ3=[-1, -1, 3.1], MQ8= [-1, -4.2, 2], ) >>>df TIME MQ2 MQ3 MQ8

浏览 3提问于2021-10-21得票数 4

回答已采纳

1回答

选择数据帧中某列的前20个值？

、、

我想知道如何从Julia (DataFrames)中的一列中实际选择前20个值，例如，如果我有一个向量data = DataFrame(X=1,2,3,4,5,6,7，Y=2,4,7,9,10,11,14)，我如何才能获得子集中X的前3个值和后3个值？来源：https://testdataframesjl.readthedocs.io/en/readthedocs/subsets/

浏览 34提问于2021-10-05得票数 2

回答已采纳

1回答

如何在Julia中从单列DataFrame中提取column_name字符串和数据向量？

、

我能够使用正则表达式提取我想要的向量的列，但是现在我想从该DataFrame列中提取一个包含列名的字符串和一个包含数据的DataFrame。如何构建下面的f和g？其他方法也很受欢迎。 julia> df = DataFrame("x (in)" => 1:3, "y (°C)" => 4:6) 3×2 DataFrame Row │ x (in) y (°C) │ Int64 Int64 ─────┼──────────────── 1 │ 1 4 2 │ 2 5

浏览 28提问于2021-09-24得票数 2

回答已采纳

2回答

朱莉娅:在Float64中将列类型从整数转换为DataFrame

、

我试图将DataFrame列中的数字类型从整数更改为浮点数。这样做应该很简单，但不起作用。数据类型仍然是整数。我遗漏了什么？ In [2]: using DataFrames df = DataFrame(A = 1:4, B = ["M", "F", "F", "M"]) Out [2]: 4x2 DataFrame | Row | A | B | |-----|---|-----| | 1 | 1 | "M" | | 2 | 2 | "F" | | 3 | 3 | "

浏览 4提问于2015-02-27得票数 7

回答已采纳

1回答

带by()的多输入函数中的同列

、

我正在尝试探索DataFrames.jl模块的功能。在试图将同一列传递到by()函数中的多个输入变量时，我遇到了以下问题。我的基本例子是： df = DataFrame(grp = rand(["a","b"], 100), x= rand(100), y = rand(100), z=rand(100)) by(df, :grp,result= (:x, :z) => ((x, y),) -> cov(x, y)) 给出以下数据 2×2 DataFrame │ Row │ grp │ result │ │ │ String

浏览 1提问于2020-02-15得票数 2

回答已采纳

1回答

在julia中如何在操作数据帧时使用条件

、、

当两个条件中的任何一个为真时，我试图找出对应于特定列的数据帧元素的平均值。例如： Using Statistics df = DataFrame(value, xi, xj) resulted_mean = [] for i in range(ncol(df)) push!(resulted_mean, mean(df[:value], (:xi == i | :xj == i))) 这里，我检查xi或xj是否等于i，然后找出存储在:value列中的所有相应值的平均值。这意味着稍后将推送到数组-> resulted_mean 但是，此代码没有生成所需的输出。请建议修复此代码片段的最佳

浏览 2提问于2021-01-04得票数 1

1回答

用多个值替换Julia中的多个字符串

、、、

在Python大熊猫中，您可以向df.replace传递一个字典，以便用对应的值替换每个匹配的键。我经常使用这个特性来代替西班牙语中的缩略语，因为它会使句子标记器变得混乱。朱莉娅身上有类似的东西吗？或者更好的，这样我(和未来的用户)就可以从经验中学习到如何在Julia漂亮的、表现性语法中实现这样一个函数的想法了吗？谢谢! 编辑:根据请求添加一个示例输入： julia> DataFrames.DataFrame(Dict("A" => ["This is an ex.", "This is a samp.", "This

浏览 9提问于2022-10-15得票数 5

回答已采纳

1回答

Julia dataframe，其中列是数组的数组？

、

我正在尝试创建一个表，其中每行都有与特定测试用例相关联的时间序列数据。 julia> df = DataFrame(var1 = Int64[], var2 = Int64[], ts = Array{Array{Int64, 1}, 1}) 0x3 DataFrames.DataFrame 我可以创建数据框架。每个var1、var2对都要有一个关联的时间序列。我希望在一个循环中生成数据，并希望使用push!附加到这个数据文件中。我试过了 julia> push!(df, [1, 2, [3,4,5]]) ERROR: ArgumentError: Length of iter

浏览 0提问于2016-04-19得票数 4

回答已采纳

1回答

如何获得Julia DataFrame的内存大小？

、、、

我想优化(在)朱莉娅DataFrame的列。为此，我希望在优化之前和之后获得DataFrame的大小。下面是一个DataFrame示例： rows, columns = 10_000, 50 df = rand([x for x in "ABCDE"], rows, columns) |> DataFrame 此df对象的大小... sizeof(df) 尺寸是24。但是，当我对列的大小求和时，大小是不同的… sum([sizeof(df[x]) for x in names(df)]) 列大小的总和是2000000。这就是优化。 for i = names(df

浏览 31提问于2020-12-08得票数 1

回答已采纳

1回答

如何在朱莉娅中重塑和绘制DataFrames？

、、、

我正在寻找一种方法，从宽到长重塑DataFrame，然后绘制结果(这应该是一个简单的操作，但我对朱莉娅来说是新手，无论如何都不是一个专家程序员)。具体地说，我有一个结构如下的数据帧： julia> df = DataFrame(Country = ["Italy","France","Germany"], Date1 = [1,4,6], Date2 = [2,5,9], Date3 = [4,3,12]) 3×4 DataFrame │ Row │ Country │ Date1 │ Date2 │ Date3 │ │ │ S

浏览 9提问于2020-03-24得票数 2

回答已采纳

3回答

朱莉娅:对两个数组进行排序(就像numpy中的词汇排序)

、

Python示例在Numpy中，有对另一个数组进行排序：给定多个排序键(可以解释为电子表格中的列)，词汇排序返回一个整数索引数组，该数组按多个列描述排序顺序。因此，以下面的例子为例： import numpy as np a = np.array([1,1,1,2,2,2]) b = np.array([10,8,11,4,8,0]) sorted_idx = np.lexsort((b,a)) print(b[sorted_idx]) # [ 8 10 11 0 4 8] 因此，在a中对b进行排序，我们可以看到： 1 1 1 2 2 2 8 10 1

浏览 9提问于2022-06-20得票数 2

回答已采纳

2回答

在julia中的dataframe中向列添加数千个分隔符

、、

我有一个有两个列a和b的dataframe，现在两者看起来都像列a，但是我想添加分隔符，这样列b看起来如下所示。我试过使用包format.jl。但我还没有得到我的结果。也许值得一提的是，这两个列都是Int64，列名a和b是类型符号。 a | b 150000 | 1500,00 27 | 27,00 16614 | 166,14 除了使用format.jl之外，还有其他方法解决这个问题吗？或者format.jl是该走的路？

浏览 8提问于2022-07-06得票数 0

1回答

如何在朱莉娅中将缺失的值插入数据

、

df3[10, :A] = missing df3[15, :B] = missing df3[15, :C] = missing 连娜也不起作用。我搞错了 MethodError:不能将类型为Missings.Missing的对象转换为类型为Int64的对象--这可能是对构造函数Int64(.)的调用产生的，因为类型构造函数返回到转换方法。Stacktrace: 1 setindex！(：数组{Int64 64，1}，::Missings.Missing，：Int64 64) at ./array.jl:583 2 insert_single_entry!(::DataFrames.Da

浏览 0提问于2018-10-09得票数 5

回答已采纳

1回答

将数组转换为DataFrame或在Julia中保存为CSV

、、、

我的数据结构看起来类似于 tdata = Array{Int64,1}[] # After 1st collection, push the first batch of data push!(tdata, [1, 2, 3, 4, 5]) # After 2nd collection, push this batch of data push!(tdata, [11, 12, 13, 14, 15]) 因此，我的数据是 > tdata 2-element Array{Array{Int64,1},1}: [1, 2, 3, 4, 5] [11, 12, 13, 14, 15] 当我试图

浏览 1提问于2021-03-05得票数 3

回答已采纳

1回答

Julia Dataframe组在另一组中被

、

我有如下所示的数据格式： julia> DataFrame(val=1:10, percent=nothing) 10×2 DataFrame Row │ val percent │ Int64 Nothing ─────┼──────────────── 1 │ 1 2 │ 2 3 │ 3 4 │ 4 5 │ 5 6 │ 6 7 │ 7 8 │ 8 9 │ 9 10 │ 10 我想应用这一点： percent(df, thresh

浏览 0提问于2020-12-17得票数 2

回答已采纳

1回答

检查DataFrame名称是否包含另一个数组中的名称

、、、

我想检查我的DataFrame是否包含我指定的所有列。当然，我可以用下面的代码来完成它，但我觉得应该可以在一行中实现。 using DataFrames bools = Array{Bool}([]) df = DataFrame(A=[1,2], B=[3,4], C=[5,6]) for name in ["A", "B"] push!(bools, name ∈ names(df)) end false ∉ bools

浏览 5提问于2021-03-12得票数 3

回答已采纳

2回答

Julia多维阵列

、、、

我将多维数组存储在Julia中的dataframe中。 dfy = DataFrame(a = [[1,2,3],[4,5,6],[7,8,9]], b = ["M","F","F"]) 3×2 DataFrame │ Row │ a │ b │ │ │ Array… │ String │ ├─────┼───────────┼────────┤ │ 1 │ [1, 2, 3] │ M │ │ 2 │ [4, 5, 6] │ F │ │ 3 │ [7, 8, 9] │ F

浏览 3提问于2020-08-10得票数 2

回答已采纳

1回答

如何从记录/行创建DataFrame

、

我有这样的数据结构： records = [("A", 1), ("B", 2), ("C", 3)] 我想要这样的DataFrame A | 1 B | 2 C | 3 如何在朱莉娅身上最有效地实现这一点？在python中，我会做一个pandas.DataFrame.from_records(records)。编辑：我正在寻找一种适用于任意数量列的方法。

浏览 2提问于2017-05-24得票数 2

回答已采纳

9回答

如何在朱莉娅(版本0.3) DataFrame中更改多个列名？

例如，假设您创建了一个类似于这样的朱莉娅DataFrame，其中有20列： y=convert(DataFrame, randn(10,20)) 如何将列名(:x1 ... :x20)转换为其他东西，例如(:col1, ..., :col20)，一次又一次？

浏览 14提问于2014-02-04得票数 22

回答已采纳

2回答

返回`DataFrames.jl`中的最大和？

、

假设我的DataFrame有两列v和g。首先，我将DataFrame按列g分组，并计算出列v的和。其次，我使用函数maximum检索最大和。我想知道是否有可能在一步内检索值？谢谢。 julia> using Random julia> Random.seed!(1) TaskLocalRNG() julia> dt = DataFrame(v = rand(15), g = rand(1:3, 15)) 15×2 DataFrame Row │ v g │ Float64 Int64 ─────┼──────────────

浏览 7提问于2021-12-29得票数 5

回答已采纳

2回答

朱莉娅有类似于dplyr的包裹吗？

、

假设我有以下数据： using DataFrames a = DataFrame(A = randn(1000), B = randn(1000), C = randn(1000)); N = 1000; 就像我想将每一列除以N(如果是数字的话)，所以在R中，我将执行以下操作(使用dplyr)： a <- a %>% mutate_if(is.numeric, function(x) x/N) 朱莉娅身上有这样的东西吗？ (我试图避免for循环，并逐列执行操作)

浏览 7提问于2022-10-12得票数 1

回答已采纳

1回答

如何将函数列向julia dataframe

、

如何将函数应用到julia dataframe中的某些/所有列(按列排列)？我试图处理的用例是简单的类型解析和处理。例如，我想从字符串到int解析这个示例的数据格式的列。 df = DataFrame(a = ["1","2", "3"], b = ["4","5","6"]) # something like this works but destroys the structure of the dataframe [parse.(Int64, col) for col in eachcol(

浏览 4提问于2020-05-19得票数 7

回答已采纳

1回答

将DataFrame拆分为DataFrames向量

、、

我有一个DataFrame df = DataFrame(a=[1,1,2,2],b=[6,7,8,9]) 4×2 DataFrame Row │ a b │ Int64 Int64 ─────┼────────────── 1 │ 1 6 2 │ 1 7 3 │ 2 8 4 │ 2 9 是否有一种将其拆分为Vector{DataFrame}s的规范方法？我能做到 [df[df.a .== i,:] for i in unique(df.a)] 2-eleme

浏览 2提问于2022-04-05得票数 1

回答已采纳

3回答

如何在给定的分隔符中将DataFrame列分隔成两列？

给了朱莉娅的DataFrame df： using DataFrames df = DataFrame(X = ['A', 'B', 'C'], Y = ["a|b", "a|c", "b|b"]) 如何通过将Y列拆分到“\”分隔符处来创建Y1和Y2列？例如，在R tidyverse中我会这样做： separate(df, Y, c("Y1", "Y2"), by = "\\|")

浏览 0提问于2019-08-21得票数 4

回答已采纳

3回答

julia创建一个空的dataframe并向其追加行

、

我正在试用Julia DataFrames模块。我对它很感兴趣，所以我可以用它在Gadfly中绘制简单的模拟。我希望能够迭代地向dataframe添加行，并且希望将其初始化为空。关于如何做到这一点的教程/文档很少(大多数文档描述了如何分析导入的数据)。要附加到非空数据帧，很简单： df = DataFrame(A = [1, 2], B = [4, 5]) push!(df, [3 6]) 这会返回。 3x2 DataFrame | Row | A | B | |-----|---|---| | 1 | 1 | 4 | | 2 | 2 | 5 | | 3 | 3 | 6 | 但

浏览 0提问于2014-10-05得票数 39

回答已采纳

1回答

如何在Julia数据帧上进行就地广播操作？

、

我有一个只有一个列"Name“的数据框，我想就地小写这个值。现有的小写广播似乎创建了一个新的数据帧，我如何将其作为就地修改？ julia> df 5×1 DataFrame │ Row │ Name │ │ │ String │ ├─────┼───────────┤ │ 1 │ Mary │ │ 2 │ Anna │ │ 3 │ Emma │ │ 4 │ Elizabeth │ │ 5 │ Minnie │ julia> lowercase.(df.Name) 5-element Arr

浏览 14提问于2020-11-01得票数 2

回答已采纳

2回答

将包含字符串的Julia DataFrame列转换为包含整数和缺失值的列

、、

我需要转换以下DataFrame julia> df = DataFrame(:A=>["", "2", "3"], :B=>[1.1, 2.2, 3.3]) 看起来像是 3×2 DataFrame │ Row │ A │ B │ │ │ String │ Float64 │ ├─────┼────────┼─────────┤ │ 1 │ │ 1.1 │ │ 2 │ 2 │ 2.2 │ │ 3 │ 3 │ 3.3 │ 我想将A列

浏览 0提问于2019-06-20得票数 1

3回答

Julia DataFrame:按名称删除列

、

Julia中的DataFrame类型允许您将其作为数组进行访问，因此可以通过索引删除列： df = df[:,[1:2,4:end]] # remove column 3 这种方法的问题是，我通常只知道列的名称，而不知道它在表中的列索引。有没有一种内置的方法可以按名称删除列？或者，有比这更好的方法吗？ colind = findfirst(names(df), colsymbol) df = df[:,[1:colind-1,colind+1:end]] 上面的是容易失败的；有一些边缘情况(单列，第一列，最后一列，符号不在表中，等等) 谢谢

浏览 0提问于2014-07-10得票数 30

回答已采纳

1回答

返回DataFrame的副本，该副本仅包含朱莉娅中缺少数据的行

、

我正在寻找与dropmissing函数相反的DataFrames.jl，以便用户知道在哪里修复他们的坏数据。这看起来应该很容易，但是filter函数期望指定一个列，我不能让它迭代所有列。 julia> df=DataFrame(a=[1, missing, 3], b=[4, 5, missing]) 3×2 DataFrame │ Row │ a │ b │ │ │ Int64? │ Int64? │ ├─────┼─────────┼─────────┤ │ 1 │ 1 │ 4 │ │ 2 │ missing │ 5

浏览 1提问于2020-11-13得票数 3

回答已采纳

1回答

在DataFrames.jl中执行列转换失败

、

假设我有以下数据帧： julia> using DataFrames julia> df = DataFrame(id=["a", "b", "a", "b", "b"], v=[1, 1, 1, 1, 2]) 5×2 DataFrame Row │ id v │ String Int64 ─────┼─────────────── 1 │ a 1 2 │ b 1 3 │ a 1 4 │ b

浏览 9提问于2021-09-15得票数 5

1回答

在Julia中将不同长度的数组保存在单个数据帧中

、

我想保存一个输出可变长度数组的模拟结果。通常，我会运行模拟，将其保存在一个数组中，将它与一个数组与先前的结果连接起来，然后通过创建一个数据帧，然后使用CSV.write保存具有所有结果的数组。但是，由于数组的长度是可变的，所以hcat()不能工作。下面是我想做的事情的一个玩具例子。 output = zeros(5) number_simulations = 10 for i = 1:number_simulations l = sample([4, 5, 6, 7]) print(l) for j = 1:l new_out = zeros(l)

浏览 3提问于2017-09-19得票数 3

回答已采纳

1回答

朱莉娅-如何通过条件找到朱莉娅DataFrame中的特定数据并改变它？

、

我有一个具有以下结构的DataFrame，例如： show(q) 2×5 DataFrame Row │ state left right up down │ Any Float64 Float64 Float64 Float64 ─────┼──────────────────────────────────────────── 1 │ (1, 1) 0.0 0.0 0.0 0.0 2 │ (2, 2) 0.0 0.0 0.0 0.0 其

浏览 5提问于2022-11-16得票数 1

回答已采纳

1回答

如何从julia dataframe创建字典？

、

我有一个像下面这样的df，我想从df中获得字典。 df = DataFrame(id=[1, 2, 3, 4], value=["Rajesh", "John", "Jacob", "sundar"], other=[0.43, 0.42,0.54, 0.63]) │ Row │ id │ value │ other │ │ │ Int64 │ String │ Float64 │ ├─────┼───────┼────────┼─────────┤ │ 1 │ 1 │ Rajesh │ 0.4

浏览 29提问于2020-09-05得票数 2

回答已采纳

1回答

在Julia dataframe中应用组特定函数

、

我想将两个可能的函数中的一个应用于DataFrame的一个列，它的类别(每个函数一个)是在另一列中指定的。我的用例是将观察列表的JD时间从两个不同的位置转换为BJD (以重心为中心的朱利安日期)，这取决于该位置。例如，如果我有一张桌子，比如： julia> using DataFrames julia> df = DataFrame(:t => 1:5, :location => rand(["locA", "locB"], 5)) 5×2 DataFrame Row │ t location │ Int64

浏览 5提问于2021-07-09得票数 2

回答已采纳

3回答

初始化具有缺失值的列，并在稍后填充字段

、

如何用缺失值初始化DataFrame中的列，然后用浮点值填充该列的某些元素呢？ julia> df = DataFrame(:a => rand(4), :b => rand(4)) 4×2 DataFrame Row │ a b │ Float64 Float64 ─────┼──────────────────── 1 │ 0.840074 0.673613 2 │ 0.98867 0.33807 3 │ 0.433315 0.150228 4 │ 0.495254 0.833268

浏览 21提问于2021-09-25得票数 2

回答已采纳

1回答

连接pandas数据帧中的列表，并在另一列中获取唯一的标记

、

我有一个由4列组成的数据框，第一列是ID，其他列在每一行中都有列表作为它们的值。我需要将这三列连接起来，获取唯一的标记并创建另一列。这是一行，我有100多万条记录。 original_df = pd.DataFrame({'ID':1, 'Name_List1':[[ 'aa','bb']], 'Name_List2':[['Mutiso','Julia','Linger']],

浏览 0提问于2020-01-23得票数 0

1回答

使用Julia，我如何读取多个CSV和合并列

、

我对朱莉娅非常陌生，我认为自己一般都是编程初学者。我用MATLAB和Python编写了一些代码。我有一堆CSV，我想把它们结合起来做数据分析。我的数据如下所示： using DataFrames using Plots using CSV using Glob using Pipe file_list = glob("*.csv") #list of all csvs in dir df = @pipe file_list[1] |> CSV.File(_,header = 2) |> DataFrame #Read file # I could have us

浏览 1提问于2021-02-05得票数 3

回答已采纳

2回答

如何计算新列并在Julia中添加数据？

、

(朱莉娅的新作) 我在试着做这个手术。下面是一个最小的工作示例： df = DataFrame(A = 1:4) Row A Int64 1 1 2 2 3 3 4 4 只有一个有四个值的数据，1-4。我想添加一个新列，其中每个值等于元素，加上前面的元素。换句话说，我想： Row A Row B Int64 Int64 1 1 1 2 2 3 3 3 6 4 4 10 我该怎么做？我可以编写一个计算所需数字的函数： function first(j) val = 0 while j != 0 val += df

浏览 4提问于2022-11-07得票数 3

回答已采纳

2回答

Julia dataframe中具有列名的控制流

、

我正在寻找一个解决方案来处理列名称不存在于Julia dataframes。更详细地说，假设我有以下数据帧和列表： df = DataFrame(id= "12345", description= rand(5)); err_Li = ["12345"] 我需要检查id列是否与err_Li匹配，例如： if (df[1,"id"] in err_Li) println("NOT VALID") else end 但是，在我的一些数据帧中，列名id并不存在。所以在Python语言中，我可以处理try-except，例

浏览 24提问于2021-11-12得票数 2

回答已采纳

2回答

在Julia中，如何将函数应用于包含数组的Dataframe？

、、

我希望把问题弄清楚，但让我在这里更好地解释一下:我有这个数据框架： m = DataFrame( x = [1,2,3], y = [[1,2,3],[4,5,6],[7,8,9]]) 我的目标是得到列z，它是每个y数组的平方加上对应于列中位置的x字符串。也许你可以这样做： m = DataFrame( x = [1,2,3], y = [[1,2,3],[4,5,6],[7,8,9]], z = [[2,5,10],[18,27,38],[52,67,84]]) 我可以使用以下代码在R中完成此操作： m <- m %>% mutate(z = map2(x,y, ~map2_d

浏览 28提问于2020-04-05得票数 4

回答已采纳