我想检查我的DataFrame是否包含我指定的所有列。当然,我可以用下面的代码来完成它,但我觉得应该可以在一行中实现。
using DataFrames
bools = Array{Bool}([])
df = DataFrame(A=[1,2], B=[3,4], C=[5,6])
for name in ["A", "B"]
push!(bools, name ∈ names(df))
end
false ∉ bools
问题语句:从子数据帧中删除行
代码:
x=[rand(3) for i in 1:3]
dfx=DataFrame(x,:auto)
dfy=@view dfx[2:3,:]
问:我想从dfy中删除第一行,这样它也会从dfx中删除。我做了原始dfx的子集,以进一步检查子集的行是否满足条件。最后,我想决定是将行保留在dfx中还是将其删除。我对dfx的子集dfy进行操作。
我正在尝试寻找一种类似于Python的功能,在Python中,我可以删除一行中有“all”null值的行- python中的代码-使用Pandas数据帧‘closed_prices’ closed_prices.dropna(axis=0, how=‘all’, inplace=True) 基本上,我想删除所有列都有缺失值的行-我使用的是股票数据,并希望删除周末和节假日,每列代表特定股票的收盘价。因此,如果某一特定行的所有列值都为空/缺失,我想删除该行。 我正在使用下面的代码- using DataFrames
using DataFramesMeta
using CSV
using Dat
我想使用PyJulia来加速代码的某些部分
import numpy as np
import julia
import pandas as pd
import random
from julia import Base
from julia import Main
from julia import DataFrames
n = 100000
randomlist = []
for i in range(0,n):
num = random.randint(1,100)
randomlist.append(num)
data = {
'Score'
我想知道如何从Julia中的数据中永久删除多行。下面是dataframe示例:
Group Variable1 Variable2
String Float64 Float64
1 B -0.661256 0.265538
2 B 0.111651 0.837895
3 A 0.197754 0.987195
4 A 1.35057 0.696815
5 A -1.20899 0.496407
6 B 0.813047 0.324904
我想从我的dataframe中删除第2、4和6行。有一个很容易做
在我的例子中,我通过使用csv模块并像这样导入它来加载以下CSV数据(https://ourworldindata.org/coronavirus-source-data): using DataFrames
using CSV
raw = CSV.read("data.csv") 然后,我想通过索引来设置字符串列,如下所示: raw[1, :location] = "AA" 我得到了以下错误: setindex! not defined for CSV.Column{String,PooledString}
Stacktrace:
[1] error(
我想优化(在)朱莉娅DataFrame的列。为此,我希望在优化之前和之后获得DataFrame的大小。 下面是一个DataFrame示例: rows, columns = 10_000, 50
df = rand([x for x in "ABCDE"], rows, columns) |> DataFrame 此df对象的大小... sizeof(df) 尺寸是24。 但是,当我对列的大小求和时,大小是不同的… sum([sizeof(df[x]) for x in names(df)]) 列大小的总和是2000000。 这就是优化。 for i = names(df
我有包含两列的dataframe:user和lang。每个用户都知道一种或多种语言:
lang user
0 Python Mike
1 Scala Mike
2 R John
3 Julia Michael
4 Java Michael
我需要为user中的每一行获取他/她知道的所有语言。我可以这样做:
df.groupby('user')['lang'].apply(lambda x:', '.join(x)).reset_index()
但我得到的是:
u