在dataframe列中填充字符串类型NA时出错

可能是由于以下原因之一：

列数据类型不是字符串类型：在填充字符串类型的NA之前，需要确保该列的数据类型是字符串类型。可以使用df['列名'] = df['列名'].astype(str)将列转换为字符串类型。
列名拼写错误：请确保填充字符串类型的NA时使用的列名是正确的，注意大小写和拼写。
NA值填充方法错误：填充字符串类型的NA时，可以使用fillna方法。例如，使用df['列名'].fillna('NA')将该列中的NA值填充为字符串'NA'。
数据中包含其他非字符串类型的NA值：如果数据中包含除了字符串类型的NA值之外还有其他类型的NA值（例如数字类型的NA值），则在填充字符串类型的NA时会出错。在填充之前，可以先使用dropna方法删除其他类型的NA值，然后再进行填充。
数据中包含缺失值：如果数据中存在缺失值（不仅仅是NA值），则在填充字符串类型的NA时可能会出错。在填充之前，可以先使用其他方法（例如插值法）来处理缺失值。

总结起来，解决在dataframe列中填充字符串类型NA时出错的方法是：确保列数据类型是字符串类型、正确使用列名、使用正确的填充方法、处理其他类型的NA值和缺失值。

Spark fillNa不替换空值

、

我有下面的数据集，它包含一些空值，需要在spark中使用fillna替换空值。 DataFrame： df = spark.read.format("com.databricks.spark.csv").option("header‌","true").load("/sam‌ple.csv") >>> df.printSchema(); root |-- Age: string (nullable = true) |-- Height: string (nullable = true) |-- Nam

浏览 1提问于2016-11-03得票数 20

回答已采纳

3回答

Pandas DataFrame中缺少的值在写入CSV时始终为空。

、、

在这个例子中，我使用的是熊猫的1.0.1版本。我有一个具有混合类型和一些缺失值的DataFrame： df = pd.DataFrame( [ [1, 2.0, '2020-01-01', 'A String'] ], columns = ['int', 'float', 'datetime', 'str'] ) df.loc[1] = [pd.NA, pd.NA, pd.NA, pd.NA] df.datetime = pd.to_datetime(df.date

浏览 0提问于2020-03-05得票数 1

回答已采纳

1回答

熊猫用日期填充列

、、

我试图用一个静态日期填充一个DataFrame列(整个列)，但它必须是一个变量。我可以使用numpy填写数字，但无法填写列的日期： currdate = ['3/31/2018'] #this is what I need filled in missing = ['GREEN', 'YELLOW', 'RED', 'BLUE', 'PINK'] 第1节： A = ({'PERIOD DT': pd.to_datetime(currdate),

浏览 50提问于2018-06-07得票数 1

回答已采纳

2回答

在循环中填充数据帧

、、

我在一个目录中有超过300个csv文件。csv文件具有以下结构 id Date Nitrate Sulfate id of csv file Some date Some Value Some Value id of csv file Some date Some Value Some Value id of csv file Some date Some Value Some Value 我希望计数每个csv文件中的行数，不包括该文件中的NA，并将其存储在dataframe中，其中有两列：(1) id & (2)

浏览 5提问于2016-02-28得票数 0

回答已采纳

3回答

更新R中用户定义函数中的特定列值

、、

我使用以下代码用中值更新R中的dataframe中的列。这可以很好地工作，但我希望能够从程序的其他部分调用它作为函数，传递其他数据帧和列。 medianVal <- median(df$column, na.rm = T) df$column[is.na(df$column)] <- medianVal 我尝试使用的代码的逻辑是传递DataFrame和列，获取中间值，更新并返回数据帧 updateWithMedian <- function(DataFrame, Column) { medianValue <- median(Column, na.rm = T)

浏览 12提问于2020-04-16得票数 1

回答已采纳

3回答

如何根据不同长度的数据帧中的条件填充数据帧中的列？

浏览 16提问于2019-06-03得票数 0

回答已采纳

2回答

如何在sklearn中修复这个自定义转换器？

、、、

我已经编写了这个简单的自定义转换器，它用0填充特定列中的na。当我对我的数据集执行fit_transform时，它不会在指定的列中填充nas。我在我的代码中看不到这个问题。 class CustomImputer(BaseEstimator, TransformerMixin): def fit(self, X, y=None): return self def transform(self, X, y=None): for col in ('PavedDrive', 'GarageQual', 'Ga

浏览 9提问于2018-12-24得票数 2

回答已采纳

2回答

将R中的两个数据帧中的单个列合并，其中只有一些行匹配

我正在尝试将数据从一个数据帧中的一个列合并到另一个数据帧中的另一个列中，使用一个具有共享数据的列作为操作的关键。我已经尝试过关于如何在r中复制Excel的几个不同的教程，并且我尝试了这里提供的几种不同的合并方法(在stackoverflow...but上的答案中)，到目前为止，我没有尝试过做我想要做的事情，尽管它似乎是相当常见的函数。下面是我尝试do...to提供的一个非常简单的例子，假设这是dataframe1： ID RESULT 4 YES 1 YES 3 NO 2 YES 下面是dataframe2，其中的结果列完全由NAs

浏览 3提问于2015-02-10得票数 1

回答已采纳

2回答

火花数据na.fill布尔列类型

我能够使用以下方法填充数字和字符串类型列： masterDF = masterDF.na.fill(-1) masterDF = masterDF.na.fill("") masterDF = masterDF.na.fill(-1.0) 但是我没有找到api来填充布尔类型列。我尝试过这样做:不支持masterDF = masterDF.na.fill(false)。有什么想法吗？

浏览 0提问于2018-06-28得票数 1

回答已采纳

1回答

如何在方法链中创建一列，并在不使用管道的情况下使用它填充另一列？

、

我正在使用pandas 0.24.2。在方法链中，我想创建一个新列(比如使用assign)，并使用新列在另一个列中填充na值，而不使用pipe函数。这个是可能的吗？举个例子： import pandas as pd df = pd.DataFrame({"a": [10, 11, 12], "b": [21, np.nan, 25]}).assign( c=lambda x: x["a"] / 2 ) 现在假设我想用c的值填充b中的na值，添加到方法链上。与assign不同的是，fillna不计算可伸缩性。这会用lambda本身填充

浏览 7提问于2019-05-07得票数 0

回答已采纳

2回答

R中数据子集的符号值

、

我很难将数据分配给另一个子集。在下面的示例中，行 ds[cavities,] <- join(ds[cavities,1:4], fillings, by="ZipCode", "left") 只修改一列而不是两列。我希望它要么不修改列，要么两者都修改，而不是只修改一个列。我编写了一个函数，通过将PrefName和CountyID列加入到另一个dataframe cs中，在dataframe ds中填充它们所在的NA列。如您所见，如果您运行它，测试将失败，因为PrefName没有被填充。在做了一些调试之后，我意识到join()正在做它期望做的事情，但是这

浏览 2提问于2014-09-24得票数 0

回答已采纳

3回答

如何根据R中的另一个数据帧创建条件列？

、

我有一个dataframe1： ID Var1 Var2 1 40 45 2 30 35 3 70 65 4 70 15 5 40 15 6 80 45 7 20 15 8 20 15 9 50 35 10 70 25 我有第二个dataframe2： ID Error 1 0 2 1 5 1 6 1 9 0 10 NA 21 0 22 NA 我想在dataframe1中创建一个标记为&#

浏览 0提问于2021-10-27得票数 0

3回答

数据框中的所有列NA值都用R中的中值填充

我需要用数据框中每列的中值填充所有数值列的空值。我做了下面的代码。 median_forNumericalNulls <- function(dataframe){ nums <- unlist(lapply(dataframe, is.numeric)) df_num <- dataframe[ , nums] df_num[] <- lapply(df_num, function(x) { x[is.na(x)] <- median(x, na.rm = TRUE) x }) retur

浏览 3提问于2021-10-17得票数 2

2回答

分隔混合类型dataframe列-如果任一列值都是字符串，则保留字符串值。

、

我有一个如下所示的dataframe (这是一个示例，真正的dataframe有数百列)： 0 Year Grade3MathPass Grade3MathTest Grade4MathPass Grade4MathTest 1 2019 2 2020 *** 15 5 15 3 2021 *** *** 12 4 2022 3 10

浏览 4提问于2022-07-29得票数 2

回答已采纳

1回答

将两个dataframe与sqldf连接在NA列中。

、、

我试图使用sqldf包连接两个数据帧。这些是我的两个数据文件的可复制的例子： a <- c(1,2,3,4,5) b <- c(1,2,3,4,5) c <- c(1,2,3,4,5) d <- c(1,2,3,4,5) e <- c(1,2,3,4,5) dataframe1 <- data.frame(a,b,c,d,e) a <- c(NA,NA,NA,NA,5) b <- c(NA,NA,NA,4,NA) c <- c(NA,NA,3,NA,NA) d <- c(NA,2,NA,NA,NA) e <- c(1,NA

浏览 1提问于2015-11-02得票数 0

回答已采纳

4回答

操纵Dataframe系列

、、、、

我有一个dataframe，我想根据条件更改列的某些元素。特别是考虑到这一栏： ... VALUE .... 0 "1076A" 12 9 "KKK0139" 5 我想得到这一点： ... VALUE .... 0 "1076A" 12 9 "0139" 5 在“value”列中，有字符串和数字，当我在字符串值中找到一个特定的子字符串时，我希

浏览 5提问于2021-06-22得票数 1

回答已采纳

1回答

带有条件的Pandas数据帧操作

、、

如何遍历Pandas DataFrame字段并使用同一数据框中另一个字段的输入填充空值我的目标是用z列中的相应值填充y列中的na值

浏览 4提问于2019-11-26得票数 0

回答已采纳

2回答

无法将数值插入postgres中的整型列

、、、、

我已经推荐了，，。因此，请不要标记为重复我在pandas dataframe中有一个名为temp_id的原始数据，如下所示。由于NA的原因，该列的数据类型为float64，在jupyter notebook中如下所示 temp_id 55608.0 55609.0 NaN 55610.0 NaN 55611.0 在csv文件中，相同的列如下所示 temp_id 55608 55609 #empty row indicating NA 55610 #empty row indicating NA 55611 我正

浏览 3提问于2021-07-15得票数 1

3回答

使用循环在R中使用嵌套if语句从dataframe中的非NA值填充列

、、、

我有3列数据，我想用来填充列D(下面的例子的最终结果，目前D列为空白)。对于每一行，and列都有一个填充值和两个NA值。我该怎么做？ A B C D 1 'a' NA NA 'a' 2 NA 'b' NA 'b' 3 NA 'b' NA 'b' 4 NA NA 'c' 'c' 5 NA NA 'c' 'c' 6 'a' NA NA 'a' 7 &#

浏览 1提问于2017-02-03得票数 0

回答已采纳

3回答

在匹配条件时写入其他列

、、

我想创建一个新列，只在它与特定条件匹配时(这里是x > 2 )，然后直接为条件(x > 2)返回TRUE的这些行覆盖另一个现有列(在这里为auxiliary)。 df <- tibble(x = 1:5, y = 1:5, auxiliary = NA) # A tibble: 5 x 3 x y auxiliary <int> <dbl> <lgl> 1 1 NA 2 2 NA 3 3 NA 4 4 N

浏览 6提问于2022-01-06得票数 1

回答已采纳

2回答

按列名合并两个数据帧( Merge ()不起作用)

、

我有两个数据框架(这是头)： 1： # A tibble: 6 x 2 twitterID Username <chr> <chr> 1 849567328899616768 AchimKessler 2 1117749912 Achim_P 3 186552155 NA 4 172269309 agnieszka_mdb 5 1127961248493129728 St

浏览 5提问于2021-12-15得票数 1

回答已采纳

1回答

Pandas read_csv与数据推断不一致

、

因此，我正在构建一个从S3存储桶中读取未知格式的csv数据的函数。如果我读取完全填充的一列数据，那么dataframe会正确地推断数据类型，但是如果列中的任何行为空，它总是会将数据类型转换为字符串。例如： csv_1 = """id,name,age 0,dan,10 1,ana, """ csv_2 = """id,name,age 3,bill,33 4,jill,35 """ df1 = pd.read_csv(io.StringIO(csv

浏览 0提问于2021-02-04得票数 0

1回答

对重复项进行分组，允许NaN等于任何值

、、、、

我想在基于多个列的DataFrame中聚合重复的行，但对“复制”的含义有一个非常规的定义。假设有一个包含两列的DataFrame：A和B In [45]: df = pd.DataFrame([[0, 0], [pd.NA, 0], [0, 1], [pd.NA, 1], [1, 1]], columns=['A', 'B']).convert_dtypes() In [63]: df Out[63]: A B 0 0 0 1 <NA> 0 2 0 1 3 <NA> 1 4 1

浏览 8提问于2020-03-21得票数 2

回答已采纳

2回答

无法将以"N/A“填充的时间戳值复制到RedShift

、、、、

我有一个DataFrame，我用"N/A“替换了一些缺少的字段值，比如.na.fill("N/A", naColumns)。但是，当数据从S3复制到RedShift时，我收到错误：Invalid timestamp format or value [YYYY-MM-DD HH24:MI:SS] 我知道用字符串值填充时间戳字段可能不是最好的主意。但是，如果我没有替换DataFrame中的空值，我会得到一个关于复制到RedShift时找不到分隔符的错误。这很可能表示缺少列。顺便说一句，这些字段不是主键的一部分，而是nullable。在DataFrame一侧填充times

浏览 1提问于2018-10-02得票数 0

2回答

fillna()依赖于列类型函数

、

我在一个函数上旋转轮子，这个函数应该接受一个数据框，迭代列，并根据列的类型，用0填充数值类型，用'na‘表示字符串类型，用默认日期表示日期类型，用False表示布尔值。 import pandas as pd import numpy as np df = pd.DataFrame(data={'a':[1,np.nan,3,np.nan], 'b':['abc',np.nan,'def','hij'],

浏览 0提问于2020-01-18得票数 2

1回答

如何成功地将pandas.Dataframe.apply与pandas.NA和lambdas结合使用

、、、、

给定具有pandas.NA值的数据帧，如何在其上运行决策lambda？ import pandas import numpy # Setup dataframe = pandas.DataFrame({"c1": [1, 2, 3, 4], "c2": [2, 3, 4, pandas.NA]}) print(dataframe) my_lambda = lambda row: row["c2"] if row["c2"] else row["c1"] # the issue dataframe[

浏览 3提问于2022-12-01得票数 0

1回答

根据分类列筛选行，然后使用另一列的值填充筛选df的不同列中的NA行。

、、、、

我有一个分类列和两个数字列的数据。“分类”列中的所有类别都没有缺少值。但是，对于分类列中的某些行，第一个数值列中的相邻行具有NA。我的问题是，我希望用第二个数值列的相应行值填充第一个数值列的NA行，但是，我只想对第一列中有NA的行相邻的类别行进行此操作。我希望在不改变原始dataframe形状的情况下执行此操作。下面的示例数据集df： Cat_col num_col1 num_col2 SS 22 54 PP NA 89 CC 128 34 XX NA 56 SS 67 56 XX NA 90 CC 47 10 BBNA 29 从上面的表中，我希望用相应的num_col1行值填充num_col

浏览 18提问于2022-10-06得票数 0

回答已采纳

1回答

替换可定制订单spark scala中的值

、、、

我正在尝试将数据帧中的空值替换为值，在每一列中，我希望使用我为每一列选择的特定值填充na。我使用的代码如下 val data = sqlContext.createDataFrame(Seq( (10,null), (null,67), (14,null), (null,80) )).toDF("V1","V2") import org.apache.spark.sql.DataFrame def valreplace(data:DataFrame,valueList:list,columnList:list):DataFrame = {

浏览 3提问于2016-10-12得票数 1

1回答

使用熊猫描述()在数据级上填充np.nan值的前后比较

、、

我试图比较填充NA值之前和之后的差异，然后使用describe()方法。例如，第一次数据访问： idx A B 1 NA 5 2 NA 4 3 3 3 4 5 NA 5 6 7 填后na idx A B 1 3 5 2 3 4 3 3 3 4 3 3 5 6 7 我希望用随机数据组合来描述填充NA值后数据之间的差异。原来的dataframe有80k行，不同的列约有30%的na (共30列)。理想结果:没有变化的结果应该显示0，结果随变化将显示差异(即，mean=2 (从3到5)) 尝试1:用方法手动减去它们

浏览 2提问于2022-08-27得票数 0

回答已采纳

2回答

连接两个数据文件以删除第一个数据文件中的NaN值

、、

我想合并两个dataframe列。我有df1，它有一个特定的列(df$col1)。该列有1-100行，某些行具有NA值(例如行10、15、20、50、69)。 Dataframe 2有行10、15、20、50、69。是否可以将DF2合并到df$col，以便每个数据集的索引编号上只有df$col中的NA值被DF2..depending填充？我试过这个，但是却得到了一个与我想要的不一样的数据 merge(brfss2$pa1min_,df,by.x=1,by.y=1,all.x=TRUE,all.y=TRUE) 这是两个数据文件 Dataframe1： 1 NA 2 110 3 NA 4 3

浏览 0提问于2019-02-21得票数 0

回答已采纳

2回答

如何根据上一行中的月份在行中增加一个月？

、、

我有一个dataframe，它有一个值列和“月份年”列。在第一行中，2018年8月是为月份年列编写的。在value列中有值的下列行是否有可能分别由下一个月自动填充？第二排是2018年9月，第三排是2018年10月，等等。实际结果： value month 645 Aug 2018 589 NA 465 NA 523 NA 632 NA 984 NA 预期成果： value month 645 Aug 2018 589 Sep 2018 465 Okt 2018 523 Nov 2018 632 Dez 2018 984

浏览 0提问于2019-01-04得票数 3

回答已采纳

2回答

R中多列的加权和

、、

我试着给出每个因子水平的加权和。我有四列数据： col1 = surface area col 2 = dominant col 3 = codominant col 4 = sub 1 2 3 4 125 A NA NA 130 A NA B 150 C B NA 160 B NA NA 90 B A NA 180 C A B 如果只填充第2列，则该值将得到列1的全部数量。，如果cols 2和3被填充，则在cols 1中的值被分割成两半；如果cols 2、3和4被填充，则将被拆分

浏览 4提问于2020-11-20得票数 2

回答已采纳

1回答

Dataframe中的列名重复。行将重复的列绑定在一起

、、

我有一个超过60-70个列名的Dataframe。在这个60-70中，大多数列名都是重复的。我想将重复的列行绑在一起。如何找出重复的列名，并将行分别添加到列中。最后，dataframe必须是不相等的行dataframe(用NA填充空单元格)。谢谢

浏览 196提问于2021-08-27得票数 0

1回答

spark scala中具有两个不同模式的过滤器列

、

我有三个列的dataframe : ID、CO_ID和DATA，其中DATA列有两个不同的模式，如下所示： |ID |CO_ID |Data |130 |NA | [{"NUMBER":"AW9F","ADDRESS":"PLOT NO. 230, JAIPUR RJ","PHONE":999999999,"NAME":"SACHIN"}] |536 |NA | [{"NUMBER":"AW9F","ADDRESS":&#

浏览 0提问于2019-05-02得票数 3

2回答

熊猫keep_default_na=False不起作用

、、

问题我有一个Excel文件(.xlsx)，其中包含一个值等于'#N/A‘的工作表。当使用熊猫将Excel表格作为DataFrame阅读时，'#N/A‘值被解释为NaN。根据指南，我希望通过添加keep_default_na=False参数，'#N/A‘可以读入DataFrame中。不幸的是，'#N/A‘仍然被解释为NaN。代码下面是使用的代码： df = pd.read_excel(io='TestWorkbook.xlsx', sheet_name="Sheet1",

浏览 0提问于2018-11-19得票数 3

回答已采纳

3回答

基于另一个R用四个日期列中的一个填充列

、、

我有一个DF，像这样的5列； A B Date1 Date2 Date3 Date4 1 x NA NA NA 2 NA y NA NA 3 NA NA z NA 4 NA NA NA f 我想使用dplyr包和case_when()函数来声明如下 df <- df %>% mutate(B = case_when( A == 1 ~ B == Date1, A == 2 ~ B == Date2, A == 3

浏览 14提问于2022-04-29得票数 1

回答已采纳

1回答

将某些行中的列折叠为R中列数最少的行

我想知道如何在没有NAs的列数最少的情况下，在dataframe中折叠这些列。有的行只有3列，其余的填充了NA。其他行的所有列都填充了数字，而没有NAs。我已经提供了下面的样本数据集和我想要的理想结果。在下面的理想数据框架中，中间列总是变成列2，例如，有5列的行将列1和2折叠为1，而4&5折叠为3。 a <- c(1, 1, 1, 1, 1, 1) b <- c(2, 2, 2, 2, 2, 2) c <- c(3, 3, 3, 3, 3, 3) d <- c(NA, 4, NA, 4, 4, NA) e <- c(NA, 5, NA, 5, 5, NA

浏览 0提问于2015-05-29得票数 0

回答已采纳

2回答

从列表填充数据帧

我有一个包含4个空列的dataframe foo，需要用list result的内容填充这些列。我不能按公共id合并，因为一个id不存在，但foo和result的长度相同。如何访问result的每个元素的内容并将它们转换为dataframe foo的列我知道要访问单个列表元素的每个部分，必须编写：result[[1]][1]、result[[1]][2]、result[[1]][3]、result[[1]][4]，但是如何遍历它们呢？我试过了 for (i in 1:length(result)){ foo$coords.x1.min <- result[[i]][1] }

浏览 7提问于2017-01-12得票数 1

回答已采纳

1回答

误差计算火花DataFrame计算标准差

、、、

我有以下简单的函数，在这里，我用0填充所有缺少值的列，然后计算标准偏差。我知道我可以使用描述功能，但我想用这个作为我的目的。 def stdDevAllColumns(df: DataFrame): DataFrame = { df.select(df.columns.map(c => df.select(c).na.fill(0).agg(stddev(c))): _*) } 这会编译，但在运行时会导致失败： <console>:143: error: overloaded method value select with alternatives: [U1](c1

浏览 0提问于2021-11-16得票数 0

回答已采纳

3回答

将一行中的所有非零值编译为字符串列。

我有一个稀疏的设计矩阵，类似于dataframe，如下所示： BRDirect BRExclusive MagnetY MagnetN Reasons 1 0.00 0.17 0.08 0.00 NA 2 0.00 0.00 0.08 0.00 NA 3 0.00 0.17 0.00 0.06 NA 4 0.29 0.00 0.00 0.06 NA 5 0.29 0.00 0.00

浏览 0提问于2018-08-17得票数 2

回答已采纳

1回答

Python Dask:无法将非限定值(NA或inf)转换为整数

、、

我正在尝试从一个postregres表中捕获一个非常大的结构化表格。它有大约200,000,000条记录。我正在使用dask而不是pandas，因为它更快。当我将数据加载到df中时，它比pandas快得多。我正试着用compute把dask DataFrame转换成Pandas dataframe，它总是给我ValueError NA/inf。我已经传递了dtype='object'，但它不工作。有没有办法解决这个问题？ df = dd.read_sql_table('mytable1', index_col=&

浏览 0提问于2020-02-20得票数 1

1回答

根据列上的条件合并2个数据

、、

我有一个dataframe df1： symbol s_1 . . Other columns aa 111 . . . ab 21 . . . 另一个dataframe df2： symbol . . . Other columns aa aa aa ab ab ab ab ac 我希望将s_1列合并到df2中，使每个符号表示s_1值。我不希望其他列来自s_1，并希望在符号在中不可用时，将NA填充到输出结果如下：输出结果如下： symbol . . .

浏览 2提问于2020-05-21得票数 0

回答已采纳

4回答

用组内插代替NAs

我想知道如何用插值将特定列中的NA值按组替换。我的一些小组只有一个非NA，我想用一个非NA填充这些组。如果我有这样的数据： Group Value ALB NA ALB 10 ALB NA ALB 12 ARE NA ARE NA ARE 2 ARE NA ARE NA ARG 4 ARG NA ARG 6 我想要创建一个新的列，所以我的dataframe看起来如下所示： Group Value New Column ALB NA 9 ALB 10 10 ALB

浏览 2提问于2018-07-14得票数 1

回答已采纳

2回答

用R中的常量值替换列中的空值

、

我试图使用以下代码来填充dataframe中列中的空值(ADRPD)。但不起作用。 data$ADRPD[is.na(data$ADRPD)]= "medium" 这是一个错误： Warning message: In `[<-.factor`(`*tmp*`, is.na(data$ADRPD), value = c(2L, 2L, 2L, : invalid factor level, NA generated 有什么建议吗？

浏览 9提问于2017-09-28得票数 0

回答已采纳

1回答

如何通过基于多个条件计算来填充一个(或多个)列的空白？

、、

我每天收集和处理数百张乱七八糟的桌子，其中一些数据需要注意。 (不好意思我的英语和印刷技巧) 级别“S”的项目很少出现，当发生时(第3、6行)，如果“检查”列是“Go”(第6行)，则需要填充目标列的空白。(如果不为空，则保留原始值) 需要用"DANGER".填充"FillNA"列中的空白 (2.如果可能的话，"Detail"列中的空白需要用dataframe的行号填充&也就是"Check"列中指示的操作)。 N = pd.NA df= pd.DataFrame({ "LEVEL":["

浏览 2提问于2022-05-15得票数 0

回答已采纳

1回答

如何在两列匹配的情况下合并两个不同的数据帧内容

、、、

我有一个包含1064条记录的dataframe1和一个包含328条记录的dataframe2。我想将dataframe2合并到dataframe1中。dataframe在第二个df中没有相应数据的其余记录应该用文本"NA“填充。例如 DF1 Name Area Totalcases Name1 Area1 200 Name2 Area2 300 Name3 Area2 100 Name3 Area3 0 DF2 Name Area S

浏览 21提问于2020-10-22得票数 0

1回答

将多个DataFrame系列添加到同一DataFrame中的新系列中

、、

我在.csv中有一个数据集，我使用熊猫将其导入到DataFrame中，组织方式如下(显然不是实数)： A B C D E F 0 20 4 24 8 28 1 21 5 25 NA NA NA NA 6 26 10 30 3 23 NA NA 11 31 我想要实现的是将数据保存在同一个DataFrame中的两个额外列G和H中，这样我就可以得到以下内容： A B C D E F G H 0 20 1

浏览 1提问于2021-01-16得票数 0

回答已采纳

2回答

Python Pandas和excel xlsx单元格式

、、、

所以我需要做的是把xlsx文件拿到熊猫的dataframe，然后用它做一些事情，并将它保存回xlsx文件。我是如何做到的： import pandas as pd from openpyxl import load_workbook from datetime import datetime path = r'D:\Test\Test.xlsx' path2 = r'D:\Test\TestResult.xlsx' dataFrame = pd.read_excel(path, sheet_name=0, index_col=None, na_values

浏览 5提问于2021-03-24得票数 0

回答已采纳

2回答

Pandas、numpy.where()和numpy.nan

、、、、

我想使用numpy.where()向pandas.DataFrame添加一列。我想对条件为false的行使用NaN值(以指示这些值是“缺失的”)。考虑一下： >>> import numpy; import pandas >>> df = pandas.DataFrame({'A':[1,2,3,4]}); print(df) A 0 1 1 2 2 3 3 4 >>> df['B'] = numpy.nan >>> df['C'] = numpy.wher

浏览 144提问于2021-05-11得票数 5

回答已采纳

1回答

为什么一个计算的向量和一个赋值的向量的行为是不同的，即使它们返回相同的值？

、、

我正在试着根据计算出的指数来填写一个整齐的data.frame。从计算值创建索引向量后，我可以测试并确认计算值是否正确。但是，当我使用该向量为data.frame中的行赋值时，我可以看到这些值没有准确地填充到正确的行中(多填充了一行，这是不应该填充的)。当我使用from:to方法将相同的值赋给一个向量时，这些值填充到正确的行中。当我使用from:to方法将相同的值赋给一个向量时，这些值填充到正确的行中。 PostPulseIndices <- ((Alpha+StepDuration)/SampleInterval+1) : ((Alpha+StepDuration+0.120)/Sa

浏览 0提问于2019-09-11得票数 0