如果'na.rm‘为FALSE，则不允许缺少值和NaN_无法使用描述性函数运行dplyr::summarize函数：“如果'na.rm‘为FALSE，则不允许缺少值和NaN's’” - 腾讯云开发者社区

python、pandas、dataframe、find、missing-data

我试图找出丢失的值，然后删除丢失的值。试着在网上寻找数据，但似乎找不到答案。提取数据：在df中，1981年和1982年，它应该是“-”，即缺失的值。我想找到丢失的值，然后删除缺失的值。使用isnull:导出数据我使用了df.isnull()，但在1981年和1982年，它被检测为'False‘，这意味着有数据。但它应该是“-”，因此被认为是缺失的值。我在下面粘贴了我的代码。我错过了什么？ import pandas as pd mydf = pd.read_excel('abc.xlsx', sep='\t') df1 =

浏览 7提问于2020-01-11得票数 4

1回答

R函数给出NA

r、function、max、na

我有以下数据： x=as.data.frame(c(NA,NA,5,20,25,50,75,8,NA)) 为什么max(x)会产生"NA“作为结果？NA不可能是最大的。这种行为背后的逻辑是什么？最后，只有max(x, na.rm = TRUE)给出了正确的最大值，但我不知道为什么。提前谢谢！

浏览 0提问于2022-10-20得票数 -1

回答已采纳

2回答

(0-1；min/max)数据中的所有列分别(按列而不是全部数据)

我有一个有300列的dataframe (标有so X17.01，X24.05，X200.4)还有500排。我希望将这些列重新划分为0到1之间，但基于每个列的最小/最大值。例如，我希望将X17.01列与X24.05列分开。我在R(以下)中使用了以下代码，但两者都增加了整个数据帧。代码1： Data_profile_standardized <- data.frame(lapply(Data_profile, function(x) scale(x, center = FALSE, scale = max(x, na.rm = TRUE)/1))) 代码2： normalize <

浏览 6提问于2022-10-18得票数 2

9回答

几何均值:有内置的吗？

r、statistics、built-in、geometric-mean

我试着找一个几何均值的内置函数，但是找不到。 (显然，在shell中工作时，内置不会为我节省任何时间，我也不怀疑在准确性方面有什么不同；对于脚本，我会尽可能多地使用内置，因为(累积)性能收益通常是显而易见的。以防没有(我怀疑是不是这样)，这是我的。 gm_mean = function(a){prod(a)^(1/length(a))}

浏览 0提问于2010-04-09得票数 114

回答已采纳

1回答

在Pandas中将NaNs转换为type 'category‘时出现问题

python、pandas、numpy、nan

在用astype('category')转换NaN值后，我遇到了问题。我使用的是pandas 1.1.3和numpy 1.19.1。 import pandas as pd import numpy as np employees = pd.DataFrame.from_dict({'First Name':['Douglas', 'Thomas', 'Maria'], 'Gender': ['Male', '

浏览 11提问于2021-11-16得票数 1

2回答

多列的时间聚合

r、time、aggregate

我添加了一个数据框架，包括一次和6个数据列，如下所示. df <- data.frame(structure(list(Time = c(100, 100.1, 100.2, 100.2, 100.3, 100.3,100.3, 100.4, 100.4, 100.5, 100.5, 100.6, 100.6, 100.7), x = c(4,NA, 7, NA, 3, 7, NA, 9, NA, 7, NA, 3, NA, 7), y = c(NA, 7, NA,9, NA, 9, 7, NA, NA, NA, 9, NA,

浏览 1提问于2018-01-15得票数 2

回答已采纳

2回答

如何在R中使用ggplot美学中的先验中值？

r、ggplot2、median

我正在尝试计算一个中位数作为一个数字，然后在ggplot的美学中使用这个数字作为一个值。我首先尝试获取中位数作为一个值： mean_delay_median <- nycflights13::flights %>% group_by(dest) %>% summarise(mean_delay = mean(arr_delay, na.rm = TRUE)) %>% median(mean_delay) 这将产生错误消息： Error in median.default(., mean_delay) : need numeric data 我该如何解决

浏览 0提问于2018-12-08得票数 0

1回答

如果一个条目为空，则删除行/列

python、pandas

我正在构建一个python脚本，将定期运行，并提醒我，如果有一个网站上的价格变化。多亏了很多其他的帖子，我已经在我的新手方法上取得了相当大的进步，但我对最后一个障碍有一个小问题。我查看了pandas文档，发现了一些应该允许我删除包含空单元格的行的东西，但我从来没有让它工作过。 pd.reset_option('max_rows') pd.reset_option('max_columns') pd.set_option('display.width', 800) url="https://support.apple.com/de-de/

浏览 3提问于2019-05-03得票数 0

2回答

R重新定义base::mean()函数以包含is.finite()功能

r、function、mean

我想重新定义平均值函数(将其应用于tabular()表中)，以省略某个变量的所有NA、NaN和Inf观测。我不想删除整行(观察)，而是使用平均值公式来计算所有不是NA、NaN、Inf的值的平均值。 Mean.new <- function(x) base::mean(x, na.rm=TRUE) 据我所知，标准平均值()中的na.rm=TRUE只删除NAs，而不是NaN和Inf。因此，如何在上面的代码中添加检查is.finite() (这将排除所有NA、NaN、Inf)的功能？谢谢你和最好的，软木

浏览 4提问于2021-02-27得票数 2

回答已采纳

2回答

在data.table中通过删除NAs来使用mean进行聚集

r、data.table

我有一个如下的data.table： ID ID2 Col1 Col2 Col3 Col4 1: 1 34 423.76 234.22 234.11 123.87 2: 2 34 154.24 NA 221.23 786.43 3: 3 11 423.13 234.67 234.65 123.54 并按sum和mean聚合如下所示： aggregated <- dt[, list(mean(Col1), mean(Col2),

浏览 0提问于2014-08-23得票数 0

1回答

如何用熊猫更改现有csv的单列

python、pandas、dataframe

我有一个.csv文件，可以用pd.read_csv()读取。在这个文件中，我有需要用新逻辑更新的SomeBoolean列。但是，当我再次使用pd.to_csv()编写文件时，其他一些列值会被更改，例如，sometimesNaN列有一些空值，这些值在读取csv时被解释为NaN，但是它们也被写入为NaN而不是空值。是否有一种方法可以更新SomeBoolean列而不意外地影响其他列(如sometimesNaN列)？ Index Date SomeBoolean Values sometimesNaN 0 2021-05-18 False

浏览 2提问于2021-05-19得票数 2

回答已采纳

3回答

如何从R中的数据帧中删除负值

r、if-statement、for-loop、dataframe

我想从dataframe中删除负值，然后我需要分别计算每行的平均值(每行的正值的平均值)，我写了这个来删除负值，但是它不起作用。我有这样的警告： [<-.data.frame中的错误(*tmp*，i，j，value = NULL)：替换长度为零我怎样才能解决这个问题？ for (i in 1:1000) { for(j in 1:20){ if (dframe[i,j]<=0) dframe[i,j]<-NULL j=j+1 } i=i+1 }

浏览 4提问于2017-03-15得票数 7

回答已采纳

1回答

如何定义pandas dataframe中的缺省缺失值

python、pandas

我想读取具有给定数据类型和缺失值的数据帧，但下面的代码是错误的。我不知道为什么会这样！ myText = StringIO("""1,2 3,\N 5,6""") myDf = pd.read_csv(myText, header=None, names=["a1","a2"], na_values=["\N"], dtype={"a1":"int", "a2":"int"}) 我得到了错误消息： ValueError: Intege

浏览 3提问于2017-02-05得票数 2

回答已采纳

1回答

在Pandas中打印包含列名和值的特定行，并使用正确的数据类型逐行打印

python、pandas

我正在尝试打印数据帧中的特定行，其中包含该行的列名及其各自的值。这是我的代码。 import pandas as pd import numpy as np df1 = pd.read_csv('mortality_inhospital_dataset1.csv') df1 = df1.set_index('ID', inplace = False) df1 = df1.loc[125047] print(df1.fillna(0).to_string()) 我得到了以下输出：我想要的输出是：结果:0 年龄: 72岁 gendera: 0

浏览 0提问于2021-11-28得票数 0

2回答

删除数据帧中的N.A值

我在R中是个乞丐，我使用一个名为rere.csv的csv归档文件，因此试图用以下代码获取质量列的平均值： x<-read.csv("rere.csv", header = TRUE, sep = ";") mean(x$quality) 但我明白了：警告消息:在mean.default(x$quality)中:参数不是数字或逻辑:返回NA quality 5 6 2 2 4 9 41 1 5 N.A 2 23 2 9 5 62 2

浏览 2提问于2014-12-17得票数 1

1回答

在R中有没有一种忽略a“的方法。在我的数据中计算平均值/sd/等

我有一个很大的数据集，我需要计算几列的均值/std dev/min/和max on。数据集使用".“表示某个主题缺少值的时间。当运行mean或sd函数时，这会导致R返回NA。有什么简单的方法可以解决这个问题吗？我的代码就是这样 xCAL<-mean(longdata$CAL) sdCAL<-sd(longdata$CAL) minCAL<-min(longdata$CAL) maxCAL<-max(longdata$CAL) 但是R将在所有这些变量上返回NA。我得到以下错误警告消息:在mean.default(longdata$CAL)中:参数不是数字或逻

浏览 15提问于2020-03-31得票数 0

回答已采纳

1回答

RMSE以向量或列表的形式返回NA或error。

我正在为计算值计算RMSE，但是它返回NA或以下错误：与请求的类型不兼容: type=list；target=double。以下是数据集： #X [1] 7.833134 5.983825 4.933213 3.928198 3.546371 3.678339 4.981000 5.991927 5.302597 6.057735 6.471139 7.080655 [13] 8.411150 5.800234 5.732390 4.497880 3.609478 4.059384 5.046262 5.268591 5.575791 5.772434 7.139264 7.61255

浏览 3提问于2021-07-13得票数 0

回答已采纳

4回答

Java自动装箱规则

java、autoboxing

我是一个java新手，下面的例子让我很困惑。是否可以认为"==“符号将比较整数和int中的”自动装箱“整数之间的值，并比较整数之间的引用地址？双打和0/0怎么样？ import edu.princeton.cs.introcs.*; public class Autoboxing { public static void cmp(Integer first, Integer second) { if (first < second) StdOut.printf("%d < %d\n", first, se

浏览 2提问于2012-09-24得票数 11

回答已采纳

1回答

R中的聚合函数，NAs之和为0

r、aggregate、plyr、summarize

我看到了一个堆叠溢出的问题列表，关于以下内容，但一直没有得到令人满意的答案。我将跟进以下问题 > test <- data.frame(name = rep(c("A", "B", "C"), each = 4), var1 = rep(c(1:3, NA), 3), var2 = 1:12, var3 = c(rep(NA, 4), 1:8)) > test name var1 var2 var3 1 A 1 1 NA 2 A 2 2 NA 3 A

浏览 9提问于2022-07-23得票数 1

回答已采纳

3回答

R:具有某一因子水平的所有情况的平均值

r、mean、na

我试着从这里Mean by factor by level代码，但它不工作。这是我的情况。从航班数据集中，我想知道UA航空公司所有飞机的平均航班延误。 library(nycflights13) data(flights) mean(flights$air_time[flights$carrier == "UA"]) 但是结果就是 [1] NA 我做错什么了？

浏览 11提问于2020-06-19得票数 2

回答已采纳

2回答

R代码有助于按列计算单元格值的索引。

我对r不熟悉，我正试图从给定的表格中计算一个指数，我计算了下面表格的最小值、最大值和中位数，我在列中有一些NaN。第一和第二列是纬度和经度，从3开始是土壤湿度。 1 2 3 4 5 6 7 8 9 10 11 28.188 -111.438 NaN NaN NaN NaN NaN NaN NaN NaN NaN 28.188 -111.312 362.74 360.723 361.

浏览 2提问于2015-01-03得票数 0

2回答

为什么我不能使用np.isnan来过滤数据？

python、pandas

我有一些数据文件，里面有很多南。我想通过第一个数据文件制作一个掩码，然后只保留那些在第一个数据文件中不包含np.nan的列。让我举一个例子： In [69]: df = pd.DataFrame(np.reshape(range(25), (5,5))) In [70]: df Out[70]: 0 1 2 3 4 0 0 1 2 3 4 1 5 6 7 8 9 2 10 11 12 13 14 3 15 16 17 18 19 4 20 21 22 23 24 In [71]: df[5]

浏览 1提问于2021-02-09得票数 0

回答已采纳

1回答

获取分组和聚合后的最后一个非NaN值

python、pandas、dataframe、pandas-groupby

我有一个这样的数据框，例如： col1 col2 0 A 3 1 B 4 2 A NaN 3 B 5 4 A 5 5 A NaN 6 B NaN . . . 47 B 8 48 A 9 49 B NaN 50

浏览 11提问于2021-05-10得票数 1

回答已采纳

3回答

为什么这个JavaScript包含()特性是有意义的？

javascript、arrays、include、nan

我正在学习include()特性，我发现了下面的代码 [NaN].includes(NaN) //True 但 NaN === NaN // False 为什么这是可确认的？

浏览 10提问于2017-10-19得票数 3

回答已采纳

2回答

在python中被视为字符串的NAN值

python、pandas、nan

我正在用python编写一个小应用程序的代码，我意识到当文件(txt，dat，csv ...)在某些数据中包含像NaN或" NAN“这样的缺失值，而如果将这些值写入nan或NaN，则通过导入数据不会有问题。例如 06.02.2011 00:10:00 NAN 43 30 2 37 42 30 2 34 41 19 4 302 5 306 8 69 2810 2811 2810 974 46 130 06.02.2011 00:20:00 36 41 28 2 36 42 27 2 35 42 26 3 295 8 298 8 69 2811 2811 2811 974 46 130

浏览 0提问于2016-02-19得票数 2

1回答

熊猫df.fillna()不替换na值

python、pandas

我有一个类似于这个的数据格式(为了清晰起见:这表示一个包含5行和8列的df )： BTC-USD_close BTC-USD_volume LTC-USD_close LTC-USD_volume \ time 1528968660 6489.549805 0.587100 96.580002 9.647200 1528968720 6487.379883

浏览 1提问于2020-05-05得票数 1

回答已采纳

1回答

为什么分类数据类型不能正确处理!= NaN比较？

python、pandas

根据项目是否属于类别，在!=比较中似乎存在不一致的行为。如果值在类别中，!= NaN将返回False，这似乎与正常的!= NaN比较的评估方式不一致。当值不在类别中时，行为似乎是预期的。 import pandas as pd import numpy as np # Standard evaluation '11' != np.NaN #True 'A' != np.NaN #True s = pd.Series([np.NaN, '11']).astype('category') s.ne('11')

浏览 0提问于2020-03-04得票数 0

2回答

R和Zoo:数据粗糙的移动平均线？

r、zoo、moving-average、ragged

我想要计算移动平均值，用已知的条目3，5和1填充NA条目。我如何使用R中的包动物园来实现这一点？输入 > library(zoo) > hh <- c(NA, NA, NA, 3, NA, 5, NA, 1, NA, NA, NA, NA) 失败 > rollmean(hh,na.omit=TRUE,k=1) [1] NA NA NA NA NA NA NA NA NA NA NA NA > rollmean(hh,4, na.omit=TRUE,k=1) [1] NA NA NA NA NA NA NA NA NA NA NA

浏览 3提问于2016-12-28得票数 0

回答已采纳

1回答

为什么平等和不平等与一个完全的nan分类序列的比较总是返回假的？

python、pandas

我发现这是一个令我困惑的问题的根源。熊猫1.05 >>> left = pd.Series(pd.Categorical([numpy.nan, numpy.nan, numpy.nan, numpy.nan], categories=["1"], ordered=False)) >>> right = pd.Series(pd.Categorical(["1", "1", "1", numpy.nan], categories=["1"], ordered=False)) &

浏览 2提问于2021-02-10得票数 0

回答已采纳

3回答

是什么使下面的代码打印为假？

java、puzzle

public class Guess { public static void main(String[] args){ <sometype> x = <somevalue>; System.out.println(x == x); } } 我必须更改某些类型和某些值，以使其返回false？有可能吗？

浏览 5提问于2010-01-06得票数 2

回答已采纳

1回答

潜在类分析减少观察次数？

我试图对一项大规模的民意调查进行一次潜在的阶级分析，我遇到了一个问题，在潜在课程结束时，观察的数量少于初始数据中的观测数。这阻碍了我进行分析，因为我希望将类描述变量附加到原始数据集，并运行一些统计/生成图表。下面是代码的一个小片段，您是我想运行LCA的数据集。问题是，当我创建你的时候，我会得到一个1948年的数据集，而在潜类之后，我会得到一个1943年的数据集。 Complete.cases(dat，91:104)==T，] f<-cbind(Q42_1，Q42_3，Q42_4，Q42_5，Q42_6，Q42_7，Q42_8，Q42_9，Q43_1，Q43_2，Q43_3，Q43_4

浏览 1提问于2018-08-13得票数 0

回答已采纳

1回答

在Pandas Dataframe中使用NaN作为空字符串合法吗？

python、pandas

我正在从S3读取一个包含空值的字符串列的csv.gz文件。一旦我使用pandas.read_csv()方法读取了该文件， pandas.read_csv(io.BytesIO(csv_data['Body'].read()), sep='|',compression='gzip', engine='python', error_bad_lines=False, warn_bad_lines=True,

浏览 2提问于2020-03-26得票数 0

3回答

如何在R中重组、计算均值并生成新的数据帧？

我是R的大一新生，最近我正在做一个小项目。我有一个数据集看起来像这样：(对不起，出于保密目的，我不能复制真实数据)，因为在一些县，化学物质已经被测量了多次。 id county chemicalA chemicalB chemicalC 1 a 0.1 NA NA 1 a 0.3 NA NA 1 a 0.2 NA NA 1 a 0.2 NA NA 2 b 0.4 0.2 NA 2

浏览 13提问于2020-04-10得票数 2

回答已采纳

1回答

我想选择某些列并创建新列，如果在pyhton中为真，它将返回列名？

python、pandas

我有一个数据框 A AA B D C E True 2 False 33 False False False 3 False 43 True False True 5 True 56 False True False 2 False 7 nan True 我想要获取名为"result“的列，如果为True，它将返回A、B和C中的列名，如果其中任何一个不为true，则返回nan。期望的列 result A C A,B nan

浏览 13提问于2020-04-02得票数 0

1回答

条件行平均

我有个简单的问题。我有一个看起来像这样的data.frame： df 甲乙丙Exclusion_criteria 3 4 5 3 2 1 6 9 2 当Exclusion_criteria与1不同时，我只想表示A、B和C列的行(例如，除了Exclusion_criteria == 1以外的所有情况)。有人能帮我吗？亲切的问候

浏览 1提问于2017-02-01得票数 0

2回答

PHP在数组中插入变量，但不能json_encode

php、arrays、json

我已经用了好几天了，我测试了变量是否被填充了，它们确实是被填充了，但我认为我不知何故没有正确地处理数组，因为'echo json_encode($response)‘没有打印出任何东西。我还尝试将数组中的变量替换为随机数，一切都很顺利，只是变量确实起作用了。 public function getPlaces() { $places = array(); $stmt = "SELECT * FROM poi "; $retval = mysqli_query( $this->conn, $stmt ); if ($retval)

浏览 0提问于2018-05-27得票数 0

1回答

给定条件的变异列

我是R的初学者，我坚持以下几点.. df <- tibble( id = c(01, 02), a = c(0.44, 0.42), b = c(1, 0.42), c = c(NaN, 0.71), d = c(0.75, 0), e = c(0.66, 0.75), f = c(0.5, 0.22), g = c(1, NaN), h = c(0.8, NaN) ) 我想知道如何对a:d和e:h列分别计算>0的单元格个数的列进行变异(&按行) 我一直在想这样的事情.. df1 <- df %>% ro

浏览 0提问于2019-09-27得票数 1

1回答

查找整个数据的分位数

我想找出我整个df的分位数。 a <- rbind(5, 10, 1.5) b <- rbind(1.5, 6.7, 7) c <- rbind(3.5, 10.2, 5) df <- data.frame(a,b,c) > quantile(df) Error in `[.data.frame`(x, order(x, na.last = na.last, decreasing = decreasing)) : undefined columns selected 有人能帮我吗？

浏览 3提问于2021-06-01得票数 1

回答已采纳

2回答

Pandas:对NaN值进行`or`操作

python、pandas、dataframe

我有一个包含3列的DataFrame，这样每一列都可以有一个值NaN。我想根据这3个值填充第4列，以便对这些列应用or操作:如果第一列不是NaN，则获取它的值，否则检查第二列，依此类推。因为NaN值不是False，所以不能按原样使用or运算符。这是我附带的代码，但它不是Pythonic式的或者Pandas式的。有没有内置的函数可以做到这一点？或者，如果你有任何其他的建议？ import pandas as pd import numpy as np nan = np.NaN df = pd.DataFrame({"a": [nan, 1, nan], "b"

浏览 22提问于2021-07-06得票数 1

回答已采纳

1回答

为什么顺序在涉及python中的np.NaN的逻辑和/或操作中很重要？

python、numpy、null、logical-operators

np.NaN的布尔值为真。那么为什么和/或操作在python中表现得如此随机。 bool(np.nan) == True 如果True or np.nan计算为True，那么为什么np.nan or True计算为nan？对于和操作来说，这完全相反： True and np.nan是nan，np.nan and True是True。

浏览 0提问于2018-06-05得票数 0

回答已采纳

3回答

在R中不使用NA的多阵列平均

r、multidimensional-array

我在多数组平均中遇到了一个问题，例如，我有一个三维的4*4*3数组x， x , , 1 [,1] [,2] [,3] [,4] [1,] NA NA NA NA [2,] 0.5 NA NA NA [3,] NA NA NA NA [4,] NA NA NA NA , , 2 [,1] [,2] [,3] [,4] [1,] NA NA NA NA [2,] 0.7 NA NA NA [3,] 0.4 NA NA NA [4,] NA NA NA

浏览 0提问于2012-07-23得票数 3

回答已采纳

1回答

在Pandas读取CSV后显示空白的列(表示北美)中有"NA“

python、pandas、dataframe

我有一个CSV文件，其中包含一个包含国家代码的Country列。在这里，"NA“指的是北美。我需要将其转换为UTF-8格式。当使用下面的代码时，带有"NA“的行在导出的文件中显示为空白： df = pd.read_csv(filepath, encoding='UTF-8') df.to_csv(r'path+filename',header=None ,encoding = 'UTF-8', index = False) 例如, 输入文件： Week Country PL Sales$ W01 AE 0I 250

浏览 6提问于2021-02-08得票数 1

1回答

java.lang.Double实现中的不一致性(OracleJDK1.8)？

java、java-8、double、jls

我查看了java.lang.Double类的实现。NaN的值是0x7ff8000000000000L的指定值。public static final double NaN字段被设置为0.0d / 0.0，如果JVM确实以这种方式实现它，则应该将其计算为0x7ff8000000000000L。为什么选择这个值(0x7ff8000000000000L)？这个值有什么特别之处(例如它的位掩码)？为什么字段被隐式地设置为该值，并依赖于0.0d / 0.0操作的底层实现，而静态方法public static long doubleToLongBits(double value)将值显式地设置

浏览 0提问于2019-03-19得票数 4

回答已采纳

1回答

R raster::calc使用na.rm = FALSE计算分位数

r、na、r-raster、quantile

我使用raster::calc来计算不同层上每个单元的分位数，但是我不理解na.rm = FALSE时的行为，就像下面的例子一样。让我们创建一个样本栅格，并从随机单元中删除5个值。 library(raster) r <- raster::raster(nrow = 2, ncol = 2) r[] <- 1:4 s <- raster::stack(r, r*2, r * 3, r * 4, r * 5) s[] set.seed(1) s[][sample(1:4, 1), sample(1:5, 1)] <- NA s[][sample(1:4, 1),

浏览 5提问于2017-08-08得票数 2

回答已采纳

2回答

一次计算两列响应变量的平均值

我正在尝试分析一个数据集，其中有两个响应变量X和Y，以及两个分组变量Treatment和Rep： tribble( ~Treatment, ~Rep, ~X, ~Y , "N1", 1, 10.18, 14.38 , "N1", 2, 13.53, 14.38 , "N2", 1, 15.34, 18.28 , "N2", 2, 10.4, 7.14 , "N3", 1, 8.57, 22.57 , "N3", 2, 13.95, 19

浏览 21提问于2020-02-05得票数 0

1回答

force_all_finite = False的sklearn pairwise_distances的预期行为？

scikit-learn、nan

我尝试在包含NaNs而不填充NaNs的数组上使用sklearn的pairwise_distances。重现该问题的最小代码示例： import numpy as np from sklearn.metrics import pairwise_distances X = np.array([[1,2],[2,3],[1,np.nan]]) res = pairwise_distances(X, force_all_finite=False) 返回 ValueError: Input contains NaN, infinity or a value too large for dtype(&

浏览 18提问于2020-04-22得票数 0

1回答

为什么pandas.to_csv要为整数写浮点数？

python、csv、types、pandas、type-conversion

我有下面的代码来解析一些csv数据。关键是最后几行，其余的只是为了显示上下文。基本上，我的数据中最后有三列，ID变量LopNr和case应该有整数“无论如何”，但为了以防万一，我将整个DataFrame转换成整数。为什么我要为结果csv文件中的LopNr列和年份列获取".0“，而第三列包含聚合数据的列实际上被转换为整数，并且输出时没有".0"？我认为，在.astype(int)之后，所有列都有整数，并且我们的输出到csv，而不将它们转换回浮动。 import iopro from pandas import * neuro = DataFrame() for ye

浏览 1提问于2014-05-02得票数 5

2回答

如果-否则返回值输出不正确:使用比较运算符[解决:不建议比较'np.nan == np.nan‘]

python、pandas

当x == math.nan时输出值不正确；我也尝试使用if (math.isnan(x) is True):作为条件。我没有返回True，而是得到了NaN。我能知道发生这种事的原因吗？输入： import math def nan_impute(x): if (x == math.nan): return True else: return False train_data['country_2'] = train_data.loc[:,'country'].apply(nan_impute) train_

浏览 0提问于2019-07-23得票数 0

2回答

如何将纯数字列替换为数字关键字dict？[python]

python、pandas、dictionary

下面有一个dataframe和一个dict，但是如何用dict替换该列呢？ data index occupation_code 0 10 1 16 2 12 3 7 4 1 5 3 6 10 7 7 8 1 9 3 10 4 …… dict1 = {0: 'other',1: 'academic/educator',2: 'artist

浏览 1提问于2017-04-22得票数 5

回答已采纳

2回答

在追加两个pandas数据帧时，布尔值将转换为浮点数

python、pandas、dataframe、append

当其中一个数据帧的列全部为空值(NaN)，而另一个数据帧在同一列中具有布尔值时，追加两个pandas数据帧具有意外的行为。结果(通过追加)数据帧中的相应列被类型化为float64，并且布尔值根据它们的原始布尔值被转换为1和0。示例： df1 = pd.DataFrame(data = [[1, 2 ,True], [10, 20, True]], columns=['a', 'b', 'c']) df1 a b c 0 1 2 True 1 10 20 False df2 = pd.DataFrame

浏览 30提问于2019-11-13得票数 2

回答已采纳