在将数据帧转换为列表时删除NaN，无数据类型_将pandas数据帧转换为元组列表并删除所有pandas数据类型_在将DF值转换为列表时保持数据类型的完整性 - 腾讯云开发者社区

、

我得到了以下数据帧： import pandas as pd test = pd.DataFrame([["Bugatti","Veyron"], ["Bugatti","Chiron"], ["VW","Golf"], ["VW","Passat"], ["VW","Polo&

浏览 7提问于2019-11-28得票数 0

回答已采纳

1回答

查看字符串是否包含数据框中的其他字符串

、、

如何使用pandas将一个数据框中的行映射到另一个数据框中的值？我当时在做一个市场分析项目。这个想法是编写一个函数来识别URL是否是“官方”URL。有两个数据帧数据帧1将是URL列表： Url ---- https://twitter.com/abcd/1223343 https://twitter.com/fegh/3232 https://twitter.com/qwer/w2234 https://facebook.com/ssdf/w1234 ... 数据框2将是官方句柄的列表： Handle_1 Handle_2 Handle_3 -------- -------- -----

浏览 16提问于2020-12-07得票数 0

2回答

如何将字典列表转换为符合一定条件的数据帧？

、、

假设我有一个字典列表： list_dict = [{0: 0.1, 1: 0.2, 2: 0.3, 3: 0.4, 'Product': 'A'}, {0: 0.5, 1: 0.6, 2: 0.7, 3: 0.8, 4: 0.9, 'Product': 'B'}, {0: 1.1, 1: 1.2, 'Product': 'C'}] 我想把它变成数据帧，比如， |State | Probability |Product| |---------|---------------|----

浏览 10提问于2020-06-24得票数 1

回答已采纳

2回答

Python初学者:提升ValueError(‘必须具有相等的len键和值')

、、、、

我想在现有的数据框中填入另一列。该列将包含字典的值。这些值是令牌列表。到目前为止，它还不起作用，有没有办法将它们添加到数据帧中？ df = pd.read_csv(sys.argv[1], na_values=['no info', '.'], encoding='Cp1252', delimiter=';') s = pd.DataFrame(dict1).T.reset_index() print(s) #result ''' index 0 1 2 0

浏览 40提问于2019-07-16得票数 1

1回答

DataFrame列为多列

、、

列 ? 如何拆分包含如下字符串列表的数据框列 [{'1','1','1','1'},{'1','1','1','1'},{'1','1','1','1'},{'1','1','1','1'}] 在每个单元格中，放入多列数据帧？考虑到列的每个单元格中的列表长度不同！在上面的图像中，左边我们有第一列，右边我们正在观察我想要的结果。

浏览 17提问于2020-09-24得票数 0

1回答

如何在不更改格式的情况下从稀疏数据帧中删除行

、、

我正在尝试删除我的数据帧中的一些空行。下面的代码显示数据类型确实是稀疏的。 items_users_sparse_top_tags_df = items_users_sparse_pd.loc[tracks_tags_df.index] items_users_sparse_top_tags_df.rename_axis('tracks', axis = 'index', inplace = True) items_users_sparse_top_tags_df.dtypes 结果是： playlists 37i9dQZF1DX7KNKjOK0o75

浏览 12提问于2020-07-04得票数 0

回答已采纳

2回答

Pandas仅删除NaN和float为0.0的行

、、

我有一个dataframe，其中每一列代表一个用户。我正在尝试删除一个只有NaN和0.000000的any列，这样Username1或第一列就不会包含在数据帧中，而其他列会包含在数据帧中。这是数据帧： username 1 2 3 4 5 date 2019-01-16 NaN 9.16667 NaN NaN 1.000000 2019-01-17 NaN NaN NaN 1.000000 1.000000 2019-0

浏览 12提问于2019-02-04得票数 3

回答已采纳

2回答

Python:对dataframe中的每一列进行记录差异

、

我有一个数据帧列表，我想记录这些数据帧中每个元素的日志，并找出第一个差异。在时间序列计量经济学中，这个过程给出了一个近似的增长率。以下代码 for i in [0, 1, 2, 5]: df1_list[i] = 100 * np.log(df_list[i]).diff() 给出一个错误 __main__:7: RuntimeWarning: divide by zero encountered in log __main__:7: RuntimeWarning: invalid value encountered in log 当我查看结果时，产生的数据帧的许多元素都是nan。我

浏览 0提问于2020-04-15得票数 0

2回答

在Pandas中按行中的值筛选列

、、

我已经在Pandas中通过df.describe()获得了我的数据帧的统计数据。 statistics = df.describe() 我想根据计数过滤统计数据帧： main Meas1 Meas2 Meas3 Meas4 Meas5 sublvl Value Value Value Value Value count 7.000000 1.0 1.0 582.00 97.000000 mean 30 37.0 26.0 33.03 16.635

浏览 9提问于2017-08-21得票数 0

回答已采纳

1回答

从具有True的列的列表的字典创建pandas数据帧

、、、

我想要一本'item': [list_of_True_column_labels]字典，看起来像这样： pre_df = {'item1':['a','b','c'], 'item2':['c','d'], 'item3':['a', 'c', 'd', 'e'], 'item4':['e']} 并将其转换为bool的熊猫数据帧，如下所示： index

浏览 2提问于2016-12-07得票数 3

1回答

使用python跨数据框比较和查找重复的值(而不是整个列

、、、、

我有一个很大的时间表数据帧，我需要计算运行的实验数量。挑战在于，for的用法在行中重复(这是可以的)，但在某些列中重复，但不是所有列中。我想删除第二个条目(如果重复的话)，但我不能删除整个第二列，因为它也将包含一些新值。如何以并排的方式比较两个列的单个条目，并在存在重复项时删除第二个条目？此操作的持续时间最多为两天，因此连续三天是从第三天开始具有相同名称的新事件。实验名称的实际文本很复杂，数据框有120列宽，因此不可能将其作为列表或字典键入。我希望使用python或numpy函数，但也可以使用循环。以下是起始数据帧和所需输出的示例图片。starting data frame example

浏览 19提问于2020-09-16得票数 0

4回答

如何使用pandas drop nan number，不丢弃所有行

、、、、

我只需要删除NaN元素，而不是删除所有行。我有一个python数据帧列表，如下所示： [[2.0, 3.0, 5.0, nan], [1.0, 3.0, 5.0, 6.0], [2.0, 5.0, nan, nan]] 我如何使用pandas更改它，如下所示:只需删除NaN元素 [[2.0, 3.0, 5.0], [1.0, 3.0, 5.0, 6.0], [2.0, 5.0]] 哪种方法可以做得更好？

浏览 0提问于2016-06-28得票数 0

1回答

熊猫多索引数据-数据插入到新的列和子行仅在列视图中可见？

、、、、

我正试图在一个多层次的熊猫数据中插入一个数据列表。它似乎工作得很好，但是当我查看整个数据帧时，新的子行就不在了。下面是一个示例：创建一个空的多索引数据文件： ind = pd.MultiIndex.from_product([['A','B','C'], ['a', 'b','c']]) #set up index df = pd.DataFrame(columns=['col1'], index=ind) #create empty df

浏览 1提问于2020-01-15得票数 2

回答已采纳

2回答

为什么在连接两个数据帧时，连接会将时间添加到日期

、

我使用pandas从sql查询和json中获取数据。我检查了两个数据帧，都只有日期，没有时间。当我连接它们时，它会将00:00:00添加到新数据帧中的一个数据帧的日期上。它为什么要这样做。有没有办法。我正在尝试连接2个dataframes和drop_duplicates，但是除非我在drop_duplicates中指定其他列，否则这会阻止它在date之前正常工作。

浏览 1提问于2020-07-31得票数 0

1回答

在Python语言中使用PyMongo在MongoDB中插入文档

、、、、

我使用Python语言中的PyMongo库在MongoDB中插入文档。pandas数据帧有37个字段和60k条记录(数据集链接：)。数据帧中的所有字段都已转换为str类型。我收到以下错误： OverflowError: MongoDB can only handle up to 8-byte ints 当我使用for循环插入2500个文档的块时，错误仍然存在。代码片段： import pandas as pd import pymongo client = pymongo.MongoClient() db = client['patenting_in_psi'] colle

浏览 0提问于2018-02-16得票数 0

3回答

如何对熊猫中具有布尔数据类型的变量执行.describe()方法

、

我试图获得数据帧列的汇总统计信息，数据类型为: Boolean。当我运行：df.describe()时，它只提供数值(在本例中为浮动)数据类型的汇总统计信息。当我将它更改为df.describe(include=['O'])时，它只提供对象数据类型。在这两种情况下，都不提供布尔数据类型的汇总统计信息。任何建议都是非常感谢的。谢谢

浏览 5提问于2018-01-13得票数 3

回答已采纳

1回答

如何使用Rasterio更改栅格的类型

、、

当在光栅数据集上应用多边形掩码时，我在处理Python的rasterio包中没有数据值时遇到了困难。这个特殊的栅格是具有7个波段的Landsat uint8，由于255是无数据的保留值，因此没有内在地指定no数据值。但是，有时uint8数据是从uint16数据中压缩出来的，而255个值是一个有效的数据值，我不想将其视为“无数据”(数据是全位范围的)。rasterio的掩码函数的缺省值是，如果没有指定这个参数，则将0视为'no data‘值，这与使用相同的方式存在问题，因为0有时被认为是一个有效的数据值。有什么方法可以覆盖“无数据”的元数据值吗？我尝试了几种不同的方法来解决这个问题(详

浏览 1提问于2019-07-29得票数 8

1回答

如何将数据折叠到最少的列中？

、、

我有一个数据帧，其中每个记录都可能有多个值对(例如，email1与value1配对)。每条记录可以有0到6个这样的对。数据帧看起来有点像这样： id email1 value1 email2 value2 email3 value3 ... 1 x@test.com 123 NaN NaN NaN NaN 2 NaN NaN y@test.com 456 NaN NaN 3 z@test.com 789 Na

浏览 7提问于2021-08-04得票数 0

回答已采纳

1回答

从dataframe中删除部分索引值

、、、

我有一个如下的数据框架。 ? 如何将其转换为数据帧，如下所示 ? PS :必须注意的是，第一个图像中的数据帧是pivot_table()

浏览 18提问于2019-10-09得票数 0

回答已采纳

1回答

Pandas dataframe column数据类型已更改为空Mysql列值，从Int更改为Float

、、

通过读取Mysql表，我使用python panadas创建了一个数据帧。因为我有几个数据类型为INT的列，但其中包含null值。当我创建一个dataframe时，所有这些列的数据类型都变成了float，null的值变成了NaN。我怎样才能保持它的格式不变。我试着这样做。 df是初始数据帧，之后是 df2 = df.astype(object).where(pd.notnull(df), None) 但是这样一来，一些列的值就变成了小数。

浏览 14提问于2017-12-13得票数 1

14回答

将Pandas或Numpy Nan替换为None以与MysqlDB一起使用

、、、

我正在尝试使用MysqlDB向mysql数据库中写入一个Pandas数据帧(或者可以使用numpy数组)。MysqlDB似乎不理解' nan‘，我的数据库抛出一个错误，说nan不在字段列表中。我需要找到一种方法将'nan‘转换为NoneType。有什么想法吗？

浏览 1提问于2013-01-05得票数 206

回答已采纳

2回答

使用熊猫在dataframe中附加空行:最佳性能标准

、

添加空行到dataframeConstraint : Performance # dataframe is onedf temp_false_list = [] for xray in range(onedf.shape[1]): temp_false_list.append(np.nan) onedf.loc[len(onedf)] = temp_false_list # this line takes 90% of time 工作，并将一个空行附加到数据文件中，但是当使用%lprun -f检查时，loc分配操作占用了 90 %的时间。 I必须执行更多3k时间相同的操作(在

浏览 11提问于2021-04-13得票数 0

回答已采纳

2回答

Pandas将新列的元素设置为列表(可迭代)引发ValueError:使用序列设置数组元素

、

同时，我想在pandas数据帧中创建一个新列，并将它的第一个值设置为一个列表。我想要转换此数据帧 df = pd.DataFrame.from_dict({'a':[1,2],'b':[3,4]}) a b 0 1 3 1 2 4 进入这一个 a b c 0 1 3 [2,3] 1 2 4 NaN 我试过了： df.loc[0, 'c'] = [2,3] df.loc[0, 'c'] = np.array([2,3]) df.loc[0, 'c'] = [[2,3]]

浏览 0提问于2018-01-25得票数 2

回答已采纳

1回答

基于两列值合并两个数据帧

、、

我正在做一个机器学习项目，现在我在做数据处理部分。不管怎么说，我有两个数据帧- Final_Lat Final_Lot Label 0 37.23140 -121.75853 1.0 1 37.34883 -121.88834 1.0 2 37.31835 -121.85878 1.0 3 37.26027 -121.87655 1.0 4 37.30793 -121.79955 1.0 5 37.24895 -121.87519 1.0 TestLat TestLot 0 37.200

浏览 1提问于2018-11-29得票数 1

2回答

发生这种情况是因为存在NaN吗？

、

我有一个浮点数列表，当我尝试将其转换为序列或数据帧时 code 000001.SZ 1.305442 000002.SZ 1.771655 000004.SZ 2.649862 000005.SZ 1.373074 000006.SZ 1.115238 ... 601512.SH 16.305734 688123.SH 53.395579 603995.SH 19.598881 688268.SH 70.174454 002972.SZ 19.644900 300811.SZ 2

浏览 12提问于2020-12-23得票数 0

24回答

将包含NaNs的Pandas列转换为dtype `int`

、、

我将数据从.csv文件读取到Pandas数据帧，如下所示。对于其中一列，即id，我希望将列类型指定为int。问题是id系列的值缺失/为空。在读取.csv时，当我尝试将id列转换为整数时，我得到： df= pd.read_csv("data.csv", dtype={'id': int}) error: Integer column has NA values 或者，我尝试在阅读后转换列类型，如下所示，但这一次我得到： df= pd.read_csv("data.csv") df[['id']] = df[['id&#

浏览 454提问于2014-01-22得票数 277

回答已采纳

2回答

Pandas在Python中将一些行转换为列

、、

因此，我的数据集包含一些按业务日期划分的信息，如下所示： Business Date Value a 1/1/2017 127 a 2/1/2017 89 b 2/1/2017 122 a 1/1/2018 555 a 2/1/2018 455 我需要如下格式的数据:我如何转换它。我不希望在我的输出数据集中有多个级别 Business 1/1/2017 2/1/2017 1/1/2018 2/1/2018 a 127 89 55

浏览 0提问于2018-02-24得票数 7

回答已采纳

3回答

重新评估NaN的现有数据框架

、

在使用read_csv()创建数据帧时，类似NA的值(如字符串'NA')被强制转换为NaN。在下面的示例中，我在字典上使用DataFrame()创建了一个数据帧，并保留了字符串'NA‘。如何重新评估此数据帧，以便将此数据帧(以及任何其他类似na的值)转换为NaN？ from collections import OrderedDict test = OrderedDict([('totalSize', 82142), ('done', True), ('records',

浏览 26提问于2019-07-30得票数 0

回答已采纳

2回答

将唯一列值分组为pandas dataframe列中每个唯一值的总和

、、、

我尝试获取一个pandas数据帧，并基于两列对其进行分组，以便在相应的值列中获得每个唯一组合的总和。 Dataframe如下所示： Charge Code Billing Number Amount 1250-001 500120 5000 1250-001 500120 -5000 1250-001 500220 300 1250-001 520320 400 1136-001 360220 700 1136-001 360220

浏览 26提问于2020-04-06得票数 0

回答已采纳

2回答

pandas数据帧到h2o帧的高效转换

、、

我有一个由;分隔的具有Encoding: latin-1的Pandas数据帧。size: 350000 x 3800的数据量几乎是非常大的。我最初想使用sklearn，但是我的数据帧缺少值(NAN values)，所以我不能使用sklearn的随机森林或GBM。因此，我不得不使用H2O's分布式随机森林来训练数据集。主要的问题是当我执行h2o.H2OFrame(data)时，数据帧不能有效地转换。我检查了提供Encoding选项的可能性，但文档中没有任何内容。有人知道这是怎么回事吗？任何线索都能帮到我。我还想知道是否有其他像H2O这样的库可以非常有效地处理NaN值？我知道我们可以推算

浏览 2提问于2017-10-27得票数 18

1回答

通过列/值对列表追加列

、、

我有一个包含A和B列的dataframe A A | B --------------- 1 | 2 4 | 3 我想应用一个函数getData，它获取A并返回元组列表(列/值对)：例如，对于第一行： [('C', 5), ('D', 1), ('Z', 1)] 至于第二行： [('E', 5), ('Z', 3)] 我的目标是生成如下所示的数据帧(替换了缺失的值)： A | B | C | D |

浏览 4提问于2017-06-12得票数 2

回答已采纳

2回答

根据单元格类型展开pandas列

、、

我有以下数据帧： field value 0 longitude 100 1 altitude 200 2 location China 3 date 20180303 ...... 我想将此数据帧转换为以下格式： field string_value int_value datetime_value boolean_value float_value field_type 0 longitude NA NA NA NA

浏览 23提问于2019-03-13得票数 1

回答已采纳

2回答

改进pandas tolist()的性能

、

我在一个有200列的pandas数据帧上执行了以下操作，该操作使用了大约1s： for col in mycols: values = [str(_item) if col_raw_type == 'object' else '{:f}'.format(_item) for _item in df[col_name].dropna().tolist() if (_item is not None) and str(_item)] 有没有更好的方法来做到这一点？似乎tolist操作有点慢？我在这里尝试做的是转换类似如下的内容：

浏览 52提问于2018-12-25得票数 0

2回答

数据帧和is.nan()

我使用sum(is.na(my.df))检查我的数据帧是否包含任何NAs，其工作方式与我预期的一致，但sum(is.nan(my.df))的工作方式与我预期的不同。 > my.df <- data.frame(a=c(1, 2, 3), b=c(5, NA, NaN)) > my.df a b 1 1 5 2 2 NA 3 3 NaN > is.na(my.df) a b [1,] FALSE FALSE [2,] FALSE TRUE [3,] FALSE TRUE > is.nan(my.df) a

浏览 0提问于2011-08-12得票数 25

回答已采纳

2回答

在追加两个pandas数据帧时，布尔值将转换为浮点数

、、、

当其中一个数据帧的列全部为空值(NaN)，而另一个数据帧在同一列中具有布尔值时，追加两个pandas数据帧具有意外的行为。结果(通过追加)数据帧中的相应列被类型化为float64，并且布尔值根据它们的原始布尔值被转换为1和0。示例： df1 = pd.DataFrame(data = [[1, 2 ,True], [10, 20, True]], columns=['a', 'b', 'c']) df1 a b c 0 1 2 True 1 10 20 False df2 = pd.DataFrame

浏览 30提问于2019-11-13得票数 2

回答已采纳

2回答

将包含int和nan的数据帧打印到csv

、、、

我有一个数据帧，如下所示： import pandas as pd import numpy as np df = pd.DataFrame([{'int':1, 'float':1.1, 'str':'aaa'}, {'int':None, 'float':None, 'str':None}]) df.fillna('', inplace=True) 我们希望将df转储到csv，如下所示(使用'#|#‘作为字段分隔符)，将int保留为int： int#|

浏览 5提问于2020-03-14得票数 0

2回答

读取netCDF文件时缺少值'--‘

、、、

在读取NetCDF文件时，我将我的水柱数据存储到数据帧中，以便再次读取。在数据帧中，我提出了缺失值--，这些值也可能被称为“掩码”值。我尝试使用filedata.replace('--','nan')替换它们，但它甚至替换了浮点数，并且我得到了使用nan的整个数据帧。此外，pd.dropna()也不起作用。在读取netcdf时避免这些值，或者在不影响浮点数的情况下用nans替换数据帧中的这些值，有什么好方法呢？以下是我的数据帧的示例部分： so_1 so_2 so_3 -- -- -- -- -- -- -- -- -- -- --

浏览 4提问于2018-08-28得票数 1

2回答

更改Pandas数据帧类型时的异常处理

、

我有一个只有一列字符串列的Pandas数据帧。我想将列数据转换为浮点型。由于格式的原因，某些值无法转换为浮点型。我想从结果中省略这些“非法字符串”，只提取可以合法地重新转换为浮点数的值。起始数据： test=pd.DataFrame() test.loc[0,'Value']='<3' test.loc[1,'Value']='10' test.loc[2,'Value']='Detected' test.loc[3,'Value']='' 所需的输出仅包含可以

浏览 4提问于2014-05-12得票数 5

回答已采纳

2回答

pandas将分组的数据帧作为行添加到另一个数据帧

、、

我得到了以下数据帧： category_name amount Blades & Razors & Foam 158 Diaper 486 Empty 193 Fem Care 2755 HairCare 3490 Irrelevant 1458 Laundry 889 Oral Care 2921

浏览 0提问于2016-05-14得票数 0

2回答

包含数字和字符串值的对象类型的键的Pandas合并问题

、、、、

我有两个数据帧df1和df2，如下所示： df1 = pd.DataFrame({'x': [1, '3', 5,'t','m','u'],'y':[2, 4, 6, 4, 4, 8]}) df2 = pd.DataFrame({'x': [1, 3, '4','t'],'z':[2, 4, 6,7]}) 我正在尝试合并(左连接)两个数据帧，如下所示： df=pd.merge(df1, df2, how='left',

浏览 0提问于2017-12-07得票数 3

回答已采纳

1回答

仅从Pandas Dataframe返回非数字元素

、、、、

我有一个从.CSV文件创建的数据帧。每列只能由数值组成，但有时也可以是字符串('>18‘、'<5’、‘取消’等) 在使用pd.to_numeric将列转换为数字并强制非数字之前，我想创建一个新的数据框或字典，其中包含在每列中找到的唯一非数字值。这将有助于理解我们正在接收的用于一个或多个预测模型的特征的非数字输入的种类。这似乎是一项相当简单的任务，但我是Python的新手，很难理解它。到目前为止，我已经将数据帧减少到只有dtype object的列，这似乎是一个很好的第一步，并删除了大多数包含所有数值的列： df = df.select_dtypes(includ

浏览 32提问于2018-05-30得票数 1

回答已采纳

1回答

来自df.to_json，并希望用NaN (python)替换None

、、、

我使用以下命令将dataframe转换为json类型： df_json = df.to_json(orient = "records") 但是通过这种方式，我的NaN列被转换为None，而我实际上希望它们为NaN。因此，当我继续向postgres发送数据帧时，将读取NaN列并将其提取为NULL。当我转换我的数据帧时的结果： no type 1 All 2 None 3 None 然而，期望的结果是： no type 1 All 2 NaN 3 NaN 到目前为止，我已经尝试过： df_json = df.to_json(orien

浏览 83提问于2021-08-30得票数 0

1回答

将3d列表转换为同一索引上的pandas单数据帧

、、、、

我的列表l具有形状np.array(l).shape (100,15,1)，它有100个数据帧，每个df有15行1列。索引是相同的，只是在列表的每个df中排序不同。我想解压列表l： l[0] = Rank l[31] = Rank A1 1 A5 1 A2 2 A1 2 A3

浏览 6提问于2020-11-11得票数 1

回答已采纳

2回答

在列表panda dataframe中存储第n行元素

、

我是python.Could的新手，你可以在follow上帮助我，我有一个如下的数据框架。a，d，f&g是列名。数据帧可以命名为df1 a d f g 20 30 20 20 0 1 NaN NaN 我需要在没有NaN's的情况下将df1的第二行放入列表中。理想情况下，如下所示。 x=0,1

浏览 50提问于2020-05-15得票数 2

回答已采纳

1回答

将pandas Series作为新列添加到特定的Dataframe行

、、

假设我有一个数据帧 df = pd.DataFrame({'A':[0,1],'B':[2,3]}) A B 0 0 2 1 1 3 然后，我有一个由其他函数使用来自df第一行的输入生成的序列，但它与现有的df没有重叠 s = pd.Series ({'C':4,'D':6}) C 4 D 6 现在，我想将s添加到df.loc[0]中，键变成新列，值只添加到第一行。df的最终结果应该如下所示： A B C D 0 0 2 4 6 1 1 3

浏览 35提问于2018-06-05得票数 2

回答已采纳

2回答

从Pandas中的dataframe列中删除特定对象类型的值

、、、

我有一个pandas dataframe，其中一些值是整数，另一些值是数组。我只是想在"ORIGIN_AIRPORT_ID“列中删除包含数组(我相信是对象数据类型)的所有行，但是在尝试了许多方法之后，我还没能弄清楚如何做到这一点。下面是我的数据帧的前20行的样子。像列表一样显示的值是我想要删除的值。数据集有几百万行，因此如果有意义，我只需要编写代码来删除该特定数据帧列中的所有类似数组的值。

浏览 0提问于2020-10-08得票数 0

1回答

在Python语言中创建DataFrame后，在转换器字典中应用转换

、、

我有下面这行代码，它读取CSV并按预期应用我的自定义转换器创建一个数据帧： csv_file_raw = read_csv(f'{directory}\{filename}', converters=converters) 但是，我希望在创建数据框后，通过以下代码行删除数据框中的所有空白行： csv_file = csv_file_raw.dropna(how="all") 我现在的问题是，转换器已经将一些值解析为空字符串，而dropna函数不会将其解释为'N/A‘值。如果我不在read_csv函数中包含转换，则会删除空行，如下所示： csv_file

浏览 1提问于2020-09-28得票数 0

3回答

从浮点型(本机浮点型或numpy.float64)到整数的转换不起作用

、、、、

我有一个数据帧，里面装满了浮点数和NaNs。我需要将所有的小数/浮点数转换为整数。我检查了所有的类型都是整型的，但是到numpy.float64的转换不起作用。这就是数据帧的样子。目前，我正在使用此代码尝试将所有非non更改为整数，但它不会将数据帧中的浮点数替换为整数。 for i, row in df_cn.iterrows(): for col in df_cn.columns: cell = row[col] if isinstance(cell, np.float64) and np.isnan(cell) == False:

浏览 3提问于2020-03-24得票数 0

2回答

将值添加到数据框列中的某个索引之后

、、、

我有一个这样的数据帧： No Data Sentence 32 xxx yyyy 45 hhh uuuu . . . . . . 8726 aaa bbbb 在No列是无序的情况下，现在我有了x，这是句子列表，我想将该列表添加到Sentence列的最后一个索引之后。因此，我的新数据帧将如下所示： No Data Sentence 32 xxx yyyy 45 hhh uuuu . .

浏览 26提问于2019-05-02得票数 1

回答已采纳

1回答

使用空字符串设置条件f字符串的格式

、、

我正在开发一个小的代码生成应用程序，它加载一个Excel文件(使用pandas ExcelFile + xlrd)，然后将该文件解析为一个数据帧(ExcelFile.parse)，以便进行几个类似SQL的操作。然后，使用map和lambda函数将存储的数据以列表的形式返回给文件编写器，并对特定字段进行少量的f字符串格式化。我遇到的问题是，并非Excel文件中的所有字段都是可预测填充的，因此我在解析数据帧时使用了fillna('')，但是当我使用f字符串时，当我应用:.0f格式化来删除小数时，未填充的字段将导致错误。如果我不使用fillna('')函数，浮点数

浏览 15提问于2020-12-21得票数 3