使用pd.read_csv忽略仅包含缺少值的列_Pandas -展平包含元组的多索引列，但忽略缺少的值_仅选择特定列仅包含特定值的ID - 腾讯云开发者社区

、、

我有一个CSV文件，其中包含一个包含国家代码的Country列。在这里，"NA“指的是北美。我需要将其转换为UTF-8格式。当使用下面的代码时，带有"NA“的行在导出的文件中显示为空白： df = pd.read_csv(filepath, encoding='UTF-8') df.to_csv(r'path+filename',header=None ,encoding = 'UTF-8', index = False) 例如, 输入文件： Week Country PL Sales$ W01 AE 0I 250

浏览 6提问于2021-02-08得票数 1

1回答

熊猫列dtype是对象，python认为它是浮动的。

、

我读过像这样的csv df = pd.read_csv(self.file_path, dtype=str) 然后我试试这个： df = df[df["MY_COLUMN"].apply(lambda x: x.isnumeric())] 我得到了一个AttributeError： AttributeError：“浮点”对象没有属性“is数值” 为什么会发生这种情况？该列主要包含数字。我想过滤掉那些没有数字的。这个问题不是如何实现这一点，也不是如何做得更好，而是为什么我在这里获得了一个AttributeError？

浏览 5提问于2021-03-23得票数 1

回答已采纳

1回答

为什么当我应用str.upper()时，pandas会将列的数据类型从object转换为float？

、

我将csv文件加载到dataframe中，并指定列的数据类型： mycols = {..., 'somecolumn': object, ...} df = pd.read_csv(..., usecols=mycols.keys(), dtype=mycols, ...) 某些列中没有数据(即只包含nans)，但加载后数据类型为object。现在，当我这样做的时候： df['somecolumn'] = df['somecolumn'].str.upper() pandas将数据类型从object转换为float。为什么？

浏览 1提问于2020-04-08得票数 0

1回答

尝试在使用concat()之后获取CSV文件的平均值

、、、

我有一个包含20个CSV文件的目录，所以我使用了concat函数来加载它们，以便读取。然而，我想采用列的均值，但它对我不起作用。这是我到目前为止所做的。 path = r'/Users/Bry/Desktop/data' filenames = glob.glob(path + "/*csv") df = [] for filename in filenames: df.append(pd.read_csv(filename)) pd.concat(df, ignore_index =False) df.mean() 我一直在找AttributeErr

浏览 0提问于2017-02-05得票数 0

1回答

如何用日期时间索引重编大熊猫的数据序列

、

用日期时间索引对熊猫数据序列进行重采样我对蟒蛇很陌生，我正在研究熊猫。我有一个包含日期、时间和其他列的GW2test.csv文件，每30分钟收集一次数据。我需要重新整理每日平均数的数据。CVS看起来像： Date time P P3W P3W1 P2W 04/18/12 15:00 0 1.334 1.006 04/18/12 15:30 0 1.336 1.003 04/18/12 16:00 0 1.323 0.985 04/18

浏览 4提问于2013-09-19得票数 0

24回答

将包含NaNs的Pandas列转换为dtype `int`

、、

我将数据从.csv文件读取到Pandas数据帧，如下所示。对于其中一列，即id，我希望将列类型指定为int。问题是id系列的值缺失/为空。在读取.csv时，当我尝试将id列转换为整数时，我得到： df= pd.read_csv("data.csv", dtype={'id': int}) error: Integer column has NA values 或者，我尝试在阅读后转换列类型，如下所示，但这一次我得到： df= pd.read_csv("data.csv") df[['id']] = df[['id&#

浏览 454提问于2014-01-22得票数 277

回答已采纳

1回答

Pandas正在处理read_csv上的高分辨率整数

、、

编辑:这是Excel更改数据类型的错误，而不是Pandas。当我使用pd.read_csv(file)读取CSV时，超长整数列被转换为低分辨率浮点型。这些整数是以微秒为单位的日期时间。示例:具有某些值的CSV列： 15555071095204000 15555071695202000 15555072295218000 15555072895216000 15555073495207000 15555074095206000 15555074695212000 15555075295202000 15555075895210000 15555076495216000 1555507709

浏览 2提问于2019-04-17得票数 0

1回答

使用pandas将列添加到CSV (从其他列计算的新列的值)

、

我有一个包含以下列的CSV ... YEAR AWARD 2020 RECORD OF THE YEAR 2020 SONG OF THE YEAR 2019 RECORD OF THE YEAR 我想创建另一个列(_id)，该列的值将从现有列中计算出来： YEAR AWARD _id 2020 RECORD OF THE YEAR 2020_RECORD_OF_THE_YEAR 2020 SONG OF THE YEAR 2020_SONG_OF_THE_YEAR 2019 RECORD O

浏览 16提问于2021-09-01得票数 0

回答已采纳

3回答

熊猫read_CSV空栏被视为NaN？过滤是是还是不是？

、、

我在用熊猫read_csv。大多数行上的最后一列缺少数据，如下面的示例所示。但在几行中，数据就在那里。它似乎不是把它当作null，而是把它当作NAN。我试图创建一个if语句，仅显示该列中有数据的行。 (美国运通至CSV的样本摘录)： 01/2018年星期一，"GOOGLE *SVCSAPPS_NEALW - CC@GOOGLE.COM，CA"，Neal，XXXX-XXXXXX，，,4.16，，GOOGLE SERVICES，"1600圆形剧场PKWYMOUNTAIN“，”94043-1351 STATES"，'320180020394601453

浏览 3提问于2019-12-01得票数 0

回答已采纳

1回答

如何定义pandas dataframe中的缺省缺失值

、

我想读取具有给定数据类型和缺失值的数据帧，但下面的代码是错误的。我不知道为什么会这样！ myText = StringIO("""1,2 3,\N 5,6""") myDf = pd.read_csv(myText, header=None, names=["a1","a2"], na_values=["\N"], dtype={"a1":"int", "a2":"int"}) 我得到了错误消息： ValueError: Intege

浏览 3提问于2017-02-05得票数 2

回答已采纳

1回答

Pandas df.isnull().all()跨多个文件计数

、

我的数据集中有2000个csv文件，每个文件有88列： filenames = glob.glob('path\*.csv') for f in filenames: df = pd.read_csv(f, error_bad_lines = False) df = df.isnull().all() 这将返回一个带有列标题的序列，如果缺少整个列，则返回True。如何计算整个数据集(2000个csv文件)中的Trues(完全缺少的列)的数量，以便我可以用百分比表示每个文件丢失了多少数据？

浏览 0提问于2016-10-07得票数 1

1回答

一个[‘年份’]=一个[‘日期’].dt.year创建了一个额外的.0

、、

我提取了日期的年份，并将其作为新列添加到Dataframe中。我需要它和2001年一样，但现在是2001.0 .0从哪里来？这是输出： Datum LebensverbrauchMIN ... Lastfaktor Jahr 0 2001-01-01 00:00:00 0.001986 ... 0.249508 2001.0 1 2001-01-01 00:01:00 0.000839 ... 0.249847 2001.0 2 2

浏览 1提问于2021-10-25得票数 0

回答已采纳

1回答

在过滤操作中导致崩溃的带有类标签均值的数据集

、

我有一个包含数值的csv文件。 val row = withoutHeader.map{ line => { val arr = line.split(',') for (h <- 0 until arr.length){ if(arr(h).trim == ""){ val abc = avgrdd.filter {case ((x,y),z) => x == h && y == arr(dependent_col_index).toDouble} //crashing here

浏览 2提问于2015-03-13得票数 1

3回答

在NaN中创建新列结果

、

我尝试在csv file.But中创建一个包含3列的新列，如果其中一个列值为NaN，则整个值将更新为NaN，而不是跳过它。* import pandas as pd import numpy as np df = pd.read_csv(r'C:\Users\RAHNA KM\Downloads\Accident_death.csv', skipinitialspace=True) df['Address']= df["ResidenceCity"].astype(str) +" "+ df["ResidenceCount

浏览 20提问于2019-10-23得票数 1

2回答

如何使用for循环一次更改多个熊猫数据

、、、

我有两个结构几乎相同的DataFrames，我想同时对它们执行数据转换/清理。为此，我创建了一个包含这些DFs和循环列表的列表。例： train = pd.read_csv('train.csv') test = pd.read_csv('test.csv') combined = [train, test] for dataset in combined: dataset = dataset.drop(['Age'], axis =1) print(dataset.head()) for循环中的最后打印语句工作得很好--删除了

浏览 0提问于2018-11-29得票数 0

回答已采纳

1回答

用计算结果填充数据帧的行

、、、、

我有一个很大的txt文件，看起来像这样：文件中有五列:代码、类型、日期、数量、时间。我正在创建一个包含八列的新文件: code，type，ddc，ond，date，timing_с，ft，nd。我需要用数据填充它。下面是一个类似于算法的东西： import pandas as pd columns = ['code', 'type', 'date', 'ond', 'date_n', 'timing_с', 'ft', 'nd'] df = pd.read_cs

浏览 4提问于2017-04-13得票数 1

1回答

我如何设置熊猫指数的频率？

、、

这就是我的代码 df = pd.read_csv('XBT_60.csv', index_col = 'date', parse_dates = True) df.index.freq = 'H' 我加载csv，将索引设置为date列，并希望将频率设置为'H‘。但这会引发这样的错误： ValueError: Inferred frequency None from passed values does not conform to passed frequency H 日期列的格式为：2017-01-01 00:00:00 在将csv设置

浏览 5提问于2022-03-03得票数 3

回答已采纳

2回答

获取pandas数据帧列表条目中的数字条目

、、

我有一个包含多个列的pandas数据帧，其中一个是我使用split命令拆分成列表的字符串： import Pandas as pd csvRead = pd.read_csv('../data/Data.csv') df = pd.DataFrame(csvRead) df['split_string'] = df['string'].str.split(r'[ ]') idx = 0 for i in df['split_string']: d

浏览 24提问于2018-12-13得票数 2

回答已采纳

4回答

如何将未命名的列设置为索引？

、、

在我发现的所有示例中，通常需要一个列名来将其设置为索引。我不想进入excel添加列标题，而是想知道是否可以将空标题设置为索引。该列包含我希望包含的所有值，但缺少列名：我的脚本目前是： import pandas as pd data = pd.read_csv('file.csv') data

浏览 3提问于2017-09-01得票数 9

回答已采纳

1回答

从文件中读取希腊字母

、、

我有一个包含一定数量列的.csv文件。其中一列有几个名为Δ (希腊字母Delta)的值。我试着打印这封信，但我成功了： print u'\u0394' 正确地返回希腊字母。但是，如果我试图在名为Δ的列中选择包含'column'的文件行，请使用 file=pd.read_csv('filename.csv',sep=';') print file[file['column']==u'\u0394'] 我发现自己有一个空列表，尽管我知道某些行在该列中确实有Δ。我做错了什么？

浏览 9提问于2020-02-06得票数 1

回答已采纳

2回答

转换熊猫数据帧中包含nan、连字符和逗号的列的数据类型

、

df = pd.read_csv("data.csv", encoding = "ISO-8859-1") 现在，我有一个列，其中有如下的值：供参考的样本数据：现在，我希望使用以下代码将列a转换为数字格式： df[['A']] = df[['A']].astype(int) 这给了我一个错误。问题是，我把这三个(nan，连字符和逗号)都放在一列中，并且需要一起解决它们。有没有更好的方法来转换这些而不替换(nan到-1)之类的东西？

浏览 0提问于2019-01-15得票数 5

回答已采纳

2回答

在apache spark ML库中处理SVM中的缺失值

、、

我有一个分类任务。我想用apache spark ml lib SVM算法进行分类。我有n维的输入数据。在特征向量中，可能缺少一些维度。如何处理缺失值？我认为假设缺失值为零或其他值是错误的。

浏览 3提问于2015-10-02得票数 1

2回答

ValueError:长度不匹配:预期轴有7个元素，新值有5个元素

、

我正在尝试使用Pandas读取csv文件。但是在使用pd.read_csv时，我得到了一个ValueError: Length不匹配:期望轴有7个元素，新值有5个元素。代码如下： # load train data data = pd.read_csv('training1.6.csv',error_bad_lines=False , encoding='iso-8859-1',low_memory=False) data.columns = ['label','id','date','user'

浏览 986提问于2020-03-30得票数 1

回答已采纳

2回答

熊猫csv阅读器创建NaN索引

、、、

我有一个CSV文件，其内容如下： A: 12, B: 14 A: 1, B: 4 A: 2, B: 1 A: 21, B: 41 我可以用regex分隔列： import pandas as pd df = pd.read_csv("test.csv", sep = ":\s*|,\s*", names = ["dummy1", "A", "dummy2", "B"], engine = "python") print(df) 输出 dummy1 A dummy2

浏览 1提问于2018-05-02得票数 4

回答已采纳

1回答

根据一个csv列的值提取另一个csv列中的值

、、、

我有一个要从中提取数据的.csv文件。这个文件有四列，['time', 'apple', 'banana', 'orange']。这些列中的每列都有100行。我希望从香蕉列中提取数据，并将其插入到dataframe中，前提是时间列中的值不为零。注意:在time，t之后，time列中的值返回到零，我不希望提取这些行。我想提取time列，并将其用作我的dataframe中的列名，然后将香蕉值作为我的dataframe中的一行。我希望将其放入数据帧的原因是，我有几个.csv文件要从中提取数据。我已经有了一个数据帧，其中包含一个列

浏览 35提问于2019-09-30得票数 1

回答已采纳

1回答

用Panda解析csv中的字符串值

、、

我是Python新手，我正在尝试使用熊猫来读取csv文件，但是我的csv文件中有一点问题。我有字符串，在末尾包含逗号，这会在末尾创建一个不想要的列，如下所示：这是原始的csv：例如，在在线14中，绿色字符串值以逗号结尾，并创建一个新列，然后在使用以下内容时给出解析错误： import pandas as pd pd.read_csv("data.csv") ParserError:错误标记数据。C错误:第8行中预期的6个字段，saw 7 有什么方法可以清理这个，合并最后两个列吗？

浏览 3提问于2021-02-24得票数 0

1回答

如果我需要得到混合类型的列呢？

、、

熊猫: 0.23.4 根据，我们得到DtypeWarning:如果数据包含int和str，那么列(0)具有混合类型，并建议设置low_memory=False，这将消除警告。但我的任务正好相反:定义具有混合类型的列！起初，我想解析DtypeWarning消息，以便了解哪些列具有混合类型，但遇到了许多困难，使我无法依赖DtypeWarning：如果将行数从30万减少到250,000，那么DtypeWarning就不再出现，但我至少需要10万行。即使是300,000行，列也不总是由混合类型确定的，例如，我从修改了数据格式。从医生那里： df = pd.DataFrame({

浏览 0提问于2018-10-20得票数 1

回答已采纳

1回答

如何修复pandas to_sql追加而不附加2000项中的一项？

、、、、

我有一个包含2000行和3列的CSV文件，分别为Int、String和String类型。我正在尝试编写一个程序来创建一个表，并将我的CSV文件rowsxcolumn附加到该表中。这一切似乎都很有效，除了一个单独的项目。项的第一列和第三列被追加，但第二列为空。控制台上没有显示任何错误，并且在调用to_sql函数之前，我已经尝试将数据打印到控制台，但它显示了缺少的一项。我的CSV文件也使用分隔符。一开始，该项目的格式不正确，因此在对所有行进行定界后，我必须专门对单行进行定界--我认为这可能是导致问题的原因？所有其他行和列都完全正常。下面是我的代码： import sqlite3 import

浏览 7提问于2019-07-24得票数 1

回答已采纳

1回答

转轴列在DataFrame中具有N/A，是Python过滤的

、、、、

我正试图在CSV中转换列。我先把他们拉进数据仓库，然后把他们转过来。这是我的密码： import pandas as pd import csv df1=pd.read_csv("C:\\testfolder\\testdemofinal1.csv",sep=',') df=pd.DataFrame(df1) a=df.pivot_table(index='Parameter1_Calculation',columns='Measure Names', values='Measure Values',aggf

浏览 3提问于2017-09-06得票数 0

回答已采纳

3回答

pandas: read_csv如何将布尔数据强制为数据类型bool而不是object

、

我正在读取一个大的平面文件，其中包含带有时间戳的多列数据。数据有一个布尔列，它可以是True/False，也可以没有条目(计算结果为nan)。当读取csv时，bool列被类型转换为object，这阻止了由于序列化错误而将数据保存在hdfstore中。示例数据： A B C D a 1 2 true b 5 7 false c 3 2 true d 9 4 我使用以下命令读取 import pandas as pd pd.read_csv('data.csv', parse_dates=Tru

浏览 0提问于2015-04-20得票数 8

回答已采纳

3回答

用SPSS Modeler替换值

我目前正在尝试对我的数据集执行数据清理，该数据集包含来自在线超市的在线交易的2K条记录。在我的数据集中，有一些数据质量问题- 1) "?“在我的收入列中，如下所示我可以知道如何在IBM SPSS Modeler中清理这些数据吗？我尝试使用"Filler“节点来替换"?”但是我不太确定要在表达式构建器中写什么。正如您所看到的，由于带有"?“的记录，Income在Filler节点中以字符串的形式存储。是否有人知道如何替换/清理收入数据，因为我希望使用data Audit Prep节点将缺少的值替换为收入列的平均值。但是，要执行此操作，我需要

浏览 47提问于2018-08-22得票数 1

2回答

如果不存在，则Pandas使用列名

、

有没有一种方法，不需要读取文件两次，就可以检查列是否存在，否则使用传递的列名？我有相同结构的文件，但由于某些原因，有些文件不包含头文件。带头部的示例： Field1 Field2 Field3 data1 data2 data3 不带头部的示例： data1 data2 data3 当尝试使用下面的示例时，如果文件有标题，它将把它放在第一行，而不是替换标题。 pd.read_csv('filename.csv', names=col_names) 当尝试使用下面的代码时，它将删除文件中没有标题的第一行数据。 pd.read_csv('filename.csv&

浏览 0提问于2021-11-29得票数 1

1回答

从Python (to_sql)插入数据到Server的问题

、、、

我对符号#有一些问题。列中的某些数据包含符号#，例如 'JRE#150' 'July banner #150' 当我将数据从文件all.csv插入Server时，包含此字符的记录将无法正确插入表中。我什么意思？！如果我尝试插入这个值'JRE#150'，只存储这个部分'JRE‘，将NULL插入到其他列中。流程的外观和我正在做的事情：是第一个独立的引擎，它将all.csv文件从API发送给DataFrame。下面一行负责将此数据导入文件。 .csv是： Df.to_csv(r‘C：\\all.csv’，编码=‘utf-8’，i

浏览 4提问于2021-09-15得票数 1

1回答

熊猫使用列表中的列名阅读csv

、、

我对潘达斯很陌生。我正在尝试创建一个读取数千个csv文件的数据文件。文件的结构不是相同的，但是我只想提取我感兴趣的列，所以我创建了一个列表，它包含了我想要的所有列名，但是我有一个错误，因为不是所有的列都包含在每个数据集中。 import pandas as pd import numpy as np import os import glob # select the csv folder csv_folder= r'myPath' # select all xlsx files within the folder all_files = glob.glob(csv_fo

浏览 2提问于2021-02-10得票数 1

回答已采纳

1回答

无法正确保存包含具有集合的列的Pandas数据帧

、

我有一个dataframe，其中包含一个带有集合的列。当我使用.to_csv()保存数据帧，然后使用pd.read_csv()重新打开它时，包含集合的列现在包含字符串。下面是一个代码示例： df = pd.DataFrame({'numbers':[1,2,3], 'sets':[set('abc'),set('XYZ'),set([1,2,3])]}) print(type(df.sets[0])) # Type = set df.to_csv('xxx/test.csv') df = pd.read_c

浏览 13提问于2020-04-21得票数 1

回答已采纳

1回答

熊猫:从csv文件中获取特定列

、、、、

我有以下示例.csv文件： str_header int_header string_a 1 string_b 2 string_c 3 根据互联网上的解决方案，这个代码： import pandas as pd data = pd.read_csv("z.csv", names=['int_header']) print(data['int_header']) 应该只将int_header列读入data。但是，data，在如上打印时，实际上包含了所有的文件列。我正在使用Python的Anaconda发行版。

浏览 3提问于2016-04-27得票数 3

回答已采纳

2回答

如何处理R中数据导入的NA值？

对这一职位采取后续行动：一些背景:我正在开发一个程序，允许用户上传csv文件。目前，我正在测试如下所示的数据集： Type Date Lively Count sm 1/13/2010 10 10 sm 1/14/2010 10 20 sm 2/15/2010 20 30 am 4/16/2010 5 42 am 1/17/2010 10 34 am 3/18/2010 40 54 sm 1/19/2010 10 65 sm 4/20/2010 5 67 sm 3/21/2010 40 76 sm

浏览 6提问于2013-08-13得票数 0

回答已采纳

3回答

我要将DataFrame与CSV合并

、

我需要合并1个df和1个csv。df1只包含1列(我想要更新的产品id列表) df2包含2列(所有产品的id，数量) df1=pd.read_csv(id_file, header=0, index_col=False) df2 = pd.DataFrame(data=result_q) df3=pd.merge(df1, df2) 我想要的是:只包含来自csv/df1的id的数据帧与相同id的df2数量合并。

浏览 6提问于2018-09-03得票数 1

回答已采纳

2回答

检查实体中是否存在字段

、、

我已经在数据存储中更新了我的模型，所以现在它有了一个额外的字段。现在，我有了包含和不包含该字段的实体，但是我需要将该字段添加到所有还没有该字段的实体中。想法是在没有该字段的函数中获取实体并添加它。因此，我想知道如何在数据存储请求中过滤此类实体？

浏览 2提问于2011-08-12得票数 1

回答已采纳

1回答

如何在pandas中创建这个条件列？

、、、

datasz是我的初始数据帧的名称。此数据框包含一个名为“CELL”的列，其中包含单元格序列。normal_cells是另一个数据框架，它在名为“cell”的列下只包含来自datasz的正常单元序列。我正在尝试向datasz数据帧中添加一个条件列(is_normal)，它基本上询问自己datasz‘cells’是否在normal_cells‘cells’中，并在新列(is_normal)中返回'normal‘，或者如果它不在normal_cells’cells‘中，则在列中返回'tumor’。下面是我的代码： datasz = pd.read_csv(...) #Blu

浏览 1提问于2021-07-16得票数 0

2回答

Python将包含特殊字符的.txt文件转换为数据帧

、、

我有一个'.txt‘文件，我想导入它，并将其转换为数据帧。我遇到了一些问题。我的代码： #The raw.txt file content: #A& B & C & D & E #foo& 13.52 & 333.2 & 4504.4 & 0 #1 taw & 13.49 & 314.6 & 4.6 & 1.29 #2 ewq & 35.44 & 4.2 & 5.2 & 3.06 #3 asd & 13.41 & 4.1 & 6.8

浏览 15提问于2021-05-12得票数 1

回答已采纳

1回答

SAS -在同时包含字符和数字的列上的频率

我有一个同时包含char和numeric变量的列。此列中的内容示例如下 T M 12 3112 我想在此列上执行proc频率(或使用任何其他函数)来读取字符值和数字值。使用proc freq会忽略char变量，只执行数值操作。谢谢

浏览 0提问于2017-04-20得票数 0

1回答

当我在Pandas中使用df.corr时，我的一些列丢失了

、、

这是我的代码： import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt data = pd.read_csv('death_regression2.csv') data3 = data.replace(r'\s+', np.nan, regex = True) plt.figure(figsize=(90,90)) corr = data3.corr() print(np.shape(list(corr))) prin

浏览 1提问于2019-03-04得票数 11

回答已采纳

3回答

如何在Python中筛选出包含某个字符串的多列

、

我刚接触python，尤其是熊猫，所以我真的不知道我在做什么。我有10列，100000行和4个字母串。我需要过滤掉所有列/行中不包含'DDD‘的行。我试着用iloc和loc来做这件事，但是不起作用： import pandas as pd df = pd.read_csv("data_3.csv", delimiter = '!') df.iloc[:,10:20].str.contains('DDD', regex= False, na = False) df.head() 它返回一个错误：'DataFrame‘对象没有

浏览 0提问于2019-11-11得票数 2

3回答

如何使用jQuery向html()添加值？

这个jQuery没有做任何事情，我做错了什么？ <head> <title></title> <script src="https://code.jquery.com/jquery-2.1.4.js"></script> </head> 体内 <p id="somediv"></p> <script> var arr = ["1", "2", "3", "4"]; $(docu

浏览 1提问于2015-07-02得票数 0

回答已采纳

2回答

pandas df按列表屏蔽特定行

、

我有熊猫df，它有7000行*7列。我有一个列表(row_list)，它包含我想要从df中过滤出的值。我想做的是，如果df中的行包含列表中的相应值，则过滤掉这些行。这就是我尝试的结果，空索引列: A、B、C、D、E、F、G DataFrame：[] df = pd.read_csv('filename.csv') df1 = pd.read_csv('filename1.csv', names = 'A') row_list = [] for index, rows in df1.iterrows(): my_list = [row

浏览 19提问于2020-11-30得票数 0

2回答

如果有空值，我如何从两个文件中读入、插入新列以及计算mean之类的函数？

、

我有一个名为'test.txt‘的文件，它看起来像这样： 3.H5 5.40077 2.H8 7.75894 3.H6 7.60437 3.H5 5.40001 5.H5 5.70502 4.H8 7.55438 5.H1' 5.43574 5.H6 7.96472 "" "" "" "" "" "" 6.H6 7.96178 6.H5 5.71068 "" "" 7.H8 8.29385 7.H1' 6.01136 "" &#

浏览 15提问于2017-08-28得票数 1

回答已采纳

1回答

如何在大型csv数据中搜索特定的功能名称？

我想要修改一个大的dataframe，以便剩下的列是只包含两个唯一值(例如，True和False)的特性，除了features (包含两个以上的唯一值)。我希望删除不相关的特性来简化/清理数据集。但是我需要保留一个叫做“模式”的特性类，因为这是预测所需要的。 import numpy as np import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('Threat_Prediction_Clean.csv') print (df.nunique()) if df.nunique() &l

浏览 0提问于2019-07-30得票数 0

1回答

如何用熊猫更改现有csv的单列

、、

我有一个.csv文件，可以用pd.read_csv()读取。在这个文件中，我有需要用新逻辑更新的SomeBoolean列。但是，当我再次使用pd.to_csv()编写文件时，其他一些列值会被更改，例如，sometimesNaN列有一些空值，这些值在读取csv时被解释为NaN，但是它们也被写入为NaN而不是空值。是否有一种方法可以更新SomeBoolean列而不意外地影响其他列(如sometimesNaN列)？ Index Date SomeBoolean Values sometimesNaN 0 2021-05-18 False

浏览 2提问于2021-05-19得票数 2

回答已采纳

2回答

从csv中的datetime中删除日期

、、

对于python中的项目，我们需要使用一个包含多个列的csv文件，并创建一个ML模型。我的问题是，有一列是datetime，日期对预测没有用，但我不知道如何删除它，因为它与time在同一列中(所以我不能直接删除该列)： 26.03.2018 00:00:00 你能帮我删除日期吗？我尝试了不同的方法来处理“datetime”，但到目前为止都不起作用。 data = pd.read_csv("TotalTrafo.csv") dir(data) type(data.Trafo1) pandas.core.series.Series

浏览 1提问于2021-01-07得票数 0