Pandas:如何从dataframe的特定列中获取每个类别的样本行，并保存到单个csv中？ - 腾讯云开发者社区

python-3.x、pandas、dataframe、oop

我正在努力减少数据帧中不需要的数据列，但让它在OOP的范围内工作。数据帧中的列是从'A‘到'M’。示例： import pandas as pd # columns 'A' 'B' and 'C' are what I want kept vibe_df = pd.read_csv('C:Location/Document.csv') vibe_df = vibe_df[['DateTime', 'A', 'B', 'C']] 上面的工作，但是，我

浏览 0提问于2020-08-27得票数 1

1回答

如何在Python中将多个文本填充行合并为一个行？

python

因此，我在Excel中的一列中有大约20,000行，其中包含所有文本。我试图将所有行合并到一个称为“消息”的单元格中，这样我就可以在TextBlob中做一些事情，比如计算句子的数量，但我没有成功地将所有文本行合并为一个文本行。输入(不能复制和粘贴，但格式化为单列) MsgBody sure can race game like one of the biggest games 所需输出： sure can, race game, like one of the biggest games 实际输出： sure can import csv from textblob import Text

浏览 0提问于2021-04-01得票数 3

1回答

如何在将熊猫数据保存到csv时保持numpy数组

python、csv、pandas、numpy

我有一个pandas.DataFrame，其中一个列作为图像。该列的每一行都是作为2d numpy.array的图像。我用DataFrame将csv文件保存到pandas.DataFrame.to_csv()中。但是，当我打开csv文件时，列变成字符串而不是numpy.array。如何读取csv文件并保存numpy.array

浏览 0提问于2017-03-13得票数 11

回答已采纳

1回答

重新排序dataframe列

python、csv、pandas

是否有办法从txt-文件中订购Pandas数据文件中的列： pandas.DataFrame.read_table 例如，从csv文件中，使用： pandas.DataFrame.to_csv 中可以传递订单列。 columns 或者一般情况下，是否有一种重新排序dataframe列的方法？也许使用.ix模块？

浏览 2提问于2014-07-15得票数 1

回答已采纳

2回答

如何将数据帧保存为独立的csv文件？

python-3.x、pandas

我有一个像这样的字典列表： sample = [ {'title': title, 'description': description, 'category': category, 'URLS': [1, 3, 4]}, {'title': title, 'description': description, 'category': category, 'URLS': [1, 3, 4, 5, 6, 7]}, {'title'

浏览 15提问于2019-08-12得票数 1

回答已采纳

1回答

如何将多只熊猫的数据连成一个比内存大的dask数据？

pandas、hdf5、dask、pytables、bigdata

我正在解析由制表符分隔的数据，以创建表格数据，我希望将其存储在HDF5中。我的问题是，我必须将数据聚合成一种格式，然后转储到HDF5中。这是~1 TB大小的数据，所以我自然不能把它放入RAM中.达斯克可能是完成这一任务的最佳方式。如果我使用解析我的数据来适应一个熊猫的数据，我会这样做： import pandas as pd import csv csv_columns = ["COL1", "COL2", "COL3", "COL4",..., "COL55"] readcsvfile = csv.r

浏览 3提问于2016-10-09得票数 14

回答已采纳

1回答

pandas dataframe to csv，关于数字串的格式问题

python、pandas、csv

我有一个dataframe df，其中第一列存储像'000001'，'000002'，‘000003’这样的字符串...ect。它们是数据帧的密钥，前面有必要的0。当我尝试将df保存到csv文件并调用df.to_csv()时，列被保存为1，2，3...而不是原始数据'000001'，'000002‘。将数据从pandas dataframe保存到csv文件时，可以解决这个问题吗？例如： df = pd.DataFrame(np.random.normal(0, 1, (3, 3))) df.iloc[:, 0] = ['00

浏览 1提问于2021-04-29得票数 0

1回答

创建一个新的dataframe，以包含Python中多个csv文件中的1列部分

python、pandas、dataframe、csv

因此，我正在尝试创建一个新的dataframe，其中包括一些来自300+ csv文件的数据。每个文件包含多达200,000行数据，我只对每个文件中的一个列感兴趣(每个文件的同一列)。我试图将这些列合并为1个dataframe，其中csv 1中的第6列将位于新dataframe的第1列中，来自csv 2的第6列将位于新的dataframe的第2列中，依此类推，直到第315 csv文件。我不需要全部提取200,000行数据，但我不确定如何从数据的中间部分只提取2,000行数据(每个文件在行数上的范围，所以每个文件的确切行数都不需要，只要是2000年中期)。如果能帮助从每个文件中提取2000行

浏览 8提问于2022-11-18得票数 1

回答已采纳

2回答

火花聚结和收集，哪一个更快？

python、apache-spark、pyspark

我使用pyspark来处理50 15的数据，使用15 m4的AWS。数据的每一行都包含一天中特定时间的一些信息。我使用下面的for循环提取和聚合每小时的信息。最后，我union数据，因为我希望我的结果保存在一个 csv文件中。 # daily_df is a empty pyspark DataFrame for hour in range(24): hourly_df = df.filter(hourFilter("Time")).groupby("Animal").agg(mean("weights"), sum("is_m

浏览 0提问于2016-09-15得票数 4

回答已采纳

1回答

无法更改数据格式中列的数据类型

python、pandas、dataframe、csv

我希望将列"id“中值的数据类型从整数更改为字符串，然后将新的dataframe保存到CSV文件中。这就是我尝试过的： import pandas as pd df = pd.read_csv ('DataSet.csv', header=[0], on_bad_lines='skip', sep = ';') df["id"] = df["id"].astype(str) 当我运行下面的代码时，它将显示数据类型已被成功更改： for index, row in df.iterrows(): pr

浏览 3提问于2022-02-14得票数 0

1回答

熊猫:如何从CSV或Excel文件中读取行？

python、excel、pandas

似乎您可以查看文件中的列没有问题，但是没有明显的方法来查看行。我知道，为了选择行，我可以将整个文件(CSV或excel)读入一个疯狂的巨大数据文件中，但我更希望能够从文件中直接抓取特定的行，并将这些行存储在一个合理大小的dataframe中。我确实意识到，在将df保存到前面提到的CVS/Excel文件之前，我可以将df转到/枢轴上。这将是Excel的一个问题，因为我的列(转置行)运行得太快了。我宁愿使用Excel也不愿使用CSV。我的原始数据文件，没有转置，有9000+行和20 not。我使用Excel 2003，它最多支持256列。编辑：想出了一个适合我的解决方案。比我想象的简单多了。

浏览 0提问于2018-04-19得票数 2

回答已采纳

1回答

KeyError：“[id 'x_center‘'y_center']不在索引中”

python、pandas

我有一个CSV文件，其中包含四列和多行，所以我隐藏了这些列，然后创建了一行和多个列，然后我想用特定的id保存到新文件中，我的意思是，我有4个唯一的id，所以对于每个id，它都会保存到新文件中，但不幸的是，我发现了这个错误。 KeyError：“id 'x_center‘'y_center’不在索引中” 这是我的代码 import pandas as pd df= pd.read_csv('./1_1.csv') df=df.sort_values(by = 'id') s = df['id'].unique() for i

浏览 3提问于2021-04-10得票数 0

回答已采纳

2回答

无法迭代Pandas Dataframe中的行

python、pandas、dataframe

我知道这个问题已经被问过很多次了，但是我已经尝试了几乎所有的方法，我试图使用下面的代码遍历DataFrame中的行。 import pandas as pd df = pd.read_csv(r"file.csv") for row in df: print(row) csv文件中只有一列，并且只打印文件的header。我还使用了.items()、.iterrows()和.itertuples()，所有这些方法都将元组作为我不需要的输出。我试图在循环中执行的进一步任务只接受来自for row in df:的输出。请帮助我如何才能以这种方式打印实际行，而不仅仅是标题

浏览 21提问于2020-12-15得票数 0

回答已采纳

2回答

熊猫df.to_csv()将dict值保存为字符串。在调用pd.read_csv()时，我如何才能拿回这些数据集？

python、pandas、dictionary、eval、export-to-csv

我从数据库中加载一个DataFrame，并有一个dict列，如下所示： id some_value ... coordinates 15 34.7 {'type': 'Point', 'coordinates': [-3.2, 37.0]} 但是，当我使用DataFrame ()将pd.to_csv保存到磁盘，然后重新读取它时，包含坐标的列不是dict，而是字符串： id some_value ... coordinates 15 34.7 "{'ty

浏览 3提问于2017-10-15得票数 4

回答已采纳

2回答

熊猫DataFrame从Numpy数组-列顺序

arrays、pandas、numpy、dataframe、smoothing

我尝试使用Pandas从.csv文件中读取数据，使用Savitsky-Golay过滤器平滑数据，过滤数据，然后再次使用Pandas编写输出csv文件。必须将数据从DataFrame转换为数组以执行平滑操作，然后再转换为DataFrame以创建输出文件。我找到了一个关于从numpy数组()创建数据格式的主题，我使用dataset = pd.DataFrame({'Column1': data[:, 0], 'Column2': data[:, 1]})行来创建我的数据。问题是，当我将列名重命名为第一列的“时间”和第二列的“角度”时，最终dataframe中的顺

浏览 1提问于2020-06-11得票数 1

回答已采纳

2回答

扩展现有第三方库的现有类的功能的最佳方法是什么？

python、oop、inheritance

例如，我在代码中使用了大量的pandas.DataFrames。这是一个非常大的类，有很多片段，而且它有一个非常类似于函数的API，在这里您倾向于将它的方法调用链接在一起。如果能够轻松地向这个现有类添加功能，同时仍然保持功能流畅的API，那就太好了。我想将这个类转换为一些特定于域的代码，以便删除许多在使用该类时经常使用的特定于域的样板代码。比方说，在我的梦里，我可以做这样的事情： pandas.read_csv('sales.csv') \ .filter(items=['one', 'three']) \ .apply(m

浏览 4提问于2017-02-09得票数 2

回答已采纳

1回答

用Python下载S&P 500公司的股票数据及其GICS标识符

python、dataframe、finance、yfinance

我正试图使用yfinance从标准普尔500家公司下载财务数据。不过，我也想为每一家公司提供GICS部门代码，以便根据GICS代码将数据分成更小的数据集。这是我的尝试： import pandas as pd import yfinance as yf import datetime payload=pd.read_html('https://en.wikipedia.org/wiki/List_of_S%26P_500_companies') first_table = payload[0] df = first_table df.head() tickers_symbol

浏览 1提问于2021-09-09得票数 0

回答已采纳

1回答

在dataframe上进行Dask计算以添加列返回AttributeError

python、json、pandas、dask、dask-dataframe

我有一个函数，它使用函数将列添加到DataFrame中，例如 def myfunc(x): resp_data = {'status': '1', 'data': x} return json.dumps(resp_data) 最初的Pandas dataframe df被转换为Dask DataFrame，如下所示 import dask.dataframe as dd ddf = dd.from_pandas(df, npartitions=30) 现在，我调用函数myfunc on ddf，使用现有的

浏览 2提问于2022-01-27得票数 1

回答已采纳

3回答

复制列，添加一些文本并写入一个新的csv文件

python、csv

我想要创建一个脚本，从一个文件夹中的多个csv文件复制第二列，并在将其保存到单个csv文件之前添加一些文本。以下是我想做的事： 1.)从所有csv文件获取第二列中的数据 2.)在开始和结束的每一行中附加文本"hello“和”欢迎“ 3.)将数据写入单个文件我试着用熊猫来创造它 import os import pandas as pd dataframes = [pd.read_csv(p, index_col=2, header=None) for p in ('1.csv','2.csv','3.csv')] merged_dat

浏览 5提问于2017-06-21得票数 0

1回答

在python中保存/读取彩色图像像素数据

python、image、pandas、csv、numpy

我正在尝试编写一个算法，将存储在每个文件名中的文件名和3通道np.array保存到csv (或类似的文件类型)，然后能够在csv中读取并再现彩色图像。我的csv格式应该如下所示： Filename RGB 0 foo.png np.array # the shape is 100*100*3 1 bar.png np.array 2 ... ... 目前，我正在迭代保存在目录中的每个文件，并附加一个列表，该列表随后存储在一个pandas.DataFrame中： df1= pandas.DataFrame() df2= pandas.DataFrame() dire

浏览 2提问于2018-02-07得票数 0

回答已采纳

1回答

将pandas.io.parsers.TextFileReader的输出写入pandas.DataFrame

python、pandas

我有一个很大的CSV文件，在块的一部分使用用户定义的输入"num_rows“(行数)，使用"chunksize”参数，返回"pandas.io.parsers.TextFileReader“对象，如下所示： num_rows = int(input("Enter number of rows to be processed chunk = pd.read_csv("large_file.csv", chunksize = number_of_rows) for data_chunk in chunk: # some processin

浏览 1提问于2019-11-21得票数 0

1回答

Flow_from_dataframe -类数与实际类数不同

pandas、dataframe、keras、label

我用熊猫来使用.txt文件和flow_from_dataframe来帮助我读取文件夹中的图片。这是我的密码： import keras import pandas as pd from keras_preprocessing import image from keras.preprocessing.image import ImageDataGenerator datagen = image.ImageDataGenerator(rescale=1./255) data = pd.read_csv('/directory/clipart_train.txt', sep

浏览 1提问于2019-02-21得票数 0

回答已采纳

1回答

Pandas DataFrame类，如列命名

python、pandas

我想知道是否有一种方法可以像定义python类一样定义DataFrame，这样我就可以更容易地执行重构或其他类似的集成开发环境操作。例如，我有一个类似下面的DataFrame，我将其保存为csv文件： >>> import pandas as pd >>> df = pd.DataFrame({'count': [10, 20, 30], 'products': ['apple', 'banana', 'lemon']}) >>> df.to_csv('

浏览 17提问于2019-11-28得票数 1

回答已采纳

2回答

如何使用python中的DataFrame生成的结果写入csv？

python、csv、pandas

我正在使用DataFrame从Pandas模块读取tsv文件中的数据。 df = pandas.DataFrame.from_csv(filename, sep='\t') 该文件大约有5000列(4999个测试参数和1个结果/输出值)。我遍历整个tsv文件，并检查结果值是否与预期值匹配。然后，我将该行写入另一个csv文件中。 expected_value = 'some_value' with open(file_to_write, 'w') as csvfile: csvfwriter = csv.writer(csvfile, del

浏览 3提问于2016-11-29得票数 0

回答已采纳

2回答

从Oracle读取包含数百万行的大表并将其写入HDF5

python、pandas、hdf5、pytables

我正在使用一个具有数百万行和100+列的Oracle数据库。我尝试使用带有索引的pytables将此数据存储在HDF5文件中。我将在pandas DataFrame中读取这些数据的子集并执行计算。我尝试了以下几种方法：使用实用程序将表下载到csv文件中，使用pandas逐块读取csv文件块，并使用pandas.HDFStore附加到HDF5表。我创建了一个dtype定义并提供了最大字符串大小。但是，现在当我尝试直接从Oracle DB下载数据并通过pandas.HDFStore将其发布到HDF5文件时，我遇到了一些问题。 pandas.io.sql.read_frame不支持分块读取。我

浏览 2提问于2013-12-17得票数 12

1回答

为什么pandas DataFrame.iloc返回的是类别数据类型的标量，而是对象数据类型的系列？

python-3.x、pandas

在pandas 0.23.0和python 3.6.5中，我看到了在DataFrame上使用iloc[int]时不理解的行为。如果DataFrame只有一列，并且该列的类型是“category”，则iloc[int]将返回标量值而不是系列。当"answer“列是一个对象数据类型时，我会得到一个预期的Series： >>> df = pandas.DataFrame({'answer': ['no', 'no', 'yes']}) >>> df['answer'] =

浏览 1提问于2018-08-24得票数 0

2回答

如何将按层次结构命名的列添加到Pandas DataFrame

python、pandas、dataframe、hierarchical-data、multi-index

我有一个空的DataFrame： import pandas as pd df = pd.DataFrame() 我想添加一个按层次结构命名的列。我试过这个： df['foo', 'bar'] = [1,2,3] 但是它给出了一个名称是元组的列： (foo, bar) 0 1 1 2 2 3 我想要的是： foo bar 0 1 1 2 2 3 如果我以这种方式构造一个全新的DataFrame，我可以得到： pd.DataFrame([1,2,3], columns=pd.Mu

浏览 3提问于2016-11-03得票数 2

2回答

列大小问题: read_csv

python、pandas、csv

我有一个有4列的数据帧。为了在本地计算机上工作，我必须将此数据帧转换为csv。当我将dataframe转换为csv时，我只有一列： df = pd.read_csv("final.csv") print df.info() <class 'pandas.core.frame.DataFrame'> RangeIndex: 20479 entries, 0 to 20478 Data columns (total 1 columns) 如何将此csv转换为4列的dataframe？

浏览 1提问于2017-10-06得票数 0

1回答

用数据填充pandas面板对象

python、pandas、panel

这可能是非常基本的，但我似乎找不到任何解决方案。我试图在pandas中构建一个3D面板对象，然后用我从几个csv文件中读取的数据填充它。下面是我想要做的一个例子： import numpy as np import pandas as pd year = np.arange(2000,2005) obs = np.arange(1,5) variables = ['x1','x2'] data = pd.Panel(items = obs, major_axis = year, minor_axis = variables) 因此，data[i]为我提供了属

浏览 1提问于2014-05-02得票数 2

1回答

PDF解析:使用pdfminer和pandas

python、pandas、pdf、pdfminer

我正在尝试将pdf文件解析为csv格式。在pdf中，有一个没有框架的表格，因此建议的方法不起作用。我的想法是使用pdfminer来分析pdf的布局，定位所有文本行，并匹配每个文本行的bbox位置以重新构建表格。到目前为止，我已经通过比较每个textline对象的x0坐标，成功地将文本行排序为" left“和" right”列，并将根据它们的y0坐标匹配左侧和右侧行。当我试图将每一行的内容放入一个pandas DataFrame中时，我得到了一个TypeErrorL不能连接非NDFrame对象。请帮帮忙。我的代码如下： testfile = 'file locatio

浏览 0提问于2017-08-15得票数 2

1回答

如何在对每个文件使用不同的skiprows值的同时，将dask的dataframe.read_csv与google storage globstring结合使用？

python、pandas、dataframe、dask

我在google存储桶中有一些文件夹，其中包含CSVs，我正在尝试将这些CSVs读取到dask.dataframe中，以便对文件进行并行标准化。例如:其中一些数据帧可能缺少其他数据帧所具有的列，因此我希望将缺少的列插入到缺少它的每个数据帧中。我的问题当使用全局字符串时，比如ddfs = ddf.read_csv(f"gs://bucket/{folder}/*.csv")，我会收到pandas.errors.ParserErrors，因为不仅一些文件的标题丢失了，而且一些文件的标题行可能没有从第一行开始。在通过dask.dataframe使用全局字符串之前，我可以遍历目录并

浏览 7提问于2021-06-08得票数 0

4回答

要列出的Pandas DataFrame列

python、pandas

我正在根据满足的另一列中的条件从一列中提取数据的子集。我可以得到正确的值，但它是在pandas.core.frame.DataFrame中。如何将其转换为list？ import pandas as pd tst = pd.read_csv('C:\\SomeCSV.csv') lookupValue = tst['SomeCol'] == "SomeValue" ID = tst[lookupValue][['SomeCol']] #How To convert ID to a list

浏览 4提问于2014-05-20得票数 188

1回答

Python:如何将带"“的数据输出到CSV？

python、csv

我想将带有"“的数据输出到CSV文件中。通过执行这段代码，我希望生成的csv中每列中的所有值都用双引号括起来，但实际上并非如此。 import pandas as pd import csv import numpy df = pd.DataFrame([{'data1': 'A', 'data2': "B", 'data3': "C", 'data4': "D", 'data5': "E", 'data6'

浏览 14提问于2019-12-18得票数 0

1回答

如何在Pandas 0.21.0版本后将Python dict转换为DataFrame列？

python、pandas、dataframe

我试图在两台计算机上运行相同的脚本，并将我的字典结构、数据转换为Pandas DataFrame。 df = pd.DataFrame(data, columns=[column_label]) df.to_csv('./result.csv', mode='w', index=False) 它在Pandas版本低于0.21.0的计算机上工作得很好。但是，当我在服务器上执行相同的代码时，它会突然生成一个只包含列标签的csv文件，而没有任何数据。我尝试打印出df的值，但在服务器上完全是NAN。当我像这样删除列部分时： df = pd.DataFrame(dat

浏览 1提问于2018-01-15得票数 0

回答已采纳

1回答

如何在PySpark中将结构列作为字符串保存到CSV/TSV中？

pyspark、apache-spark-sql

我见过很多类似的问题被问了很多次，但是对于一些应该很容易的问题，没有明确的答案。如何在PySpark中将结构列保存到CSV (tsv实际)？我想序列化它并将其保存为JSON。我有一个dataframe，它包含以下模式，我从拼花中读到它： timestamp:long timezoneOffset:string dayInterval:integer speed:double heading:double ignitionStatus:integer segmentId:string pointMM:struct mmResult:array element:stru

浏览 2提问于2022-09-20得票数 1

回答已采纳

1回答

使用Pandas创建带有系列的DataFrame，导致内存错误

python、numpy、pandas

我正在使用Pandas库进行遥感时间序列分析。最终，我希望通过使用块大小将我的DataFrame保存到csv，但我遇到了一个小问题。我的代码生成了6个NumPy数组，我将它们转换为Pandas Series。这些系列中的每个系列都包含许多项目 >>> prcpSeries.shape (12626172,) 我想将该系列添加到熊猫DataFrame (df)中，这样我就可以将它们一块一块地保存到csv文件中。 d = {'prcp': pd.Series(prcpSeries), 'tmax': pd.Series(tmaxSerie

浏览 0提问于2013-06-18得票数 20

回答已采纳

1回答

如何从pandas DataFrame中的列中减去最小值

python、pandas

我想知道从第一次观察到一个事件以来所经过的时间。为此，我将每个观察结果保存在一个CSV文件中。每个事件由唯一的散列标识。现在，我正在做以下工作： from pandas import * from bz2 import BZ2File events = DataFrame.from_csv(BZ2File('events.csv.bz2', 'r'), sep='\t', header=0, index_col=None) m = events.groupby('hash')['timestamp'].min()

浏览 0提问于2012-09-12得票数 0

1回答

如何读取csv文件，跳过描述(在几行中)到dataframe？

python、pandas、dataframe、csv

我有几个csv文件。每个csv文件都有其跨几行的描述(15行在几个文件中，100行在其他几行中等等)。我想把csv文件读入数据格式。我尝试使用pandas.DataFrame('file1.csv')将数据读入数据。不管怎么说，我得到了以下错误。 Traceback (most recent call last): File "snowdepthData.py", line 5, in <module> depthDF = pd.DataFrame('Alaska_SD_Sep2019toOct2020.csv') F

浏览 2提问于2021-02-13得票数 1

回答已采纳

1回答

如何比较两个时间序列数据的图

python、pandas、matplotlib、time-series、pose-estimation

我有两个数据，包含一个人的动作，并希望比较他们是多么相似，或准确地说，人2是如何能够复制人1。 import pandas as pd fp = pd.read_csv("first_person.csv") sp = pd.read_csv("second_person.csv") fp = fp.iloc[: , 1:] sp = sp.iloc[: , 1:] #fp.LEFT_SHOULDER_Y.plot(),sp.LEFT_SHOULDER_Y.plot() #当我在特定的列上绘图时，这就是我得到的结果。我们想要的是，在不手动为每一列编写代码

浏览 4提问于2022-10-08得票数 0

回答已采纳

1回答

如何将Tensorflow数据集导出到csv？

python、pandas、export-to-csv、tensorflow2.0

寻求如何创建TF数据集映射两个列表并将数据集保存到CSV文件的建议。我已经创建了两个列表:原始:B‘’File 1.JPG'，b‘’File 2.JPG'，b‘’File 3.JPG'，b‘’File 4.JPG‘ 重复:b‘文件1.jpg的副本’，b‘文件2.JPG的副本’，b‘文件3.jpg的副本’，b‘文件4.JPG的副本’ 需要将每个原始文件映射到相关的复制文件，并将它们保存到具有原始:复制列的CSV文件中我尝试通过运行以下命令将TF转换为pandas数据帧： dataset = tf.data.Dataset.from_tensor_slices((ori

浏览 1提问于2020-07-30得票数 3

3回答

pandas read_csv index_col=None不使用每行末尾的分隔符

python、pandas

我正在阅读“Python for Data Analysis”这本书，但在“Example: 2012联邦选举委员会数据库”部分将数据读取到DataFrame时遇到了问题。问题是其中一列数据总是被设置为索引列，即使index_col参数设置为None也是如此。下面是指向数据的链接：。下面是加载代码(为了节省检查时间，我设置了nrows=10)： import pandas as pd fec = pd.read_csv('P00000001-ALL.csv',nrows=10,index_col=None) 为了保持简短，我排除了数据列输出，但以下是我的输出(请不要使用索引

浏览 2提问于2012-10-19得票数 63

回答已采纳

2回答

将kdb表保存到数据帧，然后将数据帧保存到csv。是否将空值和字符串值错误地输出到csv？

pandas、export-to-csv、kdb、qpython

我将kdb表保存到dataframe，然后将dataframe保存到csv。但是，如果我打印csv文件(Dataframe)，则可以执行此操作；空值显示为“b”，所有其他字符串值显示为“b' string‘”。运行Python 3.7、pandas 0.24.2和qpython 2.0.0。 df = pandas.DataFrame(qpython query) df.to_csv(path_or_buf="", sep=",", na_rep='', float_format=None,

浏览 21提问于2019-07-30得票数 1

回答已采纳

1回答

如何编写CSV文件，使其被csv.DictReader()读取为字符串/int？

python、python-2.7、csv、pandas、export-to-csv

我使用pandas.DataFrame.to_csv()将DataFrame写入CSV文件。在此文件中，其中一列表示“年份”。问题是，当使用csv.DictReader()加载CSV文件时，这个列显然被读取为一个浮点数，因此，.0被添加到它的值中！！以下是正确的阅读行： csvfile = csv.DictReader(of, delimiter="|") 我检查了保存的CSV文件，根本没有小数点！如何正确地编写CSV文件，使某些列被csv.DictReader()作为字符串或至少作为中间行读取？注意事项：我无法控制如何调用csv.DictReader()。

浏览 1提问于2017-07-07得票数 1

回答已采纳

1回答

如何从文本文件写入excel文件中的多列？

python、excel、pandas

import pandas as pd dataframe1 = pd.read_csv('output_sample2.txt', sep="-", header= "lowestMarks") dataframe1.to_csv('output_sample2.csv', index=None) 我正在尝试上面的代码，将数据从txt文件拆分到一个excel文件中，在3种不同的列下都有列名。上面的代码只分成两列。样例文本文件 0-30不及格 30-70票 70-100区分期望输出谢谢。

浏览 1提问于2021-03-26得票数 0

1回答

使用Pandas删除csv或Excel文件中的列

python、pandas、data、data-cleaning、excel

我试图从我的csv文件中删除一个列(列'A‘称为“电影编号”)，但是尝试了许多不同的代码，虽然它在dataFrame中删除了列--它在实际的excel或csv文件中并没有这样做，它只是删除列名，而不是删除整个列。我在用PyCharm。这是密码。如有任何见解或帮助，将不胜感激。 import pandas as pd # create a dataframe from the csv file and read the file master_df = pd.read_csv("Master IMDB File Practice.csv") master_df.head

浏览 0提问于2021-10-19得票数 0

3回答

Pandas row with multiple

python、pandas

我请求您使用Pandas使用两个筛选器从csv中删除一行。 import pandas as pd moving = pd.read_csv('C:/Users/Salesdata.csv') df = pd.DataFrame(moving) df = df[df['Last Name, First Name'] != 'Reid, Mark and Connie' & df['Actual Sale Date'] == 3/8/2015] df.to_csv('improvedcsv.csv',

浏览 3提问于2017-02-08得票数 3

回答已采纳

2回答

写入和读取csv文件时使用特殊字符(\r)的问题

python、pandas、special-characters、export-to-csv

我正在使用pandas加载由excel创建的csv文件，进行一些分析，然后将结果保存到csv文件。我注意到pandas的to_csv和from_csv方法似乎不能处理特殊字符，例如\r，但也不会引发任何错误。 In [7]: import pandas as pd In [8]: data = { 'A': ['one', 'two', 'three'], 'B': ['four', 'five', 'six'] } In [9]:

浏览 4提问于2016-08-30得票数 1

2回答

Python Pandas dataFrame -列选择

python、pandas、dataframe

我有一个Pandas dataFrame对象train_df，它有一个名为"ColA“的列和一个"ColB”列。它是使用read_csv从带有列标题的csv文件中加载的当我编码时，我得到了相同的结果： pd.crosstab(train_df['ColA'], train_df['ColB']) 或 pd.crosstab(train_df.ColA, train_df.ColB) 这两种选择列的方式有什么区别吗？当我请求打印类型时，它是相同的：pandas.core.series.Series

浏览 22提问于2019-11-05得票数 0

1回答

迭代dataframe中的行并将对象添加到列表中

python、pandas、dataframe

我将一个txt文件读取到一个dataframe中，现在尝试遍历pandas dataframe中的行，并为每个数据条目创建一个学生对象。最终，将学生对象存储在“学生”列表中。我对如何迭代行并将学生对象添加到学生列表中感到有点困惑。有人能帮我创建这个列表吗？谢谢 students = [] import pandas as pd data = pd.read_csv('students.txt') df = pd.DataFrame(data) print(df) 文件输出 firstname lastname status gpa 0 Mike

浏览 42提问于2021-10-31得票数 0

1回答

如何在循环中读取和修改csv文件，并在Pandas中保存为分隔的DataFrame？

python、pandas、dataframe、loops、for-loop

我尝试在Pandas中创建函数，其中： I阅读5 csv 在每个读取的csv上做一些聚合(为了更容易，我们可以删除一列)将每个修改的csv保存为DataFrames 目前我有如下所示，但是它只返回一个DataFrame作为输出，而不是5，如何更改下面的代码？ def xx(): #1. read 5 csv for el in [col for col in os.listdir("mypath") if col.endswith(".csv")]: df = pd.read_csv("path/f"{el}"&

浏览 2提问于2022-11-20得票数 0

回答已采纳