使用Pandas将多个CSV文件合并到一个数据帧中_Python + CSV + xlsx + Pandas :将多个CSV文件合并到一个多页CSV中_如何将多个数据csv文件合并到一个数据帧中？ - 腾讯云开发者社区

python、csv、amazon-s3、boto3

我需要用python中的boto3从S3存储桶中读取多个csv文件，最后在pandas中将这些文件合并到单个数据帧中。我能够从以下python脚本中读取单个文件 s3 = boto3.resource('s3') bucket = s3.Bucket('test-bucket') for obj in bucket.objects.all(): key = obj.key body = obj.get()['Body'].read() 下面是我的道路 files/splittedfiles/Code-345678 在Co

浏览 2提问于2018-10-17得票数 6

2回答

用于csv文件/数据帧的Postgresql批插入(在GCP上)

sql、pandas、postgresql、google-cloud-platform、batch-processing

我有一个包含两列[key, chunk]的csv文件，需要将其插入到SQL db表中。(放大信息-托管在GCP上的Postgresql数据库，我可以很好地选择和执行其他数据库操作。) 我的csv文件有1000多万行。因此，我很好奇，针对Postgresql语法，我可以使用的最佳批处理插入选项是什么？将csv文件作为pandas数据帧打开会有帮助吗？由于文件的大小，我希望避免迭代行插入。

浏览 2提问于2021-05-28得票数 0

1回答

使用pyspark在Azure Blob存储中将多个csv文件合并为一个csv文件

azure、pyspark、azure-blob-storage、azure-databricks

我使用下面的代码将csv文件保存回blob存储，尽管它在循环中运行时会创建多个文件。现在我想将它们合并到一个单独的csv文件中。虽然我已经使用了dbutils.fs.cp/mv，但它没有什么帮助 while start_date <= end_date: df = spark.read.format("com.databricks.spark.csv").options(header="true", inferschema="true").load(inputFilePath) df.coalesce(1).write.mode("

浏览 15提问于2019-08-20得票数 1

回答已采纳

5回答

Pandas Dataframe中输入文件的并行加载

python、pandas、anaconda

我有一个需求，其中我有三个输入文件，需要在Pandas数据帧中加载它们，然后将两个文件合并到一个数据框架中。文件扩展名总是会更改的，可以是.txt一次，也可以是.xlsx或.csv。如何并行运行此进程，以节省等待/加载时间？这是我目前的密码， from time import time # to measure the time taken to run the code start_time = time() Primary_File = "//ServerA/Testing Folder File Open/Report.xlsx" Secondary_File_1

浏览 0提问于2019-01-22得票数 9

回答已采纳

2回答

将多个数据文件导出为power表，反之亦然

python-3.x、pandas、dataframe、csv、powerbi

我正在尝试编写一个python脚本，它将从一个输入文件夹中获取多个不同的csv文件，然后创建一个数据文件列表，并将它们显示为power bi中的power bi表。下面的脚本没有将任何表加载到power bi中： import os import pandas as pd path = r'C:\Users\admin\Downloads\Data analysis case study' csv_files = [os.path.join(path+"\\", file) for file in os.listdir(path) if file.endswi

浏览 20提问于2022-08-01得票数 0

2回答

数据框列中的常见元素

python、pandas、intersection

我有一个CSV列表，我目前正在Pandas的数据帧中读取。我需要在数据帧的其中一列中找到公共元素。 df1 = pd.read_csv("example.csv") df2 = pd.read_csv("example1.csv") val = np.intersect1d(example[' column'], example1[' column']) 如何对多个文件执行此操作。

浏览 30提问于2018-06-11得票数 0

回答已采纳

1回答

如何在tkinter中显示pandas数据

python、pandas、dataframe、tkinter

我从python中的csv文件创建了一个pandas数据帧。如何在tkinter窗口中显示此数据帧。 import pandas as pd methods = pd.read_csv('metode.csv') methods = methods.drop(methods.columns[[0]], axis=1)

浏览 3提问于2019-10-29得票数 0

2回答

将根据给定需求选择的某些行放入另一个数据帧中

python-3.x、pandas

我已经使用Pandas将csv文件读取到数据帧中，csv格式如下。我想把“时间列信息”在6/3/2011-10/20/2011间隔之间的行放到另一个数据帧中。我怎样才能在Pandas中高效地做到这一点？

浏览 4提问于2018-08-10得票数 0

3回答

将文本格式的电子邮件合并到一个csv文件中，以进行机器学习

python-3.x、pandas、csv、merging-data

我正在使用Enron数据集来解决机器学习问题。我想将所有垃圾邮件文件合并到一个csv文件中，并将所有ham文件合并到另一个csv文件中，以便进一步分析。我正在使用这里列出的数据集：https://github.com/crossedbanana/Enron-Email-Classification 我使用下面的代码来合并电子邮件，并且我能够合并它们。但是，当我尝试读取csv文件并将其加载到pandas中时，由于ParserError: Error tokenizing data. C error: Expected 1 fields in line 8, saw 2而出现错误将txt中的电

浏览 40提问于2020-04-27得票数 0

回答已采纳

1回答

在导入为pandas dataframe之前，从压缩的csv文件中获取标头

python、pandas、csv、zip

我正在尝试将csv文件作为pandas数据帧导入，其中csv文件位于zip文件中。为了高效导入，我尝试在将其加载到pandas数据帧之前先获取头文件。到目前为止，我尝试的是： from zipfile import ZipFile from io import TextIOWrapper import pandas as pd with ZipFile(zip_path, 'r') as zipfile: with zipfile.open(file_path, 'r') as file: reader = csv.reader(T

浏览 10提问于2020-10-08得票数 1

回答已采纳

1回答

如何从pyspark dataframe中更快地保存csv文件？

python、apache-spark、hadoop、pyspark

我目前在本地的windows10系统上使用pyspark。pyspark代码运行得相当快，但将pyspark数据帧保存为csv格式需要花费大量时间。我正在将pyspark数据帧转换为pandas，然后将其保存到csv文件中。我还尝试使用write方法来保存csv文件。 Full_data.toPandas().to_csv("Level 1 - {} Hourly Avg Data.csv".format(yr), index=False) Full_data.repartition(1).write.format('com.databricks.spark.

浏览 126提问于2019-08-01得票数 5

1回答

从现有数据帧的某些列创建新的pandas数据帧

python、pandas、dataframe

我已经阅读了将csv文件加载到pandas数据帧中，并希望对该数据帧进行一些简单的操作。我不知道如何根据从原始数据框中选择的列来创建新的数据框。我的尝试是： names = ['A','B','C','D'] dataset = pandas.read_csv('file.csv', names=names) new_dataset = dataset['A','D'] 我想用原始数据帧中的列A和D创建一个新的数据帧。

浏览 1提问于2017-07-11得票数 24

回答已采纳

1回答

无法在Python中写入具有完整路径的文件

python、pandas

这是一个以前已经解决的问题()，但是我遵循了上一个答案中的建议，它不起作用，这就是我发布这篇文章的原因。我正在尝试访问csv文件以加载到pandas数据帧中。 import os output_path = os.path.join('Desktop/My_project_folder', 'train.csv') 这是返回： IOError: File Desktop/My_project_folder/train.csv does not exist 编辑:我不明白，因为train.csv文件存在于我的项目文件夹中。

浏览 0提问于2015-12-05得票数 0

2回答

如何在一个CSV文件中组合文本和pandas数据帧

python-3.x、pandas

我刚接触pandas，想知道是否有可能将文本和pandas数据帧组合到一个csv文件中。我可以毫无问题地将数据帧写入csv文件，但我想将一些描述放在数据帧之上，以描述我何时收集数据。请参阅附件关于我想要实现的目标。提前谢谢你。

浏览 2提问于2020-07-11得票数 0

1回答

Pandas:读取具有不同分隔符的CSV文件-合并错误

python、csv、pandas、merge、delimiter

我有4个单独的CSV文件，我希望读入Pandas。我想将这些CSV文件合并到一个数据帧中。问题是CSV文件中的列包含以下内容：、；|和空格。因此，在读取不同的CSV文件时，我必须使用不同的分隔符，并进行一些转换以使其格式正确。每个CSV文件都包含一个“ID”列。当我合并我的数据帧时，它没有正确地完成，并且我在已经合并的列中得到了'NaN‘。您是否必须使用相同的分隔符才能正确合并数据帧？

浏览 10提问于2017-06-28得票数 0

回答已采纳

2回答

将.zip归档中的大文件写入Pandas数据帧

python、pandas、csv、urllib、zipfile

这是一个下载压缩文件的链接，该压缩文件包括由英国政府国家统计局发布的1 1GB邮政编码级别数据：有关数据的信息可在此处找到：我在Python中的数据科学应用程序中使用了这些数据，并将其加载到Pandas数据帧中。我已经将其集成到一个简单的网页中，并将其部署到云中。我不想在我的存储库中包含我从亚马逊网络服务EC2实例访问的大数据。因此，据我所知，我有两个选择： 1)将压缩文件包含在存储库中，并将CSV读取到Pandas数据帧中。 2)打开url，在文件中流式传输，并在脚本中解压，然后将CSV读取到Pandas数据帧中。这两种方法的问题是zip文件包含的内容不是我需要的csv文件，我不确定如

浏览 24提问于2019-11-14得票数 2

回答已采纳

2回答

如何在Python for Pandas中读取多个独立的数据帧

python-3.x、pandas、csv

我正在尝试将6个文件读入7个不同的数据帧，但我无法弄清楚该如何做到这一点。文件名可以是完全随机的，即我知道文件，但它不像data1.csv data2.csv。我试着使用这样的东西： import sys import os import numpy as np import pandas as pd from datetime import datetime, timedelta f1='Norway.csv' f='Canada.csv' f='Chile.csv' Norway = pd.read_csv(Norway.csv) Ca

浏览 24提问于2019-02-19得票数 1

回答已采纳

4回答

将数据帧写入/读取到csv -最终形状- Python时出现问题

python、pandas、dataframe、csv、file

我正在将一个大型数据库读入多个数据帧。每次都有效。所以我有单独的数据帧。然后，我将每个数据帧写入csv文件。最初它有34列。在此之后，我将csv文件读取到一个新的数据帧中，现在我有35列。我这样做是为了写入csv文件： df.to_csv(path + "file_01.csv") 这是用来读它的： import pandas as ps df = ps.read_csv(path + "file_01.csv") 我通过以下命令测试它们的列数： df.shape 为什么会发生这种情况，我如何改进\使其正常工作？

浏览 29提问于2020-08-18得票数 1

回答已采纳

2回答

如果在行中找到特定字符串，则拆分CSV (Python/Pandas/Bash)

pandas、bash、csv、split、header

我有一个糟糕的CSV文件，里面有多个头文件。它看起来是这样的： File1: #HEADER COL1 COL2 data data data #HEADER COL1 COL2 COL3 data data data data data #HEADER COL1 COL2 COL3 COL4 data data ... 由于文件头的原因，我不能用pandas加载它，所以我希望将每个头上的数据拆分到一个单独的文件中(或者pandas中的单独数据帧)。有没有办法做到这一点？此CSV由

浏览 0提问于2019-11-13得票数 0

2回答

如何在R中将多个csv文件完全外连接到单个data.table中？

r、csv、dataframe、join、data.table

我使用python处理熊猫数据帧已经有一段时间了。我想将我正在使用的相同代码切换到R。然而，我没有太多使用R的经验，我也不确定我有什么选择来做同样的事情。我有一个包含许多csv文件的文件夹，并且我有一个文件名列表，我希望遍历这些文件并对这些文件进行完整的外连接。在pandas中，我会运行以下命令， import pandas as pd filelist = pd.read_excel("/Users/XXX/Documents/test/data/list.xlsx") #contains a list of filenames in the File column ar

浏览 9提问于2020-04-08得票数 1

2回答

Pyspark将多个csv文件读取到一个数据帧中(或RDD?)

python、apache-spark、pyspark、spark-dataframe、jupyter-notebook

我有一个Spark 2.0.2集群，我正在通过Pyspark通过Jupyter Notebook访问它。我有多个以管道分隔的txt文件(加载到HDFS中。我需要使用spark-csv将其加载到三个独立的数据帧中，具体取决于文件的名称。我认为我可以采取三种方法--或者我可以使用python以某种方式遍历HDFS目录(还没有想出如何做到这一点，加载每个文件，然后执行联合。我还知道在spark中有一些通配符功能(参见) -我可能可以利用最后，我可以使用pandas从磁盘加载vanilla csv文件作为pandas数据帧，然后创建spark数据帧。这里的缺点是这些文件很大，加载到单个节点上的内

浏览 0提问于2016-12-14得票数 7

回答已采纳

1回答

如何在pandas.io.parsers.TextFileReader中添加/编辑文本

pandas、pandas-datareader

我在CSV中有一个很大的文件。因为它是一个大文件(几乎7 GB)，所以它不能转换为pandas数据帧。将熊猫作为pd df1 = pd.read_csv('tblViewPromotionDataVolume_202004070600.csv'，sep='\t'，iterator=True，chunksize=1000)导入df1: print ( chunk )中的块 df1的类型为pandas.io.parsers.TextFileReader 现在，我想在这个文件中编辑/添加/插入一些文本(新行)，并将其转换回pandas数据帧。请让我知道可能的解决方

浏览 28提问于2020-04-12得票数 0

1回答

将存储为Azure Blob的CSV直接加载到Pandas数据帧中，而不首先保存到磁盘

python、pandas、azure-storage

探索了与熊猫 ()一起存储的Azure存储中的数据，展示了如何将数据从Azure blob商店加载到Pandas数据框架中。他们首先下载blob并将其本地存储为CSV文件，然后将该CSV文件加载到数据帧中。 import pandas as pd from azure.storage.blob import BlockBlobService blob_service = BlockBlobService(account_name=STORAGEACCOUNTNAME, account_key=STORAGEACCOUNTKEY) blob_service.get_blob_to_path(

浏览 0提问于2019-11-22得票数 1

2回答

pandas.DataFrame.to_csv未导出所有行

python、python-3.x、pandas、export-to-csv、missing-data

有谁知道是什么原因导致pandas.DataFrame.to_csv无法导出完整的数据帧吗？ print(len(df)) [77814 rows x 42 columns] df.to_csv('filename.csv')) 生成的csv文件有54470行，缺少大约1/3的数据块。我的数据有时间戳，我可以告诉我丢失的数据是一个很大的块，而不是整个文件中的随机点。我使用的是python 3.6.5，pandas是0.22.0。非常感谢你的帮助

浏览 3提问于2018-04-02得票数 2

1回答

将数据从S3读取到pandas的最佳方法

python、pandas、amazon-web-services、amazon-s3、amazon-ec2

我有两个CSV文件，一个大约60 GB，另一个在S3中大约是70 GB。我需要将这两个CSV文件加载到pandas数据帧中，并对数据执行连接和合并等操作。我有一个EC2实例，它有足够的内存供两个数据帧一次加载到内存中。从S3到pandas数据帧读取这么大的文件的最佳方式是什么？另外，在我对数据帧执行了所需的操作之后，输出的数据帧应该被重新上传到S3。将巨大的csv文件上传到S3的最佳方式是什么？

浏览 5提问于2020-05-06得票数 0

2回答

将数百个数据文件合并到一个主DataFrame中的有效方法是什么？

python、pandas、append、dataframe

与标题一样，我有超过800个数据文件(全部以.csv格式)(每个文件的大小为0-5MB，每个文件包含10列，第1行是标题)，我希望将它们合并到一个DataFrame中。我可以使用Pandas数据帧一个接一个地添加它们，但这非常耗时。有办法更快地做到这一点吗？我的代码： fname = "CRANlogs/" + ffiles[0] df = pandas.read_csv(fname,header=0) for i in range(807)[1:]: print(i) fname = "CRANlogs/" + ffiles[i]

浏览 0提问于2015-03-20得票数 1

回答已采纳

2回答

读取多个文件，并将它们堆叠到单个多级数据帧中。每个文件都有相同的列名

python、database、pandas

我想问一下，是否有人知道如何使用多级索引将多个数据帧堆叠成一个单独的数据帧，而不是像我正在做的那样堆叠成一个数据帧列表。谢谢 import glob import pandas as pd glist=glob.glob("./path/*.csv") D=[] for file in glist: X=pd.read_csv(file,names=['name1','name2','name3'],index_col = 0, header=0) D.append(X)

浏览 3提问于2017-08-11得票数 0

1回答

使用Hive表迭代Spark数据帧

apache-spark、hive、pyspark、apache-spark-sql、hiveql

我有一个非常大的csv文件，所以我使用spark并将其加载到spark数据帧中。我需要从csv上的每一行提取纬度和经度，以便创建folium地图。使用pandas，我可以用一个循环解决我的问题： for index, row in locations.iterrows(): folium.CircleMarker(location=(row["Pickup_latitude"], row["Pickup_longitude"]), radiu

浏览 27提问于2018-05-30得票数 0

2回答

绘制埋藏在不同目录中的CSV

python、pandas

我正在尝试挖掘我的计算机，并在一块图上绘制一组CSV(我正在使用Python2.7和Pandas)。虽然所有CSV文件都具有相同的名称file.csv，但它们位于无数不同的文件夹中。我完成了以下操作，将CSV封装到一个数据帧中，然后根据某个范围的值绘制该数据帧。我想将每个绘图标记为文件夹名(即让图例指定CSV所在的文件夹目录) import pandas as pd from pandas import read_csv import numpy as np import matplotlib.pyplot as plt from matplotlib import style impor

浏览 16提问于2017-02-08得票数 1

回答已采纳

6回答

如何估算熊猫的DataFrame需要多少内存？

python、pandas

我一直在想..。比方说，如果我使用read_csv或read_table将一个400MB的csv文件读入到pandas数据帧中，有没有办法猜测这将需要多少内存？只是想更好地了解数据帧和内存...

浏览 4提问于2013-08-07得票数 160

3回答

如何将DASK数据帧放入MySQL数据表？

python、dask、dask-dataframe

我从CSV文件中获取了数据，并将其保存在我的Dask数据帧中并对其进行操作。然后，我需要将数据写入数据表。我还没有真正遇到过任何解决方案。Pandas的to_sql函数具有内置的功能，所以我不确定是否需要首先转换为Pandas？我目前认为，将Dask数据帧转换为Pandas会导致它被完全加载到内存中，这可能会违背最初使用Dask的目的。将Dask数据帧写入datatable最好、最快的方法是什么？

浏览 4提问于2020-03-27得票数 1

2回答

合并多个panda帧

python、pandas

我有一堆CSV文件，其中包含特定时间的数据，时间被编码为文件名： time1.csv Label val1 val2 a 5 6 b. 6 4 time2.csv Label val1 val2 a 5 6 c 6 4 ... 我可以将每个文件读入Pandas数据帧。然后我想:将"time“列添加到每个数据帧中，然后将所有数据帧合并为一个数据帧。有没有办法做到这一点？

浏览 2提问于2020-10-11得票数 0

1回答

Python pandas输出浮点数而不是整数

python、pandas、dataframe

我想要将一个矩阵(非常稀疏，有数百万个零和几个其他数字)作为熊猫数据帧保存到.csv文件中，但是数据帧将0保存为0.0 (浮点数而不是整数)，因此文件变得非常大。所以我想将0.0保存为0，以减小输出.csv文件的大小。我正在尝试类似这样的东西： import pandas table = [[0.88, 4], [0, 0.5]] pd = pandas.DataFrame(table, columns = ['C1', 'C2']) pd.to_csv('output.csv', index = False) pd 并获得输出： C1

浏览 37提问于2020-07-24得票数 0

3回答

如何使用pandas数据框打开csv文件

python、pandas、csv、dataframe

有一个包含三列数据帧的CSV格式文件。第三列包含长文本。当我尝试使用pandas.read_csv打开文件时，出现此错误消息 message : UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 0: invalid start byte. 但使用以下命令打开该文件没有问题 with open('file.csv', 'r', encoding='utf-8', errors = "ignore") as csvfile

浏览 1提问于2018-01-22得票数 3

1回答

在Databricks中使用Pyspark更新数据库表

python、pandas、pyspark、databricks

我在Azure SQL Server数据库中有一个表，该表是从我的Dataframe填充的。我想使用pyspark / pandas基于多条件数据库来更新这个表。我是PySpark / Databricks / Pandas的新手，有人能告诉我如何更新表吗？我已经将数据插入到表中-我可以想到的一种解决方案是将表中的数据加载到数据帧中，然后将新文件合并到相同的数据帧中，然后从表中删除数据并插入此数据帧。如果这是正确的方法，那么在上述场景中，我们如何从数据库表中删除数据？

浏览 2提问于2020-04-20得票数 0

2回答

如何在pandas dataframe中使用列表作为值？

python、csv、numpy、pandas、dataframe

我有一个数据帧，它要求列的子集具有具有多个值的条目。下面是一个包含“runtime”列的dataframe，其中包含程序在各种条件下的运行时： df = [{"condition": "a", "runtimes": [1,1.5,2]}, {"condition": "b", "runtimes": [0.5,0.75,1]}] df = pandas.DataFrame(df) 这就形成了一个数据帧： condition runtimes 0 a [1,

浏览 0提问于2014-11-08得票数 8

回答已采纳

2回答

将数据追加到数据帧并保存到.csv，但csv为空

python、pandas

我正在遍历目录树。在每个子目录中，当我遇到一个名为portfolio-insts-summary.csv的文件时，我打开该文件并将.csv的内容读取到一个名为df的数据框中。然后，我将df数据帧附加到另一个名为final_df的数据帧上。一旦代码遍历完目录树，数据帧df_final就会保存到一个名为final.csv的.cvs中。我打印了每个df数据帧的头部，它们包含数据，但是当我将df_final写入final.csv时，.csv文件被创建，但它是空的。我做错了什么?为什么即使df有来自每个文件的数据，final.csv文件仍然是空的？代码如下： # -*- coding: utf-8

浏览 0提问于2018-07-22得票数 0

2回答

使用dask合并csv文件

python、dask

我是python的新手。我正在使用dask读取5个大的(>1 GB) csv文件，并将它们合并(类似SQL)到一个dask数据帧中。现在，我正在尝试将合并后的结果写入单个csv。我在dask dataframe上使用compute()将数据收集到单个df中，然后调用to_csv。但是，compute()在读取所有分区的数据时速度很慢。我尝试在dask df上直接调用to_csv，它创建了多个.part文件(我没有尝试将这些.part文件合并到一个csv中)。有没有其他方法可以将dask df放入单个csv或任何参数中来计算()以收集数据。我使用硬盘和i5处理器的6 6GB内存。谢谢

浏览 5提问于2017-03-23得票数 4

2回答

spark python读取多个csv到dataframe

python、dataframe、databricks

我在一个数据记录上有多个csv文件。我可以连接到datalake，甚至可以列出文件。但我需要将这些文件放在一个数据帧中，以便可以将此数据帧加载到SQL中。加载到SQL也没有问题。问题是，只有datalakefolder中的最后一个文件的内容被读写到SQL中(因此也在dataframe中)。可能是因为每次都会覆盖数据帧。但我不知道如何在每个周期中将数据附加到数据帧中。下面是我使用的代码： for file in dayfolders.collect(): filename = file.name pathname = file.path tablen

浏览 53提问于2020-01-24得票数 0

回答已采纳

1回答

获取spark数据帧写入的文件名

python、dataframe、amazon-s3、pyspark、filenames

我使用下面的代码将spark数据帧写入s3存储桶中。 spark_df. \ coalesce(1). \ write. \ option("header", "true"). \ mode("overwrite"). \ csv(bucket_name + "/" + bucket_path + "/csv") 在这里，我想要获取正在写入s3 bukcet的文件的名称，并希望将该文件用作后面代码部分的一部分。我已经解决了上面的问题，因为我们不能在将数据帧写入s3存储桶时给出文件名。我正在考虑迭代s3存储桶，

浏览 0提问于2018-06-18得票数 1

1回答

一个3.6 gb的csv怎么能占据我所有64 gb的内存

python、pandas

我正在将csv加载到pandas数据帧中。csv是3.6 gb，我有64 gb的ram。当加载一个3.6 gb的文件时，内存怎么会超过64 gb？有没有更好的方法加载整个数据帧而不占用太多内存，或者可能是我的计算机出了什么问题。下面是我用来加载csv的代码 df = pd.read_csv('../input/ML_DATA.csv') 如果感兴趣，我也可以提供csv文件。以下是数据外观的示例 df = pd.read_csv('../input/ML_DATA.csv', nrows=10) df.shape -> (10, 4247) 这是一个

浏览 15提问于2021-09-06得票数 2

回答已采纳

2回答

使用Pandas [with key column]将CSV与不同的列组合

python、pandas、csv、dataframe、concat

我尝试在Python中组合两个CSV文件，每个CSV文件都有唯一的列，但这两个CSV文件共享一个公共键列。我一直在寻找StackOverflow/Google/Pandas文档，但没有找到我想要的东西。Pandas文档页面上提供的merge和concat示例与我试图实现的不同，所以我不确定我所要求的在Pandas中是否可行。我已经将两个CSV文件中的选定列读入到单独的数据帧中，现在我想要做的是基于键列将这两个数据帧合并为一个数据帧。 Example CSV 1: Key Make Model 501 Audi A3 502 Audi A4 503 Audi

浏览 22提问于2019-04-12得票数 2

2回答

在Pandas中将多个csv读取到单独的数据帧中

python、pandas、dataframe

我有一个很长的csv文件列表，我想以数据帧的形式读取这些文件，并按文件名命名它们。例如，我想读入文件status.csv，并为其数据帧指定名称status。有没有办法可以使用Pandas有效地做到这一点？查看this，我仍然需要在循环中写出每个csv的名称。我想避免这种情况。看看this，它允许我将多个csv读取到一个数据帧中，而不是多个。

浏览 38提问于2019-03-20得票数 1

回答已采纳

2回答

从引号中解开.csv行

python、pandas、csv

.csv文件如下所示 col1, col2, col3 "a, b, c" "d, e, f" 我想解开引号中的行以正确读取pandas/Python中的文件。如R中的重复问题所述，可以读取.csv数据两次: 1)展开辅助数据帧的第一列中的数据，以及2)调用辅助数据帧的第一列上的读取函数。对熊猫来说，最优雅的方式是什么？

浏览 0提问于2018-12-15得票数 1

2回答

重复将多个Panda数据名导出到多个csv文件的任务

pandas、dataframe、csv、for-loop

我对Pandas/Python有些陌生(更深入地了解SAS)，但我的任务如下:我有四个Pandas数据帧，我想将它们分别导出到一个单独的csv文件中。csv的名称应与原始数据帧(forsyning.csv、inntak.csv等)相同。到目前为止，我已经用数据帧的名称创建了一个列表，然后尝试将该列表放入一个for循环，以便生成一个接一个的csv。但我只做了一半。到目前为止我的代码如下： df_list = ['forsyning', 'inntak', 'behandling', 'transport'] for i in

浏览 8提问于2021-01-27得票数 2

回答已采纳

3回答

从for循环中读取和保存多个csv文件

python、pandas、csv、dataframe

我正在尝试从文件路径列表中读取多个csv文件，并将它们全部保存为单独的pandas数据帧。我觉得应该有一种方法来做到这一点，但是我找不到一个简洁的解释。 import pandas as pd data_list = [['df_1','filepath1.csv'], ['df_2','filepath2.csv'], ['df_3','filepath3.csv']] for name, filepath in data_list:

浏览 35提问于2019-07-11得票数 1

1回答

组合一个数据文件列表

python-3.x、pandas、indexing、concat

我有一个有几个..csv文件的文件夹。每个包含数据的时间，高，低，开放，Volumefrom，Volumeto，加密货币关闭。我成功地将.csvs加载到一个数据文件列表中，并删除了列Open、High、Low、Volumefrom、Volumeto，这是我不需要的，给我留下了时间，并关闭了每个数据帧。现在我想把数据列表组合成一个数据，索引以最小的硬币的时间戳开始，在这个例子中是iota。这是我到目前为止编写的代码： import pandas as pd import os # Path to my folder PATH_COINS = r"C:\Users\...\C

浏览 1提问于2018-09-25得票数 0

2回答

pandas python中没有名为read_csv的属性

python、csv、pandas、dataset、attributeerror

我是机器学习的新手，正在使用Python中的pandas创建一个数据集。我查阅了一个教程，只是在尝试创建数据帧的基本代码，但我一直得到以下回溯：模块：“AttributeError”对象没有特性“”read_csv“” 我在Excel 13中将csv文件保存为csv(逗号分隔)格式。以下是我的代码： import pandas import csv mydata = pandas.read_csv('foo.csv') target = mydata["Label"] data = mydata.ix[:,:-1]

浏览 11提问于2015-08-01得票数 9

1回答

pandas:具有保留列顺序的to_csv追加模式

pandas

我正在使用： df.to_csv('file.csv', header=False, mode='a') 将多个pandas数据帧逐个写入CSV文件。我确保这些数据帧具有相同的列名集。但是，似乎列顺序将以随机顺序写入，因此我有一个chaos CSV文件。如何确保新的数据帧将按照以前数据的列顺序写入？非常感谢

浏览 21提问于2018-08-02得票数 0

2回答