使用pandas合并多个表数据列表并另存为csv格式_如何使用pandas获取格式的表并导出到csv？_Pandas Python (CSV) -从表中访问数据并使用该数据- - 腾讯云开发者社区

python、csv、pandas、zip

Pandas 0.18支持将read_csv压缩文件作为参数，并将压缩后的csv表正确读取到数据帧中。但是当我尝试使用to_csv()方法将数据帧保存为压缩的csv时，我得到了错误。根据官方文档，to_csv()方法不支持zip格式。有什么想法吗？谢谢。将熊猫作为pd导入工作正常 data = pd.read_csv("E:\ASML SED.zip") IOError出错: Errno 2没有这样的文件或目录：'E:\ASML SED.zip‘ 压缩(“E：\ASML SED Zipped.zip"，data.to_csv= 'zip')

浏览 1提问于2016-10-04得票数 0

1回答

UnicodeDecodeError：'utf-8‘编解码器无法对位置4中的字节0xb4进行解码:起始字节无效

python、pandas、utf-8、character-encoding

我从Microsoft Excel导出了csv文件。它在带有pandas和numpy的Jupyter notebook中正确显示如下： import pandas as pd pd1 = pd.read_csv('test1.csv', encoding='utf-8') 第一次没有错误消息，但我只是打开csv文件，然后将其另存为一个新名称。我一直收到unicodeerror消息 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb4 in position 4: invalid

浏览 6提问于2020-03-11得票数 0

1回答

使用pandas数据帧修改csv中的数据

python、pandas、csv

我有一个这样的结构；用来创建一个pandas数据帧： my_dict = { 'name' : ["joe", "jack", "jill", "joan", "jesse","jacob", "jonas"], 'age' : [20,27, 35, 55, 18, 21, 35], 'designation': ["VP", "CEO

浏览 6提问于2019-07-15得票数 0

回答已采纳

2回答

python -将样式对象导出到csv时pandas数据帧错误

python、dataframe、export-to-csv、pandas-styles

我有一个针对每列的不同格式的数据帧。我需要将其导出为csv或dat文件。但得到以下错误消息： AttributeError：“Styler”对象没有属性“”to_csv“” 如何解决这个问题？ import pandas as pd import datetime def time_formatter(data): return datetime.datetime.strptime(data, "%Y/%m/%d").date().strftime('%Y%m%d') df = pd.DataFrame({'a':[1,2,3], &

浏览 0提问于2017-06-28得票数 2

2回答

将多个数据文件导出为power表，反之亦然

python-3.x、pandas、dataframe、csv、powerbi

我正在尝试编写一个python脚本，它将从一个输入文件夹中获取多个不同的csv文件，然后创建一个数据文件列表，并将它们显示为power bi中的power bi表。下面的脚本没有将任何表加载到power bi中： import os import pandas as pd path = r'C:\Users\admin\Downloads\Data analysis case study' csv_files = [os.path.join(path+"\\", file) for file in os.listdir(path) if file.endswi

浏览 20提问于2022-08-01得票数 0

1回答

如何控制一组输入数据及其处理脚本的版本？

python、python-3.x、database、git、version-control

我正在使用一组Python脚本，这些脚本从Excel文件中获取数据，该文件被设置为行为类似于伪数据库。由于兼容性和对其他不熟悉数据库的同事的访问要求，所以使用Excel而不是SQL软件。我有一组大约10个表，每个表中有多个记录，关系键将它们全部链接起来(同样是以一种伪链接的方式，使用一些脆弱的数据验证)。我使用的脚本是由Git控制的版本，我知道将.xlsx文件添加到代码库的陷阱，所以我没有使用它。由于数据有点脆弱，我想确保我有一种方法来跟踪我们对它所做的任何更改。我的想法是有一个脚本，它将Excel文件分解成.csv表，并将它们添加到存储库中，即： import pandas as pd

浏览 13提问于2019-07-09得票数 0

1回答

将几个已擦伤的表导出到一个CSV文件中

python、pandas、web-scraping、export-to-csv、scrape

如何连接从几个HTML读取的表？我知道它们被认为是列表，列表是不可能连接的，但是我如何将一个不同URL中的多个表插入到一个CSV中呢？有什么想法吗？是否可以将打印输出保存在变量中，然后将其移动到CSV中？ import pandas as pd df = pd.read_html('URL') df1 = pd.read_html('URL') print(df, df1) (**df,df1**).to_csv('name.csv') 这个属性(df，df1)当然是不正确的，只是写它来描述我缺少的东西。先谢谢你

浏览 0提问于2021-03-03得票数 0

1回答

如何在python中使用Pandas dataframe顺序创建和保存csv文件

python、pandas、csv、dataframe

我有一段简单的代码，可以将熊猫数据帧保存到csv文件中。到目前为止，它是通过覆盖文件名来工作的，所以每次我运行它时，它只是用具有相同名称的新文件替换旧文件。有没有可能保存这个数据帧，但让它按顺序创建新文件，即如果目录中已经有一些名为"filename1“的文件，请创建名为"filename2”的新文件，这样原始文件中的数据就不会丢失？ import pandas datamatrix= [[1,2,3],[1,2,3],[1,2,3]]) x=pandas.DataFrame(datamatrix) pandas.DataFrame.to_csv(x,"filena

浏览 86提问于2018-06-16得票数 1

1回答

从url中读取csv并通过熊猫在DB中推送它

python、python-3.x、pandas、python-requests

URL提供csv格式的数据。我正在尝试获取数据并将其推入数据库。但是，我无法读取数据，因为它只打印文件的头而不完整csv数据。还有更好的选择吗？ #!/usr/bin/python3 import pandas as pd data = pd.read_csv("some-url") //URL not provided due to security restrictions. for row in data: print(row)

浏览 4提问于2016-10-14得票数 2

回答已采纳

1回答

"TypeError:列表索引必须是整数或切片，而不是序列“当尝试筛选熊猫数据时

python、pandas、dataframe

这是我的密码： import pandas as pd import numpy as np pd.set_option('display.max_rows', None) daily_df = pd.read_csv (r'Data\\CSV\daily.csv') sixtymin_df = pd.read_csv (r'Data\\CSV\sixtymin.csv') thirtymin_df = pd.read_csv (r'Data\\CSV\\thirtymin.csv') fivemin_df = pd.read

浏览 2提问于2022-06-15得票数 0

2回答

读取多个文件，并将它们堆叠到单个多级数据帧中。每个文件都有相同的列名

python、database、pandas

我想问一下，是否有人知道如何使用多级索引将多个数据帧堆叠成一个单独的数据帧，而不是像我正在做的那样堆叠成一个数据帧列表。谢谢 import glob import pandas as pd glist=glob.glob("./path/*.csv") D=[] for file in glist: X=pd.read_csv(file,names=['name1','name2','name3'],index_col = 0, header=0) D.append(X)

浏览 3提问于2017-08-11得票数 0

1回答

使用熊猫read_html在网页上抓取多个表并将其转换为dataframe & csv

python、html、pandas、beautifulsoup

我正试图从BLS网站上提取多个表格，并遇到了一些障碍。我可以提取表，我查看了其他这样的帖子- ()。但是，我提取的表格式不正确，数据到处都是。以下是我到现在为止所做的事情； import urllib import pandas as pd from bs4 import BeautifulSoup def new_func(): url = input('Please enter the BLS publication that you want to scrape table from:') return url url = new_func() dat

浏览 5提问于2022-06-24得票数 1

回答已采纳

1回答

在本地驱动器中创建新的csv文件

python

最终错误数据= pd.read_csv('FinalFaultData.csv') passedmaster = pd.read_csv('PASSEDMASTER.csv') A=pd.concat(最终错误数据，passedmaster) 打印(A) 以open ('output.csv'，'w')作为输出： writer = csv.writer(output) writer.writerows(A)

浏览 2提问于2021-05-07得票数 0

2回答

phpMyAdmin导入带日期和时间的电子表格

mysql、sql、excel、phpmyadmin

我有一个Excel文件(.xlsx)，我正在尝试使用phpMyAdmin导入它。(不使用.csv) 在Excel文件中，第一行是我的表中字段的标题，其余行是我要导入的数据，如下所示。如您所见，列B包含日期和时间。(yyyy-mm-dd hh:mm:ss) 在phpMyAdmin中，我将表设置如下：当我现在转到' import‘部分导入Excel文件时，我选择了以下内容：然后我点击“Go”来导入文件。当我这样做时，日期和时间字段转换为如下所示的数字：我做错了什么吗？如何才能使日期和时间与Excel文件中的日期和时间相同？在Excel中，

浏览 3提问于2015-11-27得票数 0

2回答

合并Pandas中的数据格式会抛出“AssertionError:无法创建BlockManager._ref_locs”

python、merge、pandas

我正在尝试将几个文件从csv导入到单个DataFrame中，并在尝试添加第三个DataFrame时得到以下错误。 AssertionError: cannot create BlockManager._ref_locs because block [ObjectBlock: [CompletionDate, Categories, DateEntered_x, <lots more columns here>...], dtype=object)] does not have _ref_locs set 守则是： project = pandas.read_csv(read_csv

浏览 9提问于2013-08-11得票数 1

回答已采纳

1回答

VBA代码仅在我的新工作簿中保存2张工作表中的1张

excel、vba

我从多张工作表中获取数据，对其进行处理，以便将数据加载到我们的网站中。数据放在两个工作表上。我的VBA代码只保存了新创建的工作簿中的两个工作表中的一个。不知道为什么？我唯一知道的保存新创建的电子表格的代码是我唯一尝试过的东西。 ‘创建输出文件 Dim newWB As Workbook, currentWB As Workbook Dim newA As Worksheet, newP As Worksheet, currentS As Worksheet Dim strFullname As String strFullname = "G:\CMG\DCM\Operations\

浏览 10提问于2019-10-25得票数 0

3回答

在不更改任何数据的情况下将xls转换为csv

excel

我有xls文件，在他里面是很unicode的数据，也有像这个0004之类的数据。我需要转换这个文件到csv格式，但如果简单的save as csv从ms excel，数据被改变，unicode符号转换为- ???，数据像这样的0004，转换为4 有没有可能在不更改任何数据的情况下将xls转换为csv？

浏览 1提问于2013-04-23得票数 0

回答已采纳

1回答

以倍频程表示的xlsread返回零值

octave

我正在尝试以倍频程读取csv文件。该文件包含一个同时包含数字和文本数据的表。它还包含日期和小时的信息。此外，第一行的格式与其余行的格式不同，因为它包含标题。csvread只能读取数字数据(根据Octave帮助)，所以我尝试使用xlsread，如下所示： NUMARR，TXTARR，RAWARR，LIMITS = xlsread ('Line.csv') 我只得到了一个包含数值的NUMARR矩阵。但是，所有其他返回的变量都是空的-它们的维数是0x0。如何获取所有文本和所有其他信息？ TX！

浏览 2提问于2017-05-21得票数 1

2回答

通过添加新列向csv添加数据

python、pandas、dataframe、export-to-csv

我想使用python中的pandas模块，将一些来自红移表的数据附加到csv文件中。通过python，我可以使用psycopg2模块成功地连接和检索红移表中的行。现在，我在csv上存储按日期划分的数据。因此，我需要首先在csv中创建一个新的date列，然后追加在该新列中检索到的数据。我使用以下命令从红移表中读取： conn=psycopg2.connect( host='my_db_hostname', port=`portnumber`, user='username', password='password', dbname='db

浏览 8提问于2021-07-30得票数 0

回答已采纳

2回答

Python -在csv中读取列表

python、list、csv、pandas

我有一个问题，我不能读取一个CSV文件包含一个列的浮动列表。这是我用来保存CSV的方法。数据是元组的列表。 df = pandas.DataFrame(data, columns=['ColA', 'ColB']) df.to_csv(FILE, index=False, header=True) 通过这种方式，我可以在输出中获得以下文件，这很好。 ColA,ColB "[1.5,2.5,3.5]",9 "[4.5,5.5,6.5]",9 "[3.5,1.5,8.5]",9 现在，当我试图以这种方式加载文件时 df

浏览 8提问于2014-11-12得票数 0

回答已采纳

3回答

是否有将数据INFILE (导入) xlsx文件加载到MySQL数据库表的方法？

mysql、excel、import、load

我知道这是很多讨论，但我没有找到解决办法如何做到这一点。我需要的是将excel文件(xls/xlsx)导入到我的数据库表中。这是一个按钮，执行的命令是这样的： string cmdText = "LOAD DATA INFILE 'importTest4MoreMore.csv' INTO TABLE management FIELDS TERMINATED BY ',';"; 效果很好。但是我需要导入excel文件，而不是CSV。据我所知，LOAD DATA命令不支持xls那样的二进制文件。那有什么解决办法呢？请帮帮忙非常感谢佩皮斯

浏览 5提问于2011-11-02得票数 6

回答已采纳

1回答

无法将合并的Dask dataframe转换为pandas dataframe -出现错误"Unalignable boolean Series provided as indexer“

python、dask、dask-dataframe

我正在尝试合并3个Dask数据帧并相应地查询它们。数据帧是从formula1数据的SQL表的.csv文件创建的。表格 laptimes: raceId, driverId, lap, position, time races: raceId, year, round drivers: driverId, forename, surname 下面的laptimes表与races和drivers表具有外键关系。我已经读入，合并了数据帧，并尝试查询数据帧： from dask import dataframe as df import pandas as pd pd.set_option("

浏览 82提问于2021-10-05得票数 2

1回答

如何读取多个文本文件并提取符合某些条件的数据，然后在python中添加基于另一个查找表的列

python、excel、csv

我是python的初学者，我正在尝试使用python打开多个文本文件(总共5G数据)，并且只选择c= "string111“条件的行，然后尝试根据查询表(csv文件)添加另一列，最后编写一个cvs或excel文件。例如:文件如下所示： a b c d string1 string11 string111 678 string2 string22 string222 890 string3 string33 string333 2739 我还有另一个查找csv文件： a b c e string1 string11 string111 string1111 string2 strin

浏览 0提问于2016-01-18得票数 0

1回答

无法将CSV文件更新到BQR

google-bigquery

我遇到了这些错误：读取数据时出错，错误消息: CSV表遇到太多错误，正在放弃。行: 1；错误: 1。有关更多详细信息，请查看errors[]集合。读取数据时出错，错误消息: CSV表引用了列位置77，但从位置0开始的行仅包含56列。我的样本数据是：

浏览 2提问于2020-08-10得票数 0

1回答

Python仅从PDF文件中提取表的一部分

python

我有一个PDF文件，正在尝试使用tabula来读取和提取表格。但我只得到了提取到CSV的表中的几行，而不是整个表。PDF文件有什么问题吗？任何帮助都将不胜感激！ import tabula from tabula import read_pdf import pandas as pd from tabula import read_pdf tabula.convert_into(r"C:\Users\zjalil\Desktop\CDS_Analytical2.pdf", "CLD.csv", output_format="csv"

浏览 25提问于2021-08-13得票数 0

2回答

通过CSV将excel数据导入MySQL时出现问题

mysql、excel、csv、import

我有12个excel文件，每个文件都有两个字段(列)组织的大量数据：id和text。每个excel文件对text字段使用不同的语言:西班牙语、意大利语、法语、英语、德语、阿拉伯语、日语、俄语、韩语、中文、日语和葡萄牙语。 id字段是字母和数字的组合。我需要导入每个excel到一个不同的MySQL表，所以每种语言一个表。我尝试这样做：-将excel另存为CSV文件-在phpMyAdmin中导入该CSV 问题是我遇到了各种各样的问题，我不能正确地导入它们，可能是因为编码问题。例如，对于阿拉伯字符，我将所有内容都设置为UTF-8 (数据库表字段和CSV文件)，但是当我导入时，我得到的是奇怪的

浏览 136提问于2012-06-15得票数 0

回答已采纳

2回答

CSV - SSIS - SQL Server，字符编码问题

sql-server、csv、ssis

我有一个很大的CSV文件集，我要将它们传输到Microsoft SQL Server 2014 Management Studio。我正在使用Microsoft Visual Studio 2012中的SSIS包来实现这一点。我目前有大约两百万行数据，所以我需要SSIS 我的问题是，虽然我的CSV中的数据已经存在编码问题，但我在传输过程中使它们变得更加糟糕。现在，我需要做的只是维护字符，这样我在CSV中看到的任何内容都会出现在我的SQL服务器表中。我对‘Beno’特别感兴趣，它在我的CSV中很好，但在我的SQL表中不是，它变成了'BenoŒt‘请看我帖子底部的列表。我还想知道，在导

浏览 1提问于2014-12-16得票数 0

2回答

Google Translate with a CSV file

python、pandas、csv、google-translate

我正在Python与一个CSV文件，我想转换一些列到英语，我一直使用谷歌翻译，但它指的是他们需要一个JSON文件，有没有可能使用谷歌翻译的CSV文件。下面是我收到的错误： import pandas as pd import numpy as np import goslate from googletrans import Translator from translate import Translator df = pd.read_csv ("Johanna.csv", delimiter=',',encoding="ISO-8859-1

浏览 2提问于2019-02-18得票数 0

1回答

熊猫组合不同日期指数的两个数据

python、datetime、pandas

假设我已经从两个独立的文件中提取了csv数据，其中包含了熊猫自动提取的日期索引，这是最初的列之一。 import pandas as pd df1 = pd.io.parsers.read_csv(data1, parse_dates = True, infer_datetime_format=True, index_col=0, names=['A']) df2 = pd.io.parsers.read_csv(data2, parse_dates = True, infer_datetime_format=True, index_col=0, names=['A&#

浏览 5提问于2014-05-12得票数 1

回答已采纳

1回答

可以使用pandas将整形后的数据保存/导出到csv/text/h5文件吗？

python、csv、pandas、h5py

我发现了这个问题：我修改了脚本以将结果保存到csv文件中，但出现以下错误 AttributeError: 'numpy.ndarray' object has no attribute 'to_csv' 这就是脚本。基本上我只是添加了 to_csv() 干杯。 import pandas as pd df = pd.read_csv("test.csv") start = 0 for i in range(0, len(df.index)): if (i + 1)%10 == 0: result = df['

浏览 71提问于2017-02-10得票数 0

4回答

是否可以使用多个选项卡/工作表的csv？

c#、asp.net、excel、csv

我正在调用一个web服务，来自web服务的数据是csv格式的。如果我尝试将数据保存在xls/xlsx中，则在一个工作簿中会出现多个工作表。那么，如何在c#中使用multipletab/sheets将数据保存在csv中呢？我知道带有多个选项卡的csv是不实用的，但有没有什么该死的方法或库可以将数据保存在带有多个选项卡/工作表的csv中？

浏览 1提问于2015-04-14得票数 39

3回答

读取R中包含波斯语(波斯语)列的*.CSV文件

r、dataframe、read.csv、farsi

我正在尝试读取一个excel文件，其中有一些公司数据在R中，公司名称是波斯语，但当我将文件读取到R中时，公司名称不可读，我正在尝试此代码来读取我的数据 read.csv("book.csv",encoding = "UTF-8") ?

浏览 19提问于2019-05-04得票数 0

回答已采纳

1回答

从多个页面中抓取一个表，并将其存储在一个数据文件中

python、pandas、beautifulsoup

Problem：一个网站有c.80页，每个页面都包含一个结构相同的表。我需要刮每一张桌子，并将结果存储在一只熊猫的数据中。表内容定期更新，因此需要经常重复。我可以从一个页面中抓取表，但我很难在多个页面中完成它。我发现的所有示例都用于迭代更改的URL，例如(www.example.com/page1 1、/page2等)，而不是用于指定的URL列表。我尝试了下面的URL子集(理想情况下，我希望从csv列表中读取URL)，但它似乎只将最后一个表刮到dataframe (即ZZ)中。很抱歉，如果这看起来不太好，我对Python相当陌生，我主要使用pandas进行数据分析，直接从csv读取。任何

浏览 0提问于2018-11-13得票数 1

回答已采纳

4回答

CSV日期格式

excel、csv、vba

我有一个VB应用程序，提取数据和创建3csv文件(a.csv，b.csv，c.csv)。然后，我使用另一个Excel电子表格(import.xls)将上述CSV文件中的所有数据导入到此工作表中。 import.xls文件有一个宏，用于逐个打开CSV文件并复制数据。我面临的问题是CSV文件中的日期存储为mm/dd/yyyy，并将其复制到Excel工作表中。但是我想要dd/mm/yyy格式的日期。当我手动打开任何CSV文件时，日期都以正确的格式显示(mm/dd/yyyy)。你知道我该怎么解决这个问题吗？

浏览 3提问于2008-10-15得票数 2

回答已采纳

2回答

Oracle 10g将数据导出到CSV

oracle10g、export-to-csv

是否有一种简单的方法可以将Oracle 10g数据库中的所有表导出到单个CSV文件中？我不能使用第三方工具，因为我不能使用那些需要连接到Oracle服务器本身才能迁移它的工具。

浏览 1提问于2013-11-20得票数 0

1回答

如何将列表中的每个文件与R中的另一个数据帧连接起来

r、list、dataframe、join、merge

我已经从CSV创建了一个包含500个文件的列表，并使用以下代码附加了一个列及其文件名： filenames <- list.files(pattern="*.csv") file_list <- lapply(filenames, function(x) cbind(Ticker_Symbol=strsplit(x,'\\.')[[1]][1], read.csv(x))) 每个文件的结构都类似，但行号和列名并不相同。我有另一个带有"Ticker_Symbol“列的数据框架，我希望将每个文件与这个其他数据框架连接起来。然后，我想将所有文件合

浏览 2提问于2021-05-04得票数 0

3回答

使用pandas合并多个表数据列表并另存为csv格式

python、pandas、web-scraping

在下面的代码中，当我迭代和打印时，我得到了所有的表数据，但是当我使用pandas存储为csv格式时，我只得到了表数据的第一个列表。如何将它们全部存储到单个CSV文件中？ import requests import pandas as pd isins = ['LU0526609390:EUR','IE00BHBX0Z19:EUR'] for isin in isins: html = requests.get(f'https://markets.ft.com/data/funds/tearsheet/historical?s={isin}&

浏览 50提问于2021-10-03得票数 0

回答已采纳

1回答

使用循环合并python中的面板数据

python、pandas、loops、merge、panel-data

我正在尝试按idcode合并面板数据格式，并在我的数据文件中按“idcode”进行排序。我的数据变量名是wave68、wave69.、wave71。总的来说，我有两个问题：首先，我想使用循环对数据进行排序，但是我不知道如何分配循环文件名，即wave+i 第二，我不知道如何使循环算法正确地合并数据。我想要的最终结果是按“idcode”按波形68，69，70排序的宽窗体面板数据。通过使用循环。 import pandas as pd import numpy as np wave68 = pd.read_csv('panel_data/wave68.csv'

浏览 2提问于2017-12-04得票数 2

回答已采纳

1回答

比较两个大型CSV文件以删除相同的行/记录

c#、csv、compare

这里我需要比较两个大小为4GB的大型CSV文件，并且有超过1,000万条记录来从新CSV文件中获取记录，而忽略了旧CSV文件中的记录，我无法将这些文件加载到DT或列表中并进行比较，以找到相同的记录并删除它们，因为它将给我System.OutofMemory异常，所以我尝试了另一种方法，为CSV中的每一行生成HashCode，并为每个文件形成两个列表，然后比较两个列表，并确定两个文件之间的差异。实际问题：我知道gethashcode()方法没有足够的信息来获取转换为hashcode的原始字符串，所以我需要一些其他方法来生成哈希代码并从哈希值中检索实际的字符串值。下面是我使用的代码。生成列

浏览 3提问于2015-12-28得票数 3

3回答

在熊猫中合并两个没有列名的数据(熊猫是新的)

python、pandas

短解释如果数据中有重复的列名，请确保在读取文件时重命名一列。如果您的数据中有NaN等，请删除这些。然后使用下面正确的答案进行合并。可能是个很简单的问题。我使用pandas.read_csv()阅读了两个数据集。我的数据在两个独立的csv中。使用以下代码： import mibian import pandas as pd underlying = pd.read_csv("txt1.csv", names=['dt1','price']); options =

浏览 3提问于2014-04-17得票数 4

回答已采纳

2回答

Python多页PDF到CSV

python

我需要移动数据从pdf到表和这个脚本几乎正确。唯一的问题是每个页面都保存到一个单独的文件中。我怎么做才能把所有的东西都放在一个文件里呢？ import camelot import pandas as pd import pyodbc file = "O:\Files to Import\Millwood - DEV\LIST.PDF" tables = camelot.read_pdf(file,pages='all') tables[0].to_csv("O:\Files to Import\Millwood - DEV\FOOOO.csv"

浏览 5提问于2022-08-26得票数 0

1回答

使用大文件块对文件进行排序

python、pandas、chunks

假设我们想对一个在column=X周围有40000行的文件进行排序。我们还假设在整个表中都存在相同的值，以便不仅在前1000行中找到在column=X中具有相同值的行。现在，如果我们按块读取文件，并且只考虑1000行，那么如果我们要对该列周围的表进行重新排序，则可能会用column=X中的相同值处理其他行。那么我们如何才能解决这个问题呢？没有代码是必要的，因为没有数据是可用的，但请我寻求您的意见，在这件事上？我们应该使用合并排序，将每个块并行地分配给合并排序算法，然后重新组合结果吗？我看不出有什么办法对付熊猫，但我不确定。 import pandas as pd chunk_size = 10

浏览 2提问于2021-10-09得票数 1

回答已采纳

1回答

有没有办法将Pandas dataframe作为文件处理程序直接读取？

python、pandas、dataframe、filehandler

我使用pandas从dataSource.cvs文件加载数据： DF = pd.read_csv('dataSoruce.csv') 在pandas中，我可以清理数据，比如用0填充缺失的值。接下来，我使用DF.to_csv('temp.csv', sep=',')将DF编写为临时cvs文件，然后使用python文件处理程序再次打开该文件。 hd = open('temp.csv') for line in hd: line = line.split(',')..... 解析数

浏览 10提问于2016-07-25得票数 0

1回答

在Dask DataFrame中的分区间分配行

python、pandas、dask

期望:当我对给定的数据进行分区时，行将大致均匀地分布到每个分区中。然后，当我将数据写入csv时，得到的n个csv(在本例中是10)的长度类似于相同的长度。现实:当我运行下面的代码时，我发现所有行都在export_results-0.csv中，其余的9个csvs是空的，而不是一些均匀的行分布。问:我是否需要设置其他配置，以确保行分布在所有分区之间？ from dask.distributed import Client import dask.dataframe as dd import pandas as pd client = Client('tcp://10.0.0.60:8

浏览 1提问于2017-06-16得票数 5

回答已采纳

1回答

python中的原始输出数据帧操作

python-3.x、jupyter-notebook、data-manipulation

使用Python3时，我需要对原始数据输出进行qPCR排序，方法是搜索用户定义的字符串的第一个匹配项，然后使用该字符串后面的所有行创建一个新的数据帧。我试图在熊猫文档中找到解决方案，但到目前为止还没有成功。这是我需要处理的原始输出.csv文件。(无法粘贴完整的csv，因为超出了字符限制，这是第40-50行，我希望此文本有用？)。我需要告诉pandas创建一个新的数据帧，1.从第一次出现的字符串(“Sample Name")所在的行开始，该行作为头并包含后面的所有行。然后2.，仅包括列(“样本名称”)、(“目标名称”)、("CT")。有没有人能帮帮我，让我用pytho

浏览 0提问于2019-07-06得票数 0

1回答

AWS DMS -如何将RDS表数据写入单个S3目标文件？

amazon-web-services、csv、amazon-s3、amazon-rds、dms

我已经成功地将DMS设置为以csv格式(满载)将数据从RDS (SQL Server)复制到S3。但是，在运行任务时，DMS会复制源表，并在S3中为单个表创建多个csv文件。有没有办法确保对于一个表，DMS只在S3中创建一个目标csv文件？

浏览 6提问于2021-06-14得票数 0

3回答

为什么我的.csv文件的日期列不能正确复制到SQLite中？

sqlite、datetime、csv、import

我有一个.csv文件，其中的一列以"2011-07-29 12:00:00“的格式填充了日期和时间。当我在记事本或写字板中打开它时，我是这样看它的。然而，当我在excel中打开它时，它显示为"7/29/2011 12:00:00“。我使用以下命令将此.csv导入到SQLite数据库中 CREATE TABLE myTable (_id PRIMARY INTEGER KEY, dateTime TEXT, blah BLAH...); .separator "," .import myCsv.csv myTable 现在，我的数据库不仅用斜杠格式化了，而且秒数也

浏览 0提问于2011-07-30得票数 2

回答已采纳

1回答

python熊猫-对4000辆不同列/行的csvs的动态清洗

python、pandas、csv

我正在寻找一种方法来清除4000个类似格式的csvs，但是有不同数量的行/列，然后将它们合并到一个表中(可能是SQLite作为超过400万条记录)。数据是相关的来源/目的地(O/D)调查-每个csv都是一种特殊的路线和票证类型，包含多个停止计数(例如，101路成人、101路线儿童wkend等)。每个csv都是类似于does格式的，其中csv具有与列相同的行数(如果不包括第一行(路由信息))： route info stop1, stop1 stop2, value, stop2 stop3, value, value, stop3 stop4, value, value, value, sto

浏览 1提问于2020-08-17得票数 0

回答已采纳

1回答

Python tabula-py错误(熊猫错误？)

python、pandas、pdf、tabula

在网上阅读了一些文章之后，我决定使用tabula从pdf文件中提取表格。我们使用Anaconda，我刚刚安装了tabula 1.1.1。我想从一个简单的脚本开始，看看它将如何处理一个包含一些文本和两个表("table_p16.pdf")的单一页面pdf文件。守则： from tabula import read_pdf df = read_pdf("table_p16.pdf") 错误：拾起-Djava.security.properties=c:\Windows\Sun\Java\Deployment\sam.security :JAVA_TOOL_O

浏览 2提问于2018-07-13得票数 0

1回答