如何在python中连接两个csv文件_使用python连接两个CSV文件_如何在公共列上连接python中的两个CSV文件 - 腾讯云开发者社区

python、pandas

我试图执行两个熊猫文件的交叉连接维度3383*192和5587*1487在熊猫和接收:记忆错误。有谁能指导我如何在python中的.csv文件中执行交叉连接并获得完整的输出(无论是在python中的批处理中还是通过使用整个数据集)？

浏览 0提问于2019-12-12得票数 1

回答已采纳

1回答

如何在Python/Pandas中使用CSV的计算结果作为搜索词？

python、pandas、csv、data-science

首先，在我的实际情况中，我的数据集要大得多，但是对于这个最小的、可重复的示例(reprex)，我们假设：我有两个.csv文件。它们看起来如下:文件1称为"ObjectList.csv“ "Object","ProductName","ID" "Radio","ICF-306",1112 "TV","Q60R",1113 "Computer","EliteBook745",1114 "Keyboard","LX410&#

浏览 1提问于2019-06-12得票数 0

回答已采纳

1回答

如何连接两个csv文件并按python排序

python、sorting、csv、pandas、concat

我有两个名为all_cv.csv和common_cv.csv文件的.csv文件。首先，我通过pandas连接这两个csv文件，然后将数据保存到由pandas创建的名为join_cv_common.csv的新文件中。之后，我按sorted_cv_common.csv对join_cv_common.csv文件进行了排序，将存储的数据存储到一个名为pandas的新文件中。我想重写pandas的这两个函数--连接和按纯python排序(2.6和3.4)。有人能在这方面帮助我吗？非常感谢。 Pandas concat函数 cv = pd.read_csv('all_cv.csv') a

浏览 0提问于2015-11-26得票数 2

1回答

如何在CSV和Python中保留多行

python、dataframe、html-table

这是我在Python中读取的CSV文件中的最后一个数据文件： (除了我失去了多行，描述都是一行) 我希望将描述中的多行保持原样，但Python将它们浓缩为一行。到目前为止，我用的是熊猫和矮胖的图书馆。我可以选择从CSV和xls阅读，我目前正在从CSV阅读。然后我想把它变成下表：问题：我怎样才能把名字移到描述上面如何将姓名旁边的资历用大红色字体移动？我如何按级别分组，因为您看到它看起来像一个枢轴表。它说，<<，一些数学计算，在这里，>>，我将从其他列中取两个值并减去它们。例: val1-val2 这是保留多行的期望输出： Wtdf

浏览 0提问于2019-03-11得票数 1

2回答

如何在python中连接两个csv文件并保持列的原始顺序？

python、csv、pandas

实际上，这个问题有很多部分。通过查看其他堆栈溢出问题的答案，我已经解决了一些问题。然而，仍然有一个小问题没有解决。输出的csv文件倾向于按字母或其他顺序排序，这不是我想要的。作为示例，我将垂直连接两个csv文件。这两个csv如下所示。 a.csv B, A, C, E 1, 1, 1, 1 b.csv B, A, D, C 2, 2, 2, 2 我希望得到的结果是 c.csv B, A, D, C, E 1, 1, , 1, 1 2, 2, 2, 2, 首先，我将它们读取到pandas数据帧中。

浏览 5提问于2016-08-13得票数 2

2回答

如何使用shell/Python脚本组合CSV文件

shell、csv、scripting

我有两个CSV文件 input.csv： id,scenario,data1,data2,result 1,s1,300,400,"{s1,not added}" 2,s2,500,101,"{s2 added}" 3,s3,600,202, output.csv id,result 1,"{s1,added}" 3,"{s3,added}" 我希望使用Shell/Python脚本将这两个CSV组合起来，以便输出如下所示： final_output.csv id,scenario,data1,data2,result 1,s1,3

浏览 3提问于2017-01-14得票数 1

1回答

Python中的新特性。(使用Spyder)

python

我正在进行“数据分析和解释。从未使用过Python。我正在尝试跟随讲座视频并获得此错误。我已连接到包含我的CSV文件的文件夹。请帮助。”

浏览 8提问于2017-07-11得票数 0

回答已采纳

1回答

CSV模块连接字段

python、csv

我正在尝试连接两个csv文件中的一些字段。通常情况下，使用索引匹配在Excel中很容易完成这项任务，但是，我想用Python来完成。 CSV A(有3栏) ID, Age, FirstName 1, 18, Lia 2, 18, Joe 2, 18, John CSV B(有3栏) ID, Gender, 1, Female, 2, Male, CSV C(我想创建这个) ID, Age, FirstName, Gender 1, 18, Lia, Female 2, 18, Joe, Male 2, 18,

浏览 2提问于2021-07-13得票数 0

回答已采纳

2回答

使用pyspark将两个csv文件连接到键值rdd中

python、csv、apache-spark、pyspark

我正在尝试使用pyspark将两个没有共同之处(没有键是公共的)的csv文件组合成一个键值成对的rdd 让我们假设A.csv有 a b c 而B.csv有 1 2 3 在pyspark中有没有一个选项可以通过连接这两个来获得一个rdd，就像这样 a:1 b:2 c:3 当然，两个csv文件中的行数应该匹配。这是在pyspark中很容易做的事情，还是应该首先在常规的python中完成。也就是说，对这两个文件进行嵌套循环，然后创建一个元组元组，如((a,1)，(b,2)...)然后将其传递给parallelize。

浏览 13提问于2019-12-17得票数 0

3回答

按列连接具有相同行数的两个CSV文件

python、csv

我想要连接两个CSV文件，以便将它们合并到单个CSV文件中。第一个CSV文件的列应该在第二个CSV文件的所有列之后。我想要一些Python的代码。你能帮我做这个吗？这是我的尝试： from itertools import izip import csv with open('output.csv','rb') as f1, open('mnist_images.csv','rb') as f2, open('outputFinal.csv','wb') as w: write

浏览 0提问于2016-11-15得票数 2

1回答

如何在两个不同的服务器上查询两个表(python)？

python、database、oracle、postgresql

我遇到了以下问题：我在不同的表中有两个不同的服务器: Oracle表"A“和PostgreSQL表"B”。我正在尝试通过python编写一个程序，它连接这两个表，并将结果写入csv文件。做这件事最好的方法是什么？(将表从一个数据库导入到另一个数据库？在db之外建立连接？) 将会很高兴得到你的帮助！

浏览 0提问于2018-09-19得票数 0

2回答

Dockerfile使用python和mysql创建映像

python、mysql、docker

我有两个容器"web“和"db”。我有一个csv格式的现有数据文件。问题是，我可以用一个模式初始化MySQL数据库，使用docker或者只使用参数运行，但是如何导入现有的数据呢？我有Python来解析和过滤数据，然后将其插入db，但是由于单个图像是MySQL，所以我不能在"db“容器中运行它。 Update1 version: '3' services: web: container_name: web build: . restart: always links: - db ports:

浏览 2提问于2019-03-08得票数 1

回答已采纳

2回答

如何在Python中像这个awk命令一样有效地执行CSV连接？

python、pandas、bash、awk

我正在尝试在Python中自动化一个文件连接过程，它与我一直使用的bash命令行过程一样有效。我的bash CLI进程使用awk合并文件，我尝试使用的Python使用pandas。例如，假设我有一个目录，其中包含多个名为part_0.csv、part_1.csv、...、part_n.csv的CSV文件。每个文件的第一行都包含一个头文件。我为此使用的bash CLI命令如下： $ cd directory_containing_csv_files $ mv part_0.csv merged.csv $ awk 'FNR > 1' part*.csv > merg

浏览 0提问于2020-12-23得票数 0

3回答

如何使用sql读取csv

python、sql、csv、python-3.x

我想知道如何使用sql读取csv文件。我想使用group by并将其他csv文件连接在一起。我该如何在python中实现这一点。示例： select * from csvfile.csv where name LIKE 'name%'

浏览 3提问于2013-06-26得票数 3

1回答

如何在使用open()时禁用Python2.7中的通用换行符

python、python-2.7、newline

我有一个csv文件，其中包含两个不同的换行符(\n和\r\n)。我希望我的Python脚本使用\r\n作为换行符，而不是\n。但问题是，当我使用\n打开文件时，Python的通用换行符特性一直将所有内容规范化为open()。奇怪的是，当我编写这个脚本时，它从来没有规范我的换行符，这就是为什么我使用Python2.7，它运行得很好。但是，今天突然之间，一切都开始正常化，我的脚本不再按需要工作。如何在使用open()打开文件时禁用通用换行符(而不以二进制模式打开)？

浏览 4提问于2015-08-28得票数 2

回答已采纳

1回答

通过终端创建文件，并在script python3中连接两个文件

linux、python-3.6

我有一个叫做'dir‘的递归目录。我在终端上使用linux中的以下命令将所有子目录中的文件列表写入CSV文件。 dir$ find . -type f -printf '%f\n' > old_names.csv 我正在使用解毒代码来改变文件名。我正在做一个新的列表，使用 dir $ find . -type f -printf '%f\n' > new_names.csv 我想将这个连接到列表中，并创建一个包含两列的新列表，如下所示；为此，我将两个csv文件读取到pandas数据帧中，并将它们连接到索引中，如下所示在python

浏览 0提问于2019-01-22得票数 0

3回答

如何在多平台环境中从文件夹导入多个csv文件

python、python-3.x、pandas、csv

我希望Python导入几个CSV文件，这些文件在一个文件夹中，并将它们连接在一起。当我在Mac和Windows上工作时，我需要一个同时适用于这两种系统的解决方案。另外，我需要Python以一种特定的方式读取CSV：这是我目前的情况，我必须在代码中手动添加文件： import pandas as pd loading_files = Path("Loading Files/") loading_feb01 = pd.read_csv(loading_files / "Loading FEB 01.csv.csv", sep = ';', h

浏览 15提问于2019-02-06得票数 1

回答已采纳

1回答

火花RDD外部存储

csv、amazon-web-services、apache-spark、rdd、master-slave

我编写了一个python代码sum.py，用于总结目录data中每个csv文件的所有数字。现在，我将使用Amazon (AWS)上的(AWS)来并行处理每个csv文件的求和过程。我已经采取了以下步骤：我在AWS上创建了一个主节点和两个从节点。我使用bash命令$ scp -r -i my-key-pair.pem my_dir root@host_name将目录my_dir上传到AWS集群主节点。文件夹my_dir包含两个子目录：code和data，其中code包含python代码sum.py，data包含所有csv文件。我已经登录了我的AWS主节点，然后使用bash命令$

浏览 4提问于2015-07-21得票数 2

回答已采纳

1回答

如何在Pyspark的每个元素上使用Pyspark的csv读取器？(没有“来自广播变量的引用SparkContext”)

python-3.x、pyspark、apache-spark-sql、rdd

我想使用Pyspark在数百个csv文件中读取，创建一个数据文件，即(粗略地)连接所有csv。因为每个csv都可以安装在内存中，但一次不超过一到两个，这似乎是一个很好的契合。我的策略不起作用，而且我认为这是因为我想在映射函数的内核函数中创建一个Pyspark dataframe，从而导致一个错误： # initiate spark session and other variables sc = SparkSession.builder.master("local").appName("Test").config( "spark.driver.bindA

浏览 6提问于2022-10-03得票数 0

1回答

如何在python的.csv文件中搜索和排序文件名？

python、csv

我有两个文件A.csv和B.csv，第一列包含一个文件名列表，第二列包含一个数值。两个.csv文件中列出的文件名应该相同(有时A中的某些文件名在B中缺失，但B中的文件名始终存在于A中)，但它们的顺序不同，而且每个文件名的数值也不同。文件中的文件名数量可以在90k-200k范围内。下面是两个文件的外观示例： cat A.csv a -7.8 b -13.1 c -0.1 d -3.5 cat B.csv b 3.149 c 0.197 a 14.263 我需要使用不同

浏览 15提问于2020-07-03得票数 0

1回答

空气字节ETL，http API源与大查询之间的连接

google-bigquery、etl、connector

我手头有一个任务，我应该为air字节创建基于python的HTTP连接器。连接器将返回一个响应，它将包含一些zip文件的链接。每个zip文件都包含csv文件，该文件应该上载到bigquery 现在，我已经制作了一个连接器，它返回zip文件的URL。主要的问题是如何将底层的csv文件发送到bigquery，我当然可以解压缩，甚至可以在python连接器中读取csv文件，但是我不得不将这个文件发送到bigquery。如果你们能告诉我把CSV发送到谷歌云存储的事，那也太棒了

浏览 3提问于2021-12-13得票数 0

2回答

Pandas在合并后删除指定的重复项

python、pandas、concat、drop-duplicates

我正在尝试编写一个python脚本，它连接两个csv文件，然后删除重复的行。下面是我正在连接的csv的一个示例： csv_1 type state city date estimate id lux tx dal 2019/08/15 .8273452 10 sed ny ny 2019/05/12 .624356 10 cou cal la 2013/04/24 .723495 10 . . . .

浏览 17提问于2019-08-16得票数 0

回答已采纳

2回答

使用Visual Studio代码将数据导入SQL Server

python、sql-server、visual-studio-code、anaconda

我正在尝试使用Visual Studio代码(VSC)将csv文件导入SQL Server。我可以使用MSSQL扩展在VSC中访问SQL Server。我能够选择，添加列，创建表格等...我可以使用python加载和操作csv文件。但是，我不知道如何连接Python和SQL脚本，或者如何使用sql脚本查询本地计算机上的csv文件。一种选择是只使用use Python，但我在成功设置该连接时遇到了一些问题。

浏览 36提问于2021-04-08得票数 1

1回答

如果python脚本在完成之前就被杀死了，那么是否有一种方法可以保存由python脚本编写的文件？

python-3.x、save、export-to-csv

我一直在运行一个用Python编写的web刮板脚本。我不得不终止Python脚本，因为我的互联网连接有问题。当时，脚本已经运行了近2-3个小时.我使用for循环将数据写入CSV文件。在for循环结束后，我使用了'file.close()‘来保存文件；但是由于我提前终止了程序，我浪费了两个小时的时间。一旦我尝试删除新创建的CSV文件(其大小为0kB)，就会说‘无法完成该操作，因为该文件是用Python打开的’。我认为我提取的所有数据现在都在RAM上。(也许这就是为什么我没有权限关闭0kB大小的CSV文件？) 那么，是否有任何方法访问这些数据并将数据写入上述CSV文件？(否则，我将不得不

浏览 4提问于2022-03-17得票数 0

回答已采纳

1回答

Python/Panda -根据join表/ csv合并csv

python、pandas、csv、data-structures

我有一个关于合并两个csv文件的问题。我有两个文件，包含多列数据，包括唯一的id和另一个文件，它将文件1的id映射到文件2的id，所以我基本上有一个。现在，我想要创建一个新的csv文件，根据我的join csv中的id映射来连接来自文件1和2的数据。下面是我的数据的一个示例： CSV1 1-客户 ID, Name, Lastname 1, Peter, Pan 2, Hank, Tank CSV2 2-地址 ID, Street, State 5, Mainstr, US 7, H Blvd, DE 加入-CSV： CID, AID 1, 5 2, 7 我想要的： ID

浏览 3提问于2018-03-06得票数 1

回答已采纳

1回答

连接两个数据集，都带有点。

python、geopandas

我有两个加分的csv文件。一个学校数据集(lat、lon和学校名称)和一个房屋坐标数据集(lat、lon和school )。我想列出学校半径500米以内的所有房屋。我真的想不出如何用Python中的geopandas来进行空间连接。有人能帮帮我吗？ schools.csv 56.039484;14.164114;Parkskolan 56.029687;14.159337;Centralskolan houses.csv 56.039240;14.165066;1 56.039008;14.166709;2 56.038608;14.169420;3

浏览 1提问于2019-02-22得票数 1

回答已采纳

4回答

如何将两个CSV与Apache连接起来

etl、apache-nifi

我正在研究ETL工具(比如Talend)，并研究是否可以使用Apache。Nifi能否用于执行以下操作：选择放置在本地磁盘上的两个CSV文件加入公共列上的CSV 将已连接的CSV写入磁盘我尝试过在Nifi中设置一个作业，但无法了解如何对两个单独的CSV文件执行连接。在Apache中可以执行此任务吗？看起来，可以用来使用另一个CSV文件来执行充实，但是对于这个用例来说，这似乎太复杂了。下面是一个输入CSV的示例，需要在state_id上加入它们：输入文件 customers.csv id | name | address | state_id ---|-

浏览 15提问于2017-03-20得票数 5

回答已采纳

1回答

如何在angularjs中读取较大的csv文件

angularjs、csv

我对此还不熟悉。我正在尝试加载一个大小约为2.5 GB的CSV文件。我有一个输入类型的文件，允许选择文件。一旦改变，我将调用一个包含以下内容的函数： `var r = new FileReader(); r.onload = function (e) { var contents = e.target.result; scope.$apply(function () { scope.fileReader = contents; }); };` 我可以读取除此文件之外的其他

浏览 2提问于2017-10-30得票数 0

1回答

如何在Python中使用SAS SWAT模块更改CASTable的数据类型

python-3.x、sas

我使用SWAT模块在Python中访问SAS数据。一个键列包含数据类型为"char“的类别。我有另一个数据帧，我导入为CASTable，如下所示： conn = swat.CAS(host, port, username, password) meta = conn.read_csv("file.csv") 元数据帧有一个类似的列，但它被导入为dtype："varchar“。当我尝试合并两个数据帧时，我得到一个错误，因为两个键列具有不同的数据类型(字符和变量字符)，但我无法弄清楚如何在CASTable中更改数据类型？我曾尝试通过添加dtype =

浏览 13提问于2021-02-16得票数 1

3回答

python - vlookup在大熊猫中应用%LIKE%

python、pandas

我是Python新手，我正在尝试连接两个CSV文件(由“；”分隔)。 CSV1 Sender;Recipient Adam;123 Alex;234 John;123 Adam;888 CSV2 Name;Phone Winnie;123,234,456 Celeste;777,888,999 预期产出： Sender;Recipient;RecipientName Adam;123;Winnie Alex;234;Winnie John;123;Winnie Adam;888;Celeste Phone在CSV2中用逗号分隔。所以当我匹配时，我需要做一些搜索或%LIKE%。我知道我可以使

浏览 4提问于2017-04-26得票数 2

回答已采纳

1回答

通过R访问Azure Blob存储

r、azure、blob、databricks、azure-data-lake

我试图使用R来连接Azure Blob，我在那里存储了一些CSV文件。在将它们写回另一个Blob容器之前，我需要将它们加载到数据框架中，并对它们进行一些转换。我正试图通过Databricks来实现这一点，这样我最终可以从数据工厂调用这个笔记本，并将它包含在一个管道中。 Databricks为我提供了Python中的一个示例笔记本，其中可以使用以下代码进行连接： storage_account_name = "testname" storage_account_access_key = "..." file_location = "wasb://examp

浏览 0提问于2020-03-13得票数 2

回答已采纳

1回答

如何在弹性搜索中批量插入，忽略进程中可能发生的所有错误？

python、csv、elasticsearch

我使用的是Elasticsearch版本6.8。我需要将~10000个文档(从csv文件)插入到现有的和映射的索引中。我使用的是python (版本3.7)代码： import csv es = Elasticsearch(); from elasticsearch import helpers with open(file_path) as f: reader = csv.DictReader(f) helpers.bulk(es, reader, index=index_name, doc_type=doc_type)

浏览 1提问于2020-01-01得票数 3

2回答

如何在python中使用csv文件中的数据

python、csv、dictionary

我对Python非常陌生，我正在尝试从csv文件中读取这些数据(现在它不是逗号分隔的，但是如果有问题，我可以在数据之间使用逗号甲虫) name week number E-mini S&P 500 Options ES 2 E-mini S&P 500 Weekly Options - Week 1 EW1 4 E-mini S&P 500 Weekly Options - Week 2 EW2 6 E-mini S&a

浏览 6提问于2021-06-09得票数 0

回答已采纳

1回答

如何将Postgres结果集从远程db连接导出为CSV到本地机器？

python、database、postgresql、csv、copy

我正在使用PostgresQL DB将结果集数据导出到本地计算机。我有SQL查询，它将结果集导出到CSV文件中。但是，这些文件将在承载DB的远程机器路径中创建。我使用psycpog2来使用python连接远程数据库。据我所知，我们可以运行命令psql从中提到的终端导出CSV文件。但是如何使用Psycopg2 python来做同样的事情呢？除了os.system('psql ... .. ..')之外，还有其他方法可以使用python将CSV从远程db连接导出到本地。

浏览 1提问于2019-10-20得票数 1

回答已采纳

1回答

如何将不同的CSV文件合并为具有一个主键的新CSV

python、pandas、csv

我有两个巨大的CSV文件，并希望它们使用python pandas连接到一个新的CSV文件中，主键是id_student，我成功地将不同的列连接在一起是可以的，但当我输出到一个新的CSV文件时，整个数据串将只存在于第一行，不同的列，例如，行1列1将是id_student，就像这样： 0 12345 1 12344 则行1列将为final_result，格式如下： 0 Pass 1 Pass 但我的预期输出将如下所示： 0 12345 Pass 1 12344 Pass 有什么方法可以修复输出格式吗？ def plotlyGraph(self): df = pandas.

浏览 28提问于2019-04-19得票数 2

回答已采纳

1回答

如何在python中删除csv文件中的特殊字符？

python、python-3.x、csv、encoding

嗨，我正在尝试从csv文件中删除特殊字符，但没有得到满意的结果。你能教我怎么做吗？示例： ÃÅ“ÃÂ¾Ã‘ÂÃÂºÃÂ²ÃÂ° Ãâ€œÃÂ¾Ã‘â‚¬ÃÂ¾ÃÂ´ ÃÂ¡ÃÂ°ÃÂ½ÃÂºÃ‘â€š-ÃÅ¸ÃÂµÃ‘â€šÃÂµÃ‘â‚¬ÃÂ±Ã‘Æ’Ã‘â‚¬ÃÂ³ 我得到了这些特殊字符的国王。我用下面的python代码保存这个文件- df = pd.read_csv(r"D:\Users\SPate233\Documents\cleanData-JnJv2.csv", low_memory=False) df.to_csv(r"D:\Users\SPate23

浏览 0提问于2021-04-21得票数 0

3回答

如何使用python pandas在本地系统Jupyter Notebook中读取两个更大的5 5GB文件？如何在本地连接两个数据帧进行数据分析？

python、python-3.x、pandas、jupyter-notebook、data-science

如何使用python pandas在本地系统Jupyter Notebook中上传两个大(5 5GB)的csv文件。请建议任何配置来处理用于数据分析的大型csv文件？ Local System Configuration: OS: Windows 10 RAM: 16 GB Processor: Intel-Core-i7 代码： dpath = 'p_flg_tmp1.csv' pdf = pd.read_csv(dpath, sep="|") Error: MemoryError: Unable to allocate array 或 pd.read_c

浏览 1提问于2020-01-24得票数 4

2回答

Snakemake:如何在规则中使用不同的参数(整数)运行shell命令？

python、shell、integer、snakemake

我正试图为我的增强决策树训练研究最佳的超参数。下面是两个实例的代码： user = '/home/.../BDT/' nestimators = [1, 2] rule all: input: user + 'AUC_score.pdf' rule testing: output: user + 'AUC_score.csv' shell: 'python bdt.py --nestimators {}'.format(nestimators[i] for i in range

浏览 9提问于2021-05-14得票数 0

回答已采纳

2回答

Python记事本-导入带有两个字符分隔符的数据文件会导致错误。

python、pandas、azure、azure-sql-database

问题：我们在向Azure SQL Db加载数据文件(该文件有两个字符分隔符)时遇到以下错误。我们可能做错了什么，如何解决这个问题？使用Python笔记本在，我们试图加载一个数据文件到。数据文件中的分隔符有两个字符~*。在下面的代码中，我们得到如下错误：熊猫“python”引擎不支持的低内存数据码 import sqlalchemy as sq import pandas as pd data_df = pd.read_csv('/dbfs/FileStore/tables/MyDataFile.txt', sep='~*', engine=

浏览 11提问于2022-02-23得票数 0

回答已采纳

1回答

如何在Python中使用argparse和csv库编写文件？

python、csv、argparse

我正在使用Python创建一个报告生成器，并尝试从命令行读写文件名。例如，我希望能够生成输出文件(具有我在命令行中键入的名称)，例如： python generator.py -p product.csv -s sales.csv --p product_report.csv 这里，generator.py是Python脚本，我正在读取两个文件product.csv和sales.csv。在脚本中，我计算收入，并希望将结果输出到product_report.csv文件中。我当前的代码如下所示： import csv import argparse parser = argparse.Argu

浏览 16提问于2021-01-09得票数 0

回答已采纳

2回答

用Azure ML Python脚本读取多个CSV文件

python、csv、azure、azure-machine-learning-studio

我有4个csv文件，它们是azure ML中python脚本的输入，但是小部件只有2个数据输入，第三个输入用于zip文件。我试图将csv文件放在压缩的文件夹中，并将其连接到脚本的第三个输入，但这也不起作用：我想知道如何在python脚本中读取多个csv文件。

浏览 5提问于2017-07-12得票数 1

回答已采纳

1回答

如何创建CSV文件的头文件？

python、file、csv、header、writer

我想用Python写一个csv文件。我想使用这两个单词作为标题。 import csv myFile = open('tabelle.csv','w') with myFile: writer = csv.writer(myFile) writer.writerow(["Wort","Haeufigkeit"]) 这足以构建我的头文件吗？现在，我想在这个csv文件中添加这两个单词下的其他单词。python现在是将其作为头文件还是只作为普通行接受？

浏览 17提问于2019-03-07得票数 1

4回答

Python脚本可以读写的(CSV)文件大小是否有限制？

python、ms-access、csv、odbc

明天我将编写一个小Python脚本，首先将所有数据从一个旧的MS数据库检索到一个CSV文件中，然后在数据清理、咀嚼等之后，将数据导入到Linux上的mySQL数据库中。我打算使用pyodbc来连接到MS Access db。我将在Windows环境中运行初始脚本。数据库拥有远远超过50万行的IIRC数据。我的问题是：的记录数量是否值得关注？(也就是说，我会遇到一些限制)？是否有更好的文件格式(而不是CSV)? 我之所以选择CSv，是因为它非常简单和简单(而且我是Python新手)--但我想听听以前可能做过类似事情的人的意见。

浏览 6提问于2010-10-18得票数 1

回答已采纳

1回答

大文件导致的内存问题

python、pandas

我是Python的新手，当然，我肯定会犯一些错误。这是我的问题，谢谢大家的帮助。我有两个文件(一个是Hive)，另一个是CSV并合并它们。我有64 GB内存，我相信我创建的CSV文件就在25+ GB附近。我的问题是，当我远程连接时，我看到内存使用率达到100%，然后我甚至不能远程连接我的工作站，它需要一个硬启动。我想的是，当我合并这两个表时，我喜欢保存在CSV中(假设是100,000行)并从内存中清除它，并继续使用另外的100,000行，并附加到它，等等. 我不知道该如何做，我在谷歌搜索中找到了一些，很可能即将读取大文件，但在我阅读(合并或合并期间)之后，不确定是否将每100 K块写入C

浏览 0提问于2018-11-11得票数 2

1回答

UnicodeEncodeError：“charmap”编解码器无法在位置1087中编码字符'\u011f‘：字符映射到<undefined>

python、pandas、csv、web-scraping、beautifulsoup

我的刮擦功能有问题。在这个项目中，我有一个sqlite3数据库，其中包含音乐专辑评论的链接。我创建了一个scraper.py文件，其中包含以下两个方法： from bs4 import BeautifulSoup import requests def take_source(url): if 'http://' or 'https://' in url: source = requests.get(url).text return source else: print("Invalid

浏览 1提问于2020-10-13得票数 0

回答已采纳

1回答

从本地文件复制Vertica，处理连接重置

python、logging、vertica

你好，我是Python新手。我有超过5000个.csv.gz文件要加载到vertica数据库。服务器10分钟后断开连接，因此，如果不重新设置服务器连接，则无法复制所有5000个文件。我这里有两个基本问题：如何跟踪成功执行的复制命令？如何从上次失败的命令中重新设置连接并重新启动？我使用的代码是： import pyodbc conn = pyodbc.connect("DSN=Vertica_SG;SERVER=54.169.66.95;DATABASE=xyzdwh;PORT=5433;UID=abc123;PWD=abc123") cursor = c

浏览 0提问于2015-07-07得票数 1

1回答

如何在机器学习工作室笔记本中使用R生成PDF文件并上传到Blob Storage

r、azure、pdf、azure-blob-storage

我已经能够打开到Azure博客存储的连接，读取CSV文件，并在Azure Machine Learning Studio，Notebook中显示结果。我想要实现的是生成一个PDF文件并将其上传到blob容器。我使用这里的文档连接到Azure存储：https://github.com/cloudyr/AzureStor install.packages("AzureStor") library(AzureStor) bl_endp_key <- storage_endpoint("https://xxx.blob.core.windows.net",

浏览 7提问于2019-04-11得票数 0

回答已采纳

1回答

包括在Python中将变量更改为输出文件名

python、string、csv、filenames、output

我是Python (和编程)的新手，所以如果我问一些非常愚蠢的问题，请容忍我:) 因此，我希望在结果的文件名中包含变量。这就是我到目前为止所知道的： resfile = open("simple.csv","w") #lots of stuff of no relevance resfile.close() 在脚本中我有两个变量，minLenght=5000和minBF=10，但是我想更改它们并再次运行脚本创建一个新文件，在这个文件中我可以看到创建的文件标题中的变量数量，例如simple500010和我想每次运行脚本时创建一个新文件，这两个变量的值不同。我试

浏览 0提问于2013-03-09得票数 3

回答已采纳

1回答

Python中的CSV文件

python、csv

我想在python程序中并行读取和获取两个csv文件中的数据。一个CSV文件只有一列，而另一个CSV文件有5列。从单列csv文件"StopIterator“错误中读取时出现错误。我不确定这两个CSV文件是否有相同的行数。所以我不能使用单个for循环，我想逐行匹配数据并记下输出。所以请在这方面给我指点。我使用的是python2版本而不是3。

浏览 4提问于2017-04-07得票数 0

1回答

如何在Python中双引号字符串？

python-2.7、csv

我想引用与CSV引用的字符串相同的字符串。 >>> a='a"b' >>> print dq(a) "a""b" >>> 如何用Python2.7编写dq函数？显而易见的解决方案是'"'+a.replace('"','""')+'"'，但我并不热衷于此。我觉得有一种更复杂的方法。 CSV格式中可能还有其他问题(如果在这种情况下有" the“之类的东西)，可能会咬我一口。我不

浏览 0提问于2018-02-01得票数 0

回答已采纳