如何使用正则表达式结果列表在Pandas中生成数据帧(稍后导出为CSV)？

、

从那里，我尝试在Pandas中建立一个数据帧，使用一个字典，将'Name'，'Address‘和'Description’作为关键字，而regex的结果将作为值。我目前在生成数据帧时遇到的问题是，列将正确生成，但结果不会进入不同的行。import reimport csv #read t

浏览 6提问于2020-05-01得票数 0

回答已采纳

1回答

查找多个网页的所有日期/事件

、、

我对python / web scraping是个超级新手，我正在尝试使用beautifulsoup来查找各种网页中列出的所有事件(日期)，然后将它们输出到CSV文件中。这些是我一直在尝试的网页。

浏览 14提问于2021-09-24得票数 0

1回答

连接我在上一个问题中找到的CSV文件的分解代码？

、、、

我有数百个CSV文件要合并，手动合并可能需要数周时间。因此，我决定学习Python。不幸的是，我没有足够的时间学习来解决我的问题，所以我在这里找到了一段代码，它可以合并CSV文件并将文件名添加到新的列中。我的问题已经解决了，但现在我真的想知道我做了什么。import pandas as pd import os for csvin globbed_files

浏览 10提问于2019-07-26得票数 0

回答已采纳

2回答

数据如下(谷歌趋势结果的.csv文件，此处截断)。csv.reader()并对所有行进行循环，并保留与第一列中的日期正则表达式匹配的行，并且有两列。如果我使用类似于pandas.read_csv(input_file, header=4)的内容(稍后使用日期正则表达式来找到正确的部分)，那么当最后一节有三列时，它就会失败(这里没有，但可以)。是否有一种方法可以在第一个块之后停止我的

浏览 5提问于2013-08-28得票数 2

1回答

Pandas数据帧到csv行混乱

、、

我有一个pandas数据帧，我正在尝试将其导出为CSV文件。但是，输出文件会打乱行，而不是创建一个干净的文件。到目前为止，我已经尝试使用不同的分隔符，例如"/t"，并将"fulltext“下的值转换为一个列表，希望它能防止所有这些混乱。print('The object can\'t be converted into a csv file.这是CSV输出

浏览 45提问于2021-08-30得票数 0

0回答

无法将excel行与pandas dataframe行数匹配

、、、

我尝试对文件中的Unicode字符进行编码，并将其传递到pandas数据帧中。但是，我在Jupyter notebook中使用df.column.value_counts()获得的唯一行数与同一文件的excel行数不匹配(在删除重复值之后)。我如何解决这个问题？我加载了一个文本文件(以制表符分隔)，并使用encoding = 'ISO-8859-1‘将其转换为pandas数据帧。创建<e

浏览 13提问于2019-01-21得票数 0

2回答

将数据拆分为测试和训练，并转换为csv或excel文件

我有一个很大的数据集(大约200k行)，我想将数据集随机分成两部分，70%作为训练数据，30%作为测试数据。有没有办法在python中做到这一点？注我还希望将这些数据集保存为excel或csv文件在我的计算机中。谢谢!

浏览 81提问于2020-07-23得票数 0

回答已采纳

1回答

如何使用pandas pd.read_sql导出到csv？

我有一个可以查询数据库的python函数，当我不能转换为dataframe时，如何将其写入csv？或者我必须导入数据帧并使用该函数？Return可以很好地在我的控制台中查看结果，但现在我想导出为csv。任何帮助都将不胜感激。代码： import pandas as pdimport datetime from datetime import

浏览 24提问于2019-04-18得票数 0

回答已采纳

1回答

为什么Pandas dataframe的数据类型在导出到CSV文件后会改变

、、、、

我在Google中导出了以下数据。无论我使用哪种方法，当我稍后导入它时，我的数据显示为pandas.core.series.Series，而不是array。pandas.core.series.Series下面的代码给出了相同的<

浏览 16提问于2022-06-14得票数 1

回答已采纳

3回答

如何将Sklearn lda模型输出保存到csv？

、、、、

如何将Sklearn LDA模型输出保存到csv？它没有像genism lDA模型那样的show_topics命令。vectorizer.get_feature_names()[i], topic[i]) for i in topic.argsort()[:-top_n - 1:-1]]) 这对打印很有好处，但是如何将这些结果保存到csv？

浏览 73提问于2019-03-13得票数 0

1回答

动态构建用于导出到csv的大型数据帧(spark或pandas)的方法

、、、、

我有一个csv，我使用spark.read导入到databricks中。这个大文件包含每日级别的记录/事务。我将数据帧减少到5列，并保持500,000行不变。该脚本有一个filter/groupby/sum命令，该命令返回一行，将数据汇总为一个月的计数。我在使用此脚本的输出(显示或csv导出)时遇到了问题。在pyspark和pandas中我都遇到了问题

浏览 12提问于2020-07-12得票数 0

1回答

在循环中重命名列，R

、

我从一个循环中创建的CSV的外部目录读取数据帧的列表：for (i in 0:length-1) { read.csvFALSE) %>% 'Username' = USERNAME, ) 存储在目录中的文件数量将随着时间的

浏览 1提问于2016-06-01得票数 1

回答已采纳

2回答

如何从输出中获取panda数据帧？

、

我使用以下代码来检索emails.From的内容，我可以从中提取电子邮件的详细信息。print("Subject:", subject) print("Date:", Date) 到数据帧中我应该如何改进这段代码？我需要整个输出列表在一个数据框中。

浏览 31提问于2021-10-21得票数 0

回答已采纳

2回答

如何从不同的目录打开csv文件，进行计算并打开下一个文件

、、

我有两个带有csv文件的不同目录，它们的构建类似于"xxx_1.csv“和"yyy_1.csv”。我想读取这些文件，对它们进行计算，然后进一步迭代目录，读取"xxx_2.csv“和"yyy_2.csv"，进行计算等等。谢谢你的帮助!

浏览 31提问于2020-11-24得票数 0

3回答

如何将抓取结果保存到CSV中？

、、

我需要将网络抓取的结果保存在CSV中。遵循我的代码。我需要有在一个单一的csv的不同链接的所有抓取，但我不能做到这一点与我的代码。感谢您的帮助！

浏览 63提问于2021-09-02得票数 0

2回答

Pandas read_csv大文件性能改进

、、、

我想知道是否有一种方法可以提高将大型csv文件读取到pandas数据帧中的性能。我有3个大的(每个3.5 it的记录)管道分隔的文件，我想要加载到dataframe中，并在其上执行一些任务。目前，我使用pandas.read_csv()在参数中定义cols和它们的数据类型，如下所示。通过定义列的数据类型，我确实看到了一些改进，但它仍然需要3分钟以上的时间来加载。import pandas as pd

浏览 1提问于2018-03-09得票数 0

2回答

如何在Python中将字典列表写入csv并从CSV缓冲区创建pandas数据帧？

、、

我正在尝试从一组字典创建一个csv对象，然后通过将该csv对象作为字符串缓冲区读取来创建一个pandas数据帧。但由此产生的熊猫数据帧在我看来并不正确。我不确定如何正确地格式化它。下面是我使用的代码： import pandas as pdimport csv data = [{"x":123,"y":146},{"x"

浏览 3提问于2019-04-11得票数 0

1回答

比较两个考拉数据帧以进行测试

Pandas有一个包含assert_frames_equal的测试模块。考拉也有类似的东西吗？我正在编写一系列到考拉数据帧的转换测试。首先，由于我的测试csv文件只有几行(<10行)，我考虑只使用pandas。不幸的是，这些文件非常宽(接近200列)，并且具有在spark读取文件时指定的各种数据类型。由于熊猫的类型规范与考拉的类型规范非常不同，除了我们已经为spark编写的类型模式之外，我还必须编写大约200个完整的dtype

浏览 27提问于2020-12-12得票数 0

回答已采纳

0回答

我真的可以使用字典而不是动态赋值变量吗？

、、、、

这里的目标是读入许多csv文件，每个文件都读入一个单独的Pandas数据帧。下面三行中的第三行在"=“之前是错误的。我读过很多关于使用字典而不是动态变量的帖子，但我不明白如何在这里应用它。testlist = ['A', 'B', 'C'] 'df' + dfsuffix = pandas.read_<e

浏览 1提问于2017-11-29得票数 0

回答已采纳

1回答

pandas to_csv参数float_format和decimal不适用于索引列

、、、、

通过各种参数(在本例中仅限rpm )进行的系统分析，并将结果数据帧results_df的每一行都附加到一个汇总数据帧df，其中包含根据变化的rpm给出我的系统的性能。为了获得用于绘图和数据分析的适当索引，我将列表中的不同值(这里是rpm)转换为pandas序列ser，并将此序列与包含我感兴趣的结果的汇总数据帧df连接起来。因为我感兴趣的每个计算的结果只是每个计算的

浏览 0提问于2015-07-23得票数 24

回答已采纳

点击加载更多