python数据清理 - 腾讯云开发者社区

文章/答案/技术大牛

发布

3回答

Python -数据清理

、、、、

我有一个数据帧，它有一个形状(42538, 145)，其中有超过50列，其中所有行都有一个NaN值。我想删除这些列，而不是在df.drop中指定每个列的名称。

浏览 0提问于2018-10-10得票数 3

3回答

Python清理数据

、

我会为此使用Python正则表达式吗？另一种可能是删除包含斜杠的行，但我想将其保留为最后一种方法。 **编辑:对不起，忘了提一件事！

浏览 2提问于2016-03-25得票数 1

1回答

数据清理python

、

以下是在python中抓取时从网站收集的一些汽车信息。

浏览 0提问于2020-04-15得票数 0

1回答

我有一个包含1408行数据的Python数据。我的目标是将一周内与给定工作日相关的最大数和最小数与上一周最大/最小发生的同一天下一周的数目进行比较。为了清理数据，我需要总共删除18周的数据。也就是说，每周在与假日相关的数据中加上假日发生后的整个一周。在此之后，我想我应该在dataframe中插入一个列，用周一到周五来标记我的所有数据--对于文件中的所有日期(有6年的数据)。标记M的原因是为了使我能够按升序排序每一个与一周中的

浏览 1提问于2012-08-28得票数 1

2回答

数据科学python数据清理

、、

我正在为一个模型准备一个数据集，但不知怎么的，代码不能很好地运行。

浏览 0提问于2018-08-05得票数 1

1回答

Python Pandas数据清理

、

我正在尝试读取一个大型日志文件，该文件已经使用不同的分隔符进行了解析(遗留问题)。for root, dirs, files in os.walk('.', topdown=True): df = pd.read_csv(file, sep='\n', header=None, skipinitialspace=True) df = df[0].str.split('[,|;: \t]+', 1, expand=True).rename(columns={0: &

浏览 4提问于2020-06-12得票数 1

回答已采纳

1回答

数据清理(地址) Python

、、

我希望清理一个有61k行的数据集。我需要清理它的街道地址栏。目前，地址是一场噩梦。我是一个新的pandas/python用户，所以我不确定如何满足如此大规模的清洁需求。我以前使用过.replace()，但这似乎是完全错误的方法。会很感谢你的任何见解。长期目标是映射所有这些地址，但在数据的当前形式下，这是不可能的数据集：

浏览 17提问于2019-11-18得票数 0

1回答

Python pandas数据清理

、

我是python pandas的新手，我在实现下面的数据清理时遇到了困难，请多多帮助。Date,Description,Description,Ref.789,126.31""",IN;112138;100318;BANK,,,,我想获得如下数据<

浏览 0提问于2018-10-27得票数 1

1回答

Swift/Python引用计数差

、、

Swift的自动引用计数和Python的(手动)引用计数有什么区别？是因为Swift支持weak var自动清理循环数据结构，而在Python中没有这样的东西，您必须手动清理它，否则内存泄漏？

浏览 1提问于2019-07-02得票数 0

回答已采纳

4回答

python清理文本数据

、、、

有人会有什么提示来清理文本数据吗？我拥有的数据在一个列表(master_list)中，我试图创建一个循环或函数来删除额外的[]符号以及None,或None，因此基本上master_list中的数据将是由,分隔的字符串。

浏览 0提问于2019-09-05得票数 2

回答已采纳

1回答

用Python清理数据集

、、、

我是Python新手。在Python中，我使用Pandas加载内容，如下所示：现在，我想清理CSV文件，只保存用户ID (每行第3项)和tweet本身(我认为是第

浏览 2提问于2017-03-11得票数 0

1回答

Python Pandas数据清理问题

、

我正在尝试读取大型日志文件，这些文件已经使用不同的分隔符进行了解析(遗留问题)。每个文件是100兆字节，有1000秒的文件。在这些日志中有很多垃圾字符，非ascii字符，长队。基本上，期待文件中的任何东西和一切。 pandas.errors.ParserError: ' MemoryError: Una

浏览 8提问于2020-06-12得票数 1

5回答

使用python清理大数据

、

我必须清除python中的输入数据文件。由于错误，数据字段可能有字符串而不是数字。我想识别所有的字段是一个字符串，并填补这些使用熊猫NaN。此外，我想记录这些字段的索引。最简单的方法之一是遍历每个字段并检查它是否是一个数字，但是如果数据很大，这会消耗很多时间。我的csv文件包含与下表类似的数据：USA 1 65000IND 8gNTH

浏览 5提问于2012-12-13得票数 6

回答已采纳

1回答

Python清理数据框行

、、、、

我有一个数据框，看起来像我在下面制作的一个虚拟数据框。我从一个excel表格中提取了这些数据，并且我需要清理数据集。更具体地说，我希望保留'Col_1‘上有数字的行。nan nan 我知道如何删除具有指定条件的行，这不是我面临的挑战，encountering.The挑战是我需要假设Col_1或任何其他列中的数据类型可以切换到其他excel文件。

浏览 11提问于2021-06-21得票数 0

2回答

、、、、

我想知道哪种语言/包在大数据上表现得更好&更快？R和Python都有用于争用和清理数据的包和库。但是，哪些包和库在争论和清理大数据集方面表现最好呢？

浏览 0提问于2016-07-26得票数 1

点击加载更多