为什么pandas read_csv能够找到文件，而os.listdir不能？_为什么Pandas可以分块加载gzip文件，而Dask不能？ - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何快速学会Python处理数据？（5000字走心总结）

很多同学抱怨自己很想学好Python，但学了好久，书也买不少，视频课程也看了不少，但是总是学了一段时间，感觉还是没什么收获，碰到问题没思路，有思路写不出多少行代码，遇到报错时也不知道怎么处理。

02

【Python】npy/pkl/csv读写效率测试

CPU： Intel® Core™ i7-10700F 磁盘： ST1000DM010-2EP102 系统：windows10

03

您找到你想要的搜索结果了吗？

是的

没有找到

Python数据处理从零开始----第二章（pandas）⑧pandas读写csv文件(3)

如果我们有来自许多来源的数据，如果要同时分析来自不同CSV文件的数据，我们可能希望将它们全部加载到一个数据帧中。在接下来的示例中，我们将使用Pandas read_csv来读取多个文件。

03

python数据分析——详解python读取数据相关操作

一般在做数据分析时最常接触的就是逗号分隔值（Comma-Separated Values，CSV，有时也称为字符分隔值，因为分隔字符也可以不是逗号），其文件以纯文本形式存储表格数据（数字和文本）。纯文本意味着该文件是一个字符序列，不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成，记录间以某种换行符分隔；每条记录由字段组成，字段间的分隔符是其它字符或字符串，最常见的是逗号或制表符。通常，所有记录都有完全相同的字段序列。

03

数据分析利器 pandas 系列教程（六）：合并上百万个 csv 文件，如何提速上百倍

过完基础知识以后就是实战 tricks 的集锦，这些都是笔者在实际工作中用到的解决方案，求小而精，抛砖引玉。

02

Python实用脚本实践

练习: 1. 把 jpg,png,gif 文件夹中的所有文件移动到 image 文件夹中，然后删除 jpg,png,gif 文件夹 2. 把 doc,docx,md,ppt 文件夹中的所有文件移动到 document 文件夹中，然后删除

02

python中几秒钟就能批量处理文件的几种操作！最后一种很常见！

本文讲解一些我在生活中遇到或者想到的内容，其中一些操作如果一个一个的进行，会很累，所以本文用python进行简化操作，节省时间。本文会用到os、shutil以及pandas模块,其中os和shutil本文会交叉使用，进行互补。

02

数据分析利器 pandas 系列教程（五）：合并相同结构的 csv

距离上一篇 pandas 系列教程：数据分析利器 pandas 系列教程（四）：对比 sql 学 pandas 发布已经过去大半年，近来才记起以前开了这样一个坑，本篇是本系列 pandas 实战 tricks 的首篇，不求大而全，力争小而精。

03

Kaggle放大招：简单几步实现海量数据分析及可视化

Kaggle Kerneler bot是一个自动生成的kernel，其中包含了演示如何读取数据以及分析工作的starter代码。用户可以进入任意一个已经发布的项目，点击顶部的“Fork Notebook”来编辑自己的副本。接下来，小编将以最热门的两个项目作为例子，带领读者了解该如何使用这款便捷的工具。

00

pandas 大文件操作

这几天有一个需求是读取.dta文件并转为.csv，google了一下发现pandas也是支持dta格式的

02

Kaggle放大招：简单几步实现海量数据分析及可视化

【新智元导读】近期，Kaggle发布了新的数据分析及可视化工具——Kaggle Kerneler bot，用户只需上传数据集，便可用Python为用户自动获取相关的深度数据分析结果。本文将带领读者体验一下这款便捷而又高效的工具。

03

给数据科学家的10个提示和技巧Vol.3

原文：10 Tips And Tricks For Data Scientists Vol.3[1]

04

python 实现读取csv数据,分类求和再写进 csv

数据量很大，一份csv文件的数据与另外一个文件的数据进行对比，但是csv中的文件数据量很大，并且进行统计，如果手动单个去对比，会很花时间，吃力不讨好，还容易出错。

05

利用Python批量合并csv

前几天遇到一个工作，需要将几个分别包含几十万行的csv文件的某3列合并成1个csv文件，当时是手工合并的： 1、csv另存为excel； 2、删除不需要的列，仅保留想要的列 3、excel另存为csv 4、最后，手工合并处理好的csv 不得不说，这样操作效率真的很低，尤其是操作几十万行的文件，当时就想利用python代码肯定可以实现，今天利用周末的时间好好研究了一下，终于实现了，操作几十万行的文件只需要一两分钟，比手工高效多了。实现思路如下： 1、利用os模块获取文件下所有csv文件（表结构相同） 2、用pandas打开第一个文件； 3、循环打开剩下的文件； 4、利用pd.concat拼接不同的df，该方法可以自动去除多余的标题行； 5、挑选需要的列，去重； 6、将结果输出文csv文件；完整代码如下：

02

利用pandas向一个csv文件追加写入数据的实现示例

我们越来越多的使用pandas进行数据处理，有时需要向一个已经存在的csv文件写入数据，传统的方法之前我也有些过，向txt，excel文件写入数据，传送门：Python将二维列表（list）的数据输出（TXT，Excel）

01

一句python，一句R︱列表、元组、字典、数据类型、自定义模块导入（格式、去重）

其中pandas和numpy中的数组格式以及Series DataFrame都是基于此之上而得到的。其中比R要多：Tuple、Dictionary两种类型。

02

使用Python批量提取指定的站点空气质量数据

对于我们下载的多数数据集，我们可能需要提取其中指定的来使用，比如这个空气质量数据集，全国那么多站点，我只想要我研究的区域的站点数据，然而，当我打开文件夹的时候，失望了，因为这些数据都是一个一个的csv文件。有一个方法就是excel可以用脚本把这些单独的csv合并为一个csv，但可能伴随的问题就是数据超出excel的存储上限，so，我们换一种做法提取指定站点的数据。

04

Python批量提取指定的站点空气质量数据

对于我们下载的多数数据集，我们可能需要提取其中指定的来使用，比如这个空气质量数据集，全国那么多站点，我只想要我研究的区域的站点数据，然而，当我打开文件夹的时候，失望了，因为这些数据都是一个一个的csv文件。有一个方法就是excel可以用脚本把这些单独的csv合并为一个csv，但可能伴随的问题就是数据超出excel的存储上限，so，我们换一种做法提取指定站点的数据。

01

Python批量获取文件信息

看视频时打开视频才能看到视频的播放时长，但是每个视频都打开又太繁琐了，能不能用python来获取这一信息呢？答案是肯定的，就是过程有些周折。

03

让机器听声音识别男女（机器学习的方法）

注：该文件主要是用来构造训练过程中的特征文件，需要人为的标定male或者female。对生成的male.csv和female.csv文件再合并成为train.csv文件，用于训练。

05

一文教你用 Python 对 Excel文件进行批量操作

工作中遇到需要需要批量处理Excel文件的情况，你还在手动一个一个地处理吗？赶紧学会下面的自动化批量处理方法，告别机械式的低效工作吧！

02

csv 文件读写乱码问题的一个简单解决方法

今天扼要总结一个处理csv文件乱码问题，可能你有类似经历，用excel打开一个csv文件，中文全部显示乱码。然后，手动用notepad++打开，修改编码为utf-8并保存后，再用excel打开显示正常。

01

Python按要求提取多个txt文本的数据

本文介绍基于Python语言，遍历文件夹并从中找到文件名称符合我们需求的多个.txt格式文本文件，并从上述每一个文本文件中，找到我们需要的指定数据，最后得到所有文本文件中我们需要的数据的合集的方法。

01

一文教你用 Python 对 Excel文件进行批量操作

工作中遇到需要需要批量处理Excel文件的情况，你还在手动一个一个地处理吗？赶紧学会下面的自动化批量处理方法，告别机械式的低效工作吧！

03

用 Python 对 Excel文件进行批量操作

OS（Operation System）指操作系统。在 Python 中，OS 库主要提供了与操作系统即电脑系统之间进行交互的一些功能。很多自动化操作都会依赖该库的功能。

06

Python按要求提取多个txt文本的数据

本文介绍基于Python语言，遍历文件夹并从中找到文件名称符合我们需求的多个.txt格式文本文件，并从上述每一个文本文件中，找到我们需要的指定数据，最后得到所有文本文件中我们需要的数据的合集的方法。

01

csv 文件读写乱码问题的一个简单解决方法

今天扼要总结一个处理csv文件乱码问题，可能你有类似经历，用excel打开一个csv文件，中文全部显示乱码。然后，手动用notepad++打开，修改编码为utf-8并保存后，再用excel打开显示正常。

03

PythonforResearch | 1_文件操作

项目介绍：一直想写一份适合经济学等社科背景、学术科研向的 Python 教程。因为学经济学的多少会对 Stata 有所了解，有一些写代码命令的经历，这份教程应该：

01

Python数据处理 | 批量提取文件夹下的csv文件，每个csv文件根据列索引提取特定几列，并将提取后的数据保存到新建的一个文件夹

的基础文件操作、Pandas的读取数据、索引指定列的数据、保存数据就能解决（几分钟的事儿）。读取 csv 可能会编码错误，加参数 engine=“python”，或者指定编码 encoding=“utf-8/gbk/gb2312”，多试试就可以解决。保存数据到 csv 文件里，有中文列名 Excel 打开会乱码，指定 encoding=“gb2312” 即可。

03

NiftyNet 数据预处理

使用NiftyNet时，我们需要先将图像数据和标签进行一次简单的处理，得到对应的.csv文件。对应文件格式为： img.csv

02

[python]解析通达信盘后数据获取历史日线数据[通俗易懂]

大家好，又见面了，我是你们的朋友全栈君。转自：http://bbs.pinggu.org/forum.php?mod=viewthread&tid=4804415&page=1 平时我们在做离线的

03

python 实现两个npy档案合并

需求：把一个文件夹下的多个csv文件合并成一个文件，文件的格式是相同的，只是按照不同的月份分成了多个文件，现将文件夹下的文件进行合并

03

Python工具开发实践-csv2excel

Python学习有一段时间了，今天来尝试编写一个程序来实现csv文件转换为excel文件的功能。

03

Python筛选出多个Excel中数据缺失率高的文件

本文介绍基于Python语言，针对一个文件夹下大量的Excel表格文件，基于其中每一个文件内、某一列数据的特征，对其加以筛选，并将符合要求与不符合要求的文件分别复制到另外两个新的文件夹中的方法。

01

pandas 入门 1 ：数据集的创建和绘制

创建数据- 首先创建自己的数据集进行分析。这可以防止阅读本教程的用户下载任何文件以复制下面的结果。我们将此数据集导出到文本文件，以便您可以获得的一些从csv文件中提取数据的经验

01

使用Python批量筛选上千个Excel文件中的某一行数据并另存为新Excel文件(上篇)

前几天在帮助粉丝解决问题的时候，遇到一个简单的小需求，这里拿出来跟大家一起分享，后面再次遇到的时候，可以从这里得到灵感。

03

关于pandas的数据处理，重在groupby

一开始我是比较青睐于用numpy的数组来进行数据处理的，因为比较快。快。。快。。。但接触多了pandas之后还是觉得各有千秋吧，特别是之前要用numpy的循环操作，现在不用了。。。果然我还是孤陋寡闻，所以如果不是初学者，就跳过吧：

02

excel办公小能手，python合并多个EXCEL表的两种方法

手里头有一份网站关键词数据，当然是来源于工具，站长之家工具的网站查询数据，百度搜索前百名的网站数据，总共96个excel文档数据，至于为什么不是一百个excel文档，答案是有重复网站覆盖了，比如某些大站，比如，百度自身网站，知乎，京东，阿里网站等！

02

10 个超实用的 Python 脚本

Python 是一种通用编程语言，以其简单易读而著称。它被广泛应用于从网络开发到数据分析等各个领域。在本文中，我们将探讨十个 Python 脚本，它们可以通过自动执行常见任务让你的生活更轻松。

01

10 个超实用的 Python 脚本

Python 是一种通用编程语言，以其简单易读而著称。它被广泛应用于从网络开发到数据分析等各个领域。在本文中，我们将探讨十个 Python 脚本，它们可以通过自动执行常见任务让你的生活更轻松。

01

一些小笔记（1）图文无关哦

os.walk 遍历文件夹（含子文件夹），os.listdir遍历文件（不含子文件夹）

03

Python将表格文件的指定列依次上移一行

本文介绍基于Python语言，针对一个文件夹下大量的Excel表格文件，对其中的每一个文件加以操作——将其中指定的若干列的数据部分都向上移动一行，并将所有操作完毕的Excel表格文件中的数据加以合并，生成一个新的Excel文件的方法。

01

利用Python进行MR栅格数据处理

df 中RSRP<=-110占比字段为 str ，需要先转换为 float 再除以100，最后用1-该值得到RSRP覆盖率

02

数据处理的 3 个小技巧，都很实用

今天使用的数据集名称：IMDB-Movie-Data，取自 Kaggle，百度网盘下载链接如下：

02

高质量编码--使用Pandas查询日期文件名中的数据

代码如下，其中subDirTimeFormat，fileTimeFormat，requestTimeFormat分别来指定文件夹解析格式，文件解析格式，以及查询参数日期解析格式：

03

Selenium自动下载qbt数据

Selenium模拟浏览器自动下载数据一开始固定休眠时，下载几个文件就会被踢下线，随机休眠后基本无问题了

01

python 6行代码搞定图片批量重命名「建议收藏」

如下图所示，为f1。读取’花.xlsx’文件，以整型的形式读取’nama’,以文本的形式读取’rename’。

03

数据科学家在使用Python时常犯的9个错误

通过应用软件工程最佳实践，可以交付质量更好数据科学的项目。更好的质量可能是更少的错误、可靠的结果和更高的编码效率。

02

菜鸟程序员在Python编程时常犯的9个错误

通过应用软件工程最佳实践，可以交付质量更好数据科学的项目。更好的质量可能是更少的错误、可靠的结果和更高的编码效率。

01

Pandas常用操作

上一年由于备战考研，最近论文答辩结束，计划重启公众号。本篇文章主要是记录总结毕业论文中使用Pandas模块的常用操作，感兴趣的可以作为参考。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭