前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python数据处理从零开始----第二章(pandas)⑦pandas读写csv文件(1)

Python数据处理从零开始----第二章(pandas)⑦pandas读写csv文件(1)

作者头像
用户1359560
发布2019-02-22 15:21:24
3.6K0
发布2019-02-22 15:21:24
举报
文章被收录于专栏:生信小驿站生信小驿站

这一节我们将学习如何使用Python和Pandas中的逗号分隔(CSV)文件。 我们将概述如何使用Pandas将CSV加载到dataframe以及如何将dataframe写入CSV。

在第一部分中,我们将通过示例介绍如何读取CSV文件,如何从CSV读取特定列,如何读取多个CSV文件以及将它们组合到一个数据帧,以及最后如何转换数据 根据特定的数据类型(例如,使用Pandas read_csv dtypes)。

  • Pandas从文件导入CSV 在这个Pandas读取CSV教程的第一个例子中,我们将使用read_csv将CSV加载到与脚本位于同一目录中的数据帧。 如果我们将文件放在另一个目录中,我们必须记住添加文件的完整路径。 这是第一个非常简单的Pandas read_csv示例:
代码语言:javascript
复制
df = pd.read_csv('amis.csv')
df.head()

image.png

  • Pandas从URL读取CSV 在下一个read_csv示例中,我们将从URL读取相同的数据。 我们只是将URL作为read_csv方法中的第一个参数,这非常简单:
代码语言:javascript
复制
url_csv = 'https://vincentarelbundock.github.io/Rdatasets/csv/boot/amis.csv'
df = pd.read_csv(url_csv)

从上图中可以看出,我们得到一个名为'Unamed:0'的列。 我们还可以看到它包含数字。 因此,我们可以将此列用作索引列。 在下一个代码示例中,我们将使用Pandas read_csv和index_col参数。 此参数可以采用整数或序列。 在我们的例子中,我们将使用整数0,我们将获得更好的数据帧:

代码语言:javascript
复制
df = pd.read_csv(url_csv, index_col=0)
df.head()

image.png

index_col参数也可以以字符串作为输入,现在我们将使用不同的数据文件。 在下一个示例中,我们将CSV读入Pandas数据帧并使用idNum列作为索引。

代码语言:javascript
复制
csv_url = 'http://vincentarelbundock.github.io/Rdatasets/csv/carData/MplsStops.csv'
df = pd.read_csv(csv_url, index_col='idNum')
df.iloc[:, 0:6].head()

注意,为了得到上面的输出,我们使用Pandas iloc来选择前7行。 这样做是为了获得更容易说明的输出。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019.01.04 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档