首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >pandas基本用法(一)

pandas基本用法(一)

作者头像
ke1th
发布2018-01-02 12:02:25
1K0
发布2018-01-02 12:02:25
举报

pandas基本用法

  • 读取csv文件
import pandas
food_info = pandas.read_csv(file_name)# 返回一个DataFrame对象
n_rows = food_info.head(n) #获取前n行数据,返回的依旧是个DataFrame
column_names = food_info.columns   #获取所有的列名
dimensions = food_info.shape #获取数据的shape
  • Index

默认情况下,使用pandas.read_csv()读取csv文件的时候,会默认将数据的第一行当做列标签,还会为每一行添加一个行标签。我们可以使用这些标签来访问DataFrame中的数据。

这里写图片描述
这里写图片描述

DataFrame

  • Series对象

pandas的核心组件,构成DataFrame的基本单元。

这里写图片描述
这里写图片描述

Series

  • 如何选择一行数据
data = food_info.loc[0] #使用loc[n]获取第n行数据,如果只是获取一行数据的话,返回Series
#如何选择多行呢,和numpy的语法是一样的
datas = food_info.loc[1:2] #返回DataFrame,返回行标签为1,2的,这个和numpy不一样,而且loc[]也不支持-n

data = food_info.loc[i][j] # i-th row, j-th column 
  1. 使用DataFrame.dtypes获取每列的数据类型
  2. 使用DataFrame[indices]获取列数据。注意,要是获取多个列的话selenium_thiamin = food_info[["Selenium_(mcg)",'Thiamin_(mg)']],不要少了个中括号。

关于len()

len(data_frame) # 是data_frame的行数
len(data_frame.loc[0]) #是data_frame的列数

关于set()

set(data_frame) # 返回column name
set(data_frame["column1"]) # 返回第一列中不重复的值
set(data_frame.loc[0]) #返回第一行中不重复的值
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • pandas基本用法
    • 关于len()
      • 关于set()
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档