课程评价 (0)

请对课程作出评价:
0/300

学员评价

暂无精选评价
8分钟

DataFrame1

1. DataFrame 是一个表格型的数据结构,它含有一组有序的列,每一列都可以是不同的值类型(数值、日期、object类型)。其中object类型可以保存任何python对象,比如字符串。同一列必须是相同的值类型。

  • DataFrame 既有行索引,又有列索引。他可以被看作为Series组成的字典(共用同一个行索引)
  • DataFrame中面向行和面向列的操作基本上是平衡的。其实DataFrame中的数据是以一个或者多个二维块存放的

2. class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)

  • data:可以是一个二维数组、字典、或者DataFrame
  • index:一个Index或者array-like对象(必须为一维的),它指定了行标签。如果未提供,则使用np.arange(n)
  • columns:一个Index或者array-like对象(必须为一维的),它指定了列标签。如果未提供,则使用np.arange(n)
  • dtype:指定数据类型。如果为None,则数据类型被自动推断
  • copy:一个布尔值。如果为True,则拷贝输入数据data

常见的构造DataFrame有以下情况:

  • 二维ndarraydata就是数据,此时可以传入index/columns参数

columns/index有两种作用:如果构造的DataFrame没有索引,则它们分别给索引赋值;如果构造的DataFrame已有索引,则它们按照指定顺序排列指定的索引。