前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据分析-Pandas DataFrame的基本操作

数据分析-Pandas DataFrame的基本操作

作者头像
XXXX-user
发布2019-08-26 17:11:41
9830
发布2019-08-26 17:11:41
举报
文章被收录于专栏:不仅仅是python不仅仅是python

微信公众号:yale记 关注可了解更多的教程问题或建议,请公众号留言。

背景介绍

今天我们学习使用Pandas的DataFrame进行加载数据、查看数据的开头、结尾、设置DataFrame的索引列、列的数据转换等操作,接下来开始:

入门示例

代码块:

代码语言:javascript
复制
# ## Pandas DataFrame 的基本操作
import pandas as pd
import numpy as np
# In[45]:
data = {
    'Day':[1,2,3,4,5,6,7],
    'Visits':[23,45,12,46,88,45,98],
    'Rates':[1.0,2.1,3.5,2.2,4.3,4.5,5.0]}
# ## 使用DataFrame加载数据
# In[46]:
df = pd.DataFrame(data)
# In[47]:
df
# ## 查看前五条数据
# In[48]:
df.head()
# ## 查看最后五条数据
# In[49]:
df.tail()
# ## 查看最后2条数据
# In[50]:
df.tail(2)
# ## 使用set_index()设置dataframe的索引列
# In[51]:
df.set_index('Day')
# ## 我们继续打印前5条数据
# ## 发现索引并没有改为上边设置的Day
# ## 因为使用df.set_index('Day')默认情况下创建了新的对象
# In[52]:
df.head()
# ## 修改如上代码使索引生效
# In[53]:
df2 = df.set_index('Day')
df2.head()
# ## 我们使用参数inplace=True完成同样的事情
# ## 意思为修改DataFrame不创建新的对象
# In[54]:
df.set_index('Day',inplace=True)
df.head()
# ## 打印Visits的列值
# In[55]:
df = pd.DataFrame(data)
df['Visits']
# In[56]:
df.Visits
# ## 同时打印Visits和Rates的值
# In[57]:
df[['Visits','Rates']]
# ## 将Visits列的值转换为list
# In[58]:
df.Visits.tolist()
# ## 将Visits和Rates两列转换为numpy数组
# In[59]:
np.array(df[['Visits','Rates']])
# ## 将numpy数组作为数据源加载到DataFrame
# In[60]:
df_new = pd.DataFrame(np.array(df[['Visits','Rates']]))
df_new

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-08-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 yale记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 背景介绍
    • 入门示例
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档