微信公众号:yale记 关注可了解更多的教程问题或建议,请公众号留言。
今天我们学习使用Pandas的DataFrame进行加载数据、查看数据的开头、结尾、设置DataFrame的索引列、列的数据转换等操作,接下来开始:
代码块:
# ## Pandas DataFrame 的基本操作
import pandas as pd
import numpy as np
# In[45]:
data = {
'Day':[1,2,3,4,5,6,7],
'Visits':[23,45,12,46,88,45,98],
'Rates':[1.0,2.1,3.5,2.2,4.3,4.5,5.0]}
# ## 使用DataFrame加载数据
# In[46]:
df = pd.DataFrame(data)
# In[47]:
df
# ## 查看前五条数据
# In[48]:
df.head()
# ## 查看最后五条数据
# In[49]:
df.tail()
# ## 查看最后2条数据
# In[50]:
df.tail(2)
# ## 使用set_index()设置dataframe的索引列
# In[51]:
df.set_index('Day')
# ## 我们继续打印前5条数据
# ## 发现索引并没有改为上边设置的Day
# ## 因为使用df.set_index('Day')默认情况下创建了新的对象
# In[52]:
df.head()
# ## 修改如上代码使索引生效
# In[53]:
df2 = df.set_index('Day')
df2.head()
# ## 我们使用参数inplace=True完成同样的事情
# ## 意思为修改DataFrame不创建新的对象
# In[54]:
df.set_index('Day',inplace=True)
df.head()
# ## 打印Visits的列值
# In[55]:
df = pd.DataFrame(data)
df['Visits']
# In[56]:
df.Visits
# ## 同时打印Visits和Rates的值
# In[57]:
df[['Visits','Rates']]
# ## 将Visits列的值转换为list
# In[58]:
df.Visits.tolist()
# ## 将Visits和Rates两列转换为numpy数组
# In[59]:
np.array(df[['Visits','Rates']])
# ## 将numpy数组作为数据源加载到DataFrame
# In[60]:
df_new = pd.DataFrame(np.array(df[['Visits','Rates']]))
df_new