前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据清洗之 数据增加和删除

数据清洗之 数据增加和删除

原创
作者头像
ruochen
修改2021-05-13 14:33:12
1.9K0
修改2021-05-13 14:33:12
举报
文章被收录于专栏:若尘的技术专栏

数据增加和删除

  • 在数据中,直接添加列
  • 使用df.insert方法在数据中添加一列
  • drop(labels, axis, inplace=True)方法(删除)
    • labels表示删除的数据,axis表示作用轴,inplace=True表示是否对原数据生效
    • axis=0按行操作,axis=1按列操作
  • 使用del函数直接删除其中一列
代码语言:txt
复制
import pandas as pd
import os
import numpy as np
代码语言:txt
复制
os.getcwd()
代码语言:txt
复制
'D:\\Jupyter\\notebook\\Python数据清洗实战\\数据'
代码语言:txt
复制
os.chdir('D:\\Jupyter\\notebook\\Python数据清洗实战\\数据')
代码语言:txt
复制
df = pd.read_csv('baby_trade_history.csv', encoding='utf-8', dtype={'user_id':str})
代码语言:txt
复制
df['购买量'] = np.where(df['buy_mount']>3, '高', '低')
代码语言:txt
复制
df.head(5)

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>user_id</th>
代码语言:txt
复制
  <th>auction_id</th>
代码语言:txt
复制
  <th>cat_id</th>
代码语言:txt
复制
  <th>cat1</th>
代码语言:txt
复制
  <th>property</th>
代码语言:txt
复制
  <th>buy_mount</th>
代码语言:txt
复制
  <th>day</th>
代码语言:txt
复制
  <th>购买量</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>0</th>
代码语言:txt
复制
  <td>786295544</td>
代码语言:txt
复制
  <td>41098319944</td>
代码语言:txt
复制
  <td>50014866</td>
代码语言:txt
复制
  <td>50022520</td>
代码语言:txt
复制
  <td>21458:86755362;13023209:3593274;10984217:21985...</td>
代码语言:txt
复制
  <td>2</td>
代码语言:txt
复制
  <td>20140919</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>1</th>
代码语言:txt
复制
  <td>532110457</td>
代码语言:txt
复制
  <td>17916191097</td>
代码语言:txt
复制
  <td>50011993</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>21458:11399317;1628862:3251296;21475:137325;16...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20131011</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>2</th>
代码语言:txt
复制
  <td>249013725</td>
代码语言:txt
复制
  <td>21896936223</td>
代码语言:txt
复制
  <td>50012461</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:30992;1628665:92012;1628665:3233938;1628...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20131011</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>3</th>
代码语言:txt
复制
  <td>917056007</td>
代码语言:txt
复制
  <td>12515996043</td>
代码语言:txt
复制
  <td>50018831</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:15841995;21956:3494076;27000458:59723383...</td>
代码语言:txt
复制
  <td>2</td>
代码语言:txt
复制
  <td>20141023</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>4</th>
代码语言:txt
复制
  <td>444069173</td>
代码语言:txt
复制
  <td>20487688075</td>
代码语言:txt
复制
  <td>50013636</td>
代码语言:txt
复制
  <td>50008168</td>
代码语言:txt
复制
  <td>21458:30992;13658074:3323064;1628665:3233941;1...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20141103</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

代码语言:txt
复制
# 将第二列放在第一列
auction_id = df['auction_id']
代码语言:txt
复制
del df['auction_id']
代码语言:txt
复制
df.head(5)

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>user_id</th>
代码语言:txt
复制
  <th>cat_id</th>
代码语言:txt
复制
  <th>cat1</th>
代码语言:txt
复制
  <th>property</th>
代码语言:txt
复制
  <th>buy_mount</th>
代码语言:txt
复制
  <th>day</th>
代码语言:txt
复制
  <th>购买量</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>0</th>
代码语言:txt
复制
  <td>786295544</td>
代码语言:txt
复制
  <td>50014866</td>
代码语言:txt
复制
  <td>50022520</td>
代码语言:txt
复制
  <td>21458:86755362;13023209:3593274;10984217:21985...</td>
代码语言:txt
复制
  <td>2</td>
代码语言:txt
复制
  <td>20140919</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>1</th>
代码语言:txt
复制
  <td>532110457</td>
代码语言:txt
复制
  <td>50011993</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>21458:11399317;1628862:3251296;21475:137325;16...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20131011</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>2</th>
代码语言:txt
复制
  <td>249013725</td>
代码语言:txt
复制
  <td>50012461</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:30992;1628665:92012;1628665:3233938;1628...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20131011</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>3</th>
代码语言:txt
复制
  <td>917056007</td>
代码语言:txt
复制
  <td>50018831</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:15841995;21956:3494076;27000458:59723383...</td>
代码语言:txt
复制
  <td>2</td>
代码语言:txt
复制
  <td>20141023</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>4</th>
代码语言:txt
复制
  <td>444069173</td>
代码语言:txt
复制
  <td>50013636</td>
代码语言:txt
复制
  <td>50008168</td>
代码语言:txt
复制
  <td>21458:30992;13658074:3323064;1628665:3233941;1...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20141103</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

代码语言:txt
复制
# 第一个参数:插入位置
# 第二个参数:标签名称
# 第三个参数:数据
df.insert(0, 'auction_id_new', auction_id)
代码语言:txt
复制
df.head(5)

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>auction_id_new</th>
代码语言:txt
复制
  <th>user_id</th>
代码语言:txt
复制
  <th>cat_id</th>
代码语言:txt
复制
  <th>cat1</th>
代码语言:txt
复制
  <th>property</th>
代码语言:txt
复制
  <th>buy_mount</th>
代码语言:txt
复制
  <th>day</th>
代码语言:txt
复制
  <th>购买量</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>0</th>
代码语言:txt
复制
  <td>41098319944</td>
代码语言:txt
复制
  <td>786295544</td>
代码语言:txt
复制
  <td>50014866</td>
代码语言:txt
复制
  <td>50022520</td>
代码语言:txt
复制
  <td>21458:86755362;13023209:3593274;10984217:21985...</td>
代码语言:txt
复制
  <td>2</td>
代码语言:txt
复制
  <td>20140919</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>1</th>
代码语言:txt
复制
  <td>17916191097</td>
代码语言:txt
复制
  <td>532110457</td>
代码语言:txt
复制
  <td>50011993</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>21458:11399317;1628862:3251296;21475:137325;16...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20131011</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>2</th>
代码语言:txt
复制
  <td>21896936223</td>
代码语言:txt
复制
  <td>249013725</td>
代码语言:txt
复制
  <td>50012461</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:30992;1628665:92012;1628665:3233938;1628...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20131011</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>3</th>
代码语言:txt
复制
  <td>12515996043</td>
代码语言:txt
复制
  <td>917056007</td>
代码语言:txt
复制
  <td>50018831</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:15841995;21956:3494076;27000458:59723383...</td>
代码语言:txt
复制
  <td>2</td>
代码语言:txt
复制
  <td>20141023</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>4</th>
代码语言:txt
复制
  <td>20487688075</td>
代码语言:txt
复制
  <td>444069173</td>
代码语言:txt
复制
  <td>50013636</td>
代码语言:txt
复制
  <td>50008168</td>
代码语言:txt
复制
  <td>21458:30992;13658074:3323064;1628665:3233941;1...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20141103</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

代码语言:txt
复制
# 删除两列数据
df.drop(labels=['auction_id_new', '购买量'], axis=1).head(5)

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>user_id</th>
代码语言:txt
复制
  <th>cat_id</th>
代码语言:txt
复制
  <th>cat1</th>
代码语言:txt
复制
  <th>property</th>
代码语言:txt
复制
  <th>buy_mount</th>
代码语言:txt
复制
  <th>day</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>0</th>
代码语言:txt
复制
  <td>786295544</td>
代码语言:txt
复制
  <td>50014866</td>
代码语言:txt
复制
  <td>50022520</td>
代码语言:txt
复制
  <td>21458:86755362;13023209:3593274;10984217:21985...</td>
代码语言:txt
复制
  <td>2</td>
代码语言:txt
复制
  <td>20140919</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>1</th>
代码语言:txt
复制
  <td>532110457</td>
代码语言:txt
复制
  <td>50011993</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>21458:11399317;1628862:3251296;21475:137325;16...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20131011</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>2</th>
代码语言:txt
复制
  <td>249013725</td>
代码语言:txt
复制
  <td>50012461</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:30992;1628665:92012;1628665:3233938;1628...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20131011</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>3</th>
代码语言:txt
复制
  <td>917056007</td>
代码语言:txt
复制
  <td>50018831</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:15841995;21956:3494076;27000458:59723383...</td>
代码语言:txt
复制
  <td>2</td>
代码语言:txt
复制
  <td>20141023</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>4</th>
代码语言:txt
复制
  <td>444069173</td>
代码语言:txt
复制
  <td>50013636</td>
代码语言:txt
复制
  <td>50008168</td>
代码语言:txt
复制
  <td>21458:30992;13658074:3323064;1628665:3233941;1...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20141103</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

代码语言:txt
复制
# 再次查看df,发现刚才删除数据仍然存在
# 因为没有对原数据生效 
df.head(5)

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>auction_id_new</th>
代码语言:txt
复制
  <th>user_id</th>
代码语言:txt
复制
  <th>cat_id</th>
代码语言:txt
复制
  <th>cat1</th>
代码语言:txt
复制
  <th>property</th>
代码语言:txt
复制
  <th>buy_mount</th>
代码语言:txt
复制
  <th>day</th>
代码语言:txt
复制
  <th>购买量</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>0</th>
代码语言:txt
复制
  <td>41098319944</td>
代码语言:txt
复制
  <td>786295544</td>
代码语言:txt
复制
  <td>50014866</td>
代码语言:txt
复制
  <td>50022520</td>
代码语言:txt
复制
  <td>21458:86755362;13023209:3593274;10984217:21985...</td>
代码语言:txt
复制
  <td>2</td>
代码语言:txt
复制
  <td>20140919</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>1</th>
代码语言:txt
复制
  <td>17916191097</td>
代码语言:txt
复制
  <td>532110457</td>
代码语言:txt
复制
  <td>50011993</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>21458:11399317;1628862:3251296;21475:137325;16...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20131011</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>2</th>
代码语言:txt
复制
  <td>21896936223</td>
代码语言:txt
复制
  <td>249013725</td>
代码语言:txt
复制
  <td>50012461</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:30992;1628665:92012;1628665:3233938;1628...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20131011</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>3</th>
代码语言:txt
复制
  <td>12515996043</td>
代码语言:txt
复制
  <td>917056007</td>
代码语言:txt
复制
  <td>50018831</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:15841995;21956:3494076;27000458:59723383...</td>
代码语言:txt
复制
  <td>2</td>
代码语言:txt
复制
  <td>20141023</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>4</th>
代码语言:txt
复制
  <td>20487688075</td>
代码语言:txt
复制
  <td>444069173</td>
代码语言:txt
复制
  <td>50013636</td>
代码语言:txt
复制
  <td>50008168</td>
代码语言:txt
复制
  <td>21458:30992;13658074:3323064;1628665:3233941;1...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20141103</td>
代码语言:txt
复制
  <td>低</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

代码语言:txt
复制
df.drop(labels=['auction_id_new', '购买量'], axis=1, inplace=True)
代码语言:txt
复制
---------------------------------------------------------------------------
代码语言:txt
复制
KeyError                                  Traceback (most recent call last)
代码语言:txt
复制
<ipython-input-30-acf2a75acaf3> in <module>
代码语言:txt
复制
----> 1 df.drop(labels=['auction_id_new', '购买量'], axis=1, inplace=True)
代码语言:txt
复制
D:\Anaconda3\lib\site-packages\pandas\core\frame.py in drop(self, labels, axis, index, columns, level, inplace, errors)
代码语言:txt
复制
   3938                                            index=index, columns=columns,
代码语言:txt
复制
   3939                                            level=level, inplace=inplace,
代码语言:txt
复制
-> 3940                                            errors=errors)
代码语言:txt
复制
   3941 
代码语言:txt
复制
   3942     @rewrite_axis_style_signature('mapper', [('copy', True),
代码语言:txt
复制
D:\Anaconda3\lib\site-packages\pandas\core\generic.py in drop(self, labels, axis, index, columns, level, inplace, errors)
代码语言:txt
复制
   3778         for axis, labels in axes.items():
代码语言:txt
复制
   3779             if labels is not None:
代码语言:txt
复制
-> 3780                 obj = obj._drop_axis(labels, axis, level=level, errors=errors)
代码语言:txt
复制
   3781 
代码语言:txt
复制
   3782         if inplace:
代码语言:txt
复制
D:\Anaconda3\lib\site-packages\pandas\core\generic.py in _drop_axis(self, labels, axis, level, errors)
代码语言:txt
复制
   3810                 new_axis = axis.drop(labels, level=level, errors=errors)
代码语言:txt
复制
   3811             else:
代码语言:txt
复制
-> 3812                 new_axis = axis.drop(labels, errors=errors)
代码语言:txt
复制
   3813             result = self.reindex(**{axis_name: new_axis})
代码语言:txt
复制
   3814 
代码语言:txt
复制
D:\Anaconda3\lib\site-packages\pandas\core\indexes\base.py in drop(self, labels, errors)
代码语言:txt
复制
   4963             if errors != 'ignore':
代码语言:txt
复制
   4964                 raise KeyError(
代码语言:txt
复制
-> 4965                     '{} not found in axis'.format(labels[mask]))
代码语言:txt
复制
   4966             indexer = indexer[~mask]
代码语言:txt
复制
   4967         return self.delete(indexer)
代码语言:txt
复制
KeyError: "['auction_id_new' '购买量'] not found in axis"
代码语言:txt
复制
df.head(5)

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>user_id</th>
代码语言:txt
复制
  <th>cat_id</th>
代码语言:txt
复制
  <th>cat1</th>
代码语言:txt
复制
  <th>property</th>
代码语言:txt
复制
  <th>buy_mount</th>
代码语言:txt
复制
  <th>day</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>0</th>
代码语言:txt
复制
  <td>786295544</td>
代码语言:txt
复制
  <td>50014866</td>
代码语言:txt
复制
  <td>50022520</td>
代码语言:txt
复制
  <td>21458:86755362;13023209:3593274;10984217:21985...</td>
代码语言:txt
复制
  <td>2</td>
代码语言:txt
复制
  <td>20140919</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>1</th>
代码语言:txt
复制
  <td>532110457</td>
代码语言:txt
复制
  <td>50011993</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>21458:11399317;1628862:3251296;21475:137325;16...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20131011</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>2</th>
代码语言:txt
复制
  <td>249013725</td>
代码语言:txt
复制
  <td>50012461</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:30992;1628665:92012;1628665:3233938;1628...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20131011</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>3</th>
代码语言:txt
复制
  <td>917056007</td>
代码语言:txt
复制
  <td>50018831</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:15841995;21956:3494076;27000458:59723383...</td>
代码语言:txt
复制
  <td>2</td>
代码语言:txt
复制
  <td>20141023</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>4</th>
代码语言:txt
复制
  <td>444069173</td>
代码语言:txt
复制
  <td>50013636</td>
代码语言:txt
复制
  <td>50008168</td>
代码语言:txt
复制
  <td>21458:30992;13658074:3323064;1628665:3233941;1...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20141103</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

代码语言:txt
复制
# 删除标签为3,4数据
df.drop(labels=[3,4], axis=0, inplace=True)
代码语言:txt
复制
df.head(5)

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>user_id</th>
代码语言:txt
复制
  <th>cat_id</th>
代码语言:txt
复制
  <th>cat1</th>
代码语言:txt
复制
  <th>property</th>
代码语言:txt
复制
  <th>buy_mount</th>
代码语言:txt
复制
  <th>day</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>0</th>
代码语言:txt
复制
  <td>786295544</td>
代码语言:txt
复制
  <td>50014866</td>
代码语言:txt
复制
  <td>50022520</td>
代码语言:txt
复制
  <td>21458:86755362;13023209:3593274;10984217:21985...</td>
代码语言:txt
复制
  <td>2</td>
代码语言:txt
复制
  <td>20140919</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>1</th>
代码语言:txt
复制
  <td>532110457</td>
代码语言:txt
复制
  <td>50011993</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>21458:11399317;1628862:3251296;21475:137325;16...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20131011</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>2</th>
代码语言:txt
复制
  <td>249013725</td>
代码语言:txt
复制
  <td>50012461</td>
代码语言:txt
复制
  <td>50014815</td>
代码语言:txt
复制
  <td>21458:30992;1628665:92012;1628665:3233938;1628...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20131011</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>5</th>
代码语言:txt
复制
  <td>152298847</td>
代码语言:txt
复制
  <td>121394024</td>
代码语言:txt
复制
  <td>50008168</td>
代码语言:txt
复制
  <td>21458:3408353;13023209:727117752;22009:2741771...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20141103</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>6</th>
代码语言:txt
复制
  <td>513441334</td>
代码语言:txt
复制
  <td>50010557</td>
代码语言:txt
复制
  <td>50008168</td>
代码语言:txt
复制
  <td>25935:21991;1628665:29784;22019:34731;22019:20...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20121212</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

代码语言:txt
复制
df.drop(labels=range(0,3), axis=0, inplace=True)
代码语言:txt
复制
df.head(5)

<div>

<style scoped>

代码语言:txt
复制
.dataframe tbody tr th:only-of-type {
代码语言:txt
复制
    vertical-align: middle;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe tbody tr th {
代码语言:txt
复制
    vertical-align: top;
代码语言:txt
复制
}
代码语言:txt
复制
.dataframe thead th {
代码语言:txt
复制
    text-align: right;
代码语言:txt
复制
}

</style>

<table border="1" class="dataframe">

<thead>

代码语言:txt
复制
<tr style="text-align: right;">
代码语言:txt
复制
  <th></th>
代码语言:txt
复制
  <th>user_id</th>
代码语言:txt
复制
  <th>cat_id</th>
代码语言:txt
复制
  <th>cat1</th>
代码语言:txt
复制
  <th>property</th>
代码语言:txt
复制
  <th>buy_mount</th>
代码语言:txt
复制
  <th>day</th>
代码语言:txt
复制
</tr>

</thead>

<tbody>

代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>5</th>
代码语言:txt
复制
  <td>152298847</td>
代码语言:txt
复制
  <td>121394024</td>
代码语言:txt
复制
  <td>50008168</td>
代码语言:txt
复制
  <td>21458:3408353;13023209:727117752;22009:2741771...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20141103</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>6</th>
代码语言:txt
复制
  <td>513441334</td>
代码语言:txt
复制
  <td>50010557</td>
代码语言:txt
复制
  <td>50008168</td>
代码语言:txt
复制
  <td>25935:21991;1628665:29784;22019:34731;22019:20...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20121212</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>7</th>
代码语言:txt
复制
  <td>297411659</td>
代码语言:txt
复制
  <td>50010542</td>
代码语言:txt
复制
  <td>50008168</td>
代码语言:txt
复制
  <td>21458:60020529;25935:31381;1633959:27247291;16...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20121212</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>8</th>
代码语言:txt
复制
  <td>82830661</td>
代码语言:txt
复制
  <td>50013874</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>21458:11580;21475:137325</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20121101</td>
代码语言:txt
复制
</tr>
代码语言:txt
复制
<tr>
代码语言:txt
复制
  <th>9</th>
代码语言:txt
复制
  <td>475046636</td>
代码语言:txt
复制
  <td>203527</td>
代码语言:txt
复制
  <td>28</td>
代码语言:txt
复制
  <td>22724:40168;22729:40278;21458:21817;2770200:24...</td>
代码语言:txt
复制
  <td>1</td>
代码语言:txt
复制
  <td>20121101</td>
代码语言:txt
复制
</tr>

</tbody>

</table>

</div>

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 数据增加和删除
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档