学习了简单的 Python 操作 Excel 的两个库 xlrd 和 xlwt,今天来实际操作一个案例来增强实战功能。
案例背景
我们市场部的同学想通过分析广告投放时间前后(分钟级,前1分钟到后5分钟)的用户活跃数据来分析我们广告的投放效果,来决定是否继续投放和投放的其他选择性,所以他们需要我来帮忙计算一下数据。所以这里分享下实际操作。
数据准备
1、 广告播放时间
这里的广告播放时间文件为 ad.xlsx,由市场部同学提供,部分数据如下。
2、 用户活跃数据
一般从数据库计算导出(SQL 操作可以看我之前发布的 MySQL 相关知识),有时候也需要通过日志计算,已经计算好的数据 uv.xlsx 如下(分钟级)。这里我们区分了移动端和 PC 端。
数据计算
数据准备完毕之后,就可以直接计算了,因为前面已经说过xlrd和xlwt库的使用,这里直接贴上代码py_excel.py,大家可以实际操作试一试。(为了更好的查看代码,可以访问原文,这里的编辑器只能块引用)
#coding:utf-8
import xlrd
import xlwt
import re
import sys
import string
from datetime import datetime
#read the ad play time data
programFile = r'ad.xlsx'
#读取广告播放时间数据文件
adFile = r'ad.xlsx'
#打开文件并获取数据
adWb = xlrd.open_workbook(adFile)
adSheet = adWb.sheet_by_index(0)
#获取目标时间列(在第3列,由日期和时间拼接而成)
adTime = adSheet.col_values(2)
lenth_of_time = len(adTime)
#读取uv数据
uvFile = r'uv.xlsx'
uvWb = xlrd.open_workbook(uvFile)
#数据存储在一张表时,如果有多个sheet,要分开赋值
uvSheet = uvWb.sheet_by_index(0)
uvTime = uvSheet.col_values(0)
length = len(uvTime)
#初始化写操作
resultFile = xlwt.Workbook()
#在生成表的时候添加了两张sheet
resultMobile = resultFile.add_sheet('mobile',cell_overwrite_ok=True)
resultPC = resultFile.add_sheet('PC',cell_overwrite_ok=True)
i=1
while(i<lenth_of_time):
print (i)
playTime = xlrd.xldate_as_tuple(adTime[i],adWb.datemode)
print (playTime)
j= 1
while(j<length):
uvRow = uvSheet.row_values(j)
uvTime = xlrd.xldate_as_tuple(uvRow[0],uvWb.datemode)
#时间匹配
if((playTime[0]==uvTime[0] and playTime[1]==uvTime[1] andplayTime[2]==uvTime[2] and ((playTime[3]==uvTime[3] and uvTime[4]-playTime[4]>-2and uvTime[4]-playTime[4]<6) or (uvTime[3]==playTime[3]+1 anduvTime[4]+60-playTime[4]>-2 and uvTime[4]+60-playTime[4]<6) or(uvTime[3]==playTime[3]-1 and uvTime[4]-59==0 and playTime[4]-0==0))) or(playTime[0]==uvTime[0] and playTime[1]==uvTime[1] and playTime[2]==uvTime[2]-1and uvTime[3]==0 and playTime[3]==23 and uvTime[4]+60-playTime[4]<6)):
gap = uvTime[4]-playTime[4]
if(gap<-50):
gap=gap+60
if(gap==59):
gap=-1
if(uvRow[1]=='mo'):
resultMobile.write(i,gap+1,uvRow[2])
if(uvRow[1]=='pc'):
resultPC.write(i,gap+1,uvRow[2])
j = j + 1
i= i + 1
#保存结果
resultFile.save(r'result.xls')
查看结果:
首行数据表示分钟。
小结
上面就是今天的主题内容了,今天分享下如何使用 Python 操作 Excel 进行读写文件生成目标数据,方便后面进行数据分析。希望通过上面的操作能帮助大家。如果你有什么好的意见,建议,或者有不同的看法,我都希望你留言和我们进行交流、讨论。