前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【实战】Python 读写 Excel 实例应用

【实战】Python 读写 Excel 实例应用

作者头像
CDA数据分析师
发布2018-02-05 14:48:08
1.6K0
发布2018-02-05 14:48:08
举报
文章被收录于专栏:CDA数据分析师CDA数据分析师

学习了简单的 Python 操作 Excel 的两个库 xlrd 和 xlwt,今天来实际操作一个案例来增强实战功能。

案例背景

我们市场部的同学想通过分析广告投放时间前后(分钟级,前1分钟到后5分钟)的用户活跃数据来分析我们广告的投放效果,来决定是否继续投放和投放的其他选择性,所以他们需要我来帮忙计算一下数据。所以这里分享下实际操作。

数据准备

1、 广告播放时间

这里的广告播放时间文件为 ad.xlsx,由市场部同学提供,部分数据如下。

2、 用户活跃数据

一般从数据库计算导出(SQL 操作可以看我之前发布的 MySQL 相关知识),有时候也需要通过日志计算,已经计算好的数据 uv.xlsx 如下(分钟级)。这里我们区分了移动端和 PC 端。

数据计算

数据准备完毕之后,就可以直接计算了,因为前面已经说过xlrd和xlwt库的使用,这里直接贴上代码py_excel.py,大家可以实际操作试一试。(为了更好的查看代码,可以访问原文,这里的编辑器只能块引用)

代码语言:js
复制

#coding:utf-8
import xlrd
import xlwt
import re
import sys
import string
from datetime import datetime
 
#read the ad play time data
programFile = r'ad.xlsx'
#读取广告播放时间数据文件
adFile = r'ad.xlsx'
 
#打开文件并获取数据
adWb = xlrd.open_workbook(adFile)
adSheet = adWb.sheet_by_index(0)
 
#获取目标时间列(在第3列,由日期和时间拼接而成)
adTime = adSheet.col_values(2)
 
lenth_of_time = len(adTime)
 
#读取uv数据
uvFile = r'uv.xlsx'
 
uvWb = xlrd.open_workbook(uvFile)
#数据存储在一张表时,如果有多个sheet,要分开赋值
uvSheet = uvWb.sheet_by_index(0)
 
uvTime = uvSheet.col_values(0)
length = len(uvTime)
 
#初始化写操作
resultFile = xlwt.Workbook()
#在生成表的时候添加了两张sheet
resultMobile = resultFile.add_sheet('mobile',cell_overwrite_ok=True)
resultPC = resultFile.add_sheet('PC',cell_overwrite_ok=True)
 
i=1
while(i<lenth_of_time):
   print (i)
   playTime = xlrd.xldate_as_tuple(adTime[i],adWb.datemode)
   print (playTime)
    j= 1
    while(j<length):
       uvRow = uvSheet.row_values(j)
       uvTime = xlrd.xldate_as_tuple(uvRow[0],uvWb.datemode)
       #时间匹配
       if((playTime[0]==uvTime[0] and playTime[1]==uvTime[1] andplayTime[2]==uvTime[2] and ((playTime[3]==uvTime[3] and uvTime[4]-playTime[4]>-2and uvTime[4]-playTime[4]<6) or (uvTime[3]==playTime[3]+1 anduvTime[4]+60-playTime[4]>-2 and uvTime[4]+60-playTime[4]<6) or(uvTime[3]==playTime[3]-1 and uvTime[4]-59==0 and playTime[4]-0==0))) or(playTime[0]==uvTime[0] and playTime[1]==uvTime[1] and playTime[2]==uvTime[2]-1and uvTime[3]==0 and playTime[3]==23 and uvTime[4]+60-playTime[4]<6)):
           gap = uvTime[4]-playTime[4]
 
           if(gap<-50):
                gap=gap+60
           if(gap==59):
                gap=-1
 
           if(uvRow[1]=='mo'):
               resultMobile.write(i,gap+1,uvRow[2])
           if(uvRow[1]=='pc'):
               resultPC.write(i,gap+1,uvRow[2])
       j = j + 1
    i= i + 1
 
#保存结果
resultFile.save(r'result.xls')

查看结果:

首行数据表示分钟。

小结

上面就是今天的主题内容了,今天分享下如何使用 Python 操作 Excel 进行读写文件生成目标数据,方便后面进行数据分析。希望通过上面的操作能帮助大家。如果你有什么好的意见,建议,或者有不同的看法,我都希望你留言和我们进行交流、讨论。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-04-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CDA数据分析师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云数据库 MySQL
腾讯云数据库 MySQL(TencentDB for MySQL)为用户提供安全可靠,性能卓越、易于维护的企业级云数据库服务。其具备6大企业级特性,包括企业级定制内核、企业级高可用、企业级高可靠、企业级安全、企业级扩展以及企业级智能运维。通过使用腾讯云数据库 MySQL,可实现分钟级别的数据库部署、弹性扩展以及全自动化的运维管理,不仅经济实惠,而且稳定可靠,易于运维。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档