数据分析师肯定每天都被各种各样的数据数据报表搞得焦头烂额,老板的,运营的、产品的等等。而且大部分报表都是重复性的工作,这篇文章就是帮助大家如何用Python来实现报表的自动发送,解放你的劳动力,可以让你有时间去做更有意思的事情。
首先来介绍下实现自动报表要使用到的Python库:
pymysql 一个可以连接MySQL实例并且实现增删改查功能的库
datetime Python标准库中自带的关于时间的库
openpyxl 一个可以读写07版以后的Excel文档(.xlsx格式也支持)的库
smtplib SMTP即简单邮件传输协议,Python简单封装成了一个库
email 一个用来处理邮件消息的库
为什么使用openpyxl库来处理Excel呢?因为它支持每个sheet的行数为100W+,也是支持xlsx格式的文件。如果你接受xls文件,并且每个sheet的行数小于6W,也是可以使用xlwt库,它对大文件的读取速度要大于openpyxl。
接下来我们就进入实战部分,来正式实现这个过程。我把整个实现过程分成几个函数的方式来实现,这样看着会比较有结构感。
1
首先导入所有要用到的库
# encoding=utf-8
import pymysql as pms
import openpyxl
import datetime
from email.header import Header
import smtplib
2
编写一个传入sql就返回数据的函数get_datas(sql)
def get_datas(sql):
# 一个传入sql导出数据的函数
# 跟数据库建立连接
conn = pms.connect(host='实例地址', user='用户',
passwd='密码', database='库名', port=3306, charset="utf8")
# 使用 cursor() 方法创建一个游标对象 cursor
cur = conn.cursor()
# 使用 execute() 方法执行 SQL
cur.execute(sql)
# 获取所需要的数据
datas = cur.fetchall()
#关闭连接
cur.close()
#返回所需的数据
return datas
3
编写一个传入sql就返回数据的字段名称的函数get_datas(sql),因为一个函数只能返回一个值,这边就用2个函数来分别返回数据和字段名称(也就是excel里的表头)
def get_fields(sql):
# 一个传入sql导出字段的函数
passwd='pcNzcKPnn', database='kikuu', port=3306, charset="utf8")
cur = conn.cursor()
cur.execute(sql)
# 获取所需要的字段名称
fields = cur.description
cur.close()
return fields
4
编写一个传入数据、字段名称、存储地址返回一个excel 的函数et_excel(data, field, file)
def get_excel(data, field, file):
# 将数据和字段名写入excel的函数
#新建一个工作薄对象
new = openpyxl.Workbook()
#激活一个新的sheet
sheet = new.active
#给sheet命名
sheet.title = '数据展示'
#将字段名称循环写入excel第一行,因为字段格式列表里包含列表,每个列表的第一元素才是字段名称
for col in range(len(field)):
#row代表行数,column代表列数,value代表单元格输入的值,行数和列数都是从1开始,这点于python不同要注意
_ = sheet.cell(row=1, column=col+1, value=u'%s' % field[col][0])
#将数据循环写入excel的每个单元格中
for row in range(len(data)):
for col in range(len(field)):
#因为第一行写了字段名称,所以要从第二行开始写入
_ = sheet.cell(row=row+2, column=col + 1, value=u'%s' % data[row][col])
#将生成的excel保存,这步是必不可少的
newworkbook = new.save(file)
#返回生成的excel
return newworkbook
......
领取专属 10元无门槛券
私享最新 技术干货