前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >用Python自动生成 图文并茂的数据分析 报告

用Python自动生成 图文并茂的数据分析 报告

作者头像
程序员晚枫
发布2022-12-06 15:11:31
1.4K0
发布2022-12-06 15:11:31
举报
文章被收录于专栏:自动化办公自动化办公

最近Python星球里的一位朋友私信我,想学习一下Python自动化生成数据分析报告。

作为有问必答的知识星球,今天我们来一起学习一下~

“reportlab是Python的一个标准库,可以画图、画表格、编辑文字,最后可以输出PDF格式。它的逻辑和编辑一个word文档或者PPT很像。有两种方法:

  1. 建立一个空白文档,然后在上面写文字、画图等;
  2. 建立一个空白list,以填充表格的形式插入各种文本框、图片等,最后生成PDF文档。

因为需要产生一份给用户看的报告,里面需要插入图片、表格等,所以采用的是第二种方法。

1、一行命令,安装这个库

reportlab输入Python的第三方库,使用前需要先安装,

为了方便大家使用,我已经将这个库集成到🏠Python自动化办公的专用库:python-office中了,

因此一行命令就可以完成的安装命令如下👇左右滑动,可以查看代码

代码语言:javascript
复制
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple python-office -U

2、核心代码

①提前导入相关内容,并且注册字体。(注册字体前需要先准备好字体文件)
代码语言:javascript
复制
from reportlab.pdfbase import pdfmetrics   # 注册字体
from reportlab.pdfbase.ttfonts import TTFont # 字体类
from reportlab.platypus import Table, SimpleDocTemplate, Paragraph, Image  # 报告内容相关类
from reportlab.lib.pagesizes import letter  # 页面的标志尺寸(8.5*inch, 11*inch)
from reportlab.lib.styles import getSampleStyleSheet  # 文本样式
from reportlab.lib import colors  # 颜色模块
from reportlab.graphics.charts.barcharts import VerticalBarChart  # 图表类
from reportlab.graphics.charts.legends import Legend  # 图例类
from reportlab.graphics.shapes import Drawing  # 绘图工具
from reportlab.lib.units import cm  # 单位:cm
②注册字体

提前准备好字体文件, 如果同一个文件需要多种字体可以注册多个

代码语言:javascript
复制
pdfmetrics.registerFont(TTFont('SimSun', 'SimSun.ttf'))
封装不同内容对应的函数
创建一个Graphs类,通过不同的静态方法提供不同的报告内容,包括:标题、普通段落、图片、表格和图表。函数中的相关数据目前绝大多数都是固定值,可以根据情况自行设置成相关参数。
# Graphs类的全部内容,见后台获取的源代码。获取方式,见文末。
③生成报告
代码语言:javascript
复制
if __name__ == '__main__':  
    # 创建内容对应的空列表  
    content = list()  
    
    # 添加标题   
    content.append(Graphs.draw_title('数据分析就业薪资'))   
    
    # 添加图片   
    content.append(Graphs.draw_img('资料全集.jpg'))  
    
    # 添加段落文字  
    content.append(Graphs.draw_text('众所周知,大数据分析师岗位是香饽饽,近几年数据分析热席卷了整个互联网行业,与数据分析的相关的岗位招聘、培训数不胜数。很多人前赴后继,想要参与到这波红利当中。那么数据分析师就业前景到底怎么样呢?需要学习Python + 大数据分析,可以添加我的微信:CoderWanFeng'))   
    
    # 添加小标题  
    content.append(Graphs.draw_title(''))  
    content.append(Graphs.draw_little_title('不同级别的平均薪资'))   
    
    # 添加表格   
    data = [    
        ('职位名称', '平均薪资', '较上年增长率'),    
        ('数据分析师', '18.5K', '25%'),     
        ('高级数据分析师', '25.5K', '14%'),    
        ('资深数据分析师', '29.3K', '10%') 
    ]  
    content.append(Graphs.draw_table(*data)) 
    
    # 生成图表  
    content.append(Graphs.draw_title(''))  
    content.append(Graphs.draw_little_title('热门城市的就业情况'))  
    b_data = [(, , , , , ), (, , , , , )]  
    ax_data = ['BeiJing', 'ChengDu', 'ShenZhen', 'ShangHai', 'HangZhou', 'NanJing'] 
    leg_items = [(colors.red, '平均薪资'), (colors.green, '招聘量')]   
    content.append(Graphs.draw_bar(b_data, ax_data, leg_items))  
    
    # 生成pdf文件   
    doc = SimpleDocTemplate('report.pdf', pagesize=letter)  
    doc.build(content)

生成报告的结果如下

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-08-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python自动化办公社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1、一行命令,安装这个库
  • 2、核心代码
    • ①提前导入相关内容,并且注册字体。(注册字体前需要先准备好字体文件)
      • ②注册字体
        • ③生成报告
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档