前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python操作Mysql(连接、数据探查、写Excel)

Python操作Mysql(连接、数据探查、写Excel)

作者头像
不吃西红柿
发布2022-09-19 10:34:54
6410
发布2022-09-19 10:34:54
举报
文章被收录于专栏:信息技术智库

🍅 作者主页:不吃西红柿

🍅 简介:CSDN博客专家🏆、HDZ核心组成员💪

公号「信息技术智库」知识内容如下:

本期重点:使用python探查mysql数据库,数据分析类人员必备


目录

一、缘起

二、转机

三、成果

四、过程 

1、导包

2、连接数据库

3、数据探查

4、写execl


一、缘起

事情是这样的,领导安排一个活,详细探查xx公司的数据治理,包括数据源,数据流,数据质量。

PS.工作量非常大,费劲整理出质量报告!

 好的,没问题: 嘴上逞强,心在滴血!

二、转机

我一想,数据探查不就是看这些指标:

表名,列名,空值数量,总数据量,空值率,字符类型,字段长度,备注,主键,权限

 既如此,何不用python?

于是乎,奋笔疾书!

 三、成果

 说干就干,最终用python 快速完成数据治理调研,而我,楼下遛弯去了~

但是,活可没马虎,给大家康康效果:

四、过程

为了让更多有数据处理需求的小伙伴,高效搞定工作,我觉得把相关代码完全开源,当然,也有提升的地方,希望小伙伴在评论区指指点点。

代码大致分为4个部分:

1、导包

代码语言:javascript
复制
#coding=utf-8
from __future__ import division
import os,openpyxl,pymysql as MySQL

2、连接数据库

代码语言:javascript
复制
print("开始连接ing")
try:
    conn=MySQL.connect(host="127.0.0.1",port=3306,user="root",passwd="root",db="tomato",charset='utf8')
    #charset解决字符乱码
except:
    print("连接失败!")
cur = conn.cursor()
print("连接成功!!!")

3、数据探查

代码语言:javascript
复制
#tab=['xxxxxx','bbbbbb']  #指定探索的表名
tab=[]
if len(tab)==0 :
    quary="""show tables; """
    ret=cur.execute(quary)
    ret=cur.fetchall()  #结果是二层tuple
    for i in ret:
         tab.append(i[0])
    print('表数量: %s'%len(tab))
    print('表list: %s'%tab)
else:
    pass

m=1
result=[]
result.append(['表名','列名','空值数量','总数据量','空值率','字符类型','字段长度','备注','主键','权限'])
for i in tab:
    if m==100:
        break
        print(i)

    print("第" + str(m) + "个表")
    quary1="select count(*)  from  %s"%i
    retsc=cur.execute(quary1)
    retsc=cur.fetchall()

    quary2='''select  COLUMN_NAME from Information_schema.columns  where table_Name = '%s';'''%i
    ret1=cur.execute(quary2)
    ret1=cur.fetchall()

    for col in ret1:
        ll=[]
        quary3="""select count(*)  from  %s  AS AAA where  AAA.%s  is null; """%(i,col[0])
        print(quary3)
        ret2=cur.execute(quary3)
        ret2=cur.fetchall()
        quary4="""SELECT  DATA_TYPE,CHARACTER_MAXIMUM_LENGTH,COLUMN_COMMENT,COLUMN_KEY,PRIVILEGES  from information_schema.COLUMNS where  TABLE_NAME=\'%s\' and COLUMN_NAME=\'%s\';"""%(i,col[0])
        print(quary4)
        re4=cur.execute(quary4)
        re4=cur.fetchall()
        print(re4)
        ll.append(i)
        ll.append(col[0])
        ll.append(ret2[0][0])
        ll.append(retsc[0][0])
        try:
            ll.append(str(round(ret2[0][0]/retsc[0][0],2)))
        except:
            ll.append(0)
        ll.append(re4[0][0])
        ll.append(re4[0][1])
        ll.append(re4[0][2])
        ll.append(re4[0][3])
        ll.append(re4[0][4])
        result.append(ll)
    m=m+1
print(result)
cur.close()
conn.close()

4、写execl

代码语言:javascript
复制
path='D:\\export'   # 输入文件路径
print("请输入文件名,如不输入,默认文件名export:  ")
exportname=input()
if exportname=='':
    exportname='export'
if os.path.exists('%s\%s.xlsx'%(path,exportname)):
    os.remove('%s\%s.xlsx'%(path,exportname))
print('导出文件路径: %s\%s.xlsx'%(path,exportname))

os.chdir('%s'%path)
inwb = openpyxl.Workbook()
inwb.create_sheet('西红柿真帅',0)
sheetname=inwb.get_sheet_names()
inwb.remove_sheet(inwb.get_sheet_by_name(sheetname[1]))
ws=inwb.get_sheet_by_name(sheetname[0])
for i in range(len(result)):
    for j in range(len(result[0])):
        ws.cell(row = i+1 , column = j+1).value = result[i][j]
inwb.save('%s.xlsx'%exportname)

print("success !!!")

数据质量调研搞完了,发给领导~

 领导真有眼光!!⁄(⁄ ⁄•⁄ω⁄•⁄ ⁄)⁄

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021-09-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、缘起
  • 二、转机
  •  三、成果
  • 四、过程
    • 1、导包
      • 2、连接数据库
        • 3、数据探查
          • 4、写execl
          相关产品与服务
          数据库
          云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档