专栏首页python3Python3读取Excel数据存入My

Python3读取Excel数据存入My

Python是数据分析的强大利器。

利用Python做数据分析,第一步就是学习如何读取日常工作中产生各种excel报表并存入数据中,方便后续数据处理。

这里向大家分享python3如何使用xlrd读取excel,并使用Python3操作pymysql模块将数据存入Mysql中,有需要的朋友们一起来看看吧。

前言

pymsql是Python中操作MySQL的模块,其使用方法和MySQLdb几乎相同。但目前pymysql支持python3.x而后者不支持3.x版本。

python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库。

版本

python >= 3.6

mysql >= 5.7.19

安装

python、mysql的安装这里就不详细述说了,有需要的朋友自行百度

xlrd :  可以使用pip安装也可手动下载源码安装,pip安装:pip install xlrd

pymysql : 可以使用pip安装也可手动下载源码安装, pip安装: pip install xlrd

模块

import xlrd
import pymysql
from datetime import datetime
from xlrd import xldate_as_tuple

读取excel

data = xlrd.open_workbook("D:/sales_data.xls")   //读取D盘中名为sales_data的excel表格
table_one = data.sheet_by_index(0)                      //根据sheet索引获取sheet的内容
table_two = data.sheet_by_index(1)

创建数据库连接

db = pymysql.connect("localhost", "root", "gaishi123", "sales_data", use_unicode=True, charset="utf8")

gaishi123是mysql的root的密码,sales_data是数据库名

for site in sites:
    # 遍历sheet1
    for nrows_one in range(1, int(table_one.nrows)):
        if table_one.cell_value(nrows_one, 0) == site:
            payday = table_one.cell_value(0, 8)
            date = datetime(*xldate_as_tuple(payday, 0))
            payday = date.strftime('%Y/%m/%d')                                 # 出票日期
            sales = float(table_one.cell_value(nrows_one, 1))                  # 销量
            quantity_ticket = int(table_one.cell_value(nrows_one, 2))          # 票数
            rate_electronic = float(table_one.cell_value(nrows_one, 3))        # 电子直销占比
            sales_thanlastweek = float(table_one.cell_value(nrows_one, 4))     # 销量同比上周
            sales_thanlastyear = float(table_one.cell_value(nrows_one, 5))     # 销量同比去年
            break
    # 遍历sheet2
    for nrows_two in range(1, int(table_two.nrows)):
        if table_one.cell_value(nrows_two, 0) == site:
            session = int(table_two.cell_value(nrows_two, 1))                  # 访问量
            rate_conversion = float(table_two.cell_value(nrows_two, 2))        # 转化率
            rate_paysuccess = float(table_two.cell_value(nrows_two, 3))       # 支付成功率
            session_thanlastweek = float(table_two.cell_value(nrows_two, 4))   # 访问量同比上周
            break
    # 将数据存入数据库
    sql = "insert into sales_data(SITE, PAYDAY, SALES, QUANTITY_TICKET, RATE_ELECTRONIC, SALES_THANLASTWEEK," \
          "SALES_THANLASTYEAR, SESSION, SESSION_THANLASTWEEK, RATE_CONVERSION, RATE_PAYSUCCESS)" \
          " values ('%s','%s', %f, %d, %f, %f, %f, %d, %f, %f, %f)" %\
          (site, payday, sales, quantity_ticket, rate_electronic, sales_thanlastweek, sales_thanlastyear,
           session, session_thanlastweek, rate_conversion, rate_paysuccess)
    try:
        # 使用 cursor() 方法创建一个游标对象 cursor
        cursor = db.cursor()
        cursor.execute(sql)
    except Exception as e:
        # 发生错误时回滚
        db.rollback()
        print(str(e))
    else:
        db.commit()  # 事务提交
        print('事务处理成功')

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 1.1Jupyter notbook 的

    py3study
  • centos7使用vim打造强大的pyt

    centos7.3自带的vim是7.4.*版本, YouCompleteMe需要Vim 7.4.1578+ 我这里编译安装vim8.0

    py3study
  • Django Rest Framewor

    200 OK - [GET]:服务器成功返回用户请求的数据,该操作是幂等的(Idempotent)。 201 CREATED - [POST/PUT/PAT...

    py3study
  • Flask+python3+super

    手里有一个web项目,代码按照前端代码库、后端代码库分别在GitHub上,分散带来的结果是,不容易持续集成,比如你可能需要很多的job去保证一个项目的正常运作,...

    py3study
  • Greenplum高级使用

    stagging=#  select gp_segment_id,count(1) from  tablename  group by 1;

    小徐
  • Greenplum数据库使用总结(干货满满)--高级使用

    stagging=# select gp_segment_id,count(1) from tablename group by 1;

    小徐
  • 代码小记

      前一阵子一直在制作一款小游戏,虽说最终的成果并不完美,但也算是花了不少精力,网上批评的声音不少,但更多的则是鼓励,这也让我们颇感欣慰,自省之余,也算拾得一些...

    用户2615200
  • 数据对齐-编辑距离算法详解(Levenshtein distance)

    在信息论、语言学和计算机科学中,Levenshtein distance是用于测量两个字符串之间差异的字符串度量。非正式的说就是两个单词之间的Levenshte...

    匠心Java
  • 如何实现AutoML -- 先Auto每个环节

    最近一直在思考如何提高算法工程师效率,并且能让普通工程师也参与进来,毕竟现在来看,招聘到一个合格的算法成本颇高。经过对现实中很多场景的观察,我发现很多情况下算法...

    用户2936994
  • 《剑指offer》之从上往下打印二叉树

    打印一颗二叉树,如果直接遍历打印的话,会先打印根节点->左节点->右节点。想要按层次打印,可以依照队列来实现,从根节点依次将节点加入队列中,然后从队列中取出来达...

    程序员爱酸奶

扫码关注云+社区

领取腾讯云代金券