mysql数据库安装和使用

import pymysql
import pandas as pd
from lxml import etree
import re
#连接数据库的参数
config = {
          'host':'127.0.0.1',
          'port':3306,
          'user':'root',
          'password':'f012464998',
          'db':'我的',
          'charset':'utf8mb4',
          'cursorclass':pymysql.cursors.DictCursor,
          }
# #连接数据库
db = pymysql.connect(**config)
# #创建游标
cursor = db.cursor()
# ## 执行SQL,并返回收影响行数
cursor.execute('select body from dianxin_data_comments')
result = cursor.fetchall()
# print(type(result)) #list 查询结果是一个list,而pd.read_sql 读入了一个dataframe;
print(type(result[-1]))
print(result[-1])
print(len(result))
df3 = pd.DataFrame(result) #将查询结果转为一个dataframe。
# df3.to_csv("yidong.csv")
print(df3["body"][1])
print(type(df3["body"][1]))
a = df3["body"][2]
a= etree.HTML(a)
dom = a.xpath("//div/a/text()")
print(dom)

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏禁心尽力

solr服务中集成IKAnalyzer中文分词器、集成dataimportHandler插件

昨天已经在Tomcat容器中成功的部署了solr全文检索引擎系统的服务;今天来分享一下solr服务在海量数据的网站中是如何实现数据的检索。 在solr服务中集...

23280
来自专栏流柯技术学院

zabbix环境安装搭建

zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。 zabbix由zabbix server与可选组件zabbix a...

13930
来自专栏Pythonista

Django之常用命令以及问题汇总

django-admin.py startproject project-name

18310
来自专栏L宝宝聊IT

Mysql备份与还原——mysqldump结合binlog

MySQL 备份一般采取全库备份加日志备份的方式,例如每天执行一次全备份,每小时执行一次二进制日志备份。这样在 MySQL 故障后可以使用全备份...

17320
来自专栏云计算相关

使用JClouds在Java中获取和发布云服务器

本文中,我们举例来说明如何使用JClouds API 获取和发布云服务器。JClouds API 可以和大量云服务提供商(包括Amazon EC2和Racksp...

327100
来自专栏云计算

使用JClouds在Java中获取和发布云服务器

本文中,我们举例来说明如何使用JClouds API 获取和发布云服务器。JClouds API 可以和大量云服务提供商(包括Amazon EC2和Racksp...

21890
来自专栏aoho求索

基于可靠消息方案的分布式事务(三):Lottor使用

前面两篇文章介绍了笔者关于可靠消息方案的分布式事务的实现思路以及Java中的事务概念,奈何工作抽不出时间,如今时隔已久,分布式事务系列拖了很久,一直没能好好把项...

9510
来自专栏自由而无用的灵魂的碎碎念

将MySQL数据迁移到Oracle

因为项目的原因,今晚将mysql数据库的内容尝试迁移到oracle,虽然结果失败,不过学到了不少,下次就不一定了,哈哈

27110
来自专栏L宝宝聊IT

Mysql备份与还原——xtrabackup

上次我们介绍了采用逻辑备份mysqldump 备份方式,其最大的缺陷就是备份和恢复速度都慢,但如果数据库非常大,那再使用 mysqldump 备份就不太适...

46530
来自专栏互联网大杂烩

海量数据解决方案

缓存:将从数据库中获取的结果暂时保存起来,在下次使用时无需重新到数据库中获取。 页面静态化:将程序最后生成的页面保存起来。

14130

扫码关注云+社区

领取腾讯云代金券