首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >Python-BeautifulSoup :如何将html保存到数据库?

Python-BeautifulSoup :如何将html保存到数据库?
EN

Stack Overflow用户
提问于 2018-06-07 04:00:35
回答 2查看 992关注 0票数 0

我正在尝试将产品描述保存到MySQL数据库中。到目前为止,我已经尝试将数据类型更改为BLOB、LONGBLOB、TEXT、LONGTEXT,但不起作用。

代码语言:javascript
复制
    import bs4
from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup
import mysql.connector

cnx = mysql.connector.connect(user='root', password='Kradz579032!!',
                              host='127.0.0.1',
                              database='aliexpressapidb')
cursor = cnx.cursor()

add_data = ("INSERT INTO productdetails"
               "(description) "
               "VALUES (%s)")

my_url = 'https://www.aliexpress.com/item/Cheap-Necklace-Jewelry-Alloy-Men-Vintage-Personality-Pendant-Creativity-Simple-Accessories-Symbol-Necklace-Wholesale-Fashion/32879629913.html?spm=a2g01.11147086.layer-iabdzn.4.4a716140Ix00VA&scm=1007.16233.91830.0&scm_id=1007.16233.91830.0&scm-url=1007.16233.91830.0&pvid=acdbf117-c0fb-458f-b8a9-ea73bc0d174b'
uClient = uReq(my_url)
page_html = uClient.read()
uClient.close()
page_soup = soup(page_html, "html.parser")
description = page_soup.findAll("div", {"class": "ui-box-body"})
#print(description)
data_insert = description
cursor.execute(add_data, data_insert)




cnx.commit()

cursor.close()
cnx.close()

不断收到错误:

文件类型第160行,返回getattr( to_mysql,“_{0}_to_mysql”.format(Type_name))(值) AttributeError:'MySQLConverter‘对象没有属性'_tag_to_mysql’"MySQL type".format(type_name)) TypeError: Python 'tag‘无法转换为MySQL类型

EN

回答 2

Stack Overflow用户

发布于 2018-06-07 05:48:08

根据@MicahB的建议,通过将html数据转换为字符串解决了问题。

tostring =str(数据)

票数 0
EN

Stack Overflow用户

发布于 2020-04-29 19:43:47

代码语言:javascript
复制
maindiv = str(soup.find("body"))

这将以字符串形式返回body标记html。

代码语言:javascript
复制
sql = "UPDATE `abc` SET `html` = %s WHERE `abc`.`id` = %s"
val = (maindiv,1)
mycursor.execute(sql, val)
mydb.commit()

上面的代码更新记录

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50728615

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档