我在一个网站上有这个代码Html:
[
这是我的python脚本:
import csv
import requests
from urllib.request import urlopen
from bs4 import BeautifulSoup
csv_file = open('C:\\Users\scrap_result.csv','w',newline='')
csv_writer = csv.writer(csv_file, delimiter=',', quotechar='|', quoting=csv.QUOTE_MINIMAL)
csv_writer.writerow(['headline', 'price', 'img_src'])
for page in range (1,3):
url = "https://test.vn/products?page=/{}/".format(page)
html = urlopen(url)
soup = BeautifulSoup(html,"lxml")
for productname in soup.find_all('productname'):
headline = productname.h6.text
price= productname.find('h6',class_='product-card__name').text
img_src = productname.find('picture',class_='product-card__image mb-3 lozad').img['src']
print(headline)
print(price)
print(img_src)
csv_writer.writerow([headline, price, img_src])
csv_file.close()
当我运行它时,它返回空值。我猜我没有调用正确的标签,但是找不到哪里错了。
发布于 2021-01-13 14:36:13
我在html中看不到任何叫做"productname“的东西。所以也许soup.find_all(productname)
会返回一个空列表。
顺便说一句:for循环不是嵌套的,所以第二个循环在第一个循环结束后开始,并且只搜索最后一个url。
https://stackoverflow.com/questions/65696632
复制相似问题