我有一个包装项目,我在代码中遇到了一个问题。
import requests
from selenium import webdriver
from bs4 import BeautifulSoup
import pandas as pd
driver = requests.get('https://bama.ir/car')
products= []
prices = []
kilometrs = []
soup = BeautifulSoup(driver.text,'html.parser')
for a in soup.find_all('li',herf=True,attrs={'class':'car-list-item-li list-data-main'}):
name=a.find('div', attrs={'class':'title'})
price=a.find('p', attrs={'class':'cost single-price'})
kilometr=a.find('div', attrs={'class':'car-func-details'})
products.append(name.text)
prices.append(price.text)
kilometrs.append(kilometr.text)
print(kilometr.text)
df = pd.DataFrame({'Product Name':products,'Price':prices,'kilometr':kilometrs})
df.to_csv('products.csv', index=False, encoding='utf-8')
a.find()不工作,我不知道为什么!!你能帮我吗?
发布于 2021-10-14 13:19:24
实际上,您的请求返回403禁止状态码。
这个网站是受cloudflare保护的,看看像https://github.com/VeNoMouS/cloudscraper这样的包。
https://stackoverflow.com/questions/69568738
复制相似问题