文章/答案/技术大牛

发布

问尝试抓取Aliexpress
EN

Stack Overflow用户

提问于 2021-03-29 23:26:36

回答 1查看 66关注 0票数 0

所以我试着在Aliexpress上刮掉一件商品的价格。我试着检查看起来像这样的元素

<span class="product-price-value" itemprop="price" data-spm-anchor-id="a2g0o.detail.1000016.i3.fe3c2b54yAsLRn">US $14.43</span>

我正在尝试运行以下代码

“”“

import pandas as pd
from bs4 import BeautifulSoup
from urllib.request import urlopen
import re

url = 'https://www.aliexpress.com/item/32981494236.html?spm=a2g0o.productlist.0.0.44ba26f6M32wxY&algo_pvid=520e41c9-ba26-4aa6-b382-4aa63d014b4b&algo_expid=520e41c9-ba26-4aa6-b382-4aa63d014b4b-22&btsid=0bb0623b16170222520893504e9ae8&ws_ab_test=searchweb0_0,searchweb201602_,searchweb201603_'

source = urlopen(url).read()
soup = BeautifulSoup(source, 'lxml')
soup.find('span', class_='product-price-value')

‘但是我总是得到一个空白的输出。我肯定做错了什么，但这些方法在我看过的教程中似乎是有效的。

web-scraping

beautifulsoup

python

web

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-03-30 17:24:05

所以，我得到的是。根据我的理解，你给出的页面是由脚本接收的，但在最初，它并不包含它，只包含脚本标记，所以我只是使用split来获取它。下面是我的代码：

from bs4 import BeautifulSoup
import requests

url = 'https://aliexpress.ru/item/1005002281350811.html?spm=a2g0o.productlist.0.0.42d53b59T5ddTM&algo_pvid=f3c72fef-c5ab-44b6-902c-d7d362bcf5a5&algo_expid=f3c72fef-c5ab-44b6-902c-d7d362bcf5a5-1&btsid=0b8b035c16170960366785062e33c0&ws_ab_test=searchweb0_0,searchweb201602_,searchweb201603_&sku_id=12000019900010138'
data = requests.get(url)
soup = BeautifulSoup(data.content, features="lxml")
res = soup.findAll("script")
total_value = str(res[-3]).split("totalValue:")[1].split("}")[0].replace("\"", "").replace(".", "").strip()
print(total_value)

它工作得很好，我尝试了阿里的几个页面。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/66856978

复制

相似问题

问尝试抓取Aliexpress
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问尝试抓取AliexpressEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问尝试抓取Aliexpress
EN