腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
BeautifulSoup
:
抓取
每个
header
后面
所有
<
ul
>
的
所有
内容
python
、
beautifulsoup
我有一个很长很长
的
头部列表,
后面
跟着列表: <h2>
Header
1</h2><li>A</li><li>C</li><h2>
Header
2</h2><
ul
> <li>D</li&g
浏览 28
提问于2019-10-03
得票数 2
回答已采纳
1
回答
在我们有div标签
的
地方提取
内容
,
后面
跟着hearder标签。
python-3.x
、
web-scraping
、
beautifulsoup
例如:<div>some text here <li>list</li> <li>list</li></div> 我尝试了以下链接中提供
的
解
浏览 0
提问于2019-07-22
得票数 0
1
回答
使用CSS选择器(Python、BS4)销毁数据
python
、
web-scraping
、
beautifulsoup
、
css-selectors
我是第一次使用CSS选择器
抓取
数据。import requests url = "https://weworkremotely.com/remote-jobs/title, "company": company, "location": location, "link":f&
浏览 8
提问于2022-02-01
得票数 0
回答已采纳
1
回答
Python文本
抓取
: AttributeError:'NavigableString‘对象没有’BS4‘属性
python
、
beautifulsoup
、
screen-scraping
我想从下面的页面中用class="academicsList"
抓取
ul
中
每个
li
的
文本: import requests from fake_useragent import UserAgentcity=51I&ins
浏览 4
提问于2018-09-04
得票数 1
回答已采纳
2
回答
试图在标题和
内容
中进行擦拭和分隔。问题是,两者都有相同
的
类和标签,如何隔离?
python-3.x
、
web-scraping
、
beautifulsoup
我试图在网络上
抓取
更多
的
,将其分为两个部分:标题和
内容
,问题是两者都有相同
的
类和标签。除了使用regex和硬编码之外,如何区分和提取excel中
的
2列?在图片()或提供
的
网站链接中,bold(除了字母表字母(A)和
后面
的‘回到顶部’)表示标题和解释(在粗体下面非粗体)表示
内容
(
内容
甚至由站点
后面
的'li‘和'
ul
’块组成,应该放在相应
的
标题下)。#Code to
浏览 0
提问于2019-04-22
得票数 0
回答已采纳
1
回答
当遇到没有伴随打开标记
的
结束标记时,
BeautifulSoup
会过早地切断div。
python-3.x
、
beautifulsoup
、
html-parsing
我试图刮掉一个经常在div中间使用自定义结束标记
的
页面,而不是附带
的
开始标记,这会导致
BeautifulSoup
将其视为div
的
末尾。 <h4>Promo
Header
</h4> <li>items here</li> </
u
浏览 3
提问于2020-11-10
得票数 0
回答已采纳
1
回答
显示网页刮伤
的
内容
python
、
html
、
beautifulsoup
下面的代码将
所有
字段显示在screen.Is上,这样我就可以像在数据库或spreadsheet.In中显示
的
那样“与”字段“并排”,源代码中
的
字段跟踪、日期、日期、时间、等级、距离和奖品都在resultsBlockHeader我正在试图让它们显示为这样
的
跟踪、日期、日期、等级、距离、奖品、鳍、灰狗、陷阱、SP、timeSec、timeDistance --
所有
这些都在一个line.Any帮助中。from urllib import urlopen from bs4 import
Beautifu
浏览 2
提问于2016-02-05
得票数 1
回答已采纳
1
回答
使用
BeautifulSoup
从CSV中列出
的
多个URL中刮取信息,然后将这些结果导出到新
的
CSV文件中。
python
、
csv
、
web-scraping
、
beautifulsoup
我有一个45k+行CSV文件,
每个
文件包含相同域
的
不同路径--它们在结构上是相同
的
--而且
每个
单独
的
路径都是可点击
的
。我成功地使用
BeautifulSoup
来
抓取
每个
标题和
内容
,并通过print函数验证了刮板。但是,当我试图将收集到
的
信息导出到一个新
的
CSV文件时,我只得到最后一个URL
的
街道名称和描述,而不是我所期望
的
所有
这些
浏览 3
提问于2020-02-20
得票数 0
回答已采纳
3
回答
无法从网页上
抓取
所有
链接及其子链接
python
、
python-3.x
、
web-scraping
、
beautifulsoup
我试图递归地获取位于此左侧区域中Automotive下
的
所有
链接。我目前
的
实现只能从登录页面获取链接。import requests link = 'https://www.amazon.de/
浏览 12
提问于2020-10-10
得票数 0
1
回答
我需要一个脚本,打开一个excel链接,然后
抓取
信息,并保存它
python
我是python
的
新手,我对下面的脚本有一些疑问。基本上,我有一个excel文件,里面有很多链接,我需要从中提取一些信息。但问题是我
的
代码只挑选最后一段数据,而不是
所有
数据。我需要一个脚本,打开
每个
excel文件,然后
抓取
信息,并保存为任何格式,如CSV或excel。 请找到我正在使用的当前脚本。import csvfrom selenium import webdriver driver = webdriver.Chrome
浏览 16
提问于2020-10-22
得票数 0
1
回答
检查树是否已展开或打开(Selenium / Python)
javascript
、
python
、
selenium
、
automation
、
tree
例如,我们有以下几行代码,这是父级(使用elements面板
的
DOM视图)。这是打开
的
树:li_attr: {id: "j1_1"} original
浏览 3
提问于2018-11-21
得票数 1
1
回答
BeautifulSoup
-查找连续
的
(无层次
的
) html元素
python
、
web-scraping
、
beautifulsoup
所以我正在解析一个设计不是很好
的
网站。元素并不是真正
的
分层结构。有一个巨大
的
div,它
的
结构如下:一堆我不关心
的
东西,然后下面的结构重复了任意次:p(
ul
其中括号之间
的
所有
内容
都可以重复任意次。我想提取这个模式
的
每个
实例,但由于没有包含
所有
实例
的
元素,我只能选择它们,所以遇到了麻烦。似乎我需要某种形式
浏览 0
提问于2018-05-08
得票数 0
2
回答
使用Python中
的
BeautifulSoup
从html中提取数据
python
、
html
、
beautifulsoup
我试图使用
beautifulSoup
从一个网站中提取数据.我想从这个HTML片段中提取数据<
ul
class="result-info info-bro-6 cc" style="display:</
ul
>我想提取
的
数据是“* /****”。我希望我
的
代码返回这个和这个,但是我目前拥有的代码正在返回li标记中
的
所有
数据。我怎么能只提取我想要
的
数据呢?这是我目前
的</
浏览 0
提问于2019-03-13
得票数 0
回答已采纳
1
回答
循环页面并对Python中
的
内容
进行爬网
python-3.x
、
web-scraping
、
beautifulsoup
、
python-requests
、
web-crawler
我想从
抓取
内容
我怎么能循环
所有
的页面并
抓取
红色圆圈中
的
所有
元素呢?谢谢。代码:import requestsfrom urllib.parse import urlparse r = requests.get(url) soup =
BeautifulSoup
(r.content, "html.
浏览 9
提问于2021-03-11
得票数 0
回答已采纳
1
回答
BeautifulSoup
的
find_all( )方法:查找确切
的
事件?
python
、
html
、
web-scraping
、
beautifulsoup
我正在使用Python和
BeautifulSoup
进行web
抓取
。例如,我有以下html代码要
抓取
: <li class="product-item">Product A</li>使用
BeautifulSoup
,我希望只查找属性为“class=-item”(仅限产品A)
的
产品,而不是“class=
浏览 2
提问于2014-03-30
得票数 0
1
回答
我想用漂亮
的
汤从python
的
链接中获取
内容
。
python
、
web-scraping
、
beautifulsoup
、
python-requests
我正试图从中删除这些数据我使用python、请求和bs4from bs4 import
BeautifulSoup
import urllib.request url = 'https://www
浏览 2
提问于2020-07-07
得票数 1
回答已采纳
2
回答
BeautifulSoup
不
抓取
动态
内容
python
、
html
、
dynamic
、
beautifulsoup
我
的
问题是,我想从这个页面获取相关链接:import urllib2 from bs4 import
Be
浏览 2
提问于2013-04-07
得票数 1
2
回答
无法使用<
header
> ()找到jQuery.siblings标记
javascript
、
jquery
</div> <div> <li> <p>...</a> </form> </
ul
浏览 6
提问于2016-02-03
得票数 2
回答已采纳
2
回答
Python 3.5.2 web-scraping - list索引超出范围
python
、
web-scraping
、
beautifulsoup
我是新
的
网络
抓取
,并试图
抓取
所有
内容
的
餐厅
的
详细信息形式,以便我可以继续我
的
进一步
抓取
。import requestsimport urllib r=requests.get(url) soup=
Beauti
浏览 5
提问于2016-09-21
得票数 0
1
回答
使用
BeautifulSoup
在Python上
抓取
列表
python
、
beautifulsoup
、
yahoo
我是Python
的
新手,我试着学习如何使用
BeautifulSoup
来刮网页。首先,我只是使用yahoo.com
的
HTML代码:我想刮掉从第577行开始,以633结尾
的
链接列表,然后获取它们
的
URL和标题,并将其放在Python中
的
表中。) YahooList = yahoo.find('
ul
浏览 2
提问于2016-02-09
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
开车开车!Python爬取妹子图
享学课堂浅谈Python3中BeautifulSoup的使用方法
送上一碗鸡汤——BeautifulSoup网页解析
我想用Python开个车,真的只是开个车
Python爬虫入门,快速抓取大规模数据
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券