腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
有
选择
地
从
div
标签
中
抓取
href
?
python
、
web-scraping
、
beautifulsoup
我正在试着从一个新闻网站上
抓取
URLS。具体
地
说,它们是针对特定搜索词的搜索结果
中
列出的新闻文章的URL。我刚接触BeautifulSoup,我不知道
如何
有
选择
地
抓取
链接到一篇文章的
href
(当我试图
抓取
div
标签
中
的子
href
时,我只得到一个空集,而当我
抓取
一个标记时,我得到的URL远远多于我想要的。
有
什么想
浏览 24
提问于2020-03-21
得票数 0
回答已采纳
1
回答
使用xpath和regex获取单个链接上的文本
python
、
html
、
regex
、
web-scraping
、
scrapy
我正在做一个
抓取
项目,我们正在
抓取
一个新闻网站。
有
一个包含站点
标签
的
div
,它可能有几个链接。例如: <
div
class="article__tags">OPS<a
href
="/example/covid-19.html">
浏览 18
提问于2021-04-01
得票数 0
回答已采纳
1
回答
JSoup:访问多个HTML类
中
的数据
html
、
jsoup
我最近开始使用JSoup来
抓取
HTML数据,但是我在jsoup.org上找不到关于
如何
找到嵌套在其他
div
类
中
的
div
类的详细信息。<
div
class="Food"> <
div
class="Groceries">
浏览 3
提问于2018-03-12
得票数 0
1
回答
用SimplePie显示RSS图像
php
、
rss
、
simplepie
我正在设置一个
从
多个RSS提要
中
抓取
第一个条目的页面。我遇到了很多格式不同的RSS提要。我使用SimplePie来解析提要。[CDATA[Information on Title of Product]]></title><summary type="xhtml"> <
div
xmlns="h
浏览 0
提问于2011-01-29
得票数 1
1
回答
选择
要传递给BeautifulSoup的select方法的适当标记
python
、
css
、
beautifulsoup
、
css-selectors
我的问题是,我似乎不知道
如何
根据我在Chrome中使用开发人员工具找到的内容来
选择
合适的
标签
。<
div
data-hveid=.....> <a
href
="https://www.python.org/".....> <h3 class但是当我使用检查器时,我得到了"a
href
“
浏览 11
提问于2019-02-16
得票数 0
回答已采纳
1
回答
用漂亮的汤
从
div
标签
中
抓取
href
python-3.x
、
web-scraping
、
beautifulsoup
、
selenium-chromedriver
我
有
一个带有
div
标签
的页面源代码,就像下面的示例页面源代码。我想像下面的例子一样
抓取
所有的urls,并将它们保存在一个列表
中
。"ember1513" class="job-card-search__link-wrapper js-focusable-card disabled ember-view"> 我尝试使用下面的代码
从
href
中
抓取
urls。我正在尝试使用span类来只过滤包含j
浏览 17
提问于2019-04-16
得票数 1
1
回答
用烧瓶和刮水器进行交互式刮擦
python
、
flask
、
web-scraping
、
scrapy
我正在使用烧瓶和
抓取
刮
从
网站的结果。在这里,烧瓶网页是能够获取输入URL被刮,然后开始爬行。在此之前,一切都很好。现在,我想让这个Flask网页以HTML
标签
(它包含一些要被
抓取
的项目的信息)作为输入,并且基于输入
标签
的结果应该被
抓取
。简单
地
说,用户可以决定哪些项目应该报废,即项目应该被
选择
dynamically.Provide我
有
一些想法,我
如何
传递这些
标签
来设置在项目类别
中
要刮
浏览 1
提问于2015-08-18
得票数 0
回答已采纳
2
回答
不能使用BeautifulSoup刮取嵌套标记
python
、
web-scraping
、
beautifulsoup
我正在尝试我的手在网络
抓取
,我目前被困在
如何
从
'a‘
标签
,这是嵌套在2个
div
,反过来在'li’
标签
中
的
href
链接。例如,为了方便
地
描述问题,请考虑以下代码: <
div
class="b">
浏览 0
提问于2019-08-12
得票数 1
回答已采纳
1
回答
如何
使用javascript
选择
嵌套在表的tr内的所有锚标记
href
URL
javascript
、
html
、
dom
、
css-selectors
、
puppeteer
但是这些urls嵌套在一个表
中
。我需要
抓取
该页面的前10个甚至20个URL。以下是该网站的结构 Html body
标签
有一个带有#body的
div
标签
,在这个
div
中有3个表,第二个表是带有#body的
div
中
的第9个子表。--页面上有3个Html表,但是我想要
抓取
的URL在第二个表
中
下面是第二个表的样子 <table> <tr> <th>Fol
浏览 15
提问于2021-10-16
得票数 0
2
回答
如何
刮掉紧跟某一元素的元素?
python
、
beautifulsoup
我
有
一个Html文档,如下所示: <a
href
="unwanted link"></a> <a
href
="
浏览 5
提问于2015-12-27
得票数 6
回答已采纳
3
回答
有
选择
地
从
<
div
>获取文本
javascript
、
jquery
<
div
class="myDiv"> <a title="And this"
href
="#">but notthis</a> <p>And also<strong>This</strong> <a
浏览 0
提问于2012-02-16
得票数 1
回答已采纳
0
回答
无法使用python漂亮的汤获取项目
python
、
beautifulsoup
我正在努力学习
如何
用漂亮的汤+蟒蛇进行网络
抓取
,我想从上
抓取
摄影师的名字,但我想不出
如何
分离文本。我想要的html如下所示,我想输出的是"Steven Poster":<
div
class="text-sluglist"><p> <a
href
="
浏览 2
提问于2017-12-06
得票数 0
回答已采纳
1
回答
我
如何
使用php简单dom
抓取
无效的html?
php
、
domparser
、
simpledom
我正在尝试使用phpsimpledom
抓取
网页。$html = '<
div
class="namepageheader"> <
div
class="u">Age: </
浏览 7
提问于2021-06-12
得票数 0
1
回答
python:'NoneType‘对象没有属性'text’
beautifulsoup
、
scrapy
、
web-crawler
、
mechanize
我正在用漂亮的汤做python
抓取
,我正在爬行的网站
有
一个包含标题、链接和文本的28个容器,文本在<p>
标签
中
,我的问题是我可以
抓取
所有的数据,但是有些<p>标记没有文本,所以我收到一个错误"AttributeError: 'NoneType' object has no attribute 'text'" --我的代码是: containers = page_soup.findAll("
div
浏览 0
提问于2018-05-20
得票数 0
回答已采纳
2
回答
php
中
的数组,可以在单击锚定标记时显示一行。
php
、
javascript
、
mysql
他说,不是在点击新链接时不断
地
will数据库,而是将php数组缩小到
有
问题的楼层,并将其转换为javascript对象,这样数据就会在那里,而不必一直
从
数据库
中
抓取
它。这就是我正在尝试做的-我
有
一个楼层地图和一个锚
标签
在座位上,当它被点击时,我希望来自数据库的信息出现在地图上方的另一个
div
中
。现在我
有
了一个具有特定floor的php数组,但根据我所读到的内容,我需要将其转换为json。现在,我将
如何</em
浏览 1
提问于2012-09-20
得票数 0
回答已采纳
2
回答
如何
在python
中
抓取
唱段
标签
文本?
python
、
web-scraping
我想从网站上刮球员名单,但名字在
标签
上。我不知道怎么刮
标签
上的文字。以链接https://athletics.baruch.cuny.edu/sports/mens-swimming-and-diving/roster为例,我们
如何
从
标签
中
抓取
文本?<
div
class="sidearm-roster-player-image column"><a data-bin
浏览 26
提问于2020-10-31
得票数 1
1
回答
如何
使用漂亮的汤动态
地
抓取
内部链接
python
、
beautifulsoup
我的需求是
从
网页
中
获取标题、图像和摘要。我成功
地
获得了标题,图片和锚
标签
链接。但是我不能找到
如何
发送这个锚
标签
链接来获取摘要。soup = BeautifulSoup(source, 'lxml') m
浏览 13
提问于2019-08-19
得票数 1
2
回答
意外令牌:关闭
div
标记
php
、
html
我
有
下面的代码。当我运行它时,我在控制台中收到一条错误消息,显示
有
一个意外的标记--关闭
div
标记。我不知道为什么。如果if语句返回false,则没有问题。<
div
class="container text-center"> <br><br>
浏览 0
提问于2018-04-30
得票数 1
回答已采纳
2
回答
我不能
抓取
每个链接内容的具体时间段
从
确实
python
、
selenium
、
selenium-webdriver
、
web-scraping
、
selenium-chromedriver
我正在使用python和selenium进行web
抓取
。 我正在试着从事实上
抓取
数据。我写了以下代码,但是它正确
地
获取了页面上的所有链接,然后当我试图打开每个链接时,它只打开了第一个链接。我怎样才能打开我一个接一个的链接。EC.presence_of_element_located((By.ID, "resultsCol")) divs = td.find_elements_by_tag_name("
div
") for
div
in d
浏览 33
提问于2020-07-15
得票数 1
回答已采纳
2
回答
如果使用对象标记,则jquery .html()在IE
中
不起作用
jquery
、
html
、
internet-explorer
我
有
以下代码: <object data="some-file.swf"> </object>我想
抓取
#object-container的内容,并将它们注入到页面上的不
浏览 0
提问于2011-06-09
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
教你分分钟学会用python爬虫框架Scrapy爬取心目中的女神
如何利用Python爬取网络小说
NET Core 实现简单爬虫—抓取博文列表
net core 实现简单爬虫—抓取博客园的博文列表
Python新手爬虫,简单制作抓取廖雪峰的教程的小爬虫
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券