腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
bs4
提取
标题
标签
中
的
链接
和
标题
、
、
、
我
使用
了以下代码:import requests "https://www.olivemagazine.comtomatoes-and-lardo-on-toast-with-basil-oil/">Tomatoes and lardo on toast with basil oil</a></h3> 从这里,我想
提取
锚
标签
浏览 20
提问于2021-05-25
得票数 0
回答已采纳
1
回答
BeautifulSoup python:获取不带标记
的
文本并获取相邻
链接
、
、
我正在尝试从这个site中
提取
电影
的
标题
和
链接
from
bs4
import BeautifulSoup #r = open('json.html','rb').read()a = b.findAll
浏览 15
提问于2019-03-06
得票数 0
2
回答
仅
提取
链接
和
标题
、
、
、
、
我试图
提取
这些
链接
的
链接
和
动画网站
的
标题
,然而,我只能
提取
整个
标签
,我只想要
的
href
和
标题
。下面是我
使用
的
代码:from
bs4
import BeautifulSoup r = requests.get('http://animeonline.vip/
浏览 20
提问于2016-09-09
得票数 0
回答已采纳
1
回答
如何
使用
漂亮
的
汤动态地抓取内部
链接
、
我
的
需求是从网页
中
获取
标题
、图像
和
摘要。我成功地获得了
标题
,图片
和
锚
标签
链接
。但是我不能找到如何发送这个锚
标签
链接
来获取摘要。import requests source = reque
浏览 13
提问于2019-08-19
得票数 1
1
回答
提取
Youtube搜索结果
的
问题
、
、
我是Python新手,学习了
使用
bs4
进行Web抓取
的
基础。在这里,我试图
提取
Youtube搜索结果
的
所有
链接
,但它不像其他网站那样工作。我分析了搜索结果html数据,搜索结果
的
链接
在带有id“视频
标题
”
的
锚
标签
中
,但是
标签
没有出现在我
的
bs4
解析
的
html文档
中
。from
bs4</
浏览 0
提问于2019-05-09
得票数 3
回答已采纳
2
回答
试图在
标题
和
内容中进行擦拭
和
分隔。问题是,两者都有相同
的
类
和
标签
,如何隔离?
、
、
我试图在网络上抓取更多
的
,将其分为两个部分:
标题
和
内容,问题是两者都有相同
的
类
和
标签
。除了
使用
regex
和
硬编码之外,如何区分
和
提取
excel
中
的
2列?在图片()或提供
的
网站
链接
中
,bold(除了字母表字母(A)
和
后面的‘回到顶部’)表示
标题
和解释(在粗体下面非粗体)表示内容(内容甚至由站点后
浏览 0
提问于2019-04-22
得票数 0
回答已采纳
3
回答
获取属性错误:“NoneType”对象没有属性getText
、
、
、
我已经写了一半
的
代码,从RSS提要中
提取
标题
和
链接
,但这会导致上述错误。在获取文本时,这两个函数中都存在错误。我想去掉输入
的
标题
和
链接
标签
的
字符串。from
bs4
import BeautifulSoupimport re a= str(a) i
浏览 3
提问于2013-10-27
得票数 1
回答已采纳
1
回答
将
标题
列表与相应
链接
的
单独列表配对
的
最佳方法?(
bs4
)
、
、
、
最终编辑:下面是解决方案- -原始文章:我
使用
bs4
来刮一个食谱网站,在那里每个菜谱
的
标题
没有保存在
链接
标签
中
因此,我从代码
的
一部分
提取
了菜谱
的
标题
,从另一部分
提取
了
链接
,我得到了这两个列表(菜谱、
链接
),但我不确定将每个
标题<
浏览 1
提问于2021-03-13
得票数 1
3
回答
使用
BeautifulSoup从
标题
标签
下
提取
数据?
、
、
、
在通过python
中
的
BeautifulSoup库获取
链接
的
HTML之后,我想
提取
链接
的
标题
。基本上,整个
标题
标签
是我想
提取
“标记”<e
浏览 1
提问于2016-09-21
得票数 2
回答已采纳
1
回答
在html <script>中
使用
BeautifulSoup在python3
中
提取
标题
、
、
、
我有一个html页面,我想
提取
标题
,它在
标签
和
内部对象_BFD.BFD_INFO。我已经访问了所有的数据,但它有很多其他
的
数据,如
链接
等,现在我不知道如何访问
标题
,我想
提取
。请帮我一把。到目前为止,我编写
的
代码是import urllib3.requestrequests.get('https://
浏览 1
提问于2018-06-07
得票数 0
回答已采纳
1
回答
Web抓取youtube页面
、
、
我正在尝试获得youtube视频
的
标题
,并给出一个
链接
。import requests listed_url = "https://www.youtube.com/watch?= soup.
浏览 0
提问于2021-10-14
得票数 0
1
回答
Python抓取--不可能刮这个站点吗?
、
我想刮下以下网站:https://www.globenewswire.com/NewsRoom 我
的
目标是将新闻稿和文章存储在我稍后
使用
的
数据库
中
。我也对其他新闻网站这样做,为了更容易阅读,我删除了这里
的
代码(100%不影响提供给您
的
代码)。我
的
问题是,我不知道如何准确地抓取
标题
、
链接
和
其他数据,因为html代码是用不寻常
的
属性构造
的
。下面的代码是我如
浏览 2
提问于2021-06-27
得票数 1
回答已采纳
1
回答
转到
链接
的
Python脚本
、
大家早上好,你能帮帮我吗? 谢谢:)
浏览 2
提问于2020-07-25
得票数 0
回答已采纳
2
回答
在
使用
链接
模块时,如何从内容创建表单
中
隐藏"URL*“
标签
?
我
使用
链接
模块向用户请求
链接
。我已经禁用了
链接
文本(I.E>,锚标记
中
的
文本),这样用户就不会被要求提供
标题
。我希望发生
的
是,我不会看到字段
标签
,后面是
标签
"URL*“。然而,情况并非如此。例如,我
的
字段
标签
是Download link。我在节点创建表单中看到
的
是像Download link*这样
的
标签
,然后是文
浏览 0
提问于2014-08-18
得票数 1
回答已采纳
1
回答
Python
和
Selenium -从多个兄弟姐妹
中
刮取数据
、
、
、
我试图抓取一页数据,然后在python中
使用
该数据,并让selenium单击
链接
和
存储时间等. </td><tr> <a href>link3</a></tr&
浏览 2
提问于2014-03-06
得票数 1
回答已采纳
1
回答
如何用美汤获取无序列表
中
的
内容
、
nofollow" class="external text" href="Mylink.com"><font color="#547794"><u>My link Title</u></font></a> 我能够
提取
"a“
标签
,但我如何
提取
标题
”我
的
链接
标题
“
中
的</e
浏览 5
提问于2021-12-09
得票数 1
回答已采纳
2
回答
即使我有<title>
标签
,Google也会显示
链接
的
名称,而不是结果
中
的
实际
标题
。
、
、
、
我今天注意到,在某些情况下,在我
的
页面的谷歌结果
中
,一些
标题
结果不是用<title>标记显示
的
,而是用
链接
名称显示
的
。前面的例子如果contact
链接
是contact,
标题
是hi let's talk,google选择显示contact 当我提交包含翻译页面的更新
的
站点地图时,我注意到了这一点,例如,我有一个英文版本
和
一个意大利文版本这个奇怪
的
东西在意大利版本
中</em
浏览 0
提问于2015-07-12
得票数 2
1
回答
来自实体/路由
的
链接
字段
标题
、
我有一个Drupal
链接
字段配置为允许内部
和
外部
链接
,并启用
标题
字段,但可选。我希望用户能够引用内部实体,而不必在单独
的
标题
字段中指定任何内容,并从实体
标签
中
提取
链接
字段
的
标题
。但是,当字段
的
内部title值被保留为null时,Drupal最终
使用
字段
的
uri值作为
链接
标题
。这种行为在我看来很奇怪。我<e
浏览 0
提问于2018-11-21
得票数 2
1
回答
使用
BeautifulSoup解析HTML标记
、
、
、
、
我正在解析一个有很多超
链接
的
网页。通过在<a>
标签
中找到所有的“href”,能够
使用
漂亮汤
提取
超
链接
。接下来,我试图获得所有这些
链接
的
“
标题
”,这些
链接
显示为<a>标记
的
标记内容。需要
提取
。感谢你
的
帮助。</a>import requests from
bs4
import Beautiful
浏览 3
提问于2017-10-12
得票数 1
回答已采纳
1
回答
在python
中
为任何网页URL文档搜索特定
标题
的
文本
、
、
、
我已经搜索并介绍了python
中
的
一些网络爬行库,比如scrapy,漂亮汤等。
使用
这些库,我想抓取文档
中
特定
标题
下
的
所有文本。如果你们
中
的
任何人能帮助我,我将不胜感激。我看过一些教程,教你如何
使用
漂亮
的
soap获取特定类名下
的
链接
(通过查看源页面选项),但如何获取简单
的
文本,而不是特定类
标题
下
的
链接
。对不起,我
浏览 0
提问于2017-10-25
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Matplotlib中的titles(标题)、labels(标签)和legends(图例)
text generator模板的使用,头脑风暴,标题标签生成,校对内容等
ID如何将全文的标题进行更改和设置?如何在文本中插入页码?
数据分析师的编程之旅——Python爬虫篇(2)HTML解析器
Python爬虫教程:简书文章的抓取与存储
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券