腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
BeautifulSoup
,
尝试
从
包含
作者姓名
的
锚定
标记
中
提取
文本
python
、
beautifulsoup
、
screen-scraping
我正在
尝试
从
this图书网站上抓取一些数据。我需要
提取
标题和作者。我能够毫不费力地
提取
标题。但是,当有多个作者时,我在
提取
作者时遇到了问题,因为它们出现在同一行
中
,并且它们属于标题h4
中
的
单独锚
标记
。 White</a> </h4> 这是我
尝试
过
的
: book_container = soup.find_all('li', cla
浏览 20
提问于2020-10-21
得票数 1
回答已采纳
1
回答
在Python语言中使用
BeautifulSoup
解析数据
python
、
html
、
parsing
、
beautifulsoup
我正在
尝试
使用
BeautifulSoup
解析DOM树并
提取
作者
的
姓名。下面是一段HTML代码片段,显示了我将要抓取
的
代码
的
结构。--There are many other div tags with this structure--></html> 我
的
困惑是,当我执行soup.find时,它会找到我正在搜索
的
div
标记
的
第一个匹配项。在此阶段,如
浏览 1
提问于2009-10-01
得票数 10
回答已采纳
2
回答
Python,Beautifullsoup -获取href链接
python
、
python-3.x
、
beautifulsoup
我有问题,我
尝试
从
网站下载链接,但没有返回任何链接。我不知道我做错了什么。有人能帮帮我吗??谢谢..。 #!/usr/bin/python3import requestspage = "https://mojmikolow.pl/informacje,0.html"dat
浏览 48
提问于2021-01-29
得票数 1
回答已采纳
1
回答
需要selenium python定位名称
的
一些帮助
python
、
selenium
、
web-scraping
问题是,当你点击名字旁边
的
链接时,它会“展开”it...and下面的部分将你带到那里。没有办法知道哪个名称
的
相应链接在其描述中会有一封电子邮件。因此,我只能做到这两种情况
中
的
任何一种,但不是两种都得到。这是一个非常简单
的
site..so,查找元素没有问题。希望有人能帮我理解这里
的
逻辑。我正在做this..though这是不正确
的
,我知道。
浏览 0
提问于2021-01-05
得票数 0
1
回答
我应该如何刮刮由一个'p‘标签所代表
的
网站
的
文本
?
python
、
web-scraping
我是Python
的
新手,正在通过从中
提取
数据来练习web抓取。 import pandas as pd from bs4 import
Beau
浏览 3
提问于2020-01-06
得票数 0
1
回答
BeautifulSoup
提取
URL (相同
的
URL重复)
python
、
regex
、
url
、
csv
、
beautifulsoup
我
尝试
使用
BeautifulSoup
和regex
从
网页中
提取
URL。这是我
的
密码: Ref_pattern = re.compile('<TD width="200"><A href="(.*?)"你能帮我
提取
所有的URL并把它们写进CSV文件吗?谢谢。
浏览 6
提问于2014-06-27
得票数 0
回答已采纳
1
回答
(Python、
BeautifulSoup
)创建或修改不带锚点
标记
的
锚点
文本
列表
python
、
list
、
web-scraping
、
beautifulsoup
、
python-requests
我是Python
的
新手,我正在
尝试
构建一个
从
网站
提取
一些
文本
并将其粘贴到Google电子表格
中
的
脚本。
文本
是用标签包装在网站上
的
标题。我使用
BeautifulSoup
(也导入了pygspread )来
提取
标题,如下所示: target_url = 'WEBSITE URL' r = requests.get(target_url)soup =
BeautifulSou
浏览 16
提问于2019-12-24
得票数 0
回答已采纳
2
回答
从
包含
在具有相同类
的
div
中
的
多个链接中
提取
的
文本
的
单行打印问题
python
、
beautifulsoup
我正在
尝试
从一个具有相同类
的
几个div
的
页面中
提取
文本
。每个div
包含
不同数量
的
文本
链接。
从
每个div中
提取
的
文本
需要用一行打印出来。例如,如果一个div
包含
三个链接,另一个div
包含
两个链接,那么我希望
从
第一个div
中
的
三个链接中
提取
文本
,然后用一行打印结
浏览 0
提问于2019-08-30
得票数 0
回答已采纳
1
回答
提取
HTML表并将它们存储在单独
的
文件
中
python
、
html
、
web-scraping
、
beautifulsoup
我编写了一个代码来
提取
表
的
子部分,但是我希望
从
输入中
提取
每个
标记
,然后将它们存储在一个单独
的
html文件
中
。from bs4 import
BeautifulSoup
table = soup.find('table', {'class': '*'}) 我希望代码显示输入
文本
上
包含</em
浏览 0
提问于2019-07-21
得票数 0
回答已采纳
1
回答
如何有效地
从
docx/xml
中
删除表并
提取
文本
python
、
xml
、
beautifulsoup
、
lxml
删除表后,我在从.docx中
提取
文本
时遇到了问题。我正在处理
的
docx文件
包含
很多表,在
提取
文本
之前,我希望将这些表处理掉。我首先使用docx2html将docx文件转换为html,然后使用
BeautifulSoup
删除表
标记
并
提取
文本
。from docx2html import convert... temp = convert(Fil
浏览 6
提问于2013-09-21
得票数 1
回答已采纳
3
回答
查找
包含
特定
文本
的
标签
的
索引,请参见
beautifulsoup
/python
python
、
html
、
web-scraping
、
beautifulsoup
我有一个简单
的
4x2html表,其中
包含
有关属性
的
信息。 我正在
尝试
提取
Year Built列标题下
的
值1972。如果我找到了所有的
标记
td,如何
提取
包含
文本
Year Built
的
标记
的
索引?因为一旦找到那个索引,我就可以将4添加到
包含
值1972
的
标记
中
。<td>1972<&
浏览 1
提问于2015-10-13
得票数 2
回答已采纳
1
回答
如何在
BeautifulSoup
中
捕获内部
文本
和内部
标记
python
、
html
、
beautifulsoup
、
screen-scraping
我正在解析一个文档,它是一个
包含
div
标记
的
列表,但它有时也只有
文本
内联。我需要知道如何
从
它们中
提取
内容。说我有以下几点:<div>1</div>3</div> 我需要
提取
上面所有的
文本
,这样它就可以读到1234了。我有下面的代码,它获取所有的div
浏览 0
提问于2014-02-28
得票数 1
回答已采纳
1
回答
注释在网页上可见,但
BeautifulSoup
返回
的
html对象不
包含
注释部分
python
、
web-scraping
、
beautifulsoup
、
data-extraction
我
尝试
使用网址链接
从
网页中
提取
评论
的
文本
内容,并使用
BeautifulSoup
进行抓取。当我单击URL链接时,在页面上可以看到注释
的
内容,但是
BeautifulSoup
返回
的
HTML对象不
包含
这些
标记
和
文本
。 我使用带有'html.parser‘
的
BeautifulSoup
来做网页抓取。我成功地
提取
了给定网页中视频<e
浏览 19
提问于2019-03-25
得票数 1
回答已采纳
2
回答
Python BS4美汤HTML.Parser在网站上不起作用
python
、
beautifulsoup
我有Python3.7代码,
尝试
从
以下网站()
提取
足球统计数据。看起来我在BS4美丽汤中使用
的
超
文本
标记
语言解析器根本没有
提取
网站
中
的
任何标签。我首先
尝试
提取
特定
的
标签,比如表示主队和客队
的
两个不同
的
div标签,以及
包含
球员姓名
的
标签。当这呈现了一个空
的
标签列表时,我只是简单地
尝试</
浏览 26
提问于2019-07-13
得票数 2
回答已采纳
7
回答
将</br>转换为结束行
beautifulsoup
我正在
尝试
使用
BeautifulSoup
提取
一些
文本
。为此,我使用了get_text()函数。 我
的
问题是,
文本
包含
</br>
标记
,我需要将它们转换为结束行。我该怎么做呢?
浏览 0
提问于2012-09-23
得票数 41
回答已采纳
1
回答
如何将美汤字符串转换为utf-8编码
python-2.7
、
unicode
、
utf-8
、
beautifulsoup
我正在运行Python2.7
中
的
一个解析器,它从数据库中
提取
xml代码
的
文本
字段,并使用Beautiful Soup在xml
中
查找和
提取
不同
的
标记
。当我
从
xml
中
的
标记
中
提取
标记
并转到给定
文本
时,它将返回<name>Josef Šimánek</nam
浏览 1
提问于2015-09-19
得票数 1
2
回答
Python、
BeautifulSoup
- <div>
文本
和<img>属性按正确顺序排列
python
、
html
、
beautifulsoup
我有一个简短
的
HTML,我想通过使用
BeautifulSoup
运行。我有基本
的
导航系统,但这次我很困惑。我不知道如何依次遍历div-
标记
。我可以执行以下操作来
提取
div-
标记
中
包含
的
所有
文本
print html.get_text() 要获得div-
标记
中
包含
的
所有<em
浏览 2
提问于2013-12-15
得票数 5
回答已采纳
3
回答
关于
BeautifulSoup
中
get_text()
的
建议
python
、
beautifulsoup
我正在使用
BeautifulSoup
解析html页面
中
的
一些内容。我得到了这样
的
结果: <span class="myclass
浏览 3
提问于2013-04-20
得票数 10
回答已采纳
1
回答
一种使用
BeautifulSoup
提取
特定<p>标签
的
方法?
python
、
html
、
beautifulsoup
我遇到了使用BS4
从
p
标记
中
提取
文本
的当前问题。我需要
提取
的
是
包含
文本
的
p
标记
,但也存在其他p
标记
。我目前拥有的是:div = soup2.find("div"
浏览 8
提问于2017-03-31
得票数 0
1
回答
当元素确实存在时,
BeautifulSoup
返回'None‘
python
、
beautifulsoup
首先,如果我错过了一些非常简单
的
东西,我道歉,我已经看了很多问题,但终生都找不到答案。基本上,我试图收集
文本
的
网站是这样
的
: url = 'https://www.otcmarkets.com/stock/MNGG/overview'soup =
Be
浏览 34
提问于2021-02-27
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
爬虫入门——详解Python是如何进行网页抓取!
使用Python进行网页抓取的介绍
利用Python和BeautifulSoup进行网页爬取
利用Python和Repl.it进行网页信息爬取
用python3教你任意Html主内容提取
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券