腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
使用
BeautifulSoup
拆分HTML文档
python
、
html
、
beautifulsoup
在某些情况下,聚合的
超文本
标记
语言
文档必须按章节(以H1
标记
开头的专用
超文本
标记
语言
页面)或子章(以每个H1或H2
标记
开头的专用
超文本
标记
语言
页面)拆分。到目前为止,我们使用
BeautifulSoup
来操作聚合的
超文本
标记
语言
,但是我们无法找到一种合适的方法来使用
BeautifulSoup
以合适的方式
提
浏览 2
提问于2011-02-24
得票数 4
回答已采纳
1
回答
当元素确实存在时,
BeautifulSoup
返回'None‘
python
、
beautifulsoup
基本上,我试图收集
文本
的网站是这样的: url = 'https://www.otcmarkets.com/stock/MNGG/overview'soup =
BeautifulSoup
(page.content, "html.parser") ticker = soup.find
浏览 34
提问于2021-02-27
得票数 0
1
回答
BeautifulSoup
超文本
标记
语言
提取
文本
python
、
html
、
css
、
beautifulsoup
我是第一次使用
BeautifulSoup
,并试图从html (已下载)中
提取
一个笑话。但不幸的是,没有类可以用来
提取
信息。 有一行“开始”和“结束的笑话”,我想要的是标题以及笑话的
文本
。from bs4 import
BeautifulSoup
contents = f.read() soup =
BeautifulSoup
(contents, 'lxm
浏览 18
提问于2020-04-13
得票数 0
2
回答
将HTML/XML格式的网站转换为RDF
rdf
、
semantic-web
我想把任何html网站上的数据转换成rdf。你知道什么是html到rdf的转换吗?或者,您是否建议为此使用XQuery或GRDDL?
浏览 1
提问于2011-02-02
得票数 0
1
回答
如何在网站
BeautifulSoup
不变的情况下使用Python?
python
、
html
、
web-scraping
、
beautifulsoup
我想从一个网站
提取
数据使用
BeautifulSoup
(或其他网络抓取工具),虽然我正在努力,因为网站的网址是相同的,您登录之前和之后作为一个用户。当我尝试用BS4获取网站的
超文本
标记
语言
代码时,我得到的是登录前的
超文本
标记
语言
代码,尽管在登录后需要访问
超文本
标记
语言
。这就是我所拥有的:import requests
浏览 2
提问于2020-11-30
得票数 1
1
回答
用
beautifulSoup
抓取CSS信息
python
、
css
、
web-scraping
、
beautifulsoup
我想知道是否有一种方法可以知道网站是否响应了
beautifulSoup
?更特别的是,我们是否可以用
BeautifulSoup
检查CSS代码,或者您只能使用HTML。
浏览 2
提问于2016-05-11
得票数 0
1
回答
如何使用python转换html数据
python
、
extract
我的目的是从td块中
提取
数据到文件中,但是我停留在这里。提前谢谢你。
浏览 0
提问于2013-06-10
得票数 0
回答已采纳
4
回答
Python:将HTML代码段分隔为段落
python
、
html
、
beautifulsoup
、
lxml
(我指的是p
标记
。)我想把字符串分成不同的段落。例如:<p class="my_class">Hello!</p> <p>What's up?
浏览 0
提问于2010-02-17
得票数 3
回答已采纳
2
回答
获取
标记
中的数据(HTML内容)
python
、
html
、
beautifulsoup
<meta itemprop="price" content="4.05"/>我在Python中使用
BeautifulSoup
。
浏览 0
提问于2014-08-20
得票数 1
1
回答
在Python中
提取
XML
标记
字符串的有效方法
python
、
xml
、
mongodb
、
kml
、
geojson
我的任务是抓取一个kml文件,
提取
1个标签值,然后在geojson中将其发送到Mongo。我将以二进制请求对象的形式获取文件。考虑到我有多个源需要按分钟扫描,所以即使一次运行可能不会花那么长时间,它也会累积起来(要知道实际的文件导入成本将比任何
提取
过程都要高)。 soup =
BeautifulSoup
(doc, 'lxml-xml')
浏览 0
提问于2016-11-14
得票数 0
1
回答
从
BeautifulSoup
中与特定模式匹配的页面中
提取
所有URLS
python
、
beautifulsoup
我正在使用
BeautifulSoup
解析一个
超文本
标记
语言
页面。我需要从一个页面
提取
所有的URL和句子,匹配一个特定的正则表达式模式。例如。我该怎么做呢?
浏览 0
提问于2011-01-15
得票数 1
回答已采纳
1
回答
BeautifulSoup
超文本
标记
语言
提取
表格数据
python
、
beautifulsoup
、
extraction
到目前为止,我已经成功地逐个
提取
了货币名称,但我确实需要一个货币名称列表,如下所示 currencies = ['Euro','Australian dollar','Canadian dollar']稍后,我还需要从每个TR元素的最后一个TD元素中
提取
数据。
浏览 0
提问于2013-02-04
得票数 4
回答已采纳
1
回答
创建一个python脚本以登录到网站并
提取
HTML数据
python
、
html
、
curl
、
beautifulsoup
嗨,我希望有人能帮助我,谢谢
浏览 0
提问于2013-04-30
得票数 1
3
回答
在浏览器(由
BeautifulSoup
生成)中直接从Python启动HTML代码
python
、
html
、
python-3.x
、
beautifulsoup
我已经使用Python3.3的
BeautifulSoup
成功地从网页中
提取
了所需的信息。我还使用了
BeautifulSoup
生成新的
超文本
标记
语言
代码来显示此信息。所以我的问题是,有没有办法用Python
语言
在浏览器中启动由
BeautifulSoup
生成的HTML代码,这样我就不需要使用复制粘贴的方法了?
浏览 2
提问于2014-01-30
得票数 26
回答已采纳
1
回答
美丽的汤找不到基本的HTML数据
python
、
html
、
web-scraping
、
beautifulsoup
我正在尝试使用
BeautifulSoup
从页面中
提取
数据。我获得了我的
超文本
标记
语言
数据(类型:bs4.element.ResultSet),它包含多行代码,比如下面的代码,我想把它们编译成一个列表: <td class="va-infobox-label"我的最终目标是从这个
超文本
标记
语言
中获得一个标签列表,根据我的示例(title="">Weight<),其中一个将是'weight
浏览 17
提问于2020-10-01
得票数 1
回答已采纳
2
回答
美丽的汤和表格抓取- lxml与html解析器
python
、
web-scraping
、
html-parsing
、
beautifulsoup
、
lxml
我正在尝试使用
BeautifulSoup
从网页中
提取
表格的
超文本
标记
语言
代码。from urllib import urlopen webpage = urlopen('http://ww
浏览 3
提问于2014-09-08
得票数 14
回答已采纳
2
回答
从HTML代码获取图像宽度
python
、
selenium
、
web-scraping
、
beautifulsoup
、
phantomjs
我可以使用
BeautifulSoup
获取图像的width属性,如下所示:width = img["width"] 问题是width可以在CSS文件中设置,我希望在不从img["src"]下载图像的情况下
提取
值,如果在某个地方设置了值(
超文本
标记
语言
或CSS),或者获取浏览器将呈现的默认值(如果没有设置),我如何在Python
语言
中
提取
该值?
浏览 16
提问于2016-09-17
得票数 1
回答已采纳
1
回答
BeautifulSoup
只返回head
标记
内的内容
python
、
url
、
web-crawler
、
beautifulsoup
我正在使用
BeautifulSoup
,我发现了一个错误或者是我的一个错误。在我的示例中,我爬行了纽约时报的一个子部分网站...from bs4 import
BeautifulSoup
data =
BeautifulSoup
(urllib2.urlopen(website).read())当我运
浏览 0
提问于2013-01-14
得票数 4
回答已采纳
2
回答
通过python加载网站内容
python
、
load
如何通过python从网站加载特定内容?例如,我想加载博客的一些帖子并将它们显示在我自己的site.How中。我可以这样做吗?
浏览 2
提问于2011-03-25
得票数 1
2
回答
在PYTHON中,表单不能通过MECHANIZE提交!
python
、
mechanize
from mechanize import *from
BeautifulSoup
import
BeautifulSoup
br.open现在我希望它能显示这个的
超文本
标记
语言
,但它并没有这样做,而是返回了同一页面的
超文本
标记
语言
。我不明白为什么?
浏览 0
提问于2010-08-05
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
什么是HTML超文本标记语言
SEO实操方法之超文本标记语言,不懂这些代码做不了SEO!
我今天就要说HTML就是一门编程语言!只有外行才说它是超文本标记语言!
python教程|如何批量从大量异构网站网页中获取其主要文本?
Python自然语言处理:使用SpaCycle库进行标记化、词干提取和词形还原
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券