腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
python
的
HTML
解析器
,
可以
跟踪
标
签在
HTML
文档
中
的
位置
、
、
我正在使用
python
解析
HTML
页面。我需要定位某些标签,并以字节为单位测量它们之间
的
距离。我使用了BeautifulSoup,但它无法获取found标签
的
位置
。有没有能做到这一点
的
python
库?谢谢
浏览 13
提问于2020-10-22
得票数 0
1
回答
现有的函数不是函数吗?
、
我
的
函数正常工作,直到突然单击一个应该运行download()
的
按钮,但它不运行。因此,我打开控制台,看到如下:我很困惑。所以我认为这可能是onclick
的
一个问题(我
的
按钮有onclick="download()"),所以我使用JavaScript来添加单击事件。$("#download").onclick=download() 注意:$()是一个定制
的
jQuery函数,而不使用框架本身
浏览 4
提问于2018-04-18
得票数 1
回答已采纳
2
回答
使用find时BeautifulSoup挂起
、
、
、
、
我有一个
html
文档
,如下所示:<p> this is tab </p></body></
html
>这是我
的
代码: from bs4 import Be
浏览 0
提问于2016-03-18
得票数 3
3
回答
如何消除BeautifulSoup用户警告?
、
安装BeautifulSoup后,每当我在命令行
中
运行
Python
时,就会发出以下警告:UserWarning: No parser was explicitly specified, so I'm using the best available
HTML
parser for this system ("
html
.parser
浏览 4
提问于2015-11-04
得票数 67
回答已采纳
1
回答
未显示BeautifulSoup4标记内容
、
、
我试着从一个网站上抓取一些数据,发现BeautifulSoup4并没有像我期望
的
那样显示全部内容。在下面的第一个示例
中
,一切运行正常。不幸
的
是,在第二种情况下,以同样
的
方式找到标题,它返回
的
内容只有1个元素,我预计会有3个元素。我希望内容包含'a‘标签,文本和跨度,但它似乎只有'a’标签。编辑:我发现问题出在解析
html
响应
的
某个地方,因为它将第二个示例
中
的
更改为如下所示: <h1 class="t
浏览 15
提问于2020-09-08
得票数 0
1
回答
使用“另存为”下载
的
HTML
与使用
Python
请求下载
的
HTML
略有不同
、
、
、
因此,我使用以下代码通过请求将页面下载到另一个
html
文件
中
:with open('page_content.
html
“另存为
html
”页具有正确
的
结束标记,但“请求”页缺少某些标记
的
结尾。例如,另存为
文档
的
所有标记都已关闭: <td>stuff</td> </
浏览 0
提问于2019-05-13
得票数 0
3
回答
一个快速
的
python
HTML
解析器
、
、
、
我写了一个
python
脚本,处理大量下载
的
网页
HTML
(120K页面)。我需要解析它们并从中提取一些信息。我试过使用BeautifulSoup,它简单直观,但运行起来似乎超级慢。因为这是必须在弱机器(在amazon上)上例行运行
的
东西,所以速度很重要。在
python
中有没有比BeautifulSoup快得多
的
HTML
/XML
解析器
?或者我必须求助于正则表达式解析..
浏览 0
提问于2012-03-13
得票数 14
回答已采纳
2
回答
用Erlang编写
HTML
解析器
、
我对Erlang非常陌生,作为学习练习
的
一部分,我想用Erlang编写一个
HTML
解析器
。我认为我需要将
文档
转换为一堆令牌,也许
可以
使用有限状态机来
跟踪
我在嵌套方面的
位置
以及我在元素
中
的
位置
浏览 8
提问于2010-06-24
得票数 9
回答已采纳
2
回答
美丽
的
汤和表格抓取- lxml与
html
解析器
、
、
、
、
我正在尝试使用BeautifulSoup从网页中提取表格
的
超文本标记语言代码。我想知道为什么下面的代码与"
html
.parser"一起工作,并打印回none,如果我将"
html
.parser"更改为"lxml"。
浏览 3
提问于2014-09-08
得票数 14
回答已采纳
1
回答
使用BeautifulSoup进行网络抓取返回NoneType
、
page = requests.get("https://gematsu.com/tag/media-create-sales") print (content) print ("Exception") 但是,这将返回一个NoneType,即使div在网站上具有正确
的
ID我看到页面上有id
浏览 1
提问于2019-01-18
得票数 3
回答已采纳
1
回答
如何在jsoup
中
获取元素或节点
的
文本点
、
我正在使用jsoup,我需要知道Jsoup中元素或节点
的
文本点。例如:我有
html
:<p><span>1</span></p>,那么我需要知道<p>
的
文本点是0,<span>是4,</span>是10……如何做到这一点?
浏览 1
提问于2015-09-05
得票数 0
1
回答
如何使用BeautifulSoup查看闭合标签
的
总数?
、
下面的代码检查是否有一个以上
的
打开
html
标签, <
html
> </
html
>""" print len(sou
浏览 0
提问于2014-03-02
得票数 1
2
回答
这个解析XHTML时
的
XPath查询是错误
的
吗?使用TouchXML
、
、
、
、
我一直在尝试通过TouchXML解析XHTML
文档
,但它总是无法通过XPath query找到任何标签。XHTML <!DOCTYPE
html
PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"因此,我们
可以
看到有一个"
浏览 0
提问于2011-08-12
得票数 5
回答已采纳
1
回答
'BeautifulSoup‘和'lxml’之间有什么关系?
、
、
、
在“lxml's ”
中
,它写道: 美丽
的</em
浏览 2
提问于2015-08-25
得票数 3
回答已采纳
2
回答
具有store_true标志
的
可选子
解析器
、
、
、
如果我
的
术语取消了,请原谅我,但是我正在寻找一种方法,将子
解析器
添加到一个可选
的
arg解析参数
中
,每个arg上都有store_true标志。理想情况下,我希望使用以下语法来引用--
html
子
解析器
中
的
布尔值: print("Doing a thing") parser = argparse.ArgumentParser", action="s
浏览 3
提问于2013-10-03
得票数 0
回答已采纳
17
回答
bs4.FeatureNotFound:找不到具有您请求
的
功能
的
树构建器: lxml。你需要安装
解析器
库吗?
、
、
、
...File "/Library/
Python
/2.7/site-packages/bs4/__init__.py", line我
的
终端上
的
上述输出。我使用
的
是Mac OS 10.7.x。我有
Python
2.7.1,并跟随获得了Beautiful Soup和lxml,它们都安装成功,并且
可以
使用单独
浏览 5
提问于2014-06-25
得票数 341
3
回答
不能将file.readline()行与字符串进行比较
、
我试图将我
的
file.readline
中
的
一行与字符串进行比较,但这是行不通
的
。我正在读取一个
html
文件,需要解析该文件才能将该部分发送到字典,但是当我使用if将一行行与字符串进行比较时,当它们匹配时,它不会返回True。
浏览 1
提问于2017-05-13
得票数 0
回答已采纳
1
回答
Python
3,BeautifulSoup删除段落标记
、
、
、
、
如果有下面的
html
块:当我做以下事情时:soup = BeautifulSoup(chunk)>>> soup <
html
><body><p>BLA bla bla
html
...</p><div>
浏览 2
提问于2014-08-11
得票数 2
回答已采纳
1
回答
Python
3-HTTP代理问题
、
、
我在Windows 7
中
使用
python
3.3.0。import sys, urllibproxies = {'http
浏览 1
提问于2013-03-03
得票数 0
2
回答
JTidy保留CSS规则
、
、
、
寻找一种方法来获取一些像这样
的
html
: <head> *.td { </style> <body> </body> </<em
浏览 1
提问于2011-03-31
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
爬虫-Beautiful Soup攻略
初识BeautifulSoup
Python爬取网站博客教程并制作成PDF
Python 爬虫(五)
BeautifulSoup常用解析库-爬虫干货系列5
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券