腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(828)
视频
沙龙
1
回答
美
汤
用
&
lt
代替
<;
、
、
<div id="content">stuff here</div>变成了&
lt
;div id="content">stuff here&
lt
;/div>。如何保存数据?
浏览 9
提问于2018-08-27
得票数 2
回答已采纳
1
回答
漂亮的
汤
跳过注释和脚本标签
、
我
用
美
汤
代替
文字。for x in soup.find('body').find_all(string=True): fix_str = re.sub(...)
浏览 0
提问于2017-11-14
得票数 5
回答已采纳
1
回答
用
美
汤
代替
餐桌内容
、
、
、
、
我想解析一个HTML文档,其中也包含表格数据,使用漂亮的
汤
。我正在做一些NLP。 表格单元格可能只有数字,或者文本很重。
浏览 1
提问于2020-03-31
得票数 0
回答已采纳
1
回答
从内部类中抓取
、
我想从Merriam Webster Dictionary中抓取定义。例如。<div class="definition-block def-text"> <li> <span><span c
浏览 1
提问于2016-02-26
得票数 1
1
回答
解析
美
汤
时转换为<( &
lt
;)
、
、
我使用漂亮的
汤
来解析一个包含&
lt
;br>的字符串,美丽的
汤
将其解释为<br>。 有没有办法让漂亮的
汤
停止这样做,这样当<br>被正常解析时,&
lt
;br>不会被触及,并被视为普通字符串?
浏览 0
提问于2019-04-01
得票数 0
3
回答
如何使用Python和lxml解析本地html文件?
、
我正在使用python中的本地html文件,并尝试使用lxml来解析该文件。由于某些原因,我无法正确加载文件,并且我不确定这是否与没有在本地计算机上设置http服务器、etree使用情况或其他原因有关。这可能是一个相关的问题:from lxml import htmltree = html.fromstring(page.text) test = tree.xpath('//h
浏览 0
提问于2015-09-24
得票数 18
回答已采纳
1
回答
如何禁用所有不在列表中的链接,使用漂亮的
汤
、
、
html.parser') if not (link['href'] in link_list): link['href']="" 我刚接触
美
汤
我
用
的是
美
汤
4
浏览 15
提问于2019-06-07
得票数 0
回答已采纳
1
回答
构建类似于Python的Jon's的声誉跟踪器
我有兴趣
用
Python构建一个类似的应用程序,这样至少可以使用以下模块 通过defaultdict存储数据
浏览 3
提问于2009-07-22
得票数 1
回答已采纳
2
回答
BS4 replace_with用于替换新标记
、
、
美
汤
自动转义标签。我怎样才能避免这种行为?#!identify', '<a href="test.html"> test </a>', txt.lower())print(soup)&
lt
;a href="test.html"> test &
lt
;/a><a hre
浏览 5
提问于2020-08-14
得票数 1
回答已采纳
1
回答
如何用漂亮
汤
提取代码的某一部分
、
、
我在做一个私人项目,我有一个关于
美
汤
的问题。我使用python 3.9.2和BeautifulSoup4.9.3。现在有谁
用
美丽的
汤
来做这个吗?谢谢。
浏览 5
提问于2022-09-28
得票数 -1
回答已采纳
1
回答
BeautifulSoup,findAll('table')返回所有表,但也返回它们之间的文本
、
、
、
我试图隔离网页的一部分,不幸的是,它并不包含在任何我可以提取的东西中。storyText = soup.bodyfor each in toRemove:目前的问题是,toRemove行返回表和它们之间包含的文本,尽管不在它们中。<body> table stuff T
浏览 1
提问于2013-09-22
得票数 0
1
回答
用
美
汤
解析
、
、
、
我想解析如下所示的html代码:<span>Current Status</span>FINAL DECISION </div><span>Applicant</span>GC Planning Partnership Ltd </div><span>Agent</span>GC Planning Partnership Ltd </div><span>Wards</
浏览 2
提问于2017-05-03
得票数 0
回答已采纳
1
回答
用
漂亮的
汤
解析表中的行
、
、
我一直在试着
用
美
汤
浏览 0
提问于2017-07-13
得票数 0
1
回答
美丽的
汤
-在原始文本中找到识别标签
、
在识别了原始文档中的文本之后,我需要操作HTML中的某些文本。假设我有这个HTML代码 <a href="link" id="linkid"></div> 我想删除id标记中的<a>属性。我可以使用BeautifulSoup识别特定的标记,但是由于它改变了原始文档的格式,所以我也不能搜索/替换字符串。我不想只写BeautifulSoup的输出,而是希望在原始文档中标识标记,并将其替换为<a href="
浏览 1
提问于2013-05-09
得票数 1
1
回答
InvalidSchema(“找不到{!r}的连接适配器”.format(Url))
、
、
、
、
这个错误是什么意思,以及如何处理这种错误? File "load-more.py", line 146, in <module>File "C:\Users\Xone\.virtualenvs\Web_Scrapers-A6P4QRzc\lib\site-packages\requests \sessions.py", line 555, in get return self.request('
浏览 40
提问于2021-06-12
得票数 0
1
回答
美丽的
汤
花了很长时间在特定的网站上
、
、
、
、
我在脚本中使用Beautiful Soup来抓取几个站点。它们中的大多数都工作得很好;我习惯于在我的主计算机上看到0.01到0.02秒的解析。然而,当我尝试抓取某些网站的链接时,比如slickdeals.net,我发现任何地方都有0.9到2秒的速度;几乎慢了100倍。这在我的主计算机上还不错,但这是我计划在我的Raspberry Pi 3型号B上运行的脚本,在此基础上,这个站点上的链接平均需要30到40秒(偶尔会有罕见的60+秒)。 因为我的主计算机比我的Pi强大得多,同时从这个站点抓取链接的20+总共需要6- 10秒(与其他站点的总和相比可以忽略不计)。然而,在我的Pi上,它可能需要超过2
浏览 20
提问于2019-12-21
得票数 0
1
回答
JSSoup是否支持提取文本?
、
JSSoup是否支持提取类似于
美
汤
soup.findAll(text=True)的文本 文档没有提供关于这个
用
例的任何信息,但在我看来应该有一种方法。
浏览 19
提问于2021-11-20
得票数 1
回答已采纳
1
回答
如何在python中处理javascript进行抓取?
、
我必须做一个脚本来提取一个网站的网址。据我所知,这个url是由javascript在用户点击“播放”按钮时生成的(它是一个音频流的url)。我知道机械化的python模块不支持javascript。那么我应该用什么来检测来自那个按钮的url呢?
浏览 19
提问于2020-10-09
得票数 0
回答已采纳
1
回答
如何在centOS服务器中安装
美
汤
?
、
、
现在我有了一个
用
python编写的从bs4导入BeautifulSoup导入的网页抓取程序请帮帮忙
浏览 0
提问于2014-04-08
得票数 2
回答已采纳
1
回答
用
美
汤
刮田
、
、
我对网络刮擦很陌生。我无法从网页中获取字段(用户名)。 <div class="block-row block-row--separated"> <dl class="pairs pairs--columns pairs--fixedSma
浏览 0
提问于2020-04-15
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
用眼睛代替鼠标,这事能成吗?
未来视觉影像,用AI代替人?
7mall时代,用数据代替你的声音
谷景告诉你贴片电感可以用什么代替
用睡眠舱代替船员舱——船员住宿的新概念
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券