腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
Python
:
BeautifulSoup
并不
总是
获取
所有
文本
数据
、
我正在尝试使用
BeautifulSoup
从一个网站
获取
数据
。<li class="x-block-grid-item"> <h3 style="margin: 0 0letter-spacing: 0.05em;line-height: 1">Resolu
浏览 18
提问于2018-01-31
得票数 1
回答已采纳
1
回答
使用
python
无头浏览器
获取
html响应
、
、
、
我需要首先获得网站认证,直接到搜索页面,设置搜索参数,发出html请求,其中包括一些值通过post发送,
获取
响应作为html解析要下载的内容并下载它。
浏览 17
提问于2017-07-26
得票数 0
回答已采纳
3
回答
从HTML中读取头内容
、
、
我需要在
python
的小脚本。需要读取web文件中的自定义块。# -*- coding: utf-8 -*-response
浏览 1
提问于2010-12-20
得票数 2
回答已采纳
1
回答
Python
:
BeautifulSoup
使用FindAll
获取
所有
文本
数据
、
、
我试图下载网页的
所有
标题,但它们都有相同的类,所以当我只使用find过滤时,我只得到第一个。使用FindAll方法显然应该获得具有相同类的
所有
文本
,然后我应该能够按特定的一个进行过滤,但是使用FindAll方法我
总是
得到一个响应错误,我肯定是做错了。Mozilla/5.0'} page3 = urlopen(request3) soup3 =
BeautifulSoup
浏览 2
提问于2020-07-31
得票数 1
3
回答
如何使用
BeautifulSoup
从特定表中
获取
所有
行?
、
我正在学习
Python
和
BeautifulSoup
如何从网络上抓取
数据
,并读取超
文本
标记语言表格。我可以将它读入Open Office,它显示的是表#11。似乎
BeautifulSoup
是首选,但是谁能告诉我如何
获取
特定的表和
所有
行?我已经看过模块文档了,但是我不能理解它。我在网上找到的许多例子似乎都超出了我的需要。
浏览 1
提问于2010-01-06
得票数 24
回答已采纳
3
回答
ANSI、ASCII、Unicode和编码与
Python
混淆
、
、
我很高兴地使用了
BeautifulSoup
,我还使用了一个
文本
文件作为我的
Python
脚本的输入参数。 然后我遇到了著名的"UnicodeEncodeError“错误。在我的
文本
编辑器(Notepad++)上使用什么编码?安西?UTF-8?将字符串解码为ASCII码似乎
并不
总是
有效的(我猜字符串使用的是来自
BeautifulSoup
的不同编码)。编辑:阅读
BeautifulSoup
的文档,它说它只使用unicode,但我仍然收到Unicode
浏览 2
提问于2010-07-24
得票数 0
7
回答
Python
/
BeautifulSoup
-如何从元素中删除
所有
标签?
、
如何才能简单地从
BeautifulSoup
中找到的元素中剥离
所有
标记?
浏览 1
提问于2013-04-25
得票数 88
2
回答
AttributeError:“”LXMLTreeBuilder“”对象在使用
BeautifulSoup
时没有特性“”DEFAULT_NSMAPS_INVERTED“”
、
、
我试图通过在
python
中使用
BeautifulSoup
从URL中
获取
一些
数据
,但是当我运行最后一个命令时,我
总是
收到这个错误,告诉我'LXMLTreeBuilder下面是我的代码:from bs4 import
BeautifulSoup
url = 'https://
浏览 28
提问于2019-08-01
得票数 0
2
回答
美丽的汤:
获取
子节点的内容
、
我有以下
python
代码: html = urllib2.urlopen(urlToCheck).read() soup =
BeautifulSoup
(html)&
浏览 1
提问于2010-10-21
得票数 1
回答已采纳
1
回答
避免使用优美汤和urllib.request下载图片
、
、
、
我使用
BeautifulSoup
('lxml'解析器)和urllib.request.urlopen()从一个网站
获取
文本
信息。但是,当我在Acitivity中查看网络部分时,我看到
python
下载了很多
数据
。这意味着不仅
文本
被下载,而且图像也被下载。 在使用
BeautifulSoup
进行网络抓取时,有可能避免下载图片吗?
浏览 2
提问于2016-04-03
得票数 0
回答已采纳
1
回答
尝试使用
python
解析html时重定向到主页
、
、
、
、
from urllib.request import urlopenimport requests page = requests.get(url)soup =
BeautifulSoup
(data, "html.parser") 我尝试使用此代码从
获取</e
浏览 0
提问于2016-11-02
得票数 0
1
回答
美丽的汤不能
获取
所有
的html
、
、
、
我是一个新的刮板和
python
,我已经写了一个代码来刮网页,import requests url = 'http://www.hl.co.uk/funds/fund-discounts,-prices--and--factsheets
浏览 38
提问于2018-07-16
得票数 0
1
回答
使用
Python
抓取Ajax
、
、
、
、
我正在尝试
获取
这个网站的表中的
数据
,该表在页面加载后通过jquery更新(我有权限): 我知道我可以通过专有的“屏幕刮板”软件获得
浏览 2
提问于2012-05-04
得票数 3
回答已采纳
1
回答
如何用BS4从标签外提取
文本
、
我正在浏览一堆维基百科的网页,以
获取
有关二战的统计
数据
。from bs4 import
BeautifulSoup
df=pandas.read_csv("links.csv") links=
浏览 0
提问于2019-04-25
得票数 2
回答已采纳
1
回答
在一个HTML标记中嵌套的整个网站破坏
Python
刮板
、
、
、
、
我正在尝试创建一个
Python
,它从互联网上
获取
数据
并将其转换为表,然后作为.csv文件导出。我正在尝试让这个程序工作的示例网站是: 我本来打算使用
BeautifulSoup
库来实现这一点,但当我意识到感兴趣的网页的整个
文本
都嵌套在一个标记中时,我就撞到了墙上,如下面的图片所示。当我使用findAll函数在
文本
中找到这些列标题时,打印结果时会返回整个
文本
块,因为
所有
文本
都是在一个<p></p>标记之间
浏览 4
提问于2021-12-24
得票数 2
1
回答
使用
Python
中的美观汤从元素中
获取
文本
值
、
我正在制作
python
脚本,它从在线站点
获取
文本
数据
。这是一个简单的web抓取脚本,语言只是
python
。我不使用硒,只使用漂亮的汤。而且我可以从<p>或<div>,甚至<h>和<a>中抓取
文本
,但是当我试图从<td>
获取
文本
时,代码不起作用。下面我分享了我的代码。from threading import Thread from bs4 import
Beautifu
浏览 5
提问于2021-07-16
得票数 1
回答已采纳
4
回答
Python
:
数据
对象或类
、
、
我喜欢
所有
用于抓取网站的
python
库,我只是为了好玩而尝试使用
BeautifulSoup
和IMDB。我的问题是,当一个类只包含
数据
,而可能几乎没有行为时,我应该只使用字典吗?在其他语言中创建类型将帮助您强制执行某些限制,并且由于类型检查,IDE将帮助您编程,但在
python
中情况
并不
总是
如此,所
浏览 0
提问于2012-10-06
得票数 6
2
回答
使用
BeautifulSoup
get_text或findAll(text=True)时无法获得可见
文本
、
、
我正在尝试使用bs4和
python
3.4.1从网页中提取可见
文本
。为此,我从汤中提取
所有
脚本和样式元素,然后继续从剩余的html中
获取
文本
。soup=
BeautifulSou
浏览 5
提问于2016-02-04
得票数 0
回答已采纳
1
回答
抓取维基百科文章中的
所有
标题和纯
文本
、
、
在
Python
中,我将如何
获取
维基百科文章中的
所有
标题和平面
文本
,比如:。我目前的代码是: #Amount of documents
浏览 4
提问于2016-11-02
得票数 1
回答已采纳
1
回答
Python
库可从任意网页中刮取格式化
文本
、
、
、
我正在用
Python
做一个项目,其中包括: 尽管NLP要想成功,需要提取
文本
,因为它是在浏览器中可视化地呈现的--这
并不
总是
与源代码上的格式一致,也就是说,段落中的
文本
有时被分解成几个不同的元素( -> ),这些元素将
所有
的抓取
浏览 0
提问于2019-03-27
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
三行代码获取所有可转债数据——python 获取金融数据
利用Python和BeautifulSoup进行网页爬取
干了这碗汤,你也可以愉快地爬虫了
享学课堂浅谈Python3中BeautifulSoup的使用方法
python教程|如何批量从大量异构网站网页中获取其主要文本?
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券