腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(8744)
视频
沙龙
1
回答
Python
抓取
与
漂亮
的
汤
不能
正确
抓取
某些
数据
行
python
、
parsing
、
beautifulsoup
、
python-3.8
我正在探索
python
中
的
web
抓取
。我有以下代码片段,但这段代码
的
问题是提取
的
某些
数据
行
不
正确
。这段代码会有什么问题呢?
浏览 9
提问于2021-07-21
得票数 0
回答已采纳
1
回答
数据
挖掘-在终端中挖掘Facebook配置文件和返回
数据
python
、
facebook
、
access-token
、
data-mining
我对
python
编码有点陌生,我有一个项目,我决定编写一些代码,当输入一个Facebook用户URL时,它将返回他们
的
配置文件必须提供
的
所有
数据
。任何帮助都将是非常感谢
的
,或者如果您有类似的代码,我很想观察。 我正在寻找在
python
中执行此操作。
浏览 4
提问于2022-03-29
得票数 -1
1
回答
抓取
url不变
的
分页表
web-scraping
、
beautifulsoup
、
python-requests
、
pagination
我正在尝试从下面的网页中
抓取
表格中
的
: 有没有人能带我到
正确
浏览 26
提问于2021-05-25
得票数 1
2
回答
抓取
特定文本
的
网页(字符串)
python
在stackoverflow上
的
第一个帖子,所以如果我没有
正确
发帖,我道歉。我试图
抓取
网页
的
信息,只有当一个特定
的
文本字符串存在。我只是使用了
漂亮
的
汤
,但找不到包含我正在寻找
的
文本
的
元素。经过更多
的
研究,我尝试使用selenium,因为我知道一些动态加载
的
元素在
漂亮
的
汤
中是找不到
的
。到目前为止,我仍然找不到文本
浏览 0
提问于2020-06-06
得票数 1
2
回答
使用
漂亮
汤
从脚本标记中
抓取
数据
python
、
beautifulsoup
我是一个
python
美容
汤
库
的
新手,我正在尝试从一个网站
的
highcharts中
抓取
数据
。我发现我需要
的
所有
数据
都位于一个脚本标签中,但是我不知道如何
抓取
它们(请参见附件)有没有办法使用
python
漂亮
的
script从这个脚本标签中获取
数据
?
浏览 32
提问于2020-07-07
得票数 1
回答已采纳
1
回答
使用BeautifulSoup
抓取
的
数据
与
源代码不匹配
python
、
web-scraping
、
beautifulsoup
、
mismatch
我是网络
抓取
的
新手。我已经看过一些关于如何使用
漂亮
的
汤
来
抓取
网站
的
教程。作为练习,我想从一个房地产网站上提取
数据
。我想要
抓取
的
特定页面是这个:我遇到
的
第一个问题是,使用经典
的</e
浏览 4
提问于2021-05-02
得票数 1
2
回答
如何使用selenium web驱动程序托管由web
抓取
支持
的
后端服务?
python
、
selenium
、
selenium-webdriver
、
flask
、
web-scraping
因此,我正在开发一个项目来
抓取
一个网站并将
数据
传递给用户,但是我正在使用带有
python
/flask
的
selenium/selenium web驱动程序。我本来打算用
漂亮
的
汤
,但我
抓取
的
网站需要在页面上进行一些交互。 我有一切工作
与
刮刀,我只是试图找出一种方法,使这项工作,如果我想要托管在一个网站上使用
的
服务,如heroku。有没有一种聪明
的
方法可以不用打开浏览
浏览 20
提问于2020-05-03
得票数 1
1
回答
为什么通过
漂亮
汤
导入
的
html
与
实际
的
html不同?
html
、
beautifulsoup
嗨,我正在制作一个程序,它在堆栈溢出中为搜索词
抓取
结果。我需要知道
抓取
的
最大页面,但是通过开发工具查看
的
html结构和通过
漂亮
汤
获得
的
html信息是不同
的
。网址:soup = BeautifulSoup(result
浏览 1
提问于2020-08-30
得票数 1
1
回答
利用
漂亮
汤
刮网时
的
颜色编码
python
、
web-scraping
、
beautifulsoup
我正在使用
Python
中
的
漂亮
汤
来做web
抓取
。网站上
的
文字有红色字体颜色
的
名字,我需要有颜色代码。我正在使用网站上
的
文本作为我
的
培训
数据
的
纳(仅为
正确
的
名称)。我怎么才能用
漂亮
汤
得到颜色码呢?现在我
的
代码看起来是这样
的
。
浏览 2
提问于2021-08-07
得票数 1
回答已采纳
1
回答
内部跟踪事务
Python
etherscan
、
web3.py
、
python
、
internal-transactions
我一直试图找出使用
python
获取网络内部/跟踪事务
的
最佳方法。我在论坛上读过其他主题,其中说这些内容没有记录在区块链上,所以web3.py不是一个选项,您必须使用一种专门
的
EVM来使用契约来模拟给定
的
事务,我试图避免这种情况,因为在
python
上似乎很复杂.我正在考虑使用以太扫描站点内部交易净额,我可能会使用
漂亮
的
汤
进行网络
抓取
,但我不知道是否有人知道一个更好
的
方法,它可以使用基于
python</
浏览 0
提问于2020-02-28
得票数 3
回答已采纳
9
回答
BeautifulSoup和Scrapy crawler有什么区别?
python
、
beautifulsoup
、
scrapy
、
web-crawler
我想做一个网站,显示亚马逊和易趣产品价格
的
比较。其中哪一个会工作得更好?为什么?我对BeautifulSoup比较熟悉,但对Scrapy crawler不太熟悉。
浏览 323
提问于2013-10-30
得票数 146
回答已采纳
1
回答
是否有无监督培训
的
情感论坛
数据
?
sentiment-analysis
、
unsupervised-learning
其想法是: 这将
浏览 0
提问于2018-10-17
得票数 0
1
回答
用精美的
汤
从HTML中
抓取
表格
python
、
python-3.x
、
web-scraping
、
beautifulsoup
我正在尝试用
python
3从中
抓取
数据
。该网站包含了基于冠军
的
FPS多人游戏“圣骑士”
的
玩家
数据
。我想要得到一个基于冠军
的
球员
的
统计
数据
,如网站所示。我面临
的
问题是,当我用Chrome检查页面源代码时,我得到了包含"table“标签
的
代码,它是干净
的
,我可以很容易地
抓取
它:但是当我创建soup对象时,我得到了一个不
浏览 2
提问于2018-06-26
得票数 0
3
回答
如何使用Beautiful从
python
代码中获得javascript函数
的
结果?
javascript
、
jquery
、
python
、
html
、
web-scraping
我想从一个使用
Python
中
的
“美丽
汤
”
的
网站上
抓取
数据
。网站根据用户
的
选择更改下拉菜单
的
值。在更改下拉菜单
的
值时没有api调用。仔细看一下,我注意到有一个javascript函数在内部调用,以获取下拉菜单
的
值。我
的
问题是下拉菜单
的
值不在页面源中。它们是通过调用js函数获得
的
,但是没有api调用,我
不能
请求那个值。有人能告诉我如何从
pyt
浏览 7
提问于2014-04-06
得票数 1
回答已采纳
2
回答
在Azure上计划web
抓取
作业并在ADLS上存储结果
python
、
azure
、
u-sql
我有一个
python
作业,它使用
漂亮
的
汤
从job上
抓取
数据
。我尝试使用U-SQL执行脚本,但我一直收到一般
的
错误消息:我没有过多地研究这个错误,因为我不确定是否有可能通过U-SQL来
抓取
web。这是否可以使用U-SQL,如果不可以,我可以使用哪个Azure资源来计划此脚本并将结果存储在Azure
数据
湖存储上?
浏览 2
提问于2018-01-03
得票数 0
2
回答
接受单词开头
的
漂亮
汤
find.all()
python
、
beautifulsoup
我正在
抓取
一个网站,里面有一个
漂亮
的
汤
,它
的
类名如下: <a class="Component-headline-0-2-109" data-key="card-headline" href="/articlepolitics-senate-elections-legislation-coronavirus-pandemic-bills-f100b3a3b4498a75d6ce522dc09056b0"> 主要
的</
浏览 29
提问于2020-12-18
得票数 0
回答已采纳
1
回答
返回RSS
的
所有页面
python
、
rss
、
beautifulsoup
我正在使用
python
从rss页面
抓取
xml。我正在使用
漂亮
的
汤
来解析xml。每个URL
的
数据
使用urllib2下载并保存在变量xml中 然后,我
的
python
代码使用
漂亮
的</
浏览 0
提问于2014-12-04
得票数 0
2
回答
调用Twitch时BeautifulSoup不返回html
python
、
web-scraping
、
twitch
我正在尝试为Twitch做一个网络
抓取
器,它将获得流
的
标题和流信息。我可以从其他网站中取出页面的特定部分,但当我放入一个流时,它看起来不像inspect元素中
的
html。它看起来就像一团乱麻。
浏览 20
提问于2021-01-08
得票数 0
1
回答
有没有可能用
漂亮
的
汤
刮出一个“动态网页”?
python
、
html
、
selenium
、
beautifulsoup
我现在开始用
漂亮
的
汤
来
抓取
网站,我想我已经掌握了基本
的
知识,虽然我缺乏网页
的
理论知识,但我会尽我最大
的
努力来表达我
的
问题。我所说
的
动态网页是这样
的
:一个网站,它
的
HTML会根据用户
的
动作而改变,在我
的
例子中,它是可折叠
的
表格。我想获得一些"div“标签中
的
数据
,但是当你加载页面时,
数据</em
浏览 1
提问于2016-11-22
得票数 4
3
回答
“美丽
的
汤
”查找()并
不能
找到类
的
所有结果
python
、
html
、
web-scraping
、
beautifulsoup
信息肯定在那里(我打印了
汤
以检查),所以我不知道为什么前30 react-contextmenu-wrapper之后
的
所有东西都丢失了。= BeautifulSoup(html, "html5lib") print(main) 1.感觉我
的
搜索结果被截断了。
浏览 6
提问于2019-10-05
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
零基础入门Python爬虫,一文掌握爬虫核心原理!
IPIDEA干货|Java爬虫与Python爬虫的区别
40行代码就能学会爬虫?有了这碗“汤”你也可以!
利用Python网络爬虫抓取微信好友的签名及其可视化展示
SEO优化:如何正确设置robots.txt协议文件?
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券