腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
python
HTML
页面
中
的
Web
抓取
未满
python
、
html
、
web-scraping
、
python-requests
我正在尝试从一个
页面
中
抓取
这两个表 但是当我使用soup.find(‘表’)时,它就是找不到它。另外,当我打印soup对象时,
HTML
代码
的
表格部分没有打印出来,有什么解决方案吗?到目前为止我
的
代码如下: from bs4 import BeautifulSoupimport requests url = 'http://www.b3.= BeautifulSoup(r.text, 'lxml'
浏览 19
提问于2020-11-21
得票数 0
1
回答
在
python
中
浏览/解析
html
页面
python
、
html
、
parsing
、
browser
、
web-scraping
为了与
html
页面
进行交互,我试图把一些我需要
的
插件集合在一起。我需要
的
范围从简单
的
浏览和与按钮或网页链接(如“在这个文本框
中
写一些文本并按这个按钮”)进行交互,到解析
html
页面
和向服务器发送自定义get/post消息。我正在使用
Python
3,到目前为止,我有Request用于简单
的
网页加载、自定义get和post消息,BeautifulSoup用于解析
HTML
树,我正在考虑尝试机械化
浏览 3
提问于2014-04-17
得票数 1
回答已采纳
5
回答
如何从其他网站获取数据?
python
、
database
、
parsing
、
web-scraping
我想创建一个网站,从其他网站提取信息,并将它们打印到我
的
网站上,我正在进行研究,所以我想听取一些意见,这个项目的最佳解决方案是什么?我听说
Python
使用解析器可以做到这一点,我只是想知道我应该走哪条路,应该使用哪种语言?
浏览 1
提问于2013-06-14
得票数 4
1
回答
在没有BeautifulSoup
的
Python
语言中将
HTML
表解析为列表
python
、
html
、
html-parsing
我想知道是否有一种方法可以从
HTML
表中提取数据,并仅使用HTMLParser将其解析到字典
中
。由于某种原因,我不能做这件事..
浏览 1
提问于2012-03-04
得票数 0
2
回答
尝试将数据从网站加载到json文件
中
。
python
、
json
、
python-requests
我试图将数据从一个网站加载到一个json文件
中
。m=1" print(r.text)print(r.json)继续::import json“,s,err.value)到No
浏览 2
提问于2020-05-10
得票数 0
3
回答
从Morningstar网站
抓取
财务数据
python
、
json
、
beautifulsoup
到目前为止我
的
代码如下: fin_tbl = () soup = bs4.BeautifulSoup(c, "
html
.parsersoup.find("div&
浏览 3
提问于2016-02-27
得票数 3
2
回答
有没有办法从另一个网页上
的
HTML
表格中提取数据?
html
我很好奇,是否有一种方法可以让计算机读取这些数据,并将其输入到计算机程序
中
,这样你就可以使用这些数据。例如,如果我可以访问ESPN
的
网站,查看联赛排名并将记录发送到我
的
代码,我想这是可能
的
。我知道有些网站有你可以使用
的
API,但我会使用它
的
网站没有…
浏览 1
提问于2016-07-07
得票数 0
3
回答
用
python
刮网站
python
、
web-scraping
、
beautifulsoup
、
scrapy
、
libraries
我已经看过多个教程和博客,最常见
的
库是漂亮汤和scrapy。如果有一种方法可以在不使用任何第三方库(如beautifulsoup和scrapy )
的
情况下
抓取
一个网站,那么就可以使用beautifulsoup。
浏览 1
提问于2020-06-09
得票数 1
回答已采纳
1
回答
从网页中提取主题/关键字
python
、
web-scraping
、
keyword
我正在寻找一个系统,以提取主题或简单
的
关键字从一个网页,只有从指定
的
网页,没有跟随所包含
的
链接。要分析
的
页面
属于不同
的
站点,特别是我想分析一个人在Facebook上共享
的
链接,并从这些
页面
中提取主题或简单
的
关键字。非常感谢。
浏览 5
提问于2014-04-11
得票数 0
2
回答
使用ImportHTML和Google sheets进行
web
抓取
web-scraping
、
google-sheets
、
google-sheets-formula
、
google-sheets-importxml
我正在尝试用Google sheet和ImportHTML (以及它
的
变种,如ImportXML和ImportData)从网页上
抓取
股票行情。它可以在一些网页上工作,但不能在其他网页上工作。我无法从其中导入数据
的
网页
的
一个例子是。有没有办法下载或
抓取
这些数据?
浏览 9
提问于2020-06-15
得票数 0
2
回答
BeautifulSoup
web
抓取
,无结果
python
、
beautifulsoup
、
web-crawler
我在试着从https://hk.appledaily.com/search/apple..。我需要从div class="flex-feature"但它只返回[]..。希望大家能帮忙,谢谢! from bs4 import BeautifulSoup results = soup.find_all(
浏览 40
提问于2020-10-06
得票数 2
回答已采纳
2
回答
Python
-如何检查wordpress站点版本
python
、
wordpress
我正在考虑获取安装在域上
的
wordpress版本,但我不确定该怎么做。
浏览 0
提问于2021-02-01
得票数 0
1
回答
Python
到PHP异步数据传输
php
、
python
、
asynchronous
我有一个建立一个网络刮擦工具
的
要求。
抓取
部分将在
python
中
编码,结果将在PHP
中
显示。结果应该在PHP
中
异步显示,而
python
正在
抓取
页面
。 客户认为
python
是快速和更好
的
web
抓取
的
选择。您认为混合
python
和php仍然会带来快速
的
结果吗?还是坚持使用php进行
web
抓取
浏览 3
提问于2017-05-04
得票数 1
回答已采纳
3
回答
保存网页源代码
的
固有方法
python
、
web-scraping
我读了很多关于网络
抓取
的
答案,都是关于BeautifulSoup,Scrapy e.t.c。执行网络
抓取
。import urllib f = open('webpa
浏览 1
提问于2012-11-11
得票数 16
回答已采纳
4
回答
如何自动导航到需要身份验证
的
网站?
facebook
、
automation
、
scripting
、
screen-scraping
这就是我想要实现
的
目标。我想写一个脚本,它将导航到一个网站,要求我被认证为我自己,比如Facebook,Live Spaces,Twitter或任何其他网站,然后让该脚本在网站
的
某个
页面
上搜索某些信息。我在过去用Windows.Forms WebBrowser控件做过类似的事情,它是IE
的
一个成熟
的
实现,可以通过代码控制,一旦你通过身份验证,它将存储你得到
的
任何cookie,但它修改起来非常不友好,我希望使用一种脚本语言来代替也许在网络上有一些关于这方面的好
的
教程? 谢
浏览 1
提问于2010-04-08
得票数 1
3
回答
如何使用
python
同时下载网页?
python
、
python-2.7
我正在用
Python
编写一个
web
抓取
应用程序。我正在
抓取
的
网站有www.someurl.com/getPage?id=x表单
的
urls,其中x是标识
页面
的编号。现在,我正在使用urlretrieve下载所有
页面
for i in range(1,1001): urlretrieve('http://someurl.com/getP
浏览 14
提问于2015-05-18
得票数 1
回答已采纳
1
回答
Python
web
抓取
-从哪里开始
javascript
、
python
、
selenium
、
web-scraping
我试图建立一个网络爬虫来收集来自多个投注网站
的
投注数据。我有一些编程经验,但我非常迷失在网页,网页
抓取
等世界。但是所有这些教程都是非常简单
的
页面
,而我想要
的
似乎有些不同(也许是JavaScript?) 我怎样才能得到有赔率
的
事件,等等?
浏览 0
提问于2016-06-21
得票数 1
1
回答
访问
HTML
注释
中
的
标记
python
、
html
、
web-scraping
、
beautifulsoup
我已经通过BS4熟悉了使用
Python
进行
web
抓取
的
过程。我还没有找到嵌入在注释
中
的
DOM标记
的
解决方案。例如,当试图从.
html
页面
()获取数据时,检查
页面
上
的
表显示:我通常可以用BeautifulSoup
抓取
。但是,当我查看实际<
浏览 0
提问于2018-12-11
得票数 0
回答已采纳
1
回答
Python
Web
抓取
:通过加载
页面
抓取
页面
python
、
python-3.x
、
web-scraping
我正在建立一个网络
抓取
项目使用
python
与美丽
的
汤和请求模块,问题是我想要
抓取
的
网站有一个加载
页面
(完全不同于主页),然后它将我重定向到主页。我怎么能等到
页面
加载完成,然后从主页上
抓取
数据呢?我知道Selenium可以处理这些类型
的
网站,但网站必须使用
web
驱动程序启动,这是我不希望在我
的
项目中使用
的
原因,这就是为什么我使用Beautiful Soup和requests模块。到目
浏览 15
提问于2020-10-25
得票数 0
3
回答
可以解释JavaScript
的
网络爬虫
javascript
、
web-crawler
基本上它是一个用Java或PHP编写
的
程序,它接受URL作为输入并输出DOM树,这与Firebug
HTML
窗口中
的
输出类似。最好
的
例子是Kayak.com,当你“查看源代码”时,你看不到浏览器上显示
的
结果DOM,但可以通过Firebug保存结果。 我该怎么做呢?有什么工具可以帮助我吗?
浏览 68
提问于2010-04-20
得票数 18
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券