腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Python
-
从
复杂
的
HTML
中
自动
抓取
表格
python
、
html
、
excel
、
web-scraping
、
beautifulsoup
我正在尝试
自动
从
网站上
的
每个
表格
中
抓取
所有数据,并将每个
表格
输出到excel
中
的
选项卡
中
。我一直在使用https://www.thepythoncode.com/article/convert-
html
-tables-into-csv-files-in-
python
、https://towardsdatascience.c
浏览 24
提问于2020-04-16
得票数 0
2
回答
从
PDF
抓取
数据到CSV?
Python
vs PHP?
php
、
python
、
pdf
、
screen-scraping
我每天都要手工编译一大堆报告,这需要很长时间,所以我想把整个过程
自动
化。我将从(1)
HTML
,(2) CSV/XLS,(3) PDF
中
抓取
数据。我主要是用PHP
从
CSV/
HTML
中
抓取
数据,想知道在PHP中有没有什么可靠
的
库或
从
PDF
抓取
表格
数据
的
方法?我也刚刚开始学习
Python
,并且发现尝试使用PDFMiner和Scra
浏览 1
提问于2011-09-09
得票数 5
回答已采纳
2
回答
基于日期
抓取
表数据
python
、
web-scraping
、
beautifulsoup
、
screen-scraping
我正在尝试
抓取
kurs事务
的
表
从
2015-2020年,但问题是默认日期和我选择
的
日期之间
的
链接仍然是相同
的
。那么我如何告诉
python
从
2015-2020(20-11-15-20-11-20)
抓取
数据呢?我对
python
和
python
3
的
使用非常陌生。/www.bi.go.id/id/moneter/informasi-kurs/
浏览 0
提问于2020-11-24
得票数 0
2
回答
正在尝试
从
R
中
的
url加载数据
html
、
r
所以我想从这个url加载所有格式化
的
数据: 转换成r,这样我就可以过滤掉其中
的
一些。一旦我得到它,我知道如何正确地过滤它,但我不能将它“注入”到R
中
。如果url以".txt“或".csv”结尾,我已经看到了许多拉取数据
的
方法,但是如果这个url不是以文件类型结尾,那么我知道如何获取它
的
唯一方法就是拉出
html
,但是我得到...所有的
html
。有几种选择可以将文件下载为.csv并以这种方式注入它,但如果我做得足够好,我觉得我应该知道如何直接
从<
浏览 3
提问于2016-04-07
得票数 0
1
回答
如何在没有分页请求和美观
的
情况下
抓取
页面?
python
、
beautifulsoup
、
python-requests
我正在
抓取
web (使用
Python
请求和漂亮
的
汤),我需要浏览项目列表
中
的
所有页面,但我需要单击下一页,到目前为止,代码只返回代码
中
的
第50行import requestscontent = antenas.content table = soup.find_all(name='table
浏览 2
提问于2021-02-23
得票数 0
4
回答
有没有一种语言对于web
抓取
来说是“完美的”呢?
php
、
python
、
ruby
、
web-scraping
我已经使用了3种语言进行Web
抓取
- Ruby,PHP和
Python
,老实说,它们似乎都不适合这项任务。
Python
有一个非常差
的
机械化库。我对它有很多问题,但仍然无法解决。它
的
电子
表格
库也差不多,因为它不
浏览 0
提问于2010-08-12
得票数 7
1
回答
从
网页中提取主题/关键字
python
、
web-scraping
、
keyword
我正在寻找一个系统,以提取主题或简单
的
关键字从一个网页,只有
从
指定
的
网页,没有跟随所包含
的
链接。要分析
的
页面属于不同
的
站点,特别是我想分析一个人在Facebook上共享
的
链接,并从这些页面中提取主题或简单
的
关键字。非常感谢。
浏览 5
提问于2014-04-11
得票数 0
1
回答
抓取
url不变
的
分页表
web-scraping
、
beautifulsoup
、
python-requests
、
pagination
我正在尝试从下面的网页
中
抓取
表格
中
的
: 它显示了前25个结果,但对于其余
的
结果,您需要单击next按钮来查看它们。我有一个
python
脚本,其中我使用请求和漂亮
的
汤来
抓取
表格
,但只能从
HTML
中直接
抓取
前25个结果。我对此完全是新手,经过一些谷歌搜索,我仍然不能想出如何
从
所有页面
中
检索所有数据。问题是,当选择新
的
结果页面时,U
浏览 26
提问于2021-05-25
得票数 1
1
回答
如何使用.NET将静态
html
表格
转换为excel
表格
javascript
、
c#
、
html
、
asp.net
、
excel
我有一个项目,其中
的
一部分是将一个
html
表转换为excel文件。表
中
的
字段将是静态
的
。我使用
的
是visual studio 2015版
浏览 0
提问于2017-09-20
得票数 0
1
回答
从
Excel导出数据
的
有效解释方法
excel
、
export
我
的
公司与合作伙伴公司合作。合作伙伴业务有一个我们可以使用web表单访问
的
数据库。我们必须做每小时/每天
的
指标报告,这涉及到导出数据&复制/粘贴到google工作表
中
,然后得到我们
的
数字。我
的
问题是,如果后台访问数据库被拒绝,有没有更有效
的
方法来获取这些数据。理想情况下,我想做我自己
的
查询,但由于我没有访问权限,我在网页上运行查询,导出到excel,然后将数据复制粘贴到google
表格
中
,
浏览 1
提问于2018-03-14
得票数 0
1
回答
如何在
Python
中使用Selenium为amazon搜索页面找到正确
的
“布局”?
python
、
python-3.x
、
selenium
、
web-scraping
、
selenium-chromedriver
我正在使用
Python
3.5
从
amazon.com
中
抓取
一些产品信息。在
自动
化“搜索-
抓取
信息”过程
中
,我发现当页面布局发生变化时,它就会中断。目前,我知道两个不同
的
布局,我希望有一个如果条件
的
表格
: #do something... #do something differently... el
浏览 3
提问于2018-08-01
得票数 0
回答已采纳
2
回答
有没有办法
从
另一个网页上
的
HTML
表格
中提取数据?
html
我很好奇,是否有一种方法可以让计算机读取这些数据,并将其输入到计算机程序
中
,这样你就可以使用这些数据。例如,如果我可以访问ESPN
的
网站,查看联赛排名并将记录发送到我
的
代码,我想这是可能
的
。我知道有些网站有你可以使用
的
API,但我会使用它
的
网站没有…
浏览 1
提问于2016-07-07
得票数 0
1
回答
如何通过
python
向服务器提交表单并从服务器获取csv文件?
python
、
asp.net
、
csv
、
post
、
web-scraping
我需要提交一个
表格
到服务器,并从服务器获得csv文件通过互联网与
python
。到目前为止,我总是选择项目和日期,然后单击按钮。然后,当显示文件保存对话框时,我
从
服务器保留csv文件。我想用
python
自动
完成这些手工工作。我研究过
python
和web<em
浏览 0
提问于2014-07-23
得票数 1
1
回答
Mongodb显示文本而不是
HTML
python
、
html
、
mongodb
我用Pandas从一个用
Python
语言写
的
网站上
抓取
了一个
表格
,把它转换成超文本标记语言(df.to_
html
()),然后插入到Mongodb
中
。它在Mongodb
中
存储如下表{‘==> _
html
_table’:‘...’}In the Mongodb 然后,当我使用Flask和pymongo检索数据并将其显示在我
的
网站上时,它显示
的
是文本而不是
表格
。 有没有什么函数可以把文本(
从
浏览 16
提问于2020-08-24
得票数 0
回答已采纳
7
回答
用
Python
进行屏幕
抓取
python
、
screen-scraping
、
htmlunit
、
pycurl
Python
有提供JavaScript支持
的
屏幕
抓取
库吗? 我一直在使用pycurl来处理简单
的
HTML
请求,对于需要JavaScript支持
的
更
复杂
的
请求,使用了Java
的
HtmlUnit。理想情况下,我希望能够
从
Python
中
完成所有事情,但我还没有遇到任何允许我这样做
的
库。它们存在吗?
浏览 8
提问于2010-02-03
得票数 14
回答已采纳
2
回答
在Windows下每5分钟运行一次
python
脚本
python
我有一个简单
的
python
脚本,
从
html
页面
抓取
一些数据,并将结果写出到一个csv文件。如何在Windows下
自动
执行
抓取
,即每五分钟启动一次。 谢谢彼得
浏览 0
提问于2015-01-29
得票数 3
回答已采纳
2
回答
如何使用
python
从
网站
的
搜索栏中提取数据?
python
、
beautifulsoup
我想从一个包含许多医生和医院名称
的
网站中提取数据,我想做一些评估,所以我决定使用搜索栏,但不幸
的
是,似乎无法得到我想要
的
结果! r = requests.get(url) soup = BeautifulSoup(r.content, '
html
.parser
浏览 3
提问于2018-06-11
得票数 2
回答已采纳
2
回答
如果没有类或id属性,如何使用bs4 4/
python
在一组嵌套表中找到所需
的
表?
python
、
web-scraping
、
beautifulsoup
、
screen-scraping
我有以下
复杂
的
HTML
结构,我必须从这个结构
中
解析嵌套
的
表,并从我想要
的
表
中
抓取
。页面上有很多
表格
。我很安静,想不出怎样才能到达那张有数据可刮
的
桌子。这是页面的URL。
浏览 5
提问于2013-11-20
得票数 0
回答已采纳
1
回答
使用Mechanize将
HTML
注入页面
javascript
、
python
、
html
、
web-scraping
、
mechanize
我正在写一个网页
抓取
程序,以便
从
网站上获得我
的
成绩。我使用Mechanize登录页面并导航到我要
抓取
的
区域。不幸
的
是,页面使用Javascript对页面进行加密(可能是为了阻止我
抓取
)。我找到了解密脚本并移植到了
Python
。它起作用了,我用它从页面中提取加密
的
字符串,当我转换它时,它变成了
HTML
中
的
一个表。那么,为了达到我
的
观点,有没有什么方法可以把
H
浏览 3
提问于2013-01-14
得票数 1
回答已采纳
1
回答
使用Nokogiri
抓取
网站
ruby
、
ruby-on-rails-3
、
css-selectors
、
nokogiri
、
web-scraping
我正在使用Nokogiri
抓取
一个网站,当我试图
从
表格
中
抓取
一个字段时遇到了一个问题。我使用来查找
表格
的
CSS选择器。我正在从
抓取
数据。query_type=queryCarrierSnapshot&query_param=USDOT&query_string=#{self.dot}#Inspections"
浏览 1
提问于2011-12-07
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
从理论到实践:平动抓取手爪在机器人自动化零件搬运中的技术应用之路
零基础入门Python爬虫,一文掌握爬虫核心原理!
如何抓取网页中的表格
Python爬虫教程:简书文章的抓取与存储
爬虫入门——详解Python是如何进行网页抓取!
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券