腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
HTML
抓取
现在
得
到了
不同
的
数字
、
、
、
我构建了以下代码,通过VBA将共同基金
的
价格拉入excel。一直持续到昨晚。它刚刚开始拉动一个
不同
的
数字
(道琼斯指数
的
%回报率。页面顶部。)。我看了看网站布局是否改变了,但没弄清楚。我认为代码混淆了我试图拉取
的
“值”和道琼斯指数
的
“正值”类。 有没有办法让代码专注于“值”而不是“正向值”?
浏览 3
提问于2020-06-05
得票数 0
回答已采纳
1
回答
通过c/ libcurl使用有效密码访问受密码保护
的
新闻网站
、
、
、
、
我使用libcurl用C语言编写了一个网站爬虫,如果我们愿意的话,它可以从任何网站
抓取
文本内容。有谁能提供使用libcurl来实现这一点
的
建议吗?我知道您可以在libcurl选项中添加用户名/密码。我认为这样做,并简单地访问可能有密码保护
的
正确页面,将是它
的
全部。下面是CURL代码
的
摘录: curl
浏览 1
提问于2012-05-22
得票数 0
1
回答
编辑粘性头
html
-如何找到相应
的
php文件
、
我需要让我
的
粘性头工作
得
更顺利一点。我希望粘性标头完全出
现在
正常标头不可见
的
地方。这样,用户
的
体验是平滑
的
。我已经了解了如何通过在browser dev工具中编辑以下
html
代码来实现这一点: <div id="header-wrap" class=" clearfix" data-
浏览 0
提问于2018-07-29
得票数 1
3
回答
如何在google中获取某个关键字
的
搜索结果数
、
、
、
我需要提供一个关键字,如“蓝色金属水壶”(带引号/不带引号),并且只获得此搜索结果
的
数量。如果我
现在
搜索时不带引号,我会得到:这里'1,040,000‘是我想要
的
数字
。有没有什么API函数可以做到这一点,或者我必须通过
HTML
提取这个
数字
?做这件事最好
的
方法是什么?
浏览 1
提问于2009-11-28
得票数 5
回答已采纳
3
回答
为什么lxml不返回与此
html
元素相关联
的
文本?
、
、
、
、
我刚开始使用python解析
html
,
现在
遇
到了
麻烦。我正试着写一个简短
的
脚本,每天从网站上
抓取
一个
数字
。然而,代码并没有像我希望
的
那样返回一个
数字
,而只是返回None。下面的网页显示了每天在特定区域骑行
的
自行车数量:。我正在尝试写一个简短
的
python脚本来记录“昨天”骑过
的
自行车
的
数量(这是一个每天
不同
的
数字
,通常在500到
浏览 2
提问于2015-08-03
得票数 1
1
回答
如何
抓取
AJAX页面中
的
所有url?
、
、
、
、
我使用scrapy和splash
抓取
所有网址在网站上。在一些带有静态
html
的
网站中,它工作
得
非常好!但当我
抓取
一些网站有AJAX页面,和
html
5我无法获得任何网址(例如:,)。有谁有解决这个问题
的
办法吗?非常感谢!
浏览 0
提问于2018-10-11
得票数 0
2
回答
使用XML调用查找网页上不在源
HTML
中
的
元素
、
、
、
我正在
抓取
WebMD上
不同
药物
的
评分。当我转到评分页面(例如)时,会看到用户评论总数
的
平均值( 3.64、4.33和3.40)。我正试着用(对于第一个
数字
)或(对于所有3个),但这两个都返回
浏览 0
提问于2017-03-18
得票数 0
1
回答
使用rvest
抓取
名称相似的表
、
、
、
我正在尝试使用rvest从fbref.com上
的
不同
页面
抓取
数据表。我已经能够使用以下命令从一个页面中
抓取
数据:URL <- "https://fbref.com/en/squads/822bd0ba/Liverpool"passStats <- WS %>% rvest::
html
_nodes(xpath =
浏览 5
提问于2020-06-02
得票数 1
回答已采纳
1
回答
在PHP中,如何
抓取
某个文本模式
的
DOMDocument,然后获取匹配文本
的
文本节点
的
父元素?
、
、
、
、
我已经用PHP和cURL构建了一个简单
的
web
抓取
工具,并且一直在使用这样
的
代码来通过ID
抓取
抓取
页面的某些元素,或者在所需元素上没有ID
的
情况下通过标记名
抓取
:$table = $dom->getElementsByTagName('table')->item(4);
现在
我遇
浏览 1
提问于2011-03-09
得票数 0
回答已采纳
1
回答
统计网页上
HTML
属性
的
数量
、
我需要在多个网页上计算
不同
数量
的
特定
HTML
属性。然后,我将使用这个
数字
来
抓取
那些href属性中包含
的
所需数据。[seq(1,1500,3)]%>% na.omit(fighter_links) 上面代码
的
目的是读取该页面上
的
HTML
并提取我需要
的
链接。这只是我需要
抓取
的
26个网页中
的
一个,所有这些页面都有
不同
数量
的
链
浏览 12
提问于2020-10-22
得票数 1
回答已采纳
1
回答
GET和/或BeautifulSoup FanDuel web擦除
的
接收证书/ 403错误
、
、
、
我正在尝试
抓取
以下页面:https://www.fanduel.com/games/57764/contests/57764-245891325/scoring 以下使用urlopen()
的
代码生成了证书验证失败错误:证书链中
的
自签名证书(_ssl.c:1123)> 我还尝试使用以下代码,但收
到了
html
= f'https://www.fanduel.com/games/577
浏览 14
提问于2021-04-27
得票数 0
1
回答
谷歌搜索网页
抓取
class=与浏览器上
的
不同
、
、
我正在尝试
抓取
谷歌结果中
的
视频面板例如,我正在搜索--> "great+castles“<--在那个搜索结果中,它有一个包含视频
的
面板,当我
抓取
它时,我得
到了
HTML
,但有
不同
的
属性值,我无法
抓取
视频面板q={text}' soup = BeautifulSoup(response.text,'
htm
浏览 0
提问于2020-05-06
得票数 0
3
回答
Python -分析字符串
、
、
我有个很烦人
的
问题,答案可能很简单,但我不能把2和2放在一起…<a href="javascript:void(0);" onclick="viewsite(38903);" class="followbutton">Visit</a> 每次加载页面时,
数字
38903都会有所
不同
。每次加载页面时,我都需要一个方法来解析这些
数字
。我已经够远了,可以
抓取
并包含上面的
HTML<
浏览 4
提问于2012-05-08
得票数 0
回答已采纳
1
回答
用BeautifulSoup和Python
抓取
特定
的
'dd‘标签
、
、
我正在学习美汤,我遇
到了
一个十字问题。这就是在
html
中
抓取
dd标签。看看下面的图片,我想获取红色区域中
的
参数。问题是我不知道如何访问它们。我已经尝试过了: jedinica_mere = nek_
html
.find('
浏览 11
提问于2019-10-31
得票数 0
回答已采纳
3
回答
从网站复制和粘贴-字体-权重:粗体与<b>
、
、
、
为了满足用户
的
要求,我告诉他们只需从网页上复制和粘贴,这样他们就可以将数据放到Word文档中。如果我使用<b>标记,然后复制-粘贴,那么“粗体”就会保留到Word文档中。 我更喜欢继续使用CSS。
浏览 0
提问于2011-03-22
得票数 0
回答已采纳
2
回答
如何正确地编写这个JavaScript函数?
目前我正在学习网页开发,在完成
HTML
/CSS之后,我
现在
正在学习JavaScript基础(天哪,它比前两个难多了!),在这个练习项目中,我希望获取userGuess - secretActualNumber和computerGuess - secretActualNumber
的
绝对值,然后比较它们,看看哪一个更接近秘密
数字
userGuess-secretActualNumber); } 为了比较这两者,我想我需要
浏览 27
提问于2020-04-17
得票数 3
1
回答
在没有源代码分支
的
新计算机上写Octopress博客?
、
、
我最近更换了电脑,不小心删除了我
的
本地版本和所有的源文件(Markdown文件等)。不管我怎么想,它都在Github中(我使用GitHub页面),所以我可以从那里开始。然而,我已经进入了Github,我
的
源代码分支并不在那里(很可能我从一开始就没有生成它!)。 因此,有没有一种快速
的
方法,可以在不丢失我之前所有博客帖子
的
情况下,使用新
的
源代码分支进行发布?
浏览 1
提问于2013-04-03
得票数 2
回答已采纳
1
回答
R: not
抓取
HTML
中不包含
的
数据
、
、
、
我正在尝试从诸如these之类
的
网页中
抓取
R。但是
html
只有50行,所以我假设这些
数字
隐藏在一个javascript文件中或它们
的
服务器上。我不知道如何找到我想要
的
数字
(例如,学生人数下
的
注册号)。当我尝试使用rvest时,如在 num <- school_webpage %>%
html
浏览 6
提问于2021-07-13
得票数 0
1
回答
xml_nodeset(NextMethod())中
的
错误:使用RVEST
抓取
时期望外部指针:[type=NULL]
、
当我试图
抓取
一些数据时,我遇
到了
问题,我已经创建了一个正常工作
的
函数,当我为许多
不同
的
代码运行这个函数时会出现问题。p=",ticker) tbl= a %>%
html
_nodes("section") %>%
html
_nodes("div")%>%
html
_nodesfinale <- lapply
浏览 1
提问于2022-07-13
得票数 0
2
回答
使用for循环从多个页面中
抓取
Web
、
、
、
、
我已经创建了网页
抓取
工具,从列出
的
房子中挑选数据。问题是:在这个网页中,最后一个“页面”可以一直
不同
。
现在
是70,但明天可能是68或72。例如,如果我
的
范围是(1-74),它将多次打印最后一页,因为如果超过最大值,页面总是加载最后一页。
html
: <-如果你超过了实数(70)
的
页数,它会自动打开最后一页(70),因为它是排列
的
次数。 那么,如
浏览 2
提问于2020-12-21
得票数 0
点击加载更多
相关
资讯
爬虫爬取英文文档存为PDF,在读取PDF自动翻译文档
使用多个Python库开发网页爬虫(一)
使用Python进行网页抓取的介绍
爬虫入门——详解Python是如何进行网页抓取!
零基础入门Python爬虫,一文掌握爬虫核心原理!
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券