HTML抓取现在得到了不同的数字

文章/答案/技术大牛

发布

2回答

、、、

我构建了以下代码，通过VBA将共同基金的价格拉入excel。一直持续到昨晚。它刚刚开始拉动一个不同的数字(道琼斯指数的%回报率。页面顶部。)。我看了看网站布局是否改变了，但没弄清楚。我认为代码混淆了我试图拉取的“值”和道琼斯指数的“正值”类。有没有办法让代码专注于“值”而不是“正向值”？

浏览 3提问于2020-06-05得票数 0

回答已采纳

1回答

通过c/ libcurl使用有效密码访问受密码保护的新闻网站

、、、、

我使用libcurl用C语言编写了一个网站爬虫，如果我们愿意的话，它可以从任何网站抓取文本内容。有谁能提供使用libcurl来实现这一点的建议吗？我知道您可以在libcurl选项中添加用户名/密码。我认为这样做，并简单地访问可能有密码保护的正确页面，将是它的全部。下面是CURL代码的摘录： curl

浏览 1提问于2012-05-22得票数 0

1回答

编辑粘性头html -如何找到相应的php文件

、

我需要让我的粘性头工作得更顺利一点。我希望粘性标头完全出现在正常标头不可见的地方。这样，用户的体验是平滑的。我已经了解了如何通过在browser dev工具中编辑以下html代码来实现这一点： <div id="header-wrap" class=" clearfix" data-

浏览 0提问于2018-07-29得票数 1

3回答

如何在google中获取某个关键字的搜索结果数

、、、

我需要提供一个关键字，如“蓝色金属水壶”(带引号/不带引号)，并且只获得此搜索结果的数量。如果我现在搜索时不带引号，我会得到：这里'1,040,000‘是我想要的数字。有没有什么API函数可以做到这一点，或者我必须通过HTML提取这个数字？做这件事最好的方法是什么？

浏览 1提问于2009-11-28得票数 5

回答已采纳

3回答

为什么lxml不返回与此html元素相关联的文本？

、、、、

我刚开始使用python解析html，现在遇到了麻烦。我正试着写一个简短的脚本，每天从网站上抓取一个数字。然而，代码并没有像我希望的那样返回一个数字，而只是返回None。下面的网页显示了每天在特定区域骑行的自行车数量：。我正在尝试写一个简短的python脚本来记录“昨天”骑过的自行车的数量(这是一个每天不同的数字，通常在500到

浏览 2提问于2015-08-03得票数 1

1回答

如何抓取AJAX页面中的所有url？

、、、、

我使用scrapy和splash抓取所有网址在网站上。在一些带有静态html的网站中，它工作得非常好！但当我抓取一些网站有AJAX页面，和html5我无法获得任何网址(例如：，)。有谁有解决这个问题的办法吗？非常感谢！

浏览 0提问于2018-10-11得票数 0

2回答

使用XML调用查找网页上不在源HTML中的元素

、、、

我正在抓取WebMD上不同药物的评分。当我转到评分页面(例如)时，会看到用户评论总数的平均值( 3.64、4.33和3.40)。我正试着用(对于第一个数字)或(对于所有3个)，但这两个都返回

浏览 0提问于2017-03-18得票数 0

1回答

使用rvest抓取名称相似的表

、、、

我正在尝试使用rvest从fbref.com上的不同页面抓取数据表。我已经能够使用以下命令从一个页面中抓取数据：URL <- "https://fbref.com/en/squads/822bd0ba/Liverpool"passStats <- WS %>% rvest::html_nodes(xpath =

浏览 5提问于2020-06-02得票数 1

回答已采纳

1回答

在PHP中，如何抓取某个文本模式的DOMDocument，然后获取匹配文本的文本节点的父元素？

、、、、

我已经用PHP和cURL构建了一个简单的web抓取工具，并且一直在使用这样的代码来通过ID抓取抓取页面的某些元素，或者在所需元素上没有ID的情况下通过标记名抓取：$table = $dom->getElementsByTagName('table')->item(4);现在我遇

浏览 1提问于2011-03-09得票数 0

回答已采纳

1回答

统计网页上HTML属性的数量

、

我需要在多个网页上计算不同数量的特定HTML属性。然后，我将使用这个数字来抓取那些href属性中包含的所需数据。[seq(1,1500,3)]%>% na.omit(fighter_links) 上面代码的目的是读取该页面上的HTML并提取我需要的链接。这只是我需要抓取的26个网页中的一个，所有这些页面都有不同数量的链

浏览 12提问于2020-10-22得票数 1

回答已采纳

1回答

GET和/或BeautifulSoup FanDuel web擦除的接收证书/ 403错误

、、、

我正在尝试抓取以下页面：https://www.fanduel.com/games/57764/contests/57764-245891325/scoring 以下使用urlopen()的代码生成了证书验证失败错误:证书链中的自签名证书(_ssl.c:1123)> 我还尝试使用以下代码，但收到了 html = f'https://www.fanduel.com/games/577

浏览 14提问于2021-04-27得票数 0

1回答

谷歌搜索网页抓取class=与浏览器上的不同

、、

我正在尝试抓取谷歌结果中的视频面板例如，我正在搜索--> "great+castles“<--在那个搜索结果中，它有一个包含视频的面板，当我抓取它时，我得到了HTML，但有不同的属性值，我无法抓取视频面板q={text}' soup = BeautifulSoup(response.text,'htm

浏览 0提问于2020-05-06得票数 0

3回答

Python -分析字符串

、、

我有个很烦人的问题，答案可能很简单，但我不能把2和2放在一起…<a href="javascript:void(0);" onclick="viewsite(38903);" class="followbutton">Visit</a> 每次加载页面时，数字38903都会有所不同。每次加载页面时，我都需要一个方法来解析这些数字。我已经够远了，可以抓取并包含上面的HTML<

浏览 4提问于2012-05-08得票数 0

回答已采纳

1回答

用BeautifulSoup和Python抓取特定的'dd‘标签

、、

我正在学习美汤，我遇到了一个十字问题。这就是在html中抓取dd标签。看看下面的图片，我想获取红色区域中的参数。问题是我不知道如何访问它们。我已经尝试过了： jedinica_mere = nek_html.find('

浏览 11提问于2019-10-31得票数 0

回答已采纳

3回答

从网站复制和粘贴-字体-权重:粗体与<b>

、、、

为了满足用户的要求，我告诉他们只需从网页上复制和粘贴，这样他们就可以将数据放到Word文档中。如果我使用<b>标记，然后复制-粘贴，那么“粗体”就会保留到Word文档中。我更喜欢继续使用CSS。

浏览 0提问于2011-03-22得票数 0

回答已采纳

2回答

目前我正在学习网页开发，在完成HTML/CSS之后，我现在正在学习JavaScript基础(天哪，它比前两个难多了！)，在这个练习项目中，我希望获取userGuess - secretActualNumber和computerGuess - secretActualNumber的绝对值，然后比较它们，看看哪一个更接近秘密数字userGuess-secretActualNumber); } 为了比较这两者，我想我需要

浏览 27提问于2020-04-17得票数 3

1回答

在没有源代码分支的新计算机上写Octopress博客？

、、

我最近更换了电脑，不小心删除了我的本地版本和所有的源文件(Markdown文件等)。不管我怎么想，它都在Github中(我使用GitHub页面)，所以我可以从那里开始。然而，我已经进入了Github，我的源代码分支并不在那里(很可能我从一开始就没有生成它！)。因此，有没有一种快速的方法，可以在不丢失我之前所有博客帖子的情况下，使用新的源代码分支进行发布？

浏览 1提问于2013-04-03得票数 2

回答已采纳

1回答

R: not抓取HTML中不包含的数据

、、、

我正在尝试从诸如these之类的网页中抓取R。但是html只有50行，所以我假设这些数字隐藏在一个javascript文件中或它们的服务器上。我不知道如何找到我想要的数字(例如，学生人数下的注册号)。当我尝试使用rvest时，如在 num <- school_webpage %>% html

浏览 6提问于2021-07-13得票数 0

1回答

xml_nodeset(NextMethod())中的错误:使用RVEST抓取时期望外部指针：[type=NULL]

、

当我试图抓取一些数据时，我遇到了问题，我已经创建了一个正常工作的函数，当我为许多不同的代码运行这个函数时会出现问题。p=",ticker) tbl= a %>% html_nodes("section") %>% html_nodes("div")%>% html_nodesfinale <- lapply

浏览 1提问于2022-07-13得票数 0

2回答

使用for循环从多个页面中抓取Web

、、、、

我已经创建了网页抓取工具，从列出的房子中挑选数据。问题是:在这个网页中，最后一个“页面”可以一直不同。现在是70，但明天可能是68或72。例如，如果我的范围是(1-74)，它将多次打印最后一页，因为如果超过最大值，页面总是加载最后一页。html： <-如果你超过了实数(70)的页数，它会自动打开最后一页(70)，因为它是排列的次数。那么，如

浏览 2提问于2020-12-21得票数 0

点击加载更多