使用regex统计在google应用程序脚本爬网上出现的HTML代码的次数

使用regex统计在Google应用程序脚本爬网上出现的HTML代码的次数可以通过以下步骤实现：

首先，需要使用Google应用程序脚本编写一个函数来获取网页的HTML代码。可以使用UrlFetchApp.fetch(url)方法来获取网页内容，其中url是要爬取的网页地址。将获取到的网页内容保存在一个变量中。
接下来，使用正则表达式来匹配HTML代码。可以使用JavaScript中的RegExp对象来创建正则表达式，并使用match()方法来匹配HTML代码。例如，可以使用以下正则表达式来匹配HTML标签：<.*?>。
使用match()方法获取匹配到的HTML代码，并统计其出现的次数。可以使用length属性获取匹配到的HTML代码数组的长度，即为HTML代码出现的次数。

下面是一个示例代码：

function countHTMLCode(url) {
  var html = UrlFetchApp.fetch(url).getContentText();
  var regex = /<.*?>/g;
  var matches = html.match(regex);
  var count = matches ? matches.length : 0;
  
  return count;
}

在上述代码中，countHTMLCode()函数接受一个参数url，表示要爬取的网页地址。函数首先使用UrlFetchApp.fetch(url)方法获取网页内容，并将其保存在html变量中。然后，使用正则表达式/<.*?>/g来匹配HTML标签，并将匹配结果保存在matches数组中。最后，通过matches.length获取HTML代码出现的次数，并将其返回。

这是一个简单的示例，实际应用中可能需要根据具体需求进行适当的调整和优化。对于更复杂的爬虫任务，可能需要考虑处理异步请求、处理动态页面等问题。

使用regex统计在google应用程序脚本爬网上出现的HTML代码的次数

、、

== -1){ break; } }` Google Ads脚本中的这段代码检查一段超文本标记语言的所有但是，我想对它进行修改，以便它计算HTML片段的出现次数，然后将每个URL和总计数添加到一个数组中，这样我就可以在google工作表中记录它们的值我想我需要像下面这样<e

浏览 13提问于2021-09-28得票数 0

1回答

PHP贯穿整个页面，抓取所有链接

、

我已经写了这个脚本，它可以工作，但只抓取页面上的第一个链接，然后停止： CURLOPT_URL => $line[0],$resp = curl_exec($curl);$regex_body>%s';$myFile = "localdownload.txt

浏览 1提问于2013-03-17得票数 0

回答已采纳

1回答

我收到“超出配额此应用程序暂时超过其服务配额。请稍后再试。”在我的GAE应用上。它不支持计费。我今天对它进行了安全扫描，这可能触发了超额配额，但根据控制台中的信息，我无法解释原因。每个请求的平均大小约为347k，但我的任何响应都不应该那么大。通过过滤我的日志，我可以看到今天没有响应大小超过25k的请求。因此，尽管安全扫描在其14分钟的运行中生成了许多小请求，但它不可能占1.59G。有人能解释这个吗？

浏览 0提问于2015-10-27得票数 0

8回答

我怎么知道Google多久爬一次我的网站？

、、

我创建了一个相对较新的网站，我把它提交给了谷歌和所有的公司。我也使用谷歌的网站管理员工具。我想知道谷歌蜘蛛访问我网站的频率。我经常听到人们在论坛上谈论“我每小时爬行250页”等等……有软件可以使用吗？类似于谷歌分析的javascript方法？或者有什么东西可以分析我服务器的日志呢？谢谢

浏览 0提问于2010-01-23得票数 7

1回答

一个问题调查应用程序Google脚本和Google与用户管理

我必须为我的工作做一点“众包”，它包含在一个非常简单的web应用程序中，用户可以注册/登录，然后被带到一个页面，其中图片显示给用户并提交一个数字。我希望能够设置一些规则来选择用户将看到的图片(这样他就不必回答两次相同的问题，并且允许用户之间的一些重叠来比较他们的答案)。我们可以假设我有一个google表，其中包含可以访问的图像URL列表，并且我希望在那里填充答案。我认为本教程将是一个很好的开端，因为它处理用

浏览 0提问于2018-10-13得票数 0

回答已采纳

1回答

使用UIWebview禁用IOS应用程序中的缓存

、、、

我有一个应用程序IOS加载相同的网址，但与不同的内容每5/10秒。在我的网站上，我计算我的应用程序调用我的url websie的频率。当我在浏览器(safari/chrome/fiefox...)中调用我的网站时我的网站统计好的次数。当我使用应用程序调用我

浏览 4提问于2013-04-22得票数 1

1回答

如何在多个Google工作表中自动执行COUNTIF公式？

、、

每次发布，我的一些报告都会帮助我们的工程团队进行测试，他们被分配到google工作表中并完成测试。有没有办法统计他们的名字出现在谷歌工作表中的次数，从一个单独的工作表或应用程序？我知道我可以使用COUNTIF，但这意味着我每周都要去写一堆countif公式，供不同的人测试。我在想，一定有一种方法可以编写一个脚本，在一列中搜索唯一的名称，然后自动

浏览 23提问于2020-01-07得票数 1

回答已采纳

2回答

Drupal 7显示点击/页面查看计数器

、、、

我想在我的网站上显示一个计数器。计数器将使用Drupal完成，而不是由外部提供程序执行。不管怎么说，以下是你所做的：2)转到:管理配置?系统?统计。你可能必须首先启用“统计学”割草机。重要的是-在巨型权限面板上，向下滚动到“统计”模块，并为“阳极用户”和“认证用户”启用权限。 5)您现在可以显示页面点

浏览 4提问于2014-03-07得票数 1

1回答

从查询中使用google脚本创建表

、

我已经成功地创建了一个谷歌图表，通过查询我的谷歌表。我试图通过查询相同的google表来创建一个表，但是我没有得到任何结果。我知道我做错了什么，但我不知道它是什么:/下面是代码：<head>google.setOnLo

浏览 1提问于2014-10-19得票数 1

回答已采纳

1回答

查找示例SMTP响应

、

我正在编写一个脚本来从邮件日志中提取统计信息。对于某些SMTP服务器，提取SMTP错误代码可能很困难，即使使用错误代码，关联的文本也可能包含有用的数据。为此，我正在寻找SMTP响应的示例，但我在google中发现的一切只是3位SMTP代码的标准含义的倒退。是否有任何真实的SMTP响应列表(归因于特定的MTA)

浏览 0提问于2019-12-17得票数 -1

1回答

如何将项目导入Eclipse？

、、

我搜索了是否有一种方法可以使用Google App Script (Eclipse露娜)完成我的Eclipse项目，然后我登陆了。但是我无法跟踪到最后，因为应该显示我的项目的Eclipse对话框是空的，只有一个名为My Drive的文件夹图标，这样我就可以导入我想要处理的项目。我按了一下，然后双击，什么也没发生。授权页面指示我使用注册我的应用程序，但是现在我不知道我还应该做什么来启用Google</

浏览 1提问于2014-12-21得票数 1

回答已采纳

2回答

如何修复错误‘引用错误：’文档‘未定义’

我试图在应用程序脚本中创建一个动态下拉列表。通过参考其他示例，我以如下所示的方式创建了函数。但是，测试函数返回‘引用错误：’文档‘未定义’。

浏览 0提问于2019-07-19得票数 0

2回答

Google Forms文件上传完整示例

、、

如何允许我的查看者使用Google表单将一些文件上载到我的表单并将其保存到我的Google Drive？我正在寻找一个完整的例子:它必须告诉什么代码添加到示例谷歌表单HTML源。如何使用Google Apps脚本将查看者的文件上传到我的Google Drive帐户？

浏览 2提问于2014-01-09得票数 37

回答已采纳

1回答

Google脚本不允许在中访问

、、、

现在，这个web应用程序应该只能在我工作的Google (以前称为GSuite)中访问。此设置可在发布Web应用程序时执行。但问题是，有些用户(到目前为止还不是所有的用户！)在我们的中，不能这样访问Google脚本。有一条错误消息说Google禁止这种连接。似乎认证“通过iframe”不起作用。有趣的是，只有当脚本嵌入到iframe中( Google的</

浏览 3提问于2020-12-11得票数 0

回答已采纳

1回答

错误: HIERARCHY_REQUEST_ERR: DOM异常3

、、

我正在为Google开发一个应用程序：页面HTML <div id="wrap"></div></body>$.get(url, function(html) { $("#wrap").html</

浏览 2提问于2012-01-10得票数 10

回答已采纳

1回答

返回null (数据抓取)的Google脚本regex* (google )*

、、

目标：--目标是从这个网站抓取shiller，并将其放入每24小时更新一次的google。网址： f

浏览 3提问于2020-09-15得票数 1

1回答

我如何从Google文档中获取HTML/数据并使用CSS对其进行重新设计？

、、、

我有一个名单在谷歌的文件，我想重新使用CSS。不幸的是，Google不再允许在应用程序内部使用CSS/HTML样式。我需要做什么才能从Google文档中获取信息，并将数据转换成一个独立的站点，使用我自己的CSS样式?n它是否涉及使用某种脚本？以某种方式用Regex抓取信息？也许Google会对我有帮助

浏览 0提问于2013-07-24得票数 3

回答已采纳

1回答

如何将最后一行从谷歌电子表格转移到麻省理工学院的App应用程序？

、、

我在HTML文档中使用Javascript做了非常类似的解决方案。Basicaly代码将最后一行(最后一次数据)从Google电子表格转移到HTML。所以页面总是最新的。现在我试着用麻省理工学院的制作类似的东西。也许ActivityStarter能解决这个问题。在互联网上没有解决办法。所以如果我们能在这里找到什么就太好了。

浏览 0提问于2016-06-16得票数 0

回答已采纳

5回答

JS:替换标签的innerHTML

、、、

我的应用程序动态地从我的网站获取HTML代码，并将其保存为字符串。://www.google.com">djmhfhb</a>我现在需要的是一个脚本，它接受所有的标签">LIN

浏览 0提问于2013-05-24得票数 0

5回答

开源项目都打扮得漂漂亮亮却无处可去

源代码位于codeplex at：http://silverstats.codeplex.com上，而应用程序目前托管在http://silverstats.co.uk上。但有一点:它不是针对统计学家的！它的目标是那些需要做统计来完成他们的工作(这就是为什么它很容易使用)。就个人而言，在方便使用的基础上，它击败了类似的Rcmdr手！你是完全正

浏览 0提问于2011-02-03得票数 6

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用regex统计在google应用程序脚本爬网上出现的HTML代码的次数

相关·内容

使用regex统计在google应用程序脚本爬网上出现的HTML代码的次数

PHP贯穿整个页面，抓取所有链接

为什么我的Google App Engine站点超过配额？

我怎么知道Google多久爬一次我的网站？

一个问题调查应用程序Google脚本和Google与用户管理

使用UIWebview禁用IOS应用程序中的缓存

如何在多个Google工作表中自动执行COUNTIF公式？

Drupal 7显示点击/页面查看计数器

从查询中使用google脚本创建表

查找示例SMTP响应

如何将项目导入Eclipse？

如何修复错误‘引用错误：’文档‘未定义’

Google Forms文件上传完整示例

Google脚本不允许在中访问

错误: HIERARCHY_REQUEST_ERR: DOM异常3

返回null (数据抓取)的Google脚本regex* (google )*

我如何从Google文档中获取HTML/数据并使用CSS对其进行重新设计？

如何将最后一行从谷歌电子表格转移到麻省理工学院的App应用程序？

JS:替换标签的innerHTML

开源项目都打扮得漂漂亮亮却无处可去

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐