开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Puppeteer:搜索内部文本不区分大小写

Puppeteer是一个由Google开发的Node.js库，用于控制和自动化Chrome或Chromium浏览器的操作。它提供了一组API，可以模拟用户在浏览器中的交互行为，例如点击、填写表单、截图等。

在Puppeteer中，搜索内部文本不区分大小写是指在进行文本搜索时，不考虑文本的大小写差异。这意味着无论文本是大写、小写还是混合大小写，Puppeteer都能够找到匹配的文本。

Puppeteer可以在许多场景中使用，包括自动化测试、爬虫、数据抓取和生成网页截图等。它的优势包括：

灵活性：Puppeteer提供了丰富的API，可以模拟用户在浏览器中的各种操作，使得测试和爬取等任务更加灵活和可控。
强大的调试能力：Puppeteer可以直接在Chrome或Chromium浏览器中执行操作，方便调试和定位问题。
支持无头模式：Puppeteer可以在无界面的浏览器环境中运行，节省资源并提高性能。
社区活跃：作为一个由Google维护的开源项目，Puppeteer拥有庞大的社区支持，可以获取到丰富的文档、示例和解决方案。

对于搜索内部文本不区分大小写的需求，可以使用Puppeteer的page.evaluate方法结合正则表达式来实现。以下是一个示例代码：

const puppeteer = require('puppeteer');

async function searchCaseInsensitiveText() {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto('https://example.com');

  const caseInsensitiveText = 'example';
  const caseInsensitiveRegex = new RegExp(caseInsensitiveText, 'i');

  const matches = await page.evaluate((regex) => {
    const elements = document.querySelectorAll('*');
    const matches = [];

    elements.forEach((element) => {
      if (element.textContent.match(regex)) {
        matches.push(element.textContent);
      }
    });

    return matches;
  }, caseInsensitiveRegex);

  console.log(matches);

  await browser.close();
}

searchCaseInsensitiveText();

在上述代码中，我们首先创建了一个正则表达式caseInsensitiveRegex，使用了i标志来表示不区分大小写。然后，使用page.evaluate方法在浏览器环境中执行自定义的JavaScript代码，通过遍历页面上的元素，查找匹配正则表达式的文本内容，并将结果存储在matches数组中。最后，我们打印出匹配的文本内容。

对于腾讯云相关产品和产品介绍链接地址，由于要求不能提及具体的云计算品牌商，我无法给出具体的推荐。但是，腾讯云提供了一系列与云计算相关的产品和服务，包括云服务器、云数据库、云存储、人工智能等。你可以访问腾讯云的官方网站，了解更多关于这些产品的详细信息和使用方式。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Solr4.6,搜索不区分大小写的配置

Solr4.6搜索有些字段搜索的时候不需要区分大小写。这个时候需要做简单的过滤，建索引和搜索的时候把输入都转换成小写即可。

1.2K1 0

聊聊NPM镜像那些险象环生的坑

; const puppeteer = require("....npm config set sass_binary_site https://npm.taobao.org/mirrors/node-sass/ Node版本与node-sass版本不兼容 node-sass...全局缓存中的binding.node版本与Node版本不兼容假如本地使用nvm或n进行Node版本管理，并且已切换了Node版本，在安装过程中可能会出现Windows/OS X/Linux 64-bit...查看Node版本和NPM版本确认已安装Node环境 node -v npm -v # 安装nrm并设置NPM的淘宝镜像 npm i -g nrm nrm use taobao # 设置依赖安装过程中内部模块下载...执行npm i前设置淘宝镜像，保证安装项目依赖时都走国内网络安装不成功时，肯定是在安装过程中该模块内部又去下载了其他国外服务器的文件在Github上克隆一份该模块的源码进行分析，搜索包含base、binary

5K5 1

puppeteer使用指南-入门

上篇文章讲解了如何安装puppeteer，这篇文章我们通过几个小案例来了解一下puppeteer的常用api的使用方法。...实现了截图，下面看一下如何使用百度进行搜索。...案例2，百度搜索，代码如下： const puppeteer = require('puppeteer'); (async () => { const browser = await puppeteer.launch...具体用法为page.type(selector,value,options) 5、page.click('#index-bn')点击搜索按钮 6、page.waitForTimeout(1000)暂停1...page.waitForTimeout(1000); browser.close(); })() 第三个案例我们增加了 page.evaluate函数，这个函数的参数是一个函数，这个函数相当于在这个page页面内部执行的

2.6K4 1

Puppeteer 入门指引

安装 Puppeteer npm i puppeteer 或 yarn add puppeteer 安装 puppeteer 的过程中会下载最新版本的 Chromiun (~170MB Mac, ~282MB...puppeteer-core 会忽略所有的 PUPPETEER\_* 环境变量关于 puppeteer 和 puppeteer-core 的详细对比请参考：puppeteer vs puppeteer-core...示例 4 - 自动填充表单并提交（在 https://developers.google.com 页面搜索框中输入关键词 Headless Chrome 并搜索）创建 search.js const...const page = await browser.newPage(); await page.goto("https://developers.google.com/web/"); // 在搜索框中输入关键词...启用详细日志记录（verbose loggin） - 内部 DevTools 协议流量将通过 puppeteer 命名空间下的debug 模块记录基本用法： DEBUG=puppeteer:* node

1.5K5 0

如何将开发流程工具化，躺着把代码写了

前言当年在百度搜索团队的时候做的一个小工具，可以把一些日常工作自动化，确实解决了一些问题。正值五一，分享点有趣的东西。希望能给大家一些启发。...故事的开始就在不久之前，我入职了百度的搜索团队，参与 pc 搜索的一些业务。搜索业务这么多年，历史积累的技术债务蛮多的，其中影响效率的主要是开发过程的问题。...做完这些功能后，又会想到自动创建 icafe（百度内部的项目管理平台）卡片（把 mrd（需求描述文档）的内容拿过来自动粘贴，自动输入一些信息之后创建卡片，并且把关联 cr 的代码复制下来），自动创建提测单...image.png 每个代码库都可以在创建时输入本地路径和 icode（百度内部的代码托管平台）路径还有相关的开发和 pm 等信息，这样可以一键用 ide 打开本地代码库，在详情里可以看到相关的人员的信息...electron 提供的 node 环境中 node 版本和本地的 node 版本要分开，运行时如果报版本不兼容，你再怎么更新本地 node 版本也没用，要去更新 electron 版本，electon

9662 0

GitHub 上 9 月份最火的开源项目

3 puppeteer https://github.com/GoogleChrome/puppeteer Star 15520 Puppeteer 是用 JavaScript 测试 Web 应用程序的框架...BRPC 即 Baidu-RPC ，是百度开源的 RPC 框架，在百度内部被大量采用，拥有超过 60 万个实例和 500 多种服务。...特性如下： ● 囊括百度内部所有 RPC 协议，支持多种第三方协议 ● 模块化设计，层次清晰，很容易添加自定义协议 ● 全面的服务发现、负载均衡、组合访问支持 ● 可视化的内置服务和调试工具 ● 性能上领跑目前其他所有...SerpentAI 是一个 Game Agent 框架（ps：在人机对战中，为了区分玩家，通常称机器玩家为 agent ），简单而又强大。...Vespa 可实现： ● 使用类似 sql 的查询和非结构化搜索来选择内容 ● 组织所有匹配以生成数据驱动页面 ● 通过手动或机器学习的相关性模板对匹配结果排序 ● 每秒数千次实时写入持久性数据

1.3K4 0

使用Node.js爬取任意网页资源并输出高质量PDF文件到本地~

puppeteer 官网地址: puppeteer地址 Node.js官网地址:链接描述 Puppeteer是谷歌官方出品的一个通过DevTools协议控制headless Chrome的...page.goto 指定我们去哪个网页爬取数据，可以更换内部url地址，也可以多次调用这个方法。...page.evaluate 这个函数，内部是处理我们进入想要爬取网页的数据逻辑 page.goto和 page.evaluate两个方法，可以在async内部调用多次，那意味着我们可以先进入京东网页...console.log不能打印，而且内部不能获取外部的变量,只能return返回，使用的选择器必须先去对应界面的控制台实验过能不能选择DOM再使用，比如京东无法使用querySelector。...推荐http://nodejs.cn/download/，Node.js的中文官网下载对应的操作系统包第二步，在下载安装完了Node.js后，启动windows命令行工具(windows下启动系统搜索功能

3.1K6 0

puppeteer实现线上服务器任意区域截图

整个九月份由于业务繁重以及玩心颇重，一直没有机会来写一篇博文。而且笔者于十月一日将会举办人生大事--婚礼，现在家里筹办过程中只能抽出零碎的时间来写这篇文章。...进行页面截图： const puppeteer = require('puppeteer'); (async () => { const browser = await puppeteer.launch...= require('puppeteer'); const browser = await puppeteer.launch({args: ['--no-sandbox', '--disable-setuid-sandbox...await screenshotDOMElement(page,"[data-share-wrapper]",savedPath); await browser.close(); 服务器依赖配置目前社区内部对于...执行如下命令： npm install puppeteer --unsafe-perm=true 设置unsafe-perm为true，则是为了避免npm在执行puppeteer包的脚本的时候随意切换UID

1.9K2 0

自动化 Web 性能分析之 Puppeteer 爬虫实践

Puppeteer 安装阅读 Puppeteer 的官方 API 你会发现满屏的 async、await ，这些都是 ES7 的规范，所以你需要： Node.js 的版本不能低于 v7.6.0，因为需要支持...双探 Puppeteer：爬取苏宁易购的商品信息打开电商首页，输入想要的商品名称，点击搜索按钮，跳转至相应的商品列表页，然后一页页浏览，从而找到心仪的商品，这大概就是我们平时网购的样子。...://www.suning.com'); // 获取页面标题 let title = await page.title(); console.log(title); // 点击搜索框拟人输入...“笔记本电脑” await page.type('#searchKeywords', '笔记本电脑', { delay: 500 }); // 点击搜索按钮 await page.click...click() 触发了一个跳转，会有一个独立的 page.waitForNavigation()对象需要等待 await page.waitForNavigation(); // 获取当前搜索项商品最大页数

3.4K4 0

node爬虫入门

这里只展示编写一个简单爬虫，对于爬虫的一些用处还不清楚，暂时只知道一些通用的用处：搜索引擎使用网络爬虫定向抓取网页资源、网络上面的某一类数据分析、下载很多小姐姐的图片（手动狗头）。...const ADom = $(item).find('a.lightblue'); // 获取博文列表作者元素 // 读取元素中的信息 const info = {.../GoogleChrome/puppeteer）来实现。...获取js动态插入内容的栗子代码如下： // getDynamic.js const puppeteer = require('puppeteer'); const cheerio = require('...中的爬虫库node-crawler（https://github.com/bda-research/node-crawler），开发者可以直接将想要爬取的网页url传入，然后他会返回一个jq对象（工具库内部也使用的

5.3K2 0

【工具篇】在.Net中实现HTML生成图片或PDF的几种方式

当时想着找一种开发部署都比较清爽并且运行稳定的方案，但实际上两者同时满足基本不可能，只能做一个自己觉得合适的取舍，下面从两个维度（清爽指数和功能指数）逐一对比。 1....这种方案简单粗暴，是C#中最基础的实现方式，也是网上搜索结果最多的一种，下面看它的核心代码（从网上拼凑得来）： 1 class WebBrowserPage2Image 2 { 3...PuppeteerSharp 这个就更厉害了，说到这个就不得不先介绍下Puppeteer，因为PuppeteerSharp正是从Puppeteer衍生而来。...生成图片和PDF文件例子： const puppeteer = require('puppeteer'); (async () => { const browser = await puppeteer.launch...目前PuppeteerSharp在网上的资料还不是很多，但是得益于它与Puppeteer高度完整和相似的API，Puppeteer的文档对它基本都能适用。

2.5K3 0

手写 Puppeteer：自动下载 Chromium

它的脚本类似这样： const puppeteer = require('puppeteer'); const fs = require('fs/promises'); (async () => {...screenshot.png', screenshot); await browser.close(); })(); 我们 launch 了一个浏览器，打开一个标签页，访问 baidu，在输入框输入一些内容，然后点击搜索按钮...跑起来是这样的：其实跑这种脚本不需要看到界面，所以 puppeteer 默认是 headless 的，也就是无界面的。...接下来我们尝试自己实现一个简易版 puppeteer 来深入理解它。这会是一个系列，叫做《手写 Puppeteer》，这是第一集。...为了深入理解它的实现原理，我们会从 0 实现一个 mini puppeteer。

1.6K1 0

MySQL存储的字段是不区分大小写的，你知道吗？

00 简单回顾之前写过一篇关于mysql 对表大小写敏感的问题（你有遇到过MySQL因大小写敏感导致的问题吗），其实在mysql中字段存储的内容是不区分大小写的，本篇进行简单的总结。...想回顾一下： MySQL在Linux下数据库名、表名、列名、别名大小写规则是这样的： 1、数据库名与表名是严格区分大小写的； 2、表的别名是严格区分大小写的； 3、列名与列的别名在所有的情况下均是忽略大小写的...02 解决方案因为默认情况下字段内容是不区分大小写的，也即大小写不敏感。所以解决方案就是要新增字段内容的校验规则。使用mysql 的BINARY 关键字使搜索区分大小写。...3）utf8_general_cs：utf8_general_cs区分大小写，cs为case sensitive的缩写，即大小写敏感。...注：我本机使用5.7 版本不支持 utf8_general_cs 字符集，创建报错。

2.4K3 0

【python自动化】Playwright基础教程(三)定位操作

exact：bool，是否找到完全匹配项：区分大小写和全字符串。默认为 false。...exact：bool，是否找到完全匹配项：区分大小写和全字符串。默认为 false。...默认情况下，匹配不区分大小写，并搜索子字符串，用于 exact 控制此行为。...传递 [string] 时，匹配不区分大小写并搜索子字符串。...传递 [string] 时，匹配不区分大小写并搜索子字符串。 has：匹配包含与内部定位器匹配的元素的元素。根据外部定位器查询内部定位器。

1K6 1

Linux命令帮助文档

命令类型 linux命令分为两种：内部命令 linux内置的指令外部命令对应一个位于文件系统某目录下的可执行程序通过type指令可区分命令类型 [root@senlong ~]# type...cd # 内部命令 cd is a shell builtin [root@senlong ~]# type cat # 外部命令 cat is /bin/cat [root@senlong ~]#.../usr/share/man/man1/cat.1.gz shell程序搜寻可执行程序文件的路径定义在PATH环境变量中； [root@senlong ~]# echo $PATH # 输出环境变量内部命令帮助文档...文本搜索： /KEYWORD: 以KEYWORD指定的字符串为关键字，从当前位置向文件尾部搜索；不区分字符大小写； n: 下一个 N：上一个 ?...KEYWORD: 以KEYWORD指定的字符串为关键字，从当前位置向文件首部搜索；不区分字符大小写； n: 跟搜索命令同方向，下一个 N：跟搜索命令反方向，上一个 history命令作用：管理命令历史

2.7K2 0

用Node.js把HTML转成PDF格式

这篇博文将指导你了解它们的可能性并最终实施。目录：在客户端还是服务器端生成？...如果你没有特殊需求，例如在 PDF 中选择文本或对文本进行搜索，那么这就是一种简单易用的方法。此方法简单明了：从页面创建屏幕截图，并把它放到 PDF 文件中。非常直截了当。...最终方案3：基于 Node.js 的 Puppeteer 和 Headless Chrome 什么是 Puppeteer？...先用 npmi i puppeteer 安装 Puppeteer，并实现我们的功能。...1const puppeteer = require('puppeteer') 2 3async function printPDF() { 4 const browser = await puppeteer.launch

6.3K3 0

Nginx 路由转发配置笔记

PartOne: [=|~|~*|^~|@] = : 表示精确匹配后面的url ~ : 表示正则匹配，但是区分大小写 ~* : 正则匹配，不区分大小写 ^~ : 表示普通字符匹配，如果该选项匹配，只匹配该选项...如果找到，停止搜索。所有剩下的常规字符串，最长的匹配。如果这个匹配使用^〜前缀，搜索停止。正则表达式，在配置文件中定义的顺序。如果第3条规则产生匹配的话，结果被使用。...返回601 - 请求 localhost/world/helloworld 返回601 - 请求 localhost/helloWorld 返回602 所以同时正则匹配时放在前面的优先匹配注意如果不区分大小写时...路径匹配规则 = : 表示精确匹配后面的url ~ : 表示正则匹配，但是区分大小写 ~* : 正则匹配，不区分大小写 ^~ : 表示普通字符匹配，如果该选项匹配，只匹配该选项，不匹配别的选项，一般用来匹配目录...如果找到，停止搜索。所有剩下的常规字符串，最长的匹配。如果这个匹配使用^〜前缀，搜索停止。正则表达式，在配置文件中定义的顺序。如果第3条规则产生匹配的话，结果被使用。

6.6K6 0

Nginx的location配置规则梳理

~ 表示执行一个正则匹配，区分大小写匹配 ~* 表示执行一个正则匹配，不区分大小写匹配 !~ 区分大小写不匹配 !~* 不区分大小写不匹配 ^~ 即表示只匹配普通字符（空格）。...@ 指定一个命名的location，一般只用于内部重定向请求。...4）~* 与 ~ 类似，但这个 location modifier 不区分大小写，pattern 须是正则表达式 server { server_name website.com; location...实例说明： 1）先来测试下区分大小写和不区分大小写的优先级.如下： location ~ /5b.txt { return 501 } location ~...6）访问 http://localhost/a.xhtml 不会匹配规则F和规则G，http://localhost/a.XHTML不会匹配规则G，因为不区分大小写。

1.9K7 0

Nginx的location匹配指令及常用内置变量

有如下指令语法可使用 ~ #区分大小写的正则匹配 ~* #不区分大小写的正则匹配 ^~ #普通字符匹配，如果此选项匹配成功，忽略其他匹配选项，一般用来匹配目录 = #普通字符精确匹配...@ #定义一个内部命名的匹配，适用于error_page,try_files 匹配执行顺序及优先级： - = 精确匹配精确匹配会第一个被处理，如果精确匹配成功...，停止搜索其他匹配模式，直接使用精确匹配 - 普通字符(/download,/img, ^~ /log,) 如果有前缀 ^~,且匹配此规则，那么停止搜索其他规则，使用此规则...没有前缀 ^~,那么继续搜索正则匹配或者更长的普通字符匹配，如果发现正则匹配或者更长匹配，则使用正则或者更长匹配 - ~* 正则匹配被最后处理，匹配成功则使用此规则...documents/1.jpg @location 例子 error_page 404 = @fetch; location @fetch( proxy_pass http://fetch; ) 常见内部变量

1.5K5 0

JavaScript参考手册 String函数 7080字

script> let str = "Hello world"; document.getElementById("demo").innerHTML = str.endsWith("world");//区分大小写.../*如果传入的子字符串在搜索字符串的末尾则返回 true，否则将返回 false*/ <!..."; var n=str.lastIndexOf("runoob", 9); //定位在第 9 个字符，并从第 9 个字符开始往前搜索结果为 -1。...在字符串中查找 "ain":区分大小写 document.getElementById("demo").innerHTML=n; }//赋值给p标签 </html...myFunction(){ var str = "The rain in SPAIN stays mainly in the plain"; var n=str.match(/ain/gi);//不区分大小写

3973 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭