使用cheerio获取XML文档中的所有标记_如何使用Cheerio和XML数据(JavaScript)获取标记名？_未使用python从XML中的元素标记获取所有属性 - 腾讯云开发者社区

javascript、node.js

我使用Cheerio从以下链接的title标签中输入标题文本： https://www.starbucks.com.sg/coffeehouse/store-locator# 在html title标记中，包含以下文本。 Store Locator | Starbucks Coffee Company 然而，当我使用Cheerio进行提取时，似乎有一个额外的字符一开始就不存在于html title标记中。应该不会有什么问题。 const title = $("title").text(); /* Outputs the following instead: Store Lo

浏览 12提问于2020-03-28得票数 1

1回答

如何从html中提取javascript？

javascript、html、web-scraping

我正在创建一个用javascript编写的web抓取程序，使用request和cheerio。我试图提取的网页在html中包含javascript。这是我感兴趣的javascript，但是找不到访问它的方法。有没有办法使用cheerio来提取javascript？非常感谢你的建议，我刚刚开始学习网络抓取。我的代码是： var request = require('request'); var cheerio = require('cheerio'); var credentials = { username: 'username',

浏览 6提问于2015-02-26得票数 1

2回答

xml - Cheerio中的自关闭标记空间问题

javascript、xml、xml-parsing、tags、cheerio

我的问题不是在cheerio解析期间保留XML关闭标记中的空间。 const xmlstr = <plugin> <testId /> <classId /> <goalsone> <goals /> <info>new</info> </goalsone> </plugin>; const $one = cheerio.load(xmlstr, { xmlMode: true }); console.log( $one.xml() ); 返回 <plugin> <

浏览 6提问于2020-03-19得票数 1

回答已采纳

2回答

如何使用Cheerio和XML数据(JavaScript)获取标记名？

javascript、xml、cheerio

我有一个xml数据，我希望能够从其中获取标记名并存储它们，或者根据数据中是否存在特定的标记来运行操作例如XML数据： <MyData version="3.0"> <StudentData type="Table"> <Student type="Table"> <StudentValue type="Table"> <DateOfBirth type="Data">2009-05-31</Date

浏览 21提问于2019-06-04得票数 0

1回答

增加网页剪贴机的复杂性

javascript

我如何进一步自动化我的网络剪贴机？目前，它可以搜索奇异常数urls。如何添加一个函数，使它在一个固定的网站中搜索多个页面。这是我的密码 const PORT = 8000 const axios = require('axios') const cheerio = require('cheerio') const express = require('express') const app = express () const url = 'heresurdata' axios(url) .then(respon

浏览 1提问于2022-03-10得票数 -3

回答已采纳

1回答

节点JS，Cheerio，获取XML版本

javascript、node.js、xml、xslt、cheerio

我有一个具有这种结构的XML： <?xml version="1.0" encoding="windows-1251"?> <?xml-stylesheet type="text/xsl" href="25-1.xsl"?> <movies> <movie id="1"> <title>Matrix</title> <characters> <character>

浏览 4提问于2017-04-24得票数 0

回答已采纳

1回答

如何从我爬行的HTML页面解析JavaScript对象？

javascript、node.js、parsing、web-crawler、html-parsing

我正在尝试索引一个食品食谱页面，而实际的菜谱作为一个对象存储在页面中的JavaScript中。一个例子URL：如果我在浏览器中打开developer工具并键入： console.dir(food.recipeItem.title) 我拿回头衔： "Bakt potet med rømme- og blåmuggostdressing" 一切都很好，很好，也正是我想要的。但是，我如何获得该脚本并在Node.js应用程序中解析它呢？Cheerio也许能帮我找到剧本，但不会做得更多？或者可能会？我不知道怎么做，也不知道什么是最有效的计算答案。或者是最坚固的。

浏览 4提问于2016-11-24得票数 0

回答已采纳

1回答

不能在Cheerio中显示选择器内容

javascript、node.js、web-scraping、request、cheerio

我正试图从一个网站中提取一个表格，并且想先得到所有的列。请求发出后，我将html加载到cheerio中，但是当我试图显示选择器内容时，控制台上不会出现任何内容。让我困惑的是，当我直接在页面控制台上尝试相同的选择器时，它会工作，并向我展示所有这些选项。这是我正在刮的。这里是我用来返回列的cheerio选择器。我想要的内容在标签th上，上面有类的“排序”。 $('.sorting').each(function (index, element) { const $element = $(element); cons

浏览 3提问于2020-01-05得票数 1

回答已采纳

1回答

NodeJS -请求一个包含稍后加载信息的页面

javascript、node.js、ajax、request、web-crawler

我正在用nodeJS制作一个网络爬虫，它可以工作，它调用页面，我使用cheerio转换成JQuery，并调用标记。现在，我试图调用页面的注释，但问题是，我想要的标记在几秒钟后从Ajax请求中加载。我所做的请求-承诺找不到这个特定的标签，因为它会在稍后加载。有什么办法可以让我找到装载的标签吗？代码： /* Requires */ var rp = require('request-promise'); var cheerio = require('cheerio'); //Page to crawl var pageToVisit = "http

浏览 1提问于2017-08-14得票数 0

回答已采纳

1回答

使用Node.js、request和cheerio从网站上抓取链接？

javascript、html、node.js、web-scraping、cheerio

我正在尝试使用Node.js、在我校的课程日程网站上搜索链接。但是，我的代码并没有到达所有主题链接。链接到课程时间表网站。下面是我的代码： var express = require('express'); var request = require('request'); var cheerio = require('cheerio'); var app = express(); app.get('/subjects', function(req, res) { var URL = 'http://cours

浏览 2提问于2016-02-09得票数 1

回答已采纳

1回答

在K6测试中捆绑npm模块“cheerio”

npm、k6

我正在尝试使用K6框架从LoadImpact创建一些测试，但我很难按照文档站点上的说明包含外部NPM模块。在loadImpacts文档站点上，它们包含了一个详细的示例，说明我所追求的是哪些模块，这些模块使我能够从soap服务响应中解析xml。但是，我无法做到这一点！现在，我是一个完全的javascript新手，但我已经编码很多年了，我真的很想解决这个问题。可以在这里找到：，有人能做到这一点吗？我需要在与Internet隔离的服务器上运行这个程序，所以我完全依赖于创建包和传输所需的文件。根据文档创建的包如下所示 -- bundle `cheerio` npm module git clone

浏览 0提问于2019-05-06得票数 2

回答已采纳

1回答

NodeJS Cheerio刮取li标记总是返回NULL

javascript、html、node.js、cheerio

我试图在URL变量中页面的li标记中包含的URL上进行调整。应该很简单，但我不能让它起作用。我得到了正确的元素数，但它们都是空白的。text()返回'‘& html()返回null。我在这里做错什么了？ const cheerio = require('cheerio'); const request = require('request'); function getHistory(){ let url = 'http://coinmarketcap.com/historical/'; request(url,(err

浏览 3提问于2017-07-15得票数 1

回答已采纳

1回答

节点JS:给定一个html字符串，如何在所有<script>标记中获取内容，操作并替换它？

node.js、string、liquid

概述我正在进行一个项目，其中包含数十个.Liquid (Shopify)片段，其中包含<script> tags代码。它们类似于HTML，它们看起来像这样： {% assign variable = 'test' %} <p>hey {{variable}}</p> <script>console.log("hey")</script> {% schema %} { ...json stuff } {% endschema %} 问题基本上，我想要做的是在<script>中获取内容，

浏览 1提问于2021-01-20得票数 0

1回答

使用cheerio获取XML文档中的所有标记

node.js、xml、cheerio

我正在尝试使用cheerio.js来转储xml文档中的所有标记。我的尝试如下所示，但它似乎不是迭代文档中的每个标记，而是迭代文档中的每个单词(或者在我看来是这样)。 let uniqTags = {}; const listTags = function($, tagname) { uniqTags[tagname] = ''; let childNodes = $(tagname).contents() .map((index, element) => { if (element.type === '

浏览 12提问于2019-05-21得票数 0

1回答

如何使用cheerio获取itemprop元素的值？

javascript、reactjs、cheerio

我第一次尝试从paginas amarillas中做一点网络抓取，比如公司名称，地址等。地址在跨度内，没有类，只有一个itemprop="streetAddres"，我尝试了不同的方法，因为它是一个很长的字符串来到达选择器，我得到数据，直到项目属性之前的一个，但我不知道如何瞄准项目属性选择器，我遇到的问题是pathAddreses常量，它在控制台日志中返回一个空数组，如果我删除字符串的最后一个元素(itemprop='streetAddres')，它会给我带来数据，但不是我想要的数据代码如下： const cheerio = require("chee

浏览 1提问于2020-01-28得票数 0

2回答

使用node.js访问DOM

javascript、node.js、dom、cheerio、jsdom

我想使用node.js访问html文件并通过id获取元素，这是我的html文件： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>Diagram </title> <script> function generatePNG (oViewer) { // some other code reader.onloadend = function() { base6

浏览 1提问于2015-12-14得票数 6

3回答

node.js + cheerio :传递一个urls数组来下载？

javascript、jquery、node.js、scrape、cheerio

首先，以下是我到目前为止所取得的进展： var http = require("http"); // Utility function that downloads a URL and invokes // callback with the data. function download(url, callback) { http.get(url, function(res) { var data = ""; res.on('data', function (chunk) { data += chunk;

浏览 0提问于2013-12-14得票数 1

1回答

如何为嵌套的div格式化cheerio选择器？

html、css-selectors、cheerio

我需要一些使用cheerio抓取网站的帮助 https://www.keepandshare.com/calendar/mobile.php?i=1940971&do=n 我想要抓取的文本紧跟在<p>之后。我想从calendar_one_line_text目录中获取此文本的最后一个匹配项。 <div class="calendar_one_line_text"> <p>Cedar 3,044 gr/m3 High, Grass 27 gr/m3 High, Trees 27 gr/m3 Medium, Molds Low&l

浏览 26提问于2020-12-27得票数 0

回答已采纳

1回答

cheerio的选择器(Node.js)在控制台中工作，但不在我的脚本中

javascript、node.js、cheerio

我正在写一个简单的脚本，从网站上抓取一个货币表。到目前为止，这是我的脚本，我想要做的是从以下网站获取外汇汇率表：https://www.bangkokbank.com/en/Personal/Other-Services/View-Rates/Foreign-Exchange-Rates 到目前为止，这是我的代码。 const cheerio = require('cheerio'); const request = require('request'); request({ method: 'GET', url: '

浏览 9提问于2020-12-18得票数 0

回答已采纳

1回答

如何在web浏览器中显示控制台内容？

javascript、node.js

我有example1.js nodejs文件，它在控制台中运行正常我们如何使用http请求在web浏览器中显示它？ var request = require('request'); var cheerio = require('cheerio'); request('news.ycombinator.com', function (error, response, html) { if (!error && response.statusCode == 200) { var $ = cheerio.load(ht

浏览 2提问于2014-05-09得票数 0

2回答

sitemap中找不到任何链接

cheerio、apify

我正在尝试从我想要刮的站点地图( sitemap，XML)获取URL。为此，我尝试使用标准Cheerio模板，但它一直返回没有找到URL。知道为什么会这样吗？ const Apify = require("apify"); const cheerio = require("cheerio"); Apify.main(async () => { const input = await Apify.getInput(); // Download sitemap const xml = await Apify.utils.requestAsBro

浏览 11提问于2022-10-06得票数 1

4回答

如何根据JavaScript / cheerio的要求从以下html中提取文本？

javascript、html、cheerio

我想从名为text.html的html中提取文本，如下所示 <div class="trans-container"> <ul> <p class="wordGroup"> <span style="font-weight: bold; color: #959595; margin-right: .5em; width : 36px; display: inline-block;">adj.</span> <span class=

浏览 2提问于2017-09-08得票数 0

回答已采纳

2回答

如何在PHP中准确解析XML XLIFF文件并获取源内容

php、xml

如何准确解析XML XLIFF文件，并在PHP中获取源内容。如何获取xml文件的源内容

浏览 2提问于2009-11-10得票数 0

1回答

在SQL Server 2008中动态选择Xpath中的节点

sql-server-2008、xpath

我要在SQL Server 2008中解析以下XML <Root> <Document> <Body> <Component> </Component> </Body> </Document> </Root> 我想检索我的xml中的所有<Component>标记，问题是<Document>标记有时可能不会出现，因此我的(根/文档/主体)的xpath查询将不起作用。有没有办法可以获得所有的<Component>标签，而

浏览 1提问于2011-11-01得票数 1

1回答

使用nodeJs进行XML抓取

node.js、xml、web-scraping、cheerio、tally

我有一个非常大的xml文件，它是我从tally导出所有数据后得到的，我试图使用网络抓取来从我的代码中提取元素，但我在格式或类似的东西上遇到了问题。使用fs.readFileSync()读取它可以很好地工作，并且console.log会显示完整的xml文件，但是当我使用fs.writeFileSync编写文件时，它会显示如下所示： ? 而我的web抓取代码输出的是空文件： const cheerio = require('cheerio'); const fs = require ('fs'); var xml = fs.readFileSync(&#

浏览 11提问于2020-06-30得票数 0

1回答

从在线分数网站上抓取数据

javascript、html、node.js、web-scraping、cheerio

我正试着从一个实时得分网站上获取数据。我使用node.js与express.js，request.js和cheerio.js从网页中获取超文本标记语言。它适用于HTML的某些部分，但不适用于活动部分。我在试着从网站上搜集数据。当我使用Chrome开发人员工具时，我可以看到HTML内容，但当我使用JavaScript代码时，结果是空的。以下是我试图提取的Chrome截图：下面是我使用的代码： var express = require('express'); var fs = require('fs'); var request = require

浏览 2提问于2015-11-03得票数 3

1回答

执行web scraper时出现的问题

javascript、node.js、web-scraping、screen-scraping

我正在抓取网页https://www.g2a.com/rising-storm-2-vietnam-steam-cd-key-global.html 我需要从表数据中获取标题。 var express = require('express'); var fs = require('fs'); var request = require('request'); var cheerio = require('cheerio'); var app = express(); app.get('/scrape',

浏览 0提问于2017-06-20得票数 0

1回答

用node.js通过网页刮擦获取IMG SRC

node.js、web-scraping、cheerio

使用事件侦听器获取，并使用cheerio使img退出： <div class="mainimage"> 当前代码： var cheerio = require('cheerio'), $ = cheerio.load(this.responseText); console.log($('mainimage').attr('img')); 然而，它返回“未定义”

浏览 2提问于2017-05-11得票数 0

回答已采纳

1回答

如何减少Node JS中多个异步函数的运行时间？

javascript、node.js、promise、request

我想在Node js中抓取一些网页并从中获取一些数据。我的代码正在工作，但它几乎需要1分钟来完成抓取和返回所有数据。我已经为每个网站使用了异步功能，并承诺收集所有信息。有至多100个链接，我已经在它上工作。我认为运行时间对这个来说太长了。我的代码结构中有没有什么问题( request-promise，promises，async，await等的用法)是什么原因造成了延迟？所有函数都可以并行/异步运行，但我的限制是我需要等待每个网站的所有结果。我将每个请求的超时时间限制在10秒内。如果我进一步减少它，现有的ETIMEDOUT、ECONNRESET、ESOCKETTIMEDOUT错误(我仍然无法摆

浏览 2提问于2018-11-29得票数 0

2回答

从维基百科中抓取表列的NodeJS程序

node.js、cheerio

我正在学习Node和如何在网上刮擦。我认为从维基百科页面中提取列是一个很好的方法。我一直在学习如何使用Cheerio进行网络抓取，但我不确定如何在NodeJS中编写这个代码。我已经熟悉html选择器来识别页面上的元素，但不知道如何将其提取到程序中。我计划将这些信息提取到一个列表中。我希望在wiki页面上提取表中的符号和安全列。下面是我编译的代码和我正在得到的结果。我在网页上创建了一个基于选择器的const。我认为它应该根据选择器返回列中的所有值。 var AWS = require("aws-sdk"); var AWS = require("aws-sdk/glo

浏览 4提问于2021-11-08得票数 1

回答已采纳

1回答

用cheerio抓取所有元素

javascript、node.js、cheerio

我正在运行下面的代码来抓取数据。但是，代码只抓取了第一个元素。 const cheerio = require('cheerio') const jsonframe = require('jsonframe-cheerio') const got = require('got'); async function scrapeCoinmarketCap() { const url = 'https://coinmarketcap.com/all/views/all/' const html = await got(

浏览 0提问于2017-10-30得票数 0

2回答

node js cheerio xml

node.js、cheerio

我有下面的代码，它工作得很好，可以得到： <troveUrl>http://trove.nla.gov.au/work/23043869</troveUrl> 但是我想从同一页面中获取下面的'id‘之后的值，但无法获取！ <work id="23043869" url="/work/23043869"> 下面是我目前拥有的代码 var request = require ('request'), cheerio = require ('cheerio'); reques

浏览 0提问于2014-07-29得票数 4

回答已采纳

2回答

通过部分标记名获取元素树标记文本

python、xml、elementtree

在XML文档中，我有一个带有DateTime标记的元素，可以使用以下方法提取该元素： for elem in xml_tree_root.iter(tag='DateTime'): print(elem.text) 在同一个XML文件的另一个版本中，标记的名称是blahblooDateTimebloobli。所以我需要这样的东西： for elem in xml_tree_root.iter(tag='*DateTime*'): print(elem.text) 这可能适用于两个版本的XML。但是对于后者，它不起作用。不过，如果我只将'*

浏览 2提问于2021-05-08得票数 2

回答已采纳

1回答

使用cheerio来刮除html不能检索第二个连续元素

html、node.js、cheerio、scrape

伙计们，我正在使用cheerio刮一个html文档，如下所示，我需要在每个文章元素中找到两个元素的href。 <article> <div class="row"> <div class="col-md-5 col-6"> <a class="btn" href="https://xxxxxx.png">abc1</a> </div> <div class="col-md-5 c

浏览 1提问于2019-04-29得票数 0

回答已采纳

1回答

如何在Node.js (支持HTML实体和CDATA部分)中解析和修改XHTML？

javascript、node.js、dom、xhtml

我正在开发一个Node.js应用程序，它接收XHTML (汇流存储格式)，应该对其进行一些修改，然后将修改后的XHTML发回。XHTML可能包含HTML实体(如ö)和CDATA部分(如<![CDATA[test]]>)。我遇到的挑战是，在我尝试过的解析器中，当我在HTML模式下解析片段时，CDATA部分会中断，但是当我在XML模式下解析它时，HTML实体就不会被正确地解释。下面是一个示例，说明我如何在浏览器中使其工作，但如何使用jsdom和cheerio使其无法工作。我是否可以使用其他库来实现这一目标，或者使用jsdom或cheerio的其他方式？在浏览器中

浏览 4提问于2021-10-26得票数 0

回答已采纳

1回答

使用Jetty解析器检索重复元素

java、xml、xml-parsing、nashorn

目前，我正在使用JavaScript Nashorn中的Jetty检索XML有效负载中的某些节点，并且希望检索具有相同名称的某个子节点。例如： <MessageV1 xmlns="http://schemas.somecompany.com.au/somemessage.xsd"> <DeliverWeb> <DeliveryMethod>WebService1</DeliveryMethod> <DeliverToUrl>https://someurl.com/class/Webs

浏览 6提问于2022-01-27得票数 0

回答已采纳

1回答

将cheerio.load()转换为DOM对象

javascript、jquery、dom、web-scraping、cheerio

我正在尝试学习如何制作一个网络刮板，并使用node将网站内容保存到一个文本文件中。我的问题是，为了获取内容，我使用了cheerio和jquery (我想？)，而我没有使用它们的经验。我正在尝试将从cheerio获得的结果转换为我有更多处理经验的DOM对象。如何从cheerio获取html并将其转换为DOM对象？提前感谢！ const request = require('request'); const cheerio = require('cheerio'); request('https://www.wuxiaworld.com/novel/ove

浏览 5提问于2018-11-18得票数 1

1回答

如何评估web报废时使用cheerio的javascript变量

javascript

当我使用Cheerio刮取时，我只接收一个变量名，而不是变量值。代码： const BankofAmericaScraper = async (browser) => { const date = new Date().toLocaleDateString(); const page = await browser.newPage(); await page.goto(URL, { waitUntil: ["load"], timeout: 0, }); const MortgagesPage = await page.content

浏览 3提问于2022-08-25得票数 -1

1回答

如何获取数据与欢呼声？当我看到页面源数据是空的，但是当我在检查元素中看到数据时

javascript、node.js、web-scraping、ecmascript-6、cheerio

我希望你在乎。当我在另一个网站上抓取数据的时候，我是很有价值的。这是我的情况，当我看到页面源数据是空的，但当我看到检查元素时，我看到了数据。如果您不了解这些图像，请先在“检查”元素中查看，然后在“查看”页源中显示。这是我的代码 const request = require('request'); const cheerio = require('cheerio'); const url = "https://pikobar.jabarprov.go.id/" request(url, (error, response,

浏览 5提问于2020-04-11得票数 0

回答已采纳

2回答

如何使用Node.js中的Cheerio通过更改数据来刮表？

javascript、node.js、web-scraping、cheerio、request-promise

我正在尝试从一个网站中的表中刮取数据，该网站的值一直在变化，。因此，每一行都可以日复一日地变化，但我希望能够刮取正确的数据。目前，我正在使用Cheerio库，我对它并不熟悉，但我拥有的是： const rp = require("request-promise"); const cheerio = require("cheerio"); let Italy = ""; async function main() { const result = await rp.get("https://www.worldometers.in

浏览 1提问于2020-03-09得票数 0

回答已采纳

1回答

用于在HTML文档的<script>标记内查找特定文本的脚本

jquery、node.js、cheerio

我正在尝试构建一个爬虫，它是用JavaScript制作的，但也使用了node.js，以及'request'，'cheerio‘和'url-parse’节点模块(使用npm安装)。我只想找到包含脚本标记DM_redirect("http://mobile.作为下一个节点的一对脚本中的第二个。看起来cheerio使用的是jQuery的精简版本，我所有的尝试都失败了，我试图找到正确的命令来指向文本节点的第二个脚本。任何关于这方面的意见都将非常感谢。

浏览 1提问于2016-05-16得票数 0

1回答

Web抓取返回URI，而不是图像的URL。(Javascript Cheerio)

javascript、web-scraping、cheerio

我正在使用Cheerio和请求网络抓取图像URL，当我想要获取URL时，我会一直获取URI。我能做些什么来修复这个问题？ const request = require('request-promise'); const cheerio = require ('cheerio'); (async () => { const webUrl = 'https://www.redbubble.com/lists/9747201/favorites'; const response = await request(webUr

浏览 47提问于2020-04-04得票数 0

回答已采纳

1回答

Webscraping walmarts产品

javascript、dom、cheerio

我试着在网上刮沃尔玛的产品。这里是我试图拉出的链接，我能够成功地从页面中刮出10个产品。这是我正在使用的代码。 const axios = require('axios'); const cheerio = require('cheerio'); axios.get('https://www.walmart.com/search/?query=&cat_id=91083').then( res => { var combino1 = []; const $ = cheerio.load(res.da

浏览 7提问于2020-04-11得票数 0

回答已采纳

2回答

nodejs保存所有镜像

javascript、node.js

什么是一个解决方案，以保存所有的图像文件从一个网页。我还在玩呢。目前我得到的只是src的列表。我现在如何着手下载这些文件。 var request = require('request'); var cheerio = require('cheerio'); var url = 'http://www.slashdot.org'; request(url, function(err, resp, body){ $ = cheerio.load(body); imglist = $('img'); for (v

浏览 0提问于2012-04-26得票数 0

1回答

节点js cheerio解析html

javascript、node.js、parsing、cheerio

因此，我有一个问题，我无法获得链接到一部电影，我想为“人们也喜欢”部分，它显示给你的电影是相似的。不过，有些电影的那一页我看不太清楚，因为有一个角色部分 function findCommonMovies(movie, callback){ request('http://www.imdb.com/find?ref_=nv_sr_fn&q='+ movie +'&s=all', function (error, response, body) { if (error){ return }els

浏览 3提问于2017-10-05得票数 0

回答已采纳

2回答

使用Cheerio从<ul>获取<li>下的href

javascript、node.js、cheerio

这可能不是最好的问题，但我真的不能让它工作。我想要做的是从下面的html中获取hrefs。 <ul id="nav-products"> <li><a class="" href="/shop/hats/">yellow good looking hat</a></li> <li><a class="" href="/shop/shoes/">cat feet holders</a></li>

浏览 125提问于2019-03-24得票数 1

回答已采纳

2回答

未捕获TypeError：$(...).text不是函数

javascript、html、node.js、cheerio

我有一个非常简单的，并且我尝试使用cheerio执行一个简单的CSS选择器。 const $ = cheerio.load(html); console.log($(`body > div > div.-layout-h > div.task-tests--label`).text()); 结果： Input:Output: Expected Output:Console Output: 我的目标是获得第一个元素并打印出它的内部文本。我还尝试使用each()遍历选定的元素： const $ = cheerio.load(html); $(`body > div >

浏览 1提问于2017-05-15得票数 0

2回答

用nodejs在非结构化html上爬行

node.js、xpath、web-crawler、cheerio

我需要抓取/废弃一个静态的非结构化HTML，我试图用nodejs代码获取内容，我尝试使用cheerio和xpath，但没有成功。要获取的第一个元素的Xpath是/html/body/center/center/table/tbody/tr3，然后我需要获取TR中的每个TD文本。如果尝试获取tbody节点 var parser = new parse5.Parser(); var document = parser.parse(response.toString()); var xhtml = xmlser.serializeToString(docum

浏览 0提问于2015-11-01得票数 1

回答已采纳

1回答

用cheerio从JS函数调用中提取参数值

postman、html-parsing、cheerio

邮递员请求返回html页面。在postman测试中使用cheerio，我找到需要从中提取更具体值的标记，cheerio代码是： const $ = cheerio.load(pm.response.text()); postman.setEnvironmentVariable("the_tag", $('body script')); 这给了我： < script type = "text/javascript" > $(function () { some_func(arg1, arg2, arg3, arg4); }); <

浏览 5提问于2021-12-27得票数 0

1回答

node js将节点或元素添加到xml文件

node.js、xml、dom、cheerio

如何在node js express中添加新的节点/元素或更新xml文件？我试着用cheerio做这件事，我的代码是： $ = cheerio.load("my.xml", {xmlMode: true}); $('urlset').append('<url><loc>www.google.com</loc></url>');

浏览 11提问于2017-08-08得票数 1