我想爬行我的SPA构建的Vue框架(相对相同的反应框架)。但是,我看到在爬行时没有呈现内容。结果是:
<!doctype html>
<HTML>
<body>
<div id=app>
</div>
<script type=text/javascript src=/static/js/manifest.2ae2e69a05c33dfc65f8.js></script>
<script type=text/javascript src=/static/js/vendor.60c471696de493d48a1c.js></script>
<script type=text/javascript src=/static/js/app.335a9e9866cb7dc6a517.js></script>
</body>
</html>
基于组件的javascript框架是否反爬行?如何使组件由爬虫呈现?
我使用Abot
框架爬行建议
发布于 2022-03-06 01:56:54
Abot所做的就是向目标网站发送请求,解析数据并将其传回给您。您可能知道,React或Vue这样的框架是基于100% JavaScript的,这意味着除非您运行JavaScript,否则不会呈现任何数据。因此,这里的解决方案是启动无头浏览器或另一个DOM引擎,并刮取数据。
您可以使用的几个引擎是Selenium ( Python和其他一些语言中的浏览器自动化框架)、Puppeteer (NodeJS中基于Chromium的刮刀器),或者像JSDOM这样的DOM引擎。
故事的寓意是:如果您想看到JavaScript呈现的结果,您必须在DOM中执行JavaScript。
https://stackoverflow.com/questions/71367153
复制相似问题