使用javascript从chrome控制台抓取网站_Chrome扩展JavaScript -从外部网站抓取内容_使用Google Chrome扩展抓取网站 - 腾讯云开发者社区

javascript、c#、.net、winforms、webbrowser-control

我正在使用带有VS2015的C# .net 4.5，并尝试抓取网站。HTML表格到数据。对于使用winform的网页浏览器控件，因为我听说它比C#控件有更多的功能。这是我试图解析的网站。(像苹果音乐这样的韩国音乐流媒体网站) ，还有一个翻页的脚本，如下所示。 javascript:pageObj.sendPage('21'); 这意味着从数据列表的21开始显示数据表。但是我不知道如何在我的C#浏览器中运行这个脚本。我试着用带参数的InvokeScript运行，但它找不到脚本。据我所知，为了执行对象包装函数，我可以像代理一样在加载的HTML文档中注入一个函数。但它也失败了。经过

浏览 31提问于2016-09-01得票数 1

回答已采纳

2回答

用铬远程接口进行Node.js擦拭

python、node.js、google-chrome、selenium、screen-scraping

我一直在努力刮一个由保护的网站，在这个网站中，使用selenium (与Python一起使用)总是会失败。我做了一些搜索，我的结论是这个站点可以通过使用某种javascript来检测您正在使用Selenium。然后我在chrome-remote-interface拿走了一个赃物，好像这是我想要的东西，但是后来我被卡住了。我想要做的是自动化以下步骤：打开Chrome实例导航到页面运行一些javascript 收集数据并保存到文件中重复步骤2-4 我知道我可以通过以下方式打开Chrome实例以进行调试： google-chrome --remote-debu

浏览 5提问于2017-05-04得票数 5

回答已采纳

1回答

用于获取HTTP响应代码的Chrome控制台API

javascript、google-chrome、google-chrome-devtools

如何在Chrome的Javascript控制台中查询网站的HTTP响应代码(200、500、404等)？由于我在命令行中以无头模式使用Chrome，所以我无法访问DevTools窗口。最好是，我想知道Javascript的名称，它允许我从Chrome的Javascript控制台查询其他HTTP响应细节。我也不想安装额外的扩展来使这个工作。

浏览 0提问于2019-05-21得票数 0

3回答

使用python抓取此网站

javascript、python

我是网络抓取的新手，并试图抓取以下网站：我正在尝试使用python进行抓取。我已经尝试了请求，PhantomJS，selenium chromedriver来获取html。但是我得到的html与我在使用google chrome进行检查时看到的html不匹配。我对抓取非常陌生，对html的了解很少，对JavaScript几乎一无所知。我的主要难题是获得我在google chrome中看到的html，这样我就可以开始抓取了。提前感谢！

浏览 30提问于2018-02-01得票数 0

1回答

使用JavaScript将请求有效负载存储到localStorage

javascript、json、xmlhttprequest、local-storage

在网站上提交表单后，在Google Chrome的开发控制台中有一个application/json类型的XHR请求，该请求将数据发布到另一个服务器。 POST请求包含一个JSON数组，我正在尝试获取其中一个参数，并将其存储在localStorage或sessionStorage中以供以后使用。是否可以仅在前端使用JavaScript来完成此操作？我想沿着名称，请求url是，然后抓取JSON对象，选择‘lines...when’元素，在localStorage中设置为键'name‘。

浏览 0提问于2016-01-06得票数 0

1回答

crawler抓取chrome扩展id

javascript、google-chrome、web-crawler

我该如何为谷歌chrome扩展网站编写一个爬虫呢？我正在做一些关于chrome扩展的安全研究。每个类别大约有100个扩展，我现在遇到的问题是编写一个爬虫来至少抓取UID。这个网站似乎是用javascript更新的。如果我抓取html，我将什么也得不到，因为该站点似乎会在稍后阶段加载页面的其余部分。换句话说，我需要的核心内容(即包含所有扩展元素的DOM )似乎是在我使用python抓取HTML之后加载的。有什么想法吗？

浏览 2提问于2012-04-21得票数 1

回答已采纳

1回答

使用API通过node.js执行浏览器操作

javascript、node.js

我想做一些活动。在网站中单击。我可以在chrome中用javascript (或chrome扩展)来做这件事，但是有没有可能不打开chrome而用服务器端代码呢？未提供任何API。它不是抓取，而是执行某种操作。

浏览 3提问于2016-12-28得票数 1

2回答

如何使用web浏览器控制台访问网站资源文件

javascript、internationalization、google-chrome-devtools、dom-events

我已经加载了一个网页，现在打开Chrome开发者控制台。现在，我想阅读网站在web浏览器控制台中加载的资源文件(如样式/图像/语言属性)。如果可以读取使用Javascript代码从控制台发出的网络调用，也就足够了。 (实际执行情况如下：我将使用Selenium和Java代码启动Chrome浏览器，一旦启动，我将执行Javascript代码，以便为特定网站通过网络加载国际化文件，这样我就可以根据所使用的国际化语言调整我的Java selenium代码库。 URL：试图获取这个文件的url，它可以在网络选项卡中看到，但我需要使用使用Javascript代码执行的Javascript来获取这个ur

浏览 7提问于2016-02-26得票数 1

1回答

使用Python远程运行脚本命令

javascript、python

我有一个Python程序，它使用BeautifulSoup从网站提取一些数据。在Google Chrome中，有一个名为开发人员控制台的选项；它用于在网页上实时执行javascript命令。有没有办法或者变通的办法使用Python远程执行javascript命令？比如将网页转换为对象，然后在后台运行javascript命令(无需启动新的Chrome窗口)？

浏览 5提问于2018-01-13得票数 1

1回答

在Chrome中使用Headless模式效率较低？

python、selenium、selenium-webdriver、web-scraping、selenium-chromedriver

我使用selenium +美汤(使用selenium打开包含大量javascript的页面，并使用javascript命令将其转换为BeautifulSoup对象)来从体育网站上抓取数据，但由于某些原因，我不能使用无头浏览器。当我使用chromedriver实现无头浏览器时，我几乎不会像让chromedriver打开并运行时那样抓取大量数据。有没有人有类似的问题，或者有什么建议？ def get_bs(self, url, sport_url): driver = webdriver.Chrome(executable_path='drivers/chromed

浏览 2提问于2020-05-09得票数 0

1回答

区分控制台和浏览器的javascript

javascript、google-chrome-devtools

有没有办法区分属于网站的javascript代码和Chrome DevTools中从控制台选项卡运行的javascript代码？我想做的是：当我将javascript代码复制到控制台时，将DEBUG变量初始化为true，当javascript代码位于html文件中的<script>标记中或从浏览器中下载到外部.js文件时，初始化false。

浏览 5提问于2014-10-26得票数 1

回答已采纳

2回答

使用javascript分页进行抓取

web-scraping

我试图抓取一个多页的网站，分页是用javascript完成的。该网页如下：网页只是一个例子。在网页上使用相同的分页来显示所有提出立法的法案，列表，这些法案最终将被刮掉。使用Chrome中的开发人员工具并检查网络活动，我无法找到点击页码时发送的参数。用于分页的javascript似乎是这样的(cbpHorizontalMenu.js)：我正在尝试用R进行抓取，但我对其他编程语言或程序(在Chrome、Python、Puppeteer、Phantomjs中运行的脚本)持开放态度。

浏览 1提问于2020-06-04得票数 0

2回答

使用Python从控制台捕获信息

python、selenium、webdriver

我正在创建一个脚本，在这个脚本中，我试图从网站上专门抓取m4a文件。目前，我正在使用BS4和selenium来实现此目的。我在获取信息时遇到了一些麻烦。文件链接不在页面的HTML源中。相反，我只能在控制台中找到它。我尝试获取的链接在这个标记为"audio_url_m4a:“的图像()中。下面是我正在使用的一些示例代码： from selenium import webdriver from selenium.webdriver.common.desired_capabilities import DesiredCapabilities\ d = DesiredCapabiliti

浏览 1提问于2021-01-22得票数 1

2回答

Selenium:从Python中的<script type>标记获取可变数据

python、selenium、web-scraping

所以我试着用selenium从一个网站上抓取数据，因为selenium和web抓取仍然是新的，我被卡住了。我想刮一下<script type>标签下的一些数据，标签如下所示： ... ... <script type="text/javascript"> var myData_1 = {"name" : ..... }; var myData_2 = {......}; var myData_id = 4565843; var myData_mapping = {.....}; </script> ...

浏览 0提问于2020-08-19得票数 4

回答已采纳

1回答

Ruby获取页面内容

ruby-on-rails、ruby

我有一个Ruby应用程序，我想要检测网站上是否安装了特定的Javascript。在大多数网站上，使用以下代码来获取该页面的内容是没有问题的： user_agent = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.2 (KHTML, like Gecko) Chrome/15.0.854.0 Safari/535.2" doc = Nokogiri::HTML(open(url, 'User-Agent'=>user_agent, 'read_timeout'

浏览 1提问于2016-12-29得票数 0

1回答

Chrome dev tools:从控制台选项卡中使用Javascript检查网络选项卡

javascript、google-chrome、google-chrome-devtools

有时，我的网站的用户报告一个广告的问题，但屏幕截图不足以识别广告提供商和挖掘DOM树使用Chrome开发工具的元素标签是相当困难的非技术用户& DOM元素可能会根据广告提供商而有所不同。我可以要求每个用户打开Chrome开发工具并在控制台中执行一段javascript代码。这段javascript必须从Network选项卡中提取内容(我需要对特定HTTP请求的HTTP响应)。使用纯javascript和chrome API (无需开发Chrome扩展)可以做到吗？

浏览 1提问于2017-11-16得票数 3

1回答

抓取需要触发javascript的外部网站

javascript、node.js、selenium-webdriver、heroku、web-scraping

既然phantomjs被放弃了，我想知道是否有任何替代方法。例如，chrome-webdriver不是一个好的解决方案，因为它不能在heroku这样的远程主机上运行。那么，有没有可能抓取一个需要javascript先被触发的外部网站呢？请注意，应该可以从nodejs应用程序运行它。

浏览 3提问于2018-08-18得票数 0

2回答

是否可以使用Selenium WebDriver来驱动PhantomJS？

selenium、web-scraping、webdriver、phantomjs

我正在浏览Selenium WebDriver的文档，例如，它可以驱动Chrome。我在想，“驾驶”PhantomJS不是更有效率吗？有没有一种方法可以在PhantomJS中使用Selenium？我的预期用途是web抓取:我抓取的网站加载了AJAX和许多可爱的JavaScript，我认为这个设置可以很好地替代我目前正在使用的Scrapy Python框架。

浏览 4提问于2012-06-27得票数 35

回答已采纳

1回答

可以从Python中的Inspect元素中抓取HTML吗？

python、screen-scraping

我正在尝试抓取一个网站，试图阻止抓取。通过Chrome、requests或requests_html查看源代码会导致无法显示正确的源代码。下面是一个示例： from requests_html import HTMLSession session = HTMLSession() content = session.get('website') content.html.render() print(content.html.html) 它会显示这个页面:看起来你的浏览器禁用了JavaScript或者不支持它。即使启用了Javascript。在实际的浏览器上也会发生同

浏览 2提问于2020-11-18得票数 0

2回答

边缘没有加载一些javascript

javascript、html

我有一个网站，运行良好的Chrome和FF，但失败的边缘。当我查看控制台日志( one )时，它告诉我某些javascript函数是未定义的，如果我打开默认的Edge developer工具的调试器，我可以看到我的js文件中有一个没有被加载，但其他文件已经加载了(见下文)。控制台登录FF和chrome报告没有错误或警告。页面标题设置为<!DOCTYPE html>，js包括如下所示. <script src="js/generalUtils.js" type="text/javascript"></script> <sc

浏览 1提问于2016-08-04得票数 1

回答已采纳

1回答

如何在python语言中使用selenium和chromedriver抓取此页面？

screen-scraping

我正在尝试使用selenium和chromedriver从网站“”中抓取数据。当我运行代码时，chromedriver成功地输入了url，但无法加载页面，显示了一个空白页面。我尝试将目标网站切换到google.com，但抓取成功。我的结论是目标网站服务器检测到selenium并拒绝发送回数据。那么如何在Python语言中使用selenium和chromedriver从网站抓取数据呢？我是一个Python初学者，感谢您的帮助。下面是我的简单代码： from selenium import webdriver my_driver_path = r"C:\python chrome driv

浏览 0提问于2020-05-29得票数 0

2回答

从另一个网站向我拥有的网站发送MySQL查询(使用Google Chrome扩展)

mysql、screen-scraping、cross-domain、google-chrome-extension

我想写一个Google Chrome扩展，它可以从我不拥有的网站(www.notmysite.com)获取信息，将这些信息发送到我拥有的网站(www.mysite.com)，然后在我的网站上使用这些信息进行某种MySQL查询。例如，我希望能够从www.notmysite.com上的超文本标记语言解析出一些javascript变量，并将其插入到www.mysite.com上的MySQL数据库中。我可以将XMLHttpRequests从一个www.notmysite.com页面转换到另一个页面，但是当我尝试连接到www.mysite.com时，却遇到了跨域脚本的限制。有什么办法可以解决这个问题

浏览 0提问于2011-01-12得票数 0

回答已采纳

1回答

由javaScript从chrome控制台填写的HTML表单消失

javascript、html、google-chrome-console

我想通过自动生成从Chrome控制台操作DOM的javascript代码，在第三方网站上填写html表单： document.getElementById("g_address").value = "abcdefg" 第一步，javascript将更改应用到输入域。但是，如果我从控制台或手动按下submit，输入字段中所有填写的数据都会消失。如果我开始在任何输入字段中手动键入，也会发生同样的情况。我的问题是-是网站阻止了我这样做，还是通常不可能这样做。

浏览 21提问于2021-03-21得票数 1

5回答

从真正的移动浏览器访问颤振本地主机

flutter、dart、localhost、mobile-safari、ip-address

我有颤振的网页应用程序，可以很容易地部署到我的个人电脑上的铬浏览器。成功部署后：控制台 Web浏览器(Chrome) 我正在寻找从我的iPhone浏览器访问在chrome中运行的本地主机的方法。我的iPhone和PC都连接在同一个网络上。我抓取了网络的IP地址，并尝试从我的iPhone safari浏览器访问，链接如下：但是它不起作用，我得到了“无法联系到这个网站”的信息。有什么额外的步骤，我可以执行，使颤振本地主机可从我的移动浏览器，或简单地说，它不可能与颤振？

浏览 7提问于2020-06-04得票数 19

回答已采纳

1回答

使用外部javascript代码在Chrome控制台上运行代码段

javascript、google-chrome、console

是否可以在外部javascript代码(例如，用户脚本通过篡改猴子)中运行Chrome控制台上的代码片段。例如，console.log将文本打印到控制台。是否有某种方式，比如函数console.eval，或者更复杂的方式，可以在控制台上运行代码而不需要在给定的网站上手动打开它，但是使用网站后面的原始javascript代码或用户脚本呢？注:我在Windows 10上使用谷歌Chrome。最好这个答案应该尽可能地适用，但我的首要任务是在我的环境中工作。谢谢, 麦克

浏览 5提问于2021-02-02得票数 1

回答已采纳

1回答

抓取google地图链接

javascript、google-maps、google-chrome、google-chrome-extension

我正在创建一个Google Chrome扩展，它可以抓取任何网站的链接，并将其发送到localStorage。我知道怎么从onmibox上抓取链接。但是，在Google Maps的情况下，“真正的”链接永远不会显示。到目前为止，我还没有找到任何可以帮助我的东西。我怎样才能做到这一点呢？我在Javascript方面没有太多经验，但如果有任何帮助，我将不胜感激。如果你需要更好的解释，请提出来。提前谢谢。

浏览 2提问于2012-04-04得票数 0

回答已采纳

1回答

使用python抓取推送数据？

python、web-scraping、push

我试着刮掉这个新闻网站的左边(= SENESTE NYT)：但是数据似乎到处都找不到？在html或相关的api/json等中都没有。它是某种推送数据吗？使用Chrome的网络控制台，我找到了这个接口，但它没有包含左侧的新闻项：有谁可以帮我？如何抓取"SENESTE NYT"？

浏览 13提问于2018-01-23得票数 1

2回答

不执行JavaScript的Selenium not驱动程序

javascript、python、html、selenium、selenium-webdriver

我正试着从Aliexpress产品页面上抓取数据。我需要 (事务历史记录) 我的代码： from selenium.webdriver.chrome.options import Options from selenium import webdriver my_url = 'https://www.aliexpress.com/item/Cosmetic-Brush-Makeup-Blusher-Eye-Shadow-Kabuki-Brushes-Set-Tool-Kit-22pcs/32765190537.html?ws_ab_test=searchweb0_0' chr

浏览 0提问于2019-01-21得票数 1

1回答

将信息从网站上传递到chrome分机

javascript、google-chrome-extension

我正在尝试将数据从网站javascript发送到我的chrome分机。我读到了关于的文章，但我无法让它发挥作用。在我的网站上： $("#button-id").click(function(){ chrome.runtime.sendMessage("msg", {arg: "1"}, function(response){alert("got response: " + response);}); }); 在background.js中(在chrome扩展中) chrome.runtime.onMessageE

浏览 4提问于2014-09-20得票数 0

回答已采纳

2回答

Chrome扩展怎么能基本上cURL其他页面呢？

javascript、google-chrome、google-chrome-extension、browser-extension

我正在考虑写一个Chrome扩展，它需要在某个网站的某个动态页面上，抓取几个链接并分析链接页面的内容。实际上，我对编写浏览器扩展了解不多，所以我想先看看这是否可行，然后再开始学习。我确实知道扩展通常会执行Javascript，但我不知道如何使用Javascript获得这样的结果。

浏览 1提问于2012-05-27得票数 3

3回答

从桌面应用程序自动化Chrome控制台？

google-chrome、google-chrome-devtools

我希望能够从我的应用程序发送信息到Chrome开发者控制台。例如，我的应用程序有一些json。我希望这个json出现在一个现有的或新创建的chrome工具控制台实例中。这个是可能的吗？如果是的话，是否有指向示例的指针？请注意，平台应该是任何语言，而不仅仅是javascript。而且绝对不是一个已经运行在Chrome上的网站。我有兴趣在另一个过程中实现这一点。

浏览 7提问于2013-11-24得票数 2

回答已采纳

1回答

在Chrome扩展中拦截AJAX响应

javascript、ajax、google-chrome、google-chrome-extension、intercept

我们正在现有系统的基础上构建一个chrome扩展，以帮助完成一些任务。它是AJAX密集型的，它比抓取html和触发事件来拦截一些AJAX响应要高效得多。示例:从chrome控制台，networks，您可以看到漂亮的JSON： Chrome扩展是如何到达那个JSON的？我尝试过，但它似乎不允许这样做。

浏览 1提问于2014-05-09得票数 14

1回答

用python和漂亮的汤从网站上抓取代码

python、html、python-3.x、beautifulsoup

我的项目是关于抓取5个购物网站。我从StackOverflow和youtube上找到了有用的数据。但是我被困在了一个网站上。一个div类使用样式显示，无和隐藏可见性之后，所有div类都被隐藏。我尝试使用ajax，google chrome extension for javascript，并应用了其他4种不同的方法，但这个网站对我来说有点难。如果有人帮助我读取这些标签，这样我就可以从网站上抓取数据，这将是有益的。网址为：目前，我使用简单的代码进行解析。这是我使用的代码。 y = requests.get(url) soup = BeautifulSoup(y.text, "ht

浏览 13提问于2019-11-27得票数 0

回答已采纳

1回答

使用JavaScript抓取可能的网站->以及抓取的网站上显示的IP

javascript、angular、web-crawler

在一个Angular-App中抓取一个网站是可能的？我说的是从Angular给一个网站打电话，而不是抓取一个Angular-App。如果是这样，那么我想知道哪个IP将显示在抓取的网站上。因为JavaScript是客户端，所以我建议，它是客户端的IP，而不是服务器的IP(就像nodejs)。但据我所知，它主要是浏览器实现的东西，我们可以在JS中使用，所以它甚至可以用JavaScript (或Angular)的方法抓取网站？致以最好的问候

浏览 3提问于2019-03-22得票数 0

回答已采纳

2回答

执行从随机网站下载的javascript代码

javascript、security

我做了一个工具，从其他网站(任何类型)抓取所有的html，css，javascript和图片。然后我在我自己的域名上执行这个(当然是在修改链接之后)。 javascript也会执行，因此页面呈现与抓取的网站上的页面呈现完全相同。但都在我的域名下。有没有什么方法可以保护这个javascript的执行(使用不受控制的代码)，这样被抓取的网站就不能获得我网站用户的cookie了？(或其他潜在的安全漏洞？) 谢谢。

浏览 1提问于2013-05-24得票数 1

1回答

在Chrome扩展中执行使用AJAX检索的javascript

javascript、google-chrome-extension

我正在写一个chrome扩展，它将一个div注入到一个带有内容脚本的网站中。内容脚本向我在manifest.json文件中清除的网站发出AJAX请求，并使用innerHTML将数据插入到div中。AJAX请求返回的部分内容是需要执行的javascript。内容脚本中的AJAX请求运行良好。当我从常规网站发出相同的AJAX请求时，返回的javascript执行得很好，但当我从内容脚本发出AJAX请求时，它不会执行。控制台中未显示任何错误。如果可能的话，我不想重新加载网站。我假设这是一个安全“特性”，而不是一个bug。如何关闭或规避此行为？

浏览 0提问于2012-12-20得票数 1

回答已采纳

1回答

使用Google Chrome扩展抓取网站

web-scraping、google-chrome-extension

我正在尝试建立一个chrome扩展，以供许多用户使用。这个chrome扩展将总是从同一个网站抓取数据。经过在线培训后，我知道我必须将抓取逻辑放在内容脚本中。现在，由于要抓取的网站包含许多页面和链接，我正在尝试以一种扩展用户看不到主窗口打开不同链接的方式进行抓取。您将在下面找到内容脚本的起始点 chrome.runtime.onMessage.addListener(function(request,sender, sendResponse){ if (request.todo=="extractData") { alert("before launchin

浏览 14提问于2019-08-27得票数 0

1回答

Python Spynner - jQuery调用失败

jquery、python、code-injection、spynner

编辑:虽然原始问题得到了解决，但代码实际上并没有做任何事情。在Chrome上测试后，它会在密码框中插入“hi”。在Spynner中，它只是加载页面。我正在尝试使用Spynner抓取我的学校用来提供在线时间表的网站。由于某些原因，我总是得到以下错误： Run Javascript code: jq("[class^=login-text-box]").val("hi") Javascript console: ReferenceError: Can't find variable: jq 这是由以下代码引起的： import spynner brows

浏览 1提问于2012-11-27得票数 0

回答已采纳

2回答

使用python将内容写入文本文件，使用java清除同一文本文件中的内容。

java、python、python-3.x、file-writing

我已经写了一个python脚本转到一个网站，从网站上抓取一些文本，并将这些文本保存到我的计算机上的文本文件中 from selenium import webdriver import os chrome_path = r"C:\tf_alert\chromedriver.exe" driver = webdriver.Chrome(chrome_path) driver.get("https://www.minuteinbox.com/") email = driver.find_element_by_xpath("""/html/

浏览 26提问于2020-03-08得票数 0

2回答

我如何知道哪个浏览器被用来在Scrapy框架中爬行？

python、selenium、web-scraping、scrapy、web-crawler

我的背景是：正如你所知道的，Chrome，Firefox，Safari上的网站HTML结构是非常不同的。因此，当我使用CSS-Selector从HTML结构中获取元素标记中的数据时，有时这个标记已经在Chrome浏览器中有了，而另一个则没有。因此，我只想专注于一个浏览器，以减少我的工作量。当我使用Scrapy框架从urls抓取数据时，我不知道Scrapy将使用哪个浏览器来抓取数据。因此，我也不知道返回哪种HTML响应体。我检查了响应，我发现，有时结构是相同的，从Chrome，但有时它不是。看起来Scrapy框架使用了许多不同的web浏览器来抓取数据。我想要的：我只想

浏览 0提问于2018-12-05得票数 0

回答已采纳

1回答

网站抓取问题-网站上的JavaSript被禁用

python、web-scraping

你好, 我已经玩了一段时间不和谐的机器人(用Python)，我遇到了一个问题，在一些网站上抓取信息，这些网站通过禁用javascript来保护自己不受数据收集的影响，这样你就无法访问他们的数据。我已经看过许多网站建议改变标题和其他事情，但它没有帮助。下一步是使用selenium，它将返回此信息。很抱歉，如果没有启用JavaScript，Hive引擎资源管理器就不能正常工作。请让它继续。代码： chrome_options = Options() chrome_options.add_argument('--no-sandbox') chrome_op

浏览 1提问于2022-02-11得票数 0

回答已采纳

2回答

用Selenium，BS抓取Java驱动的站点

python、selenium、web-scraping、beautifulsoup、webdriver

我是Python的新手我正在尝试从它的网站获取打印机计数器值。这个网站是用Javascript写的，我什么也弄不出来。站点元素看起来像这样，我需要突出显示的元素的值。 inspect elements 我试过使用selenium，requests，webdriver，漂亮的汤。尝试了所有的webdriver.find方法等。我的最新代码看起来像这样，我尝试了一堆其他的东西，但什么都没有得到。 from bs4 import BeautifulSoup import requests from selenium import webdriver #url = requests.ge

浏览 14提问于2019-02-01得票数 1

回答已采纳

4回答

您如何使用EC.presence_of_element_located((By.ID，“myDynamicElement”)，除非指定类而不是ID

python、selenium、selenium-webdriver、webdriverwait、expected-condition

我试图使用Python来抓取一个网站，通过使用嵌入的javascript文件将数据呈现为HTML的响应来动态加载它的HTML。因此，如果仅使用BeautifulSoup，我将无法检索所需的数据，因为我的程序将在Javascript加载数据之前对其进行抓取。因此，我正在将selenium库集成到我的代码中，让我的程序等待某个元素被找到，然后它才会抓取网站。我最初是这样做的： element = WebDriverWait(driver,100).until(EC.presence_of_element_located((By.ID, "tabla_evolucion"))) 但

浏览 2提问于2019-07-29得票数 18

回答已采纳

1回答

解决方案:将经过身份验证的用户电子邮件从网页发送到chrome分机

javascript、laravel、vue.js、google-chrome、google-chrome-extension

我正在创建一个网站(websiteA)，其中有Laravel 8和Vuejs，还有一个带有JavaScript的刮铬扩展。这个扩展正在抓取另一个websiteB的内容，我希望将从websiteB中刮到经过身份验证的用户行的数据存储在websiteA的数据库中。我被困在从websiteA获取经过身份验证的用户的电子邮件或id到chrome扩展，以便扩展知道在哪里存储数据。到目前为止，我已经尝试通过定义扩展的ID并使用：chrome.runtime.sendMessage和扩展：chrome.runtime.onMessageExternal.addListener将消息从chrome.runt

浏览 3提问于2020-11-11得票数 0

回答已采纳

1回答

如何通过快捷方式ios应用程序运行网站定义的javascript函数？

javascript、ios、function、shortcut

我正在尝试使用我的车库门的远程服务器网站，以便从我的iPhone打开我的车库。该网站的javascript有一个GarageDoor()函数，如果我在Google Chrome控制台输入GarageDoor(1)，车库门就会打开。我正在使用ios快捷方式应用程序的“在网页上运行Javascript”功能。我有以下代码： GarageDoor(1); completion(result); 如果我输入它，我只得到响应"ReferenceError: Can't find variable: GarageDoor“。如何访问网站的GarageDoor()函数？干杯

浏览 13提问于2020-08-18得票数 2

0回答

使用Selenium和lxml进行Python Web抓取

javascript、python、selenium、web-scraping

我有个问题需要帮助。我正在尝试从一个网站上抓取一些数字(参见下面代码中的链接)。因为网站是使用JavaScript加载的，所以我使用selenium首先加载页面，然后将其传递给xlml以解析数据。我使用的代码如下： from selenium import webdriver from lxml import html import time url = "http://sebgroup.com/large-corporates-and-institutions/prospectuses-and-downloads/rates/swap-rates" xpath =

浏览 4提问于2016-12-30得票数 2

回答已采纳

2回答

Chrome:从系统命令行调用Javascript函数？

javascript、google-chrome、command-line、terminal、remote-access

我需要调用一个Javascript函数，从一个运行在Google / Chromium命令行的网站。是否有可能通过命令行从外部访问开发人员工具？有我可以用来执行代码的扩展吗？最方便的方法是从命令行访问Chrome控制台。编辑：为了更清楚地说明:假设我所在的网站定义了以下功能： function hello() { alert("hello"); } 我想调用这个函数，但我无法访问Chrome中的开发工具。我只能访问Mac终端(通过SSH)。这是一个没有键盘的画廊里的设置。可能需要某种管道。

浏览 6提问于2015-09-30得票数 6

1回答

Android的Chrome :振动API

javascript、google-chrome

当尝试使用(测试稳定版本43和开发版45)中的Vibrate时，它从来不会震动。使用最简单的代码： window.navigator.vibrate(200); 从Javascript控制台运行时，它返回true。供应商前缀不能修复它。Chrome状态网站显示API是在32版中实现的。这段代码适用于Android的Firefox。这是Chrome的问题还是我的代码的问题？

浏览 4提问于2015-06-26得票数 2

回答已采纳

2回答

如何从inc5000中刮取公司名称？

selenium、web-scraping、beautifulsoup、screen-scraping

我正试着从inc5000站点(“”)中抓取所有的公司名称。问题是公司名称是用JavaScript显示的。我尝试过使用selenium和requests_html来呈现站点，但是当我获取页面的源代码时，我得到了JavaScript。这就是我尝试过的。我对网络抓取很陌生，所以我可能犯了一些愚蠢的错误。请指导。这是我的密码。 ... from selenium import webdriver from webdriver_manager.chrome import ChromeDriverManager from selenium.webdriver.chrome.options import

浏览 2提问于2022-07-05得票数 0

回答已采纳

3回答

Selenium Chrome驱动程序限制大规模Web抓取

java、selenium、selenium-webdriver、selenium-chromedriver、google-chrome-headless

我计划为我的项目使用Selenium Chrome驱动程序，它将用于对多个公共网站(如kayak或skyscanner)进行网络抓取。所以将会有一个REST GET端点，在那里我的后端将启动无头Chrome来抓取多个网站，并最终返回一个被操纵的JSON。我想知道Chrome Driver的可伸缩性如何，因为它听起来像是一个无头的Chrome实例需要在请求进入时启动。更新:使用Google Chrome Headless提问

浏览 0提问于2017-10-31得票数 4