使用Selenium和BeautifulSoup提取iFrame内容

文章/答案/技术大牛

发布

2回答

、、、

我正在尝试完成以下表格并提取相关保费。当我运行我的代码时，我希望提取156美元的年度保费，但我得到的只是“年度保费：-”from selenium import webdriverfrom bs4 importBeautifulSoup driver = webdriver.Chrome(r"C:\Users\tomwp\Downloads\chromedriver_win32= driver.find_element_by_xpath(&

浏览 11提问于2019-03-26得票数 1

回答已采纳

1回答

C#中的动态网站抓取不挑项目

、、、、

但是，像selenium和puppeteersharp这样的动态网站抓取库不会拾取显示在这个页面表格上的项目(见图)。

浏览 5提问于2021-07-19得票数 1

回答已采纳

3回答

使用请求Python登录网站

、、、

with requests.Session() as s:是在站点内部维护cookies的内容，这就是允许一致刮取的内容。在此基础上，BeautifulSoup现在可以从accounts站点中获取和解析HTML。在这种情况下，"html.parser"和"lxml"都是兼容的。如果iframe中有HTML，那么它是否可以仅使用requests进行抓取和解析是值得怀疑的，所以我建议最好使用selenium。soup

浏览 6提问于2020-05-24得票数 0

回答已采纳

3回答

Python Selenium无法从mpob网站检索标记内容

、、、、

我试图从这个站点中获取一些信息来进行一些建模，但是selenium似乎无法获得表，并且扩展到表tr/td中的任何标记。这是我的密码from pandas import DataFrameimportdriver.get(url)summary_2018.cli

浏览 2提问于2018-12-12得票数 1

回答已采纳

1回答

使用BeautifulSoup获取“查看元素”代码，而不是“查看源代码”代码

、、、

我使用以下代码从网页中获取所有<script>...</script>内容(参见代码中的url )：from bs4 import BeautifulSoupimport imp page = urllib2.urlopen(url) soup

浏览 4提问于2016-03-21得票数 2

回答已采纳

1回答

我能在BeautifulSoup的javascript后面得到一个iframe吗？

、、、、

我想要做一个用户列表，谁已经评论，但无法在页面上找到iframe时，使用BeautifulSoup拉它。注释在iframe中，并且由于某种原因，当我使用BeautifulSoup拉出html时，它中似乎没有iframe。我知道有一个iframe保存了评论，因为我查看了网页上的html，以尝试向下钻取和提取我所需要的BeautifulSoup。.766213.html") bsObj = <

浏览 5提问于2016-03-03得票数 4

1回答

用bs4解析空src的iframe

、、、

下面是我最近遇到的问题： <div id="contents_layout"> marginheight="0" marginwidth="

浏览 1提问于2016-06-27得票数 0

1回答

Python Selenium在iframe中切换为iframe

、、

我正在尝试使用Selenium、Python和BS4访问iframe中的iframefrom selenium import webdriverwebdriver.Firefox()try: ifra

浏览 0提问于2014-04-26得票数 7

回答已采纳

1回答

为什么BeautifulSoup发现保持返回的元素的类id与我传递的不同？

、、、

我正在尝试使用BeautifulSoup来解析包含一篇韩国新闻文章的iframe，并打印出文章中每个单独的正文段落。因为韩语段落内容位于其自己的td标记中的p标记中，并且类id为"tlTD"，所以我想我可以使用该类名遍历每个td并打印p标记，如下所示： link ="https://gloss.dliflc.edu/我尝试使用lambda表达式和正则表达式来使类名更具排他性，但我总是得到相同的结果。我可以理解为

浏览 16提问于2019-06-27得票数 1

回答已采纳

1回答

Python Selenium运行所有页面Javascripts

、、

我正在抓取我的网站，它使用谷歌自定义搜索iframe。我使用Selenium切换到iframe，并输出数据。我使用BeautifulSoup来解析数据，等等。from bs4 import BeautifulSoupimport time driver = webdriver.Firefox('iframe&#

浏览 2提问于2014-04-26得票数 0

2回答

如何在python #文档标记中获取html？

</head> <iframe id="hiddenFrame" name="hiddenFrame"> <html></body> </iframe>这是我想要爬行的网站结构。我试图在#document标记中获取html (尝试

浏览 1提问于2020-05-22得票数 1

回答已采纳

1回答

在python中单击页面的验证码

、、

：单击后，我会得到如下信息：我用python编写了以下代码，仅用于单击按钮(使用selenium)： boton = driver.find_element_by_id("luk")boton.cli

浏览 0提问于2017-05-27得票数 0

1回答

我试图在python中使用selenium提取i帧中的评论，但无法访问内部HTML。

、、、、

我试图从iframe中提取评论，我试图切换到iframe，我想我成功地切换了，但是无法访问更多的标记和属性。我已经尝试了多个解决方案，也就是注释，我需要得到具体的审查div，或者即使我们得到完整的页面源iframe，然后我能够解析通过Beautifulsoup。Url=from telnetlib import ECfrom bs4 import BeautifulSoup from selenium

浏览 2提问于2020-05-08得票数 0

回答已采纳

2回答

BeautifulSoup:无法获取文本

、、、

price_BeautifulSoup = bs.find("span", {"id": "prcIsum"}).text我所尝试的是：我已经尝试过搜索"class 'bs4.BeautifulSoup'".price_BeautifulSoup = bs.

浏览 0提问于2019-09-30得票数 1

回答已采纳

1回答

、、、、

我试着解析网站上的表格from bs4 import BeautifulSoupfrom selenium import webdriver browser = webdriver.Chrome() time.sleep(3) html = browser.page_sour

浏览 0提问于2018-02-07得票数 0

回答已采纳

点击加载更多