使用R解析HTML数据

文章/答案/技术大牛

发布

0回答

、、、

我有一个html数据集，如下所示，我想解析它并将其转换为我可以使用的表格格式。<html> <title>Page Title</title> <div class="brewery" id我面临的问题是它使用Rvest转换成文本文件，但似乎不能

浏览 11提问于2017-06-02得票数 2

回答已采纳

4回答

如何从ajax加载的html中获取类名和属性

、、、

我通过ajax加载页面，需要从解析的html中抓取某个类。我使用的方法似乎不起作用，只返回'undefined‘。$.ajax({ url:"path/to/page", r = $(r);//parse htmlvar page = r.find('

浏览 1提问于2011-02-15得票数 0

回答已采纳

1回答

BeautifulSoup html解析器需要时间来解析html文件

、、

我正在尝试使用BeautifulSoup从html文件中获取结果： with open(r'/home/maria/Desktop/iqyylog.html', "r") as f:soup = BeautifulSoup(page, 'html.parser') for tag in soup.find_all('details'

浏览 14提问于2020-09-02得票数 0

2回答

在python中解析XML文件并在HTML页面中显示它

、、、、

我正在做一个使用Raspberry-Pi的数字标牌项目。R将连接到HDMI显示器和互联网.R中将有一个XML文件和一个自行设计的HTML网页，XML文件将经常从远程终端更新。我的想法是使用Python (lxml)解析XML文件，并将分析过的数据传递给我的本地HTML网页，以便它能够在R的web浏览器中显示这些数据。我能够使用Python (lxml)解析XML文件。但是，我应该

浏览 0提问于2015-02-04得票数 2

回答已采纳

1回答

电梯中无法解释的错误信息

、

我正在使用Scala和Lift作为一个单页面的web应用程序。我经常用Comet块中的新内容替换页面的部分内容。在其中一个例子中，我得到了一条错误消息：当Lift试图处理错误消息/template-editContext.html中显示的文件时发生错误，如下所示： <script>

浏览 0提问于2014-04-02得票数 2

回答已采纳

1回答

如何从html页面中提取文本？

、、、

我尝试了以下方法将html转换为文本：from urllib import urlopen html = urlopen(url).read() print

浏览 6提问于2015-11-06得票数 4

回答已采纳

1回答

如何使用R解析html文本？

、

我有表的html代码示例<td>Hope, Bob</td><td style="background-color>2</td><td style="

浏览 0提问于2019-10-21得票数 1

回答已采纳

1回答

Python BeautifulSoup -从网页中解析表格时出现问题

、、、、

我想解析来自以下站点的表数据：，并创建一个包含所有表值(vCPU、内存、存储、价格)的数据帧。但是，使用下面的代码，我似乎找不到页面上的表。有人能帮我找出如何解析这些值吗？使用pd.read_html时，会出现找不到表的错误。import requests url = "https://aws.amazon.com/ec2/pricing/

浏览 59提问于2018-07-18得票数 0

3回答

如何一次加载无限滚动中的所有条目以解析python中的HTML

、、、、

我能够解析HTML并获得前10个条目所需的信息，但我希望在解析HTML之前完全加载所有条目。page = json.loads(r.text[16:]) #sk

浏览 2提问于2014-01-08得票数 34

回答已采纳

2回答

解析HTML文件中的id和类名

、、、

我可以使用getElementByTagName解析html文件中的标签。但我也想解析该html文件中存在的id和类名...这是我尝试过的： $html->loadHTMLFile($url); //url is the url of the site$data = $html->getElementById($identifier); /&

浏览 3提问于2013-03-01得票数 0

回答已采纳

1回答

对字符串中不匹配的部分应用str_replace

、

我正在解析表单数据，从回复到我网站上的一个“线程”，我使用Prism将sytaxing添加到代码中。但是的棱镜脚本使用\r\n来表示换行符，因为它可以包含什么(html代码所以基本上，我需要解析所有不在并将所有\r\n更改为所以像这样的回复：im showing some code /r&#x

浏览 0提问于2015-08-18得票数 0

回答已采纳

2回答

javascript中的格式化字符串

、、、

我正在对一个jQuery脚本执行Ajax调用，该脚本在Javascript中返回这个字符串变量：这里我可能遗漏了一些简单的东西，但是有什么方法可以将\r\n恢复为<br/>，但更重要的是，将\"page\"恢复为"page"吗？

浏览 3提问于2012-05-12得票数 0

回答已采纳

4回答

使用DOM解析html

、、

我想从一个特定的网址提供的HTML数据解析。但我无法解析数据，因为我收到的错误很少。这是我的代码： $html->loadHTML($url); //$url is where the site url is defined$value = array(); foreach($html->find($identifier) as $eleme

浏览 3提问于2013-03-01得票数 2

回答已采纳

1回答

Requests-html包不能为fast.com正确呈现

、

我正在开发一个使用python 3.7的web抓取应用程序。我使用requests html来解析数据。到目前为止，我已经尝试了下面的代码，它试图使用render函数(因为fast.com上的速度数据是通过javascript加载的)。from requests_html import HTMLSessionsession = HTMLSessio

浏览 55提问于2019-02-03得票数 3

1回答