我怎样才能连接从美景汤中的html解析中获得的元素？

文章/答案/技术大牛

发布

1回答

、

我有多个html文件，如下所示。文件中脚注in的数量可以不同，范围从0到数百。我希望ids和内容出现在csv文件中具有"/“分区的同一单元中。这将类似于"F1 content1/F2 content2/F3 content3/F4 content4“ 下面的代码是我所有的。Footnotes = soup.select('footnotes

浏览 7提问于2019-09-13得票数 1

回答已采纳

1回答

需要方向-网络机器人的创建

我想要创建的东西，将在一个网站上的一个特定的位置，并阅读在这个位置的价值。然后将这个值放入一个已经创建的文本块中。我需要做什么研究才能创造出这样的东西？简单的方向，如关键词到谷歌等，将是非常有用的。

浏览 3提问于2015-09-08得票数 0

回答已采纳

2回答

如何从javafx解析html并将这些数据传输到Jsoup文档？

、、

我试图解析一些文档站点的侧栏TOC(组件表)。我试过汤了。我无法获得TOC元素，因为这个标签中的HTML内容不是初始HTML的一部分，而是在页面加载后由JavaScript设置的。你可以看到我前面的问题：建议的解决方案是检查哪些连接是手动从Browser Dev T

浏览 0提问于2018-09-17得票数 0

回答已采纳

1回答

缺少一些html表格标记的漂亮汤

、

我正在尝试从一个网站中提取数据，使用漂亮的汤来解析html。我目前正在尝试从以下网页获取表格数据： soup = BeautifulSoup(fh, '

浏览 22提问于2016-09-12得票数 0

1回答

使用urllib和漂亮汤查找“隐藏”标记中的值

、、

我想知道是否可以显示隐藏标记的值。我用的是易拉布和美丽的汤，但我似乎得不到我想要的东西。下面编写了使用html代码im：(保存为hiddentry.html) ) <script type="text/javascript">我要打印

浏览 2提问于2011-03-14得票数 0

回答已采纳

3回答

解析美汤后原网页链接缺失

、、

如果我的解释很简单，请原谅。我对蟒蛇和美汤都是新手。我想提取与24个奖牌获得者在网站上的每个人相对应的链接。我可以从Firefox检查器中看到，他们的链接中都有“英雄”字样。然而，当我使用美丽汤解析网站时，这些链接并没有出现。我试过使用标准的html

浏览 2提问于2019-03-24得票数 0

1回答

如何获得img文本和数据-src使用优美汤？

、、

HTML片段：<a href="/profile/Smit-Soni-2" id="__w2_GDetCwt_linkassets.ec.quoracdn.net/main-thumb-18048885-50-ujrumofdevpkaarfisuvjdtbihztxnta.jpeg" alt="Smit Soni"

浏览 1提问于2016-10-27得票数 1

回答已采纳

1回答

从解析的网页中提取Python文本

、、、、

我正在开发一个从网页中提取内容的小系统(我知道已经完成了，但这是一个很好的练习，也是我需要的)。基本上，我正在寻找提取内容-内容，即，如果它是一篇文章，我只想要文章文本，而不是其他。我才刚刚开始，就当我是一张愚蠢的白板吧。我感兴趣的是你是如何做的，用什么做的，特别是python，但我对任何我发现相当有

浏览 2提问于2012-08-31得票数 2

回答已采纳

1回答

为什么漂亮汤找不到我要找的html元素？

、

我正试图从coinbase中获取加密货币价格的变化，方法是用漂亮的汤进行解析。在coinbase网站()上，我可以找到价格变化的html元素。TextElement__Spacer-hxkcw5-0 caIgfs Header__StyledHeader-sc-1xiyexz-0 dLILyj">+0.33%</h4> 然后，在python中，

浏览 1提问于2020-06-14得票数 2

回答已采纳

1回答

Python Selenium -获取所有内容并将其写入文件

、、、

我怀疑太多的连接尝试。..and说真的，我不应该每次想尝试一些新代码时都尝试连接，所以这让我想到了一个问题：所以，我如何才能从页面上抓取所有东西，并将其保存到...and文件中，然后离线加载文件以搜索我需要的字段。当我被拒绝的时候，我正在测试下面的代码，所以我不知道什么是有效的--下面可能有排字:/任何人能提供任何建议或改进吗？:D..but，Sers<

浏览 0提问于2019-02-28得票数 0

1回答

以图形形式表示维基百科

、、

我想用图表的形式来表示整个维基百科，就像每一篇文章都是一个节点，如果一篇文章包含其他文章的链接，那么它们就共享一条边。因为这将是太多的点击，所以我需要在本地提出请求(在本地安装维基百科)。你能指导我如何做到这一点(告诉我一些有用的库或工具)吗？

浏览 2提问于2016-08-15得票数 3

回答已采纳

2回答

在有漂亮汤的字符串之前获得一个元素

、、、、

我正在使用“美丽汤”搜索一组整数值，并生成与名称匹配的这些值的列表。然而，我遇到的问题是，网站对我需要的元素(“列表-条目”)使用了一些非常模糊的类名，这些元素被复制在其他元素中，我不想抓住这些元素。是否有一种方法，使它如此美丽汤只返回元素的内容，而后面有一个特定的<

浏览 1提问于2016-12-30得票数 1

回答已采纳

1回答

用id网络抓取python <span>

、、、、

我想要在<span/>属性中使用BeautifulSoup为给定的网站报废数据。你可以在屏幕截图中看到它所在的位置。但是，我使用的代码只是返回一个空列表。我找不到我想要的名单上的数据。我做错了什么？opener.addheaders = [('User-agent', 'Mozilla/5.0')]

浏览 2提问于2018-02-22得票数 0

回答已采纳

2回答

如何将从Chrome复制的css选择器路径转换为漂亮的路径？

、、、

我一直在尝试做一个函数，当从Chrome开发工具复制的css选择器路径被给定时，它会返回漂亮的汤对象。当我从Chrome复制一个元素的css选择器路径时，它是这样的： body > table > tbody > tr:nth-child(2) > td.ColumnText2 如果我想让它成为一个合法漂亮的汤类对象，我会手动解析它，如下所

浏览 20提问于2019-09-27得票数 2

回答已采纳

1回答

如何在java中获取使用angularJs生成的页面的标题？

、、

目前，我正在使用JSOUP连接器来获取网页的页面标题。但是如果网站是使用angularJs构建的，那么JSOUP连接器就无法获取标题，因为页面源中没有标题。System.out.println(doc.title()); e.printStackTrace();如果页面是用java构建的angularJs，那么如何获得页面的标题？

浏览 2提问于2016-12-07得票数 0

2回答

python无法获取整个网页。

、、

我正在做一个刮擦的项目，在上刮取一些数据。我认为这可能与请求头有关，所以我复制Firefox的用户代理来伪造一个，只是为了发现它失败了。什么是问题，我该如何解决？我发现问题在于网页使用ajax加载一些数据，这些数据是我找不到的。

浏览 2提问于2011-07-26得票数 0

1回答

不正确的美汤解析

、、、

通过这段代码，我从BS解析中获得了以下URL：result, data = mail.uid('fetch', latest_email_uid, '(RFC822)')

浏览 3提问于2013-10-11得票数 0

回答已采纳

1回答

网络刮美汤

、、

我正在尝试的是从 import requestsx=requests.get("https://www.walmart.comoz/34199310")print(soup.find_all("p",{"class":"Ingredients"})[0]) 但它显示的

浏览 1提问于2018-05-04得票数 0

10回答

我目前正在尝试抓取一个HTML格式相当差的网站(通常缺少结束标记，没有使用类或it，因此很难直接转到您想要的元素，等等)。到目前为止，我使用BeautifulSoup已经取得了一些成功，但偶尔(尽管很少)，我会遇到一个页面，在这个页面上，BeautifulSoup创建的HTML树与(例如) Firefox或Webkit略有不同虽然这是可以理解的，因为HTML的格式使这种模棱两可，如果我</e

浏览 3提问于2010-03-08得票数 9

回答已采纳

1回答

漂亮的python在href中获取文本值，

、、

<a href="allswell/index.html">Oh well Oh well</a>我可以使用tr['href']获取"allswell/index.html“ 但是我已经尝试了所有的文本，元素..我把这个值叫做什么?我如何从漂亮汤中</e

浏览 0提问于2016-11-06得票数 0

点击加载更多