首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >获取bs4.element.ResultSet对象的第一个元素

获取bs4.element.ResultSet对象的第一个元素
EN

Stack Overflow用户
提问于 2019-06-20 23:35:16
回答 1查看 1.9K关注 0票数 1

因此,我正在尝试使用BeautifulSoup获取有关网站的信息。问题是,使用findAll()我得到了一个bs4.element.ResultSet对象,我必须遍历它才能得到它的元素。但我很确定我只会得到它的一个标签,而且我不想循环遍历一个只有一个元素的集合。

所以我的问题是,如何只获取bs4.element.ResultSet对象的第一个元素,也可能是唯一的元素?

代码语言:javascript
运行
复制
<div class="textinfo">
   <div class="author">A tale of <span><a href="/profile/89965">Edgar Allan Poe</a></span></div>
   <div class="category">Category: Horror</div>
   <div class="date">Date: 27/11/2008</div>
   <div class="votes">Votes <a href="/text/200811799/votes"><span id="votesmedia">10.00</span></a> </div>
</div>

这些方法都在一个类中,这就是我使用“self”的原因。

代码语言:javascript
运行
复制
def getTales(self):
    talesLinks = self.file.readLinks(self.file.talePath)
    driver = browser.connectChrome()

    for link in talesLinks:
        headerTale = []
        driver.get(link)
        page_source = driver.page_source
        soup = BeautifulSoup(page_source, 'html.parser')

        #Probably I'll get only one div 'textinfo' for each link.
        header = soup.findAll('div', {'class': 'textinfo'})
        self.getHeaderInfo(header, headerTale)

    driver.quit()
    print("chrome headless closed")

def getHeaderInfo(self, header, headerTale):

    # I don't want to loop because I know 'header' has only one element.
    for author in headerTale:
        author = header.findAll('div', {'class', 'author'})
        #...
        #...
EN

Stack Overflow用户

回答已采纳

发布于 2019-06-21 00:31:13

要获取第一个元素,请使用find()select_one()

在你的情况下,而不是

代码语言:javascript
运行
复制
header = soup.findAll('div', {'class': 'textinfo'})

请尝试以下两种方法之一。

代码语言:javascript
运行
复制
header = soup.find('div',class_='textinfo')

代码语言:javascript
运行
复制
header = soup.select_one('div.textinfo')

代码语言:javascript
运行
复制
 header = soup.find_all('div',class_='textinfo')[0]
票数 2
EN
查看全部 1 条回答
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56689442

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档