BeautifulSoup，获取tr中所有td的文本(一些带逗号的文本)

BeautifulSoup是一个Python库，用于从HTML或XML文件中提取数据。它提供了一种简单而灵活的方式来遍历解析文档树，并提取所需的数据。

在使用BeautifulSoup获取tr中所有td的文本时，可以按照以下步骤进行操作：

导入BeautifulSoup库：from bs4 import BeautifulSoup
创建BeautifulSoup对象并解析HTML文档：html = ''' <html> <body> <table> <tr> <td>1,2,3</td> <td>4,5,6</td> </tr> <tr> <td>7,8,9</td> <td>10,11,12</td> </tr> </table> </body> </html> ''' soup = BeautifulSoup(html, 'html.parser')
使用select方法选择所有的tr元素，并遍历每个tr元素：trs = soup.select('tr') for tr in trs: # 在每个tr元素中，使用select方法选择所有的td元素，并遍历每个td元素 tds = tr.select('td') for td in tds: # 使用text属性获取td元素的文本内容 text = td.text print(text)

以上代码将输出：

1,2,3
4,5,6
7,8,9
10,11,12

BeautifulSoup的优势在于它可以处理复杂的HTML文档，并提供了灵活的选择器来定位所需的元素。它还提供了许多方便的方法和属性来处理解析后的文档树。

在腾讯云的产品中，与BeautifulSoup相关的产品包括云爬虫（https://cloud.tencent.com/product/ccs）和Web+（https://cloud.tencent.com/product/tcb）。云爬虫是一种提供网页数据抓取和解析的服务，可以帮助用户快速获取网页中的数据。Web+是一种提供全托管的Web应用托管服务，可以帮助用户轻松部署和管理网站应用。

希望以上信息能对您有所帮助！

从python列表中剥离HTML标记的最好方法是什么？

python、beautifulsoup

使用BeautifulSoup，我有： from bs4 import BeautifulSoup url= "http://scores.espn.go.com/ncb/playbyplay?gameId=400551234" import urllib2 page= urllib2.urlopen(url).read() soup= BeautifulSoup(page) tr_tags= soup.findAll("tr", attrs={"class": True}) for tag in tr_tags: if "ev

浏览 2提问于2014-06-13得票数 0

2回答

Python语法:数组索引作为用逗号分隔的两个数组意味着什么？

python、numpy

我不认为数组是Python中的索引。例如，我在Numpy中有一个2d数组A [[1,2,3] [4,5,6] [7,8,9] [10,11,12]] A[1,3，0,1]是什么意思？

浏览 3提问于2017-11-06得票数 0

回答已采纳

1回答

将多维数组转换为HTML表

javascript、jquery、html、arrays、html-table

玩一个快速的概念。希望答案很简单，我的尝试只是因为某种原因而失败了。假设我有一个数组，如： var items = [[1,2,3],[4,5,6],[7,8,9],[10,11,12]]; 我试着翻转数据，所以它把它转换成： var items_converted = [[1,4,7,10],[2,5,8,11],[3,6,9,12]]; 这些都已经完成了。现在，使用新的多维数组，我希望将每个内部数组的内容推送到HTML表行： <tr> <td>1</td> <td>4</td> <td>7&l

浏览 2提问于2014-05-10得票数 2

回答已采纳

1回答

在javascript中对表的红色行进行求和，然后更改表

javascript、jquery

我的web应用程序收集数据时： id (键值) 时间戳价值然后，创建一个HTML表，如下所示： <table> <tr bgcolor="#FFA9A9"> <td> ID1 </td> <td> 20150619T09.43.03</td> <td>VALUE1</td> </tr> <tr> &

浏览 3提问于2015-06-19得票数 10

回答已采纳

2回答

漂亮汤:把文字放进桌子里(Python)

python、beautifulsoup、request

我正在尝试使用Beautifullsoup从表中获取值(1.212,00)，但tr没有定义的类--这是我的尝试： import requests from bs4 import BeautifulSoup url = "http://www-sdc/ResultadoSalCon.asp" bs = BeautifulSoup(requests.get(url).content, "html.parser") trs = ( bs.find("td", {"b": "SALÁRIO-BASE"})

浏览 1提问于2022-07-29得票数 -1

回答已采纳

1回答

如何使用PHP简单HTML DOM解析器仅获取第一个特定标签

php、html、simple-html-dom

我正在尝试使用PHP简单的HTML DOM解析器获取前3个标记文本，并将它们收集到数组中。表如下所示： <table> <tbody> <tr> <td>Floyd</td> <td>Machine</td> <td>Banking</td> <td>HelpScout</td> </tr> <

浏览 17提问于2019-09-20得票数 1

回答已采纳

2回答

Python在循环中继续不正确

python

我正在使用BeautifulSoup，但我一直收到一个错误:在循环中不能正确地继续。所以我删除了continue，然后我得到了print语句的无效语法错误。我正在运行BS4和Python2.7.5，这对我非常有帮助。这是我的代码。 from bs4 import BeautifulSoup soup = BeautifulSoup (open("43rd-congress.html")) final_link = soup.p.a final_link.decompose() trs = soup.find_all('tr') for tr in trs

浏览 3提问于2013-10-26得票数 0

1回答

美丽的姜戈汤

python、django、beautifulsoup

我有这段代码，我需要从表中的每个tr标记中移动，打印6个td标记中的数据，然后移动到下一个tr标记，直到访问所有tr标记。我用的是美汤4。 from django.shortcuts import render from bs4 import BeautifulSoup import urllib import re def home(request): url = urllib.urlopen("http://etrain.info/in?STATION=SME#!TRAIN_BETWEEN=SMET-MYS") soup = BeautifulSoup(u

浏览 0提问于2013-09-24得票数 0

回答已采纳

1回答

Java解析html表中的数据

java、html、jsoup

我想从表中从链接中获取数据。链接：我已经尝试过我的代码，但它不起作用。 public static void main(String[] args) { try { Document doc = Jsoup.connect("https://www.nasdaq.com/symbol/aapl/financials?query=balance-sheet").get(); Elements trs = doc.select("td_genTable"); for (Element tr : tr

浏览 0提问于2019-01-09得票数 0

回答已采纳

1回答

使用服务器端文件中的javascript填充下拉框

javascript、pug

我有一个小的网站，有一个下拉框，我希望我可以填充从一个文件夹在一个托管服务器，在下拉框中的每一项应表示文件夹中每个文件的文件名。然后将其链接到一个按钮，该按钮将调用一个函数，将选定的数据加载到脚本中以进行可视化。我目前不确定是否将文件列表加载到应用程序中。到目前为止，我已经：下拉列表(注:使用翡翠)： select#dataSetChoice 根据下拉框的内容运行脚本的函数： function loadDataSet(){ var dataSet = dataSetChoice.options[dataSetChoice.selectedIndex].text;

浏览 1提问于2013-12-08得票数 0

2回答

如何使用BeautifulSoup获取TR行中的TDs列表

python、beautifulsoup、iterator

我有一张简单的桌子，看起来像： <tr> <td>cell1</td> <td>cell2</td> </tr> <tr> <td>cell3</td> <td>cell4</td> </tr> 我正在使用漂亮的汤来尝试将TDs的内容映射到对象值。我正在做以下几件事： rows = soup.findAll('tr') for td in rows[1]: print(td.text) 这些指纹： cell1 cel

浏览 0提问于2020-03-21得票数 0

1回答

当选择<thead>标记时返回<tr>标记？

html、jsoup

我刚开始喝汤，可能用错了。我本来打算联系邮件列表的，但是。我试图从表中选择<td>元素，但返回的第一个元素实际上是<thead>。这是获取给定表的<td>元素的错误方法吗？如果是的话，正确的方法是什么？以下是简单的代表性问题： HTML： <table id="results_table"> <thead> <th>Header1</th> </thead> <tbody> <tr>

浏览 3提问于2015-06-03得票数 2

回答已采纳

1回答

使用jQuery抓取HTML子元素？

jquery、node.js、jquery-selectors、screen-scraping、web-scraping

我目前正在编写一个脚本，以便从HTML页面中抓取一些非常基本的信息。具体地说，我想从allmusic.com上获取一些关于艺术家的信息。我使用jQuery在node.js中编写此脚本以执行实际的抓取，并通过使用中的示例在一定程度上使其正常工作。我要做的是搜索一个流行的艺术家，然后在第一个结果中存储一些基本信息，这几乎就是我正在寻找的艺术家。我可以使用下面的代码提取有问题的表，但是我不知道如何从超文本标记语言中获取前两个td元素，这才是我真正需要做的。我的node.js代码如下： var request = require('request'), jsdom = req

浏览 2提问于2011-08-19得票数 0

回答已采纳

3回答

网络刮刮与美丽的汤4蟒蛇

python、html、beautifulsoup

所以我刚刚开始使用漂亮的汤4，我遇到了一个问题，我已经尝试了几天，但我无法解决。让我首先粘贴我想要分析的html代码： <table class="table table-condensed table-hover tenlaces tablesorter"> <thead> <tr> <th class="al">Language</th> <th class="ac">Link</th> </tr> </thead> <tbody

浏览 2提问于2014-06-27得票数 2

1回答

使用jsoup解析html表

java、html、parsing、web-scraping、jsoup

我正在试着用jsoup解析HTML表格。我是个新手，我已经读过一些关于它的教程。我需要从这个网站的每个列的表中提取值：https://www.basketball-reference.com/boxscores/pbp/201905160GSW.html。我尝试获取每个时间戳，但它只打印单个元素。这是我上次尝试的代码。 Document doc = Jsoup.connect("https://www.basketball-reference.com/boxscores/pbp/201905160GSW.html").get(); Elements trs

浏览 21提问于2019-05-24得票数 1

2回答

BeautifulSoup限制为两个小数，以0.00开头的整数结果为"0.0“

python、beautifulsoup

这个应用程序的目标是打印加密货币的价格。它在的第一页打印100种货币的价格，然而，它只记录了最多两位小数，我不知道为什么。当int以0.00开始时，应用程序只打印0.0。为什么？ from bs4 import BeautifulSoup import requests url = "https://coinmarketcap.com/" result = requests.get(url).text doc = BeautifulSoup(result, "html.parser") tbody = doc.tbody trs = tbody.content

浏览 1提问于2021-09-10得票数 0

2回答

在带有特定id的表中获取td中的文本，使用特定属性获取tr中的文本

html、python-3.x、beautifulsoup

给定这样的html： page_html = ''' <html> <head> <title>Title</title> </head> <body> <div id="div1"> <h1>h1 text</h1> <div id="div div1">text div div1

浏览 2提问于2019-03-02得票数 1

回答已采纳

2回答

在HTML表中查找匹配值并突出显示

javascript

我需要你的帮助。因为我的数据将被结构化。我需要创建某种函数，允许用户将记录号从第1列输入到输入框" record“。然后，单击按钮，代码将从我的数据表中的第1列中找到准确的匹配值，并使用现有代码来突出显示该行。我似乎无法就如何使这件事起作用而把某种逻辑结合起来。 <!DOCTYPE html> <html> <head> <style type="text/css"> #data tr.normal td { color: #235A81; background-color: white; } #data

浏览 4提问于2013-08-07得票数 1

回答已采纳

1回答

从TBODY中提取TD

python、python-3.x

如何从tr中提取第一委员会、立法委员会、特别委员会？ <tr> <td class="text-center">1</td> <td class="hidden-xs"><a href="/en/anggota/detail/id/1319"><img class="img-responsive" src="/doksigota/photo/1319.jpg"/></a></td> <td><a hre

浏览 0提问于2019-09-16得票数 0

1回答

Python -使用请求和bs4进行超级简单的抓取

python、beautifulsoup、python-requests

我正在尝试从这个页面的主表中获取数据：我试过： import requests from bs4 import BeautifulSoup address="https://www.interactivebrokers.com/en/index.php?f=2222&exch=globex&showcategories=FUTGRP#productbuffer" r=requests.get(address) soup=(r.text,"html_parser") 我知道这是超基本的，但不知怎么我在这里被堵住了。我尝试了soup.find

浏览 5提问于2017-07-31得票数 0

回答已采纳

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

BeautifulSoup，获取tr中所有td的文本(一些带逗号的文本)

相关·内容

从python列表中剥离HTML标记的最好方法是什么？

Python语法:数组索引作为用逗号分隔的两个数组意味着什么？

将多维数组转换为HTML表

在javascript中对表的红色行进行求和，然后更改表

漂亮汤:把文字放进桌子里(Python)

如何使用PHP简单HTML DOM解析器仅获取第一个特定标签

Python在循环中继续不正确

美丽的姜戈汤

Java解析html表中的数据

使用服务器端文件中的javascript填充下拉框

如何使用BeautifulSoup获取TR行中的TDs列表

当选择<thead>标记时返回<tr>标记？

使用jQuery抓取HTML子元素？

网络刮刮与美丽的汤4蟒蛇

使用jsoup解析html表

BeautifulSoup限制为两个小数，以0.00开头的整数结果为"0.0“

在带有特定id的表中获取td中的文本，使用特定属性获取tr中的文本

在HTML表中查找匹配值并突出显示

从TBODY中提取TD

Python -使用请求和bs4进行超级简单的抓取

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐