如何将soup中的特定标签转换为字符串？_如何在Beautiful Soup中拉取具有相同标签的特定嵌套元素？_如何将python字符串中的字符串替换为特定字符？ - 腾讯云开发者社区

html、python-3.x、beautifulsoup

我有一个UTF-8编码的HTML，如下所示。我想用python和bs4从这里提取OWNER，NVCODE，CKHEWAT标签。但是<>被转换为<和>我不能从OWNER，NVCODE，CKHEWAT标签中提取文本。请指导我从这些标签中提取文本。 <?xml version="1.0" encoding="utf-8"?><html><body><string xmlns="http://tempuri.org/"><root><OW

浏览 37提问于2019-03-23得票数 0

1回答

还是用更简单的方式写这个？

python、beautifulsoup

我要从这里删除：和页面只是一个混乱的字体标签。我已经成功地刮到了我需要的数据，但是我很好奇我是否能写这个“更干净的”--我想是因为没有一个更好的词。当我开始清理报废的数据时，我不得不使用三个不同的临时列表，这似乎很愚蠢。例如，下面是我的代码片段，它获取页面上“表”中每个团队的总体评分： source = urllib.request.urlopen('https://www.usatoday.com/sports/ncaaf/sagarin/').read() soup = bs.BeautifulSoup(source, "lxml") page_sourc

浏览 2提问于2017-05-22得票数 1

回答已采纳

1回答

python编码和json.dumps()的问题

python、python-3.x、python-2.7、list、tuples

我想将标题标签存储到mysql中，我需要存储来自不同语言(例如英语、波斯语、阿拉伯语等)的标签。例如，我的字符串必须如下所示： {"h1": "زبان فارس - english"} 但是当我想在我的数据库中存储unicode时，它会变成下面这样的代码： {"h1": "\u0628\u0631\u062e\u0648\u0631\u062f"} 我的python 3代码是： data = {} if not soup.find('h1'): h1 = ""

浏览 1提问于2019-11-02得票数 0

2回答

从包含br标记的td标记中提取文本

python、python-3.x、beautifulsoup

我想从td标签中提取包含br标签的文本。 from bs4 import BeautifulSoup html = "<td class=\"text\">This is <br/>a breakline<br/><br/></td>" soup = BeautifulSoup(html, 'html.parser') print(soup.td.string) 实际产出：None 预期产出：This is a breakline

浏览 0提问于2018-03-14得票数 1

回答已采纳

2回答

如何在输入的spring标签中显示空格而不是"0“

spring、jsp、spring-mvc

在我的应用程序中，我需要有一个文本字段(MNC )，它是int类型的，当它在表单中显示为空格时，它是空的，但它的value.How却显示为"0“。我可以这样做吗?我正在使用，但由于我发现我在表单中没有值标签:input of spring标签，我如何在表单中包括一个值标签:input标签，以便I可以将其留空""？请在这方面帮助我

浏览 6提问于2011-04-07得票数 1

1回答

如何将soup中的特定标签转换为字符串？

python、beautifulsoup

假设我有一个名为'title‘的标记，我看到了一种使用soup.title.string将特定标记转换为字符串的方法但是当我有几个同名的标签时，我找不到将它们转换为字符串的方法。我使用了findall by id，但是我不能转换成字符串 url = 'http://rollersadnessstranded.com' req = requests.get(url) html = req.text soup = (BeautifulSoup(html, 'html.parser')) x=soup.find_all('title', a

浏览 67提问于2021-05-08得票数 0

1回答

TypeError:应为类似字符串或字节的对象

python、beautifulsoup、html-parsing

我已经编写了一个来解析html并仅打印文本内容。我想忽略标签。但是我的程序有一个问题。我不确定这是什么。请帮帮我。 import urllib.request import re from bs4 import BeautifulSoup url = "www.example.com" def hi(): dep = urllib.request.urlopen(url) soup = BeautifulSoup(dep, 'html.parser') for link in soup.find_all('p',

浏览 0提问于2016-03-11得票数 2

回答已采纳

1回答

如何遍历每个系列的每个数据标签

python-pptx

我有一个图表，我只想在图表上显示一些数据标签。我在series.points上迭代，但我无法获得当前的数据标签值。即使我使用number_format="0.0%"，所有的数据标签值都会变成100的倍数。 for point in series.points: print(dir(point.data_label)) 输出应该精确到该点的数据标签，而不是乘以100值，并且应该隐藏小于2的点数据标签值。 ?

浏览 8提问于2019-05-28得票数 1

回答已采纳

1回答

如何将Alexa AVS响应输出转换为8 8Khz或只从Alexa输出解析波形，该输出必须由Sox检测为wav以进行转换

json、sox、alexa-voice-service、avs

如何将Alexa AVS响应输出转换为8 8Khz或只从Alexa输出解析波形，该输出必须由Sox检测为wav以进行转换 I获取错误失败格式:无法打开输入文件*：在使用sox将输出转换为8 8kHz时未找到RIFF报头

浏览 4提问于2016-04-03得票数 0

2回答

从输出Python中移除HTML标签

python、html

我正在使用Python 2，我有以下脚本： from bs4 import BeautifulSoup import requests, re page = "http://hidden.com/example" headers = {'User-Agent': 'Craig'} html = requests.post(page, headers=headers) soup = BeautifulSoup(html.text, "html.parser") final = soup.find('p',{&#

浏览 2提问于2017-01-16得票数 0

1回答

Java将huffman编码的文本保存为文件

java、huffman-code

我正在用java开发一个huffman压缩和解压缩应用程序。到目前为止，我已经完成了编码和解码的工作。它将一个大的输入文本转换为编码的二进制文本。这是一个1和0的字符串。例如：字符串原始文本=“你好，我正在尝试编写一个huffman应用程序和.” 字符串编码文本=“1100001110001111010101001101001100110.”一根很长的绳子。现在，我希望将字符串保存为二进制文件，以减小大小。但是当我尝试这样做的时候，大小会比原来的文本大得多。相反，我需要的大小比原来的文件大小更小。将编码后的文本保存到文件中后，我需要将二进制文件读入其中，并将其转换为encodedtext字

浏览 1提问于2018-04-14得票数 0

1回答

解析html文件后将元组转换为字符串

python、parsing、tuples、urlparse

我需要将解析结果保存在一个文本文件中。 import urllib from bs4 import BeautifulSoup import urlparse path = 'A html file saved on desktop' f = open(path,"r") if f.mode == 'r': contents = f.read() soup = BeautifulSoup(contents) search = soup.findAll('div',attrs={'class

浏览 0提问于2014-11-19得票数 1

2回答

使用条件匹配应用Groovy RegEx

regex、groovy

使用Groovy和正则表达式，如何将其转换为： String shopping = "SHOPPING LIST(TOMATOES, TEA, LENTIL SOUP: packets=2) for Saturday" 打印输出 Shopping for Saturday TOMATOES TEA LENTIL SOUP (2 packets)

浏览 2提问于2012-06-30得票数 1

回答已采纳

2回答

如何导航到BeautifulSoup对象中的特定标记？

python、xml、beautifulsoup

链接到我正在使用的url：我可以访问某些标记中包含的文本/值，但不能访问其他标记中的文本/值。安装(我是如何到达BS汤对象的)： new_url = r"https://www.sec.gov/Archives/edgar/data/789019/000106299321002323/0001062993-21-002323.txt" response = requests.get(new_url) soup = BeautifulSoup(response.content, 'lxml') 所有顶级标记(没有父标记的标记)似乎都是可访问的。包含值的子标记也

浏览 5提问于2021-04-28得票数 0

回答已采纳

3回答

如何使用python解析ld+json

python、json、web-scraping、json-ld

我一直在尝试一些网络抓取，我偶然发现了这个标签中的一些有趣的数据： <script type="application/ld+json"> 我已经能够用美丽的汤分离出那个标签 html = urlopen(url) soup = BeautifulSoup(html, "lxml") p = soup.find('script', {'type':'application/ld+json'}) print p 但是我还不能处理这些数据，也不能从那个标签中提取任何数据。如果我尝试使用正则表达式从其中获

浏览 2提问于2017-04-27得票数 9

2回答

使用BeautifulSoup从网页下载损益表并转换成Pandas数据？

html、pandas、dataframe、html-table、beautifulsoup

我正试图获取麦当劳公司"“的损益表。我用了漂亮的汤。html是下载的，但是似乎没有典型的"tr"，"td“标签用于收入表。如何将损益表表转换成df数据？我的密码： url="https://finance.yahoo.com/quote/MCD/financials?p=MCD" result = requests.get(url) result.raise_for_status() result.encoding = "utf-8" src = result.content soup = BeautifulSoup(src

浏览 1提问于2020-02-09得票数 1

回答已采纳

1回答

用Python2.7x从href标记中提取字符串

python、regex、python-2.7、beautifulsoup

我目前正在使用Beautifulsoup4从HTML页面中提取href标签。我在Beautifulsoup4中使用的是Beautifulsoup4查询，它运行良好，并返回我正在寻找的'a href‘标记。返回内容的示例如下： "<a href="manage/foldercontent.html?folder=Pictures" style="background-image: url(shares/Pictures/DefaultPicture.png)" target="content_window" title=

浏览 3提问于2015-06-30得票数 0

回答已采纳

1回答

漂亮的汤结合了同名的标签

python、xml、beautifulsoup

我有多个Title标签，我想把它们组合成一个Title标签。下面是我所拥有的：(我想组合Title标签，这样当我打印soup时，标签就在一起了&我不想让它们变成字符串) <title> <b> Title Name 1 </b> </title> <title> Title Name 2 </title> 这是我想要的输出： <title> <b> Title Name 1 </b> Title Name 2 </title> 这就是我到目前为止尝试做

浏览 0提问于2018-11-10得票数 1

1回答

使用python将标签放在html中的子字符串周围。

python、html、beautifulsoup

保存为BeautifulSoup对象的html脚本如下所示。 <html> <head> <title>Sample</title> </head> <body> <p>Sundar Pichai is the CEO of Google</p> </body> </html> 现在，我想从soup.p中单独搜索Google这个词，并在它周围包装一个快照标签，从而得到一个更新的汤对象。我试过用 new_span

浏览 1提问于2019-12-26得票数 1

回答已采纳

3回答

如何使用Python BeautifulSoup将输出写入html文件

python、html、beautifulsoup

我使用beautifulsoup删除了一些标记，从而修改了一个html文件。现在我想把结果写回一个html文件中。我的代码： from bs4 import BeautifulSoup from bs4 import Comment soup = BeautifulSoup(open('1.html'),"html.parser") [x.extract() for x in soup.find_all('script')] [x.extract() for x in soup.find_all('style')] [x.ex

浏览 2提问于2016-11-10得票数 50

回答已采纳

1回答

如何使用bs4从网站获取表格数据

python、beautifulsoup

我试图用bs4抓取一个网站，里面有一个表，但我得到的内容元素并不像我从inspect得到的那样完整。我在里面找不到标签<tr>和<td>。如何获取该站点的完整内容，尤其是表格的标记？下面是我的代码： from bs4 import BeautifulSoup import requests link = requests.get("https://pemilu2019.kpu.go.id/#/ppwp/hitung-suara/", verify = False) src = link.content soup = BeautifulSoup(sr

浏览 62提问于2019-04-24得票数 1

回答已采纳

1回答

如何在BeautifulSoup中用unicode呈现标签的内容？

python、xml、web-applications、screen-scraping、beautifulsoup

这是一个来自WordPress帖子详细信息页面的汤： content = soup.body.find('div', id=re.compile('post')) title = content.h2.extract() item['title'] = unicode(title.string) item['content'] = u''.join(map(unicode, content.contents)) 在赋值item['content']时，我想省略封闭的div标记。有没有办法用unico

浏览 4提问于2009-05-09得票数 2

回答已采纳

4回答

我可以把两个'findAll‘搜索块组合在一个漂亮的汤里吗？

python、beautifulsoup

我是否可以将这两个块合并为一个：编辑:任何其他方法，而不是像Yacoby在答案中所做的那样组合循环。 for tag in soup.findAll(['script', 'form']): tag.extract() for tag in soup.findAll(id="footer"): tag.extract() 还可以将多个块合并为一个： for tag in soup.findAll(id="footer"): tag.extract() for tag in soup.findAll(i

浏览 1提问于2009-12-01得票数 2

回答已采纳

1回答

如何对分类变量进行编码以传递给SVM

machine-learning、nlp、svm、categorical-data

我正在做一些NLP任务。我的列表中的一个功能是句子的词性标签。我如何将POS标签作为特征传递给SVM，因为它需要数字数据。

浏览 7提问于2016-07-19得票数 1

2回答

如何使用python在现有的html文件中的h1标记之后添加新的div标记

python、python-2.7、html-parser

我有一个html文件，我想在h1标签之后添加一个div标签。div标签将有一个锚标签。如何使用python编辑现有的html文件并添加带有链接的div这就是我想要做的 <h1> </h1> <div> <a></a> </div> 我和BeatifulSoup试过了。获取AttributeError：'NoneType‘对象没有属性'insert_after’此错误： htmlFile ='path to html file' soup = Soup(htmlFile) headTag

浏览 1提问于2013-11-05得票数 4

1回答

谷歌单张平均每小时获得小费

google-sheets、type-conversion

在一篇专栏文章中，我列出了一周来我在另一篇专栏中所得到的所有技巧，以及我工作的总时间。你如何将工作的总小时转化为小数点，然后用它除以每周的平均时间。 200 / 20:00

浏览 0提问于2018-07-14得票数 1

回答已采纳

1回答

从表抓取将数据写入csv文件

python-3.x、beautifulsoup

我很难弄清楚如何将这个文件写入csv。我正在解析来自表的数据，并且可以很好地打印它，但是当我尝试写入csv文件时，我得到了错误消息"TypeError: write()参数必须是字符串，而不是列表“。我不确定如何将我的数据点转换为字符串。代码： from bs4 import BeautifulSoup import urllib.request import csv html = urllib.request.urlopen("https://markets.wsj.com/").read().decode('utf8') soup = Beaut

浏览 4提问于2018-08-29得票数 0

回答已采纳

2回答

使用漂亮的汤获取带有条件的类内容

python、xml、beautifulsoup

我想用漂亮的汤找标签的子标签(得失)大于0。然后，我想打印内部标签“增益”、“损失”和"band.textualrepresentation“的内容。这基本上就是我想要的脚本(尽管这个脚本不起作用)。 import sys from BeautifulSoup import BeautifulSoup as Soup def parseLog(file): file = sys.argv[1] handler = open(file).read() soup = Soup(handler) for anytype in

浏览 3提问于2017-06-07得票数 2

回答已采纳

1回答

Python+BeautifulSoup:从网页中抓取特定的表

python、web-scraping、beautifulsoup

我正试着从：中抓取一个特定的表我想要的是股票信息。日期、公司名称、比率以及是否可以选择。到目前为止，我的情况如下： from bs4 import BeautifulSoup import urllib2 url = "http://biz.yahoo.com/c/s.html" page = urllib2.urlopen(url) soup = BeautifulSoup(page.read()) alltables = soup.find_all('table') 这段代码给出了页面上的所有表(不止一个)。 1)我不知道如何确定我需要的表格。 2

浏览 5提问于2016-01-07得票数 1

回答已采纳

2回答

在Python中将抓取的数据存储到文本文件中

python、web-scraping

我可以使用Beautifulsoup抓取数据，现在我希望生成一个文件，其中包含我使用Beautiful Soup抓取的所有数据。 file = open("copy.txt", "w") data = soup.get_text() data file.write(soup.get_text()) file.close() 我在文本文件中看不到所有的标签和全部内容。有关于如何实现它的想法吗？

浏览 0提问于2019-12-28得票数 1

1回答

将包含美元符号的字符串转换为int

python、string、beautifulsoup、request、integer

嗨，我正在做一个projekt，在那里我需要刮一个站点并得到一个int。问题是，我得到的文本带有一个美元符号，如何将其转换为int。有什么我能做的吗？ import requests from bs4 import BeautifulSoup url = "https://coinmarketcap.com/currencies/forus/" page = requests.get(url) soup = BeautifulSoup(page.content, "html.parser") x = soup.find_all("div",

浏览 4提问于2022-02-18得票数 -1

3回答

使用re模块输出soup.findall()作为进一步文本操作的输入

python、regex、web-scraping、beautifulsoup

尝试使用BeautifulSoup从网页中提取文本。希望将soup.findall()的输出作为输入传递，以便使用re模块进一步清理数据纯文本输入正常工作，但如果传递soup.findall()的输出，它将引发以下错误。回溯(最近一次调用)：文件“scpe2.py”，第18行，在url = re.search( '，univ) File "/usr/lib/python2.7/re.py“中，第142行，在搜索返回_compile(模式，标志).search( string ) TypeError:预期字符串或缓冲区 soup.findall()的变量打印正在工作。

浏览 6提问于2013-11-24得票数 0

回答已采纳

1回答

创建数组时出错:无法将类stdClass的对象转换为字符串

laravel-6.2

在使用标签创建数组和在数组中创建数组时，Laravel 6.2给出了以下错误：无法将类stdClass的对象转换为字符串。不是语法错误。 [ 'product_id'=>(string)$productId, 'name'=> 'SubscriptionPlan', 'description'=> 'SubscriptionPlan', 'status'=>'ACTIVE', 'billing_cycles'=>[ 0=>[ &

浏览 9提问于2022-01-03得票数 0

回答已采纳

2回答

使用BeautifulSoup的xml

python、xml、beautifulsoup

from bs4 import BeautifulSoup list = (glob.glob("/home/anastasiya/PycharmProjects/bachelor/rutexts/*.xhtml")) for text in list: print(text) with open(text, "r", encoding="windows-1251") as file: with open("ruscorpus.txt", "a") as file2: for line

浏览 0提问于2017-05-08得票数 0

2回答

当存在其他标签时，提取<p>标签的内容

python、beautifulsoup

我想要提取标签内的文本和下面这段html中的后面的部分，使用漂亮的汤： <p><i>Italic stuff</i> Not Italic stuff</p> 我就是这么做的 soup = BeautifulSoup('<p><i>Italic stuff</i> Not Italic stuff</p>') ital = soup.i.string notital = soup.string 但是soup.string返回None，而不是“不是斜体的东西……我做错了什么？” 谢谢!

浏览 1提问于2013-06-18得票数 1

回答已采纳

2回答

解析HTML以检索术语

python、python-3.x、html-parsing

我创造了一个爬虫。所以，现在我有了一堆被爬行的URL。我需要创建一个使用向量空间的索引，或者至少一个HTML中所有术语的列表。假设这个随机网页如何解析该网页中的所有术语？我有点不明白，我应该在特定的标签之间获取文本，或者其他的东西，或者我应该使用哪个库？我完全迷路了。下面是我需要对HTML所做的事情：您可以在线使用html解析器，但原则上，您可以使用html正文中的文本.或者在像这个p /p，h2 /h2这样的标签之间。任何帮助解析上面的HTML是非常感谢的。编辑:我正在尝试BeautifulSoup： import bs4 from urllib.request impo

浏览 0提问于2018-12-08得票数 1

回答已采纳

3回答

如何提取带有标签的标签内的文本？

python、beautifulsoup

我想使用beautifulsoup解析html页面。我希望在不删除html标签的情况下提取标签中的文本。例如，示例输入： <a class="fl" href="https://stackoverflow.com/questio..."> Angular2 <b>Router link not working</b> </a> 样本输出： 'Angular2 <b>Router link not working</b>' 我试过这样做： from bs4 import

浏览 10提问于2019-10-11得票数 2

回答已采纳

1回答

用python刮脚本标记

python、regex、web-scraping、python-requests-html、python-regex

我要刮这串"O email n o oéválido“。从这个脚本标签 $(function() { ,messages: { "resetPasswordEmail": { required: "O email é de preenchimento obrigatório." ,remote: "O email não é válido.&

浏览 2提问于2022-11-01得票数 -1

1回答

BeautifulSoup -在标签中搜索文本

python、html、beautifulsoup

from bs4 import BeautifulSoup from fake_useragent import UserAgent import requests user = UserAgent() headers = { 'user-agent' : user.random } url = 'https://www.wildberries.ru/?utm_source=domain&utm_campaign=wilberes.ru' def main(): resp = requests.get(url, headers=heade

浏览 4提问于2022-06-11得票数 1

4回答

如何在objective c++中拆分字符串

iphone、objective-c、ios、nsstring、stringtokenizer

如何在objective-C中拆分字符串？我正在开发一个包含日期选择器的简短应用程序。我确实显示日期，从日期选择器中获取日期，并通过标签显示。我的主要问题是，如何将日期拆分为三个独立的字符串？有人知道这件事吗？谢谢

浏览 2提问于2011-02-24得票数 10

回答已采纳

2回答

将JSON解析为对象字典

python、json、dictionary

我的JSON为： { "employee_1": {"name": "Sarah"}, "employee_2": {"name": "Emma"} } 它被创建为： class Employee: def __init__(self, name): self.name = name employees = {} employees["employee_1"] = Employee("Sarah") employees[&

浏览 23提问于2021-08-11得票数 0

1回答

如何使用漂亮汤读取html标记

python、beautifulsoup

我试图使用漂亮的some来读取html标签，并检查一些标签是可用的还是缺少的。我正在使用漂亮汤读取文件，然后在测试文件中使用它。在这里，我试过但没有成功： class Testing(unittest.TestCase): @classmethod def setUp(name): name.html = None with open("index.html") as frd: name.html = frd.read() nam

浏览 2提问于2014-03-01得票数 0

回答已采纳

3回答

为什么变量=变量+1工作？

ruby

这是一个Ruby练习，我很难理解一个特定的概念。例如，"soup bowl" = "soup bowl" + 1将无效，那么为什么@dishes_needed[a] = (@dishes_needed[a] || 0) + 1在下面的代码中工作呢？是因为它们是变量而不是对象吗？如果是这样的话，为什么在我最初设置a = (a||0)+1时代码a = "Soup"不能工作？ class Dish end class Soup < Dish end class IceCream < Dish end class ChineseGreen

浏览 7提问于2013-07-25得票数 1

回答已采纳

1回答

从输出中删除HTML标记

python、html、scrape

我对python很陌生，在从输出中删除html标记时遇到了困难。我想删除a标签和其中的内容。我也想移除p标签。有什么建议吗？ import urllib2 from bs4 import BeautifulSoup # Ask user to enter URL url = raw_input("Please enter a valid URL: ") # Make sure file is clear for new content open('ctp_output.txt', 'w').close() # Open txt docume

浏览 1提问于2014-02-25得票数 0

回答已采纳

1回答

用BeautifulSoup简单的标签替换

python、python-3.x、beautifulsoup

我有一个非常简单的标签替换问题，我正试图用BeatifulSoup的replace_with方法来解决这个问题，但是我很难理解它应该如何工作。我有字符串'<b>This is text</b>'，我只想简单地将它转换为'<bold>This is text</bold>'。看来BS4的replace_with命令应该能够做到这一点，但它并不像我所期望的那样工作。我尝试过(在其他一些变体中)如下所示： >>> a = '<b>This is text</b>'

浏览 2提问于2022-05-15得票数 1

回答已采纳

1回答

UnicodeWarning: Unicode相等比较失败

python、string、beautifulsoup、python-unicode

我不明白为什么我的两个字符串不能被比较和匹配。 warn_msg = ('Přihlášení bylo neúspěšné.') # Translated as: Login Failed. soup = BeautifulSoup(auth, 'lxml') find_login = soup.find("div", class_="box").text # Will Give: 'Přihlášení bylo neúspěšné.'' # Translated as: 'Login Fai

浏览 65提问于2019-07-28得票数 0

回答已采纳

2回答

for循环在Python中工作，但在Django中工作

python、django、beautifulsoup

我需要从网站解析h2标签。我使用BeautifulSoup 这是Views.py部分。我搜索所有的H2标签 from django.shortcuts import render from django.http import HttpResponse from django.template import loader from django.views.generic.edit import CreateView from django.urls import reverse_lazy from urllib.request import urlopen from bs4 import

浏览 30提问于2020-04-02得票数 0

回答已采纳

1回答

将字符串类型用作映射键时出错

solidity、mapping、string、bytes

下面的代码没有编译，因为编译器需要一个固定大小类型的映射键，以便为公共映射创建访问器。我用的是字符串类型。我的字符串是24字节十六进制字符串。我的问题：如何将字符串转换为可用作映射键的任何固定大小的类型？对于如何使代码更有效，您有什么建议吗？ pragma solidity ^0.4.6; contract C { struct User { uint balance; } mapping (string => User) public accounts; function newUser(string id, uint balan

浏览 0提问于2016-12-13得票数 11

回答已采纳

1回答

如何从soup Python中删除锚标记

python

我正在使用Beautiful Soup来读取HTML数据。读完之后，我想删除一些锚标签。下面是我的代码： import urllib from bs4 import BeautifulSoup url=raw_input("enter url:") html=urllib.urlopen(url).read() soup=BeautifulSoup(html) tags=soup('a') 标签的输出格式为： [<a href="https://www.naukri.com/psu-government-jobs" target=

浏览 4提问于2017-02-06得票数 0

1回答

如何提取以特定单词开头的特定标题下的文本？

python

我试图在标题下的H2标签中刮文本，标题以“...so的好处”开头，它可能像“玩具的好处”或“杯子的好处”等等。 html代码是： <h2 class="DrugOverview__title___1OwgG">Benefits of Toys</h2> 到目前为止，我使用的代码是 benfit = soup.find('h2',text='Benefits of') q = benefit.get_text(strip=True) 我该怎么解决呢？另外，请记住，在这种情况下(由于其他问题)不

浏览 1提问于2021-01-21得票数 1

回答已采纳