如何在BeautifulSoup对象中搜索字符串？_如何在SQL中执行Contains(Description，'a')搜索，如‘%a%’_如何在Typoscript中定义对象变量(如javascript) - 腾讯云开发者社区

、、、

我目前正在使用Beautifulsoup4从HTML页面中提取href标签。我在Beautifulsoup4中使用的是Beautifulsoup4查询，它运行良好，并返回我正在寻找的'a href‘标记。返回内容的示例如下： "<a href="manage/foldercontent.html?folder=Pictures" style="background-image: url(shares/Pictures/DefaultPicture.png)" target="content_window" title=

浏览 3提问于2015-06-30得票数 0

回答已采纳

3回答

urlopen('http.....').read()中的read()做了什么？[urllib]

、、

嗨，我正在读"Web Scraping with Python (2015)“。我看到了以下两种打开url的方法，分别使用和不使用.read()。请参阅bs1和bs2 from urllib.request import urlopen from bs4 import BeautifulSoup html = urlopen('http://web.stanford.edu/~zlotnick/TextAsData/Web_Scraping_with_Beautiful_Soup.html') bs1 = BeautifulSoup(html.read(), '

浏览 3提问于2016-03-08得票数 8

回答已采纳

1回答

使用BeautifulSoup按标签内容进行搜索

、、

我想通过文本内容来搜索特定的标签。例如： <a href="http://goinghere.com">Lets go somewhere</a> 我想通过搜索文本“让我们去某个地方”来找到上面的内容。我目前正在使用re做这件事。它可以在BeautifulSoup中完成吗?还是在这种情况下使用re更好？

浏览 0提问于2011-08-29得票数 2

回答已采纳

2回答

当搜索查询未出现在url中时，如何使用搜索栏结果刮取网页

、、

我试图在网页中搜索搜索结果，但是当我输入int搜索栏(即ABC)时，它并不反映URL中的搜索结果，所以当我使用BeautifulSoup4刮取URL时，它给了我“None”，是否有一种方法可以找到/写入包含搜索参数的URL？我尝试过使用'BeautifulSoup带‘请求’和'lxml‘解析器，但是结果总是'None’。 from bs4 import BeautifulSoup import requests source = requests.get('URL').text soup = BeautifulSoup(source, 'l

浏览 0提问于2019-06-17得票数 0

1回答

避免使用优美汤和urllib.request下载图片

、、、

我使用BeautifulSoup ('lxml'解析器)和urllib.request.urlopen()从一个网站获取文本信息。但是，当我在Acitivity中查看网络部分时，我看到python下载了很多数据。这意味着不仅文本被下载，而且图像也被下载。在使用BeautifulSoup进行网络抓取时，有可能避免下载图片吗？

浏览 2提问于2016-04-03得票数 0

回答已采纳

1回答

Python:查找字符串返回无

、、

我正在做一个解析HTML页面的项目。这是一个公司的内部网站，但我改变了例子，以便你可以尝试。我获得HTML页面的源代码，并搜索特定的标记。然后，我想提取这个标记的子字符串，但它不起作用。Python返回一个0..。下面是我的代码，注释中包含了Python的返回： #!/usr/bin/python import urllib2 from bs4 import BeautifulSoup response = urllib2.urlopen("http://www.resto.be/restaurant/liege/4000-liege/8219-le-bar-a-gouts/

浏览 4提问于2014-07-28得票数 0

回答已采纳

2回答

在BeautifulSoup中，如何在一个元素中搜索另一个元素？

、、、

我使用的是Django 2，Python3.7和BeautifulSoup 4。我有下面的代码，它应该在一个元素中找到一个元素…… req = urllib2.Request(fullurl, headers=settings.HDR) html = urllib2.urlopen(req, timeout=settings.SOCKET_TIMEOUT_IN_SECONDS).read() bs = BeautifulSoup(html, features="lxml") pattern = re.compile(r'^submitted ') posted_

浏览 20提问于2020-03-03得票数 0

回答已采纳

1回答

BeautifulSoup中文本和字符串的区别

、

当我搜索BeautifulSoup中包含特定文本的标记时，我使用find_all(string='text I want') soup = BeautifulSoup('<a id="someid">stackoverflow</a>', 'lxml') soup.find_all(string='stackoverflow') 但我最近发现我可以 soup.find_all(text='stackoverflow') 我查看了 for BeautifulSoup 4，但没有

浏览 4提问于2016-03-26得票数 1

回答已采纳

1回答

如何在BeautifulSoup对象中搜索字符串？

、、、

我正在检查Craigslist的帖子，看看它们是否已经被标记为删除。我的脚本非常简单： import requests from bs4 import BeautifulSoup def check_if_flagged(url): page = requests.get (url) soup = BeautifulSoup(page.content, 'html.parser') return ('flagged for removal' in soup) 问题是，我有一个url，我知道它已经被标记为删除，但check_if_fla

浏览 12提问于2020-10-28得票数 0

1回答

BeautifulSoup找不到匹配

、、、

我试图通过搜索锚文本从页面中提取BeautifulSoup。我在BeautifulSoup中尝试过几种不同的方法，包括不同的html解析器，但这些方法都没有成功。代码： import requests import re from bs4 import BeautifulSoup url = "http://forum.xda-developers.com/showthread.php?t=1916098" response = requests.get(url) soup = BeautifulSoup(response.content, "lxml"

浏览 3提问于2016-09-26得票数 1

回答已采纳

4回答

理解Python代码中的类方法

我对Python了解甚少。但是我试图用一个小Python脚本在提取、转换和加载(ETL)方面实现一些目标。我得到了想要的结果，但仍然想要理解这个脚本。 from bs4 import BeautifulSoup import urllib import re import string import csv urlHandle = urllib.urlopen("http://finance.yahoo.com/q/cp?s=^DJI") html = urlHandle.read() soup = BeautifulSoup(html) table = soup.find(&

浏览 6提问于2016-03-27得票数 0

2回答

如何在不使用href的情况下查找url

、、、

import requests as rs from bs4 import BeautifulSoup as bs import re site = 'https://www.iciciprulife.com/' req = rs.get(site) soup = bs(req.text, 'html.parser') link=input("Enter which url you want http or https:") if link == "http": for i in soup.find_all('

浏览 23提问于2021-06-09得票数 0

1回答

选择结尾带有随机字母的css标签

、、、、

我目前正在学习用python进行网络抓取。我正在阅读的“用Python进行Web抓取”。我被困在爬行网站通过搜索。例如，书中给出的工作得很好，但是当我试图自己找到它时，就像我将来要做的那样，我得到了这个。在第二个链接中，它是为一个人类工作的，但是由于这个class="media-story-card__body__3tRWy"这样的奇怪的类名，我不知道如何刮它。第一个链接给我简单的名字，比如我可以刮的这个class="search-result-content"。我在其他网站上也遇到过同样的问题。将来我该如何去刮它或者找到一个正常名字的链接呢？下面是我

浏览 2提问于2022-06-25得票数 1

2回答

与BeautifulSoup find()等效的Lxml

、、

最近，我从Beautifulsoup转向了lxml，因为lxml可以处理损坏的HTML，这就是我的情况。我想知道什么是等效的，还是一种编程形式的“美丽之汤”()。在BS中，我可以通过这样的搜索找到一个树节点： bs = BeautifulSoup(html) bs.find('span', {'class': 'some-class-name'}) lxml find()只是搜索树上的当前级别，如果我想在所有的树节点中搜索怎么办？谢谢

浏览 2提问于2013-09-26得票数 0

回答已采纳

2回答

Python3中来自BeautifulSoup的“非法多字节序列”错误

、、、、

.html保存到本地磁盘，我使用BeautifulSoup (bs4)解析它。直到最近，它才被更改为Python3。我在另一台机器Python2中测试了相同的.html文件，它正常工作，并返回页面内容。 soup = BeautifulSoup(open('page.html'), "lxml") Python 3的机器不工作，它说： UnicodeDecodeError: 'gbk' codec can't decode byte 0x92 in position 298670: illegal multibyte sequence

浏览 4提问于2019-10-09得票数 2

回答已采纳

1回答

使用httplib2和BeautifulSoup递归搜索网站的链接

、、

我使用以下方法从网页中获取所有外部Javascript引用。我如何修改代码，以便不仅搜索网址，而且搜索网站的所有页面？ import httplib2 from BeautifulSoup import BeautifulSoup, SoupStrainer http = httplib2.Http() status, response = http.request('https://stackoverflow.com') for link in BeautifulSoup(response, parseOnlyThese=SoupStrainer('script&

浏览 5提问于2017-10-02得票数 0

2回答

如何在lxml.etree python中使用类名解析html

、、、

req = requests.get(url) tree = etree.HTML(req.text) 现在，我想知道是否可以像在beautifulSoup soup.find('div',attrs={'class':'myclass'})中那样通过id的类名进行搜索，而不是使用xpath。

浏览 0提问于2014-05-13得票数 1

2回答

如何在Python中过滤HTML元素

、、、、

我通过抓取一个网站得到了一个字符串列表。如果列表中包含"L“，我希望代码从列表中打印HTML元素。我已经成功地编写了一段在“普通列表”上运行良好的代码，我只需手动将其写入代码中(下面的示例1)，但一旦我尝试使用该代码筛选HTML元素列表，它只会打印空"[]“，尽管我知道应该有多个值。下面是工作的代码： import urllib.request from bs4 import BeautifulSoup url = 'https://kouluruoka.fi/menu/kouvola_koulujenruokalista' request = urllib

浏览 8提问于2022-01-18得票数 1

回答已采纳

4回答

美汤基于部分属性值的标签查找

、

我正在尝试根据属性值的一部分来识别html文档中的标签。例如，如果我有一个Beautifulsoup对象： import bs4 as BeautifulSoup r = requests.get("http:/My_Page") soup = BeautifulSoup(r.text, "html.parser") 我想要具有id属性的tr标签，其值的格式如下："news_4343_23255_xxx“。我对任何新闻标记都感兴趣，只要它的id属性值的前4个字符是“tr”。我知道我可以搜索如下： trs = soup.find_all("

浏览 0提问于2018-06-01得票数 5

3回答

如何在BeautifulSoup中找到给定文本的标记名

、

我有以下html代码： soup = BeautifulSoup("<div class='mydiv'>123456789abc</div>", 'lxml') 现在，我有一条短信'456‘。我想在所有标签中找到文本，这些标签都有相同的标签名，其中包含文本'456‘。也就是

浏览 0提问于2020-08-01得票数 1

回答已采纳

1回答

如何通过Python BeautifulSoup中的特定文本找到标记？

、、、

您知道如何在pythons BeautifulSoup中搜索特定的文本吗?查找标记？？更好的标记完整路径，包含一些string。例如，BS4的常用用法是： import requests from bs4 import BeautifulSoup url = "https://elementy.ru/novosti_nauki" website = requests.get(url) results = BeautifulSoup(website.content, 'html.parser') 然后，您可以使用一些属性(如头、类等)查询所有标记。但是我

浏览 4提问于2022-09-04得票数 0

回答已采纳

1回答

无法解决: TypeError:预期的字符串或缓冲区

、、、

我试图编写一个代码，通过查找span标记和其中的数字，从HTML中删除数字。我一直收到错误“预期的字符串或缓冲区”。在通过不同的问题进行搜索时，我阅读了一些解决方案，但是当我尝试" ''.join(some_list)"时，我得到了另一个错误： “序列项目0:预期字符串，找到标记” 试图搜索那个，看到了一些解决方案，比如使用.get而不是re.findall，但是错误保持不变。守则： import urllib from BeautifulSoup import * url = raw_input('Enter the URL:')

浏览 2提问于2016-11-10得票数 0

1回答

re.compile如何在BeautifulSoup中执行find_all函数？

、

在审查从html表构建csv的解决方案时，我偶然发现了这段代码 ol = map(cell_text，row.find_all row.find_all) 黑体字到底是怎么回事？find_all调用html元素和标记。粗体文本是如何做到这一点的？下面的背景 #!/usr/bin/python from bs4 import BeautifulSoup import sys import re import csv def cell_text(cell): return " ".join(cell.stripped_strings) soup = Beautiful

浏览 7提问于2016-12-03得票数 1

回答已采纳

1回答

BeautifulSoup4无法正确打印。Python3

、、、

我目前正在学习Python3，我正在抓取一些数据，这很好用，但是当我打印出p标签时，我就是无法让它像我期望的那样工作。 import urllib import lxml from urllib import request from bs4 import BeautifulSoup data = urllib.request.urlopen('www.site.com').read() soup = BeautifulSoup(data, 'lxml') stat = soup.find('div', {'style' :

浏览 0提问于2016-01-21得票数 0

1回答

如何在网页中搜索多个关键词？这只输入一个关键字

从bs4导入BeautifulSoup导入时间导入smtplib 默认情况下为True 而True： url = "https://www.google.com" browser = mechanize.Browser() browser.open(url) response = browser.response().read() soup = BeautifulSoup(response, "lxml") count = 1 if str(soup).find("English") == -1: # wait 60 seconds (c

浏览 1提问于2021-12-25得票数 -1

1回答

Eclipse的代码搜索功能是如何工作的？

、

我正在尝试在我的产品中为Java类构建一个代码搜索功能。作为参考，我试图了解Eclipse IDE中的代码搜索功能是如何工作的。 Eclipse提供了文件搜索和Java搜索功能。在Java search中，它提供了对Method，Field等的搜索。它是如何工作的？任何指向这一点的建议都是值得感谢的。我所指的示例代码搜索： ?

浏览 14提问于2019-03-10得票数 2

1回答

如何获取div标记中的所有li标记

、、

我正在刮一个网站，以了解公司和产品的细节。它有div标记，其中有li标记，我希望在div标记中得到所有的li标记。我使用python3.5.1和BeautifulSoup 我的代码： from bs4 import BeautifulSoup import urllib.request import re r = urllib.request.urlopen('http://i.cantonfair.org.cn/en/ExpExhibitorList.aspx?k=glassware') soup = BeautifulSoup(r, "html.parser"

浏览 4提问于2016-02-26得票数 0

回答已采纳

3回答

如何从特定网站刮取数据

、

我试图刮数据从一个网站，以作出一个分析的实践。我有一些问题与一个特定的网站。这个网站是关于西雅图地区的警方报告的。我读了很多文章，但没有得到答案。网址是：我知道我应该使用漂亮的汤，并尝试找到一个关键字来做搜索，然后将类型转换为文本。然而，我一直没有得到任何东西。 import requests URL = 'https://data.seattle.gov/Public-Safety/real-time-911/nvqc-w7eg' page = requests.get(URL) from bs4 import BeautifulSoup soup = Beautifu

浏览 3提问于2020-04-22得票数 1

2回答

BeautifulSoup4:打开URL的FileNotFoundError

、

我正在使用BeautifulSoup4抓取一个站点。以下是我所拥有的内容的精简版本： from bs4 import BeautifulSoup def getTeamRoster(teamURL): soup = BeautifulSoup(open(teamURL)) def main(): getTeamRoster("http://modules.ussquash.com/ssm/pages/leagues/Team_Information.asp?id=11325") 我拉出了页面，它在我的浏览器(Chrome)中正常加载。由于某些原因，我得到

浏览 2提问于2015-06-02得票数 2

2回答

BeautifulSoup:搜索.text属性

、、

我有以下情况 from bs4 import BeautifulSoup html = '''HeyJoe''' soup = BeautifulSoup(html, 'lxml') tag = soup.find('span', text="HeyJoe") print(tag) 打印None。但如果

浏览 0提问于2018-12-31得票数 1

回答已采纳

1回答

TypeError：‘字节’对象是不可调用的

、、

我的代码 page = requests.get(URL).content() soup = BeautifulSoup(page,"html.parser") prices = soup.find("span", class_="value hidden-xs").encode for row in prices('div', attrs = {'class':'col-md-6 col-xs-12'}): price = {} p

浏览 3提问于2022-02-22得票数 -1

回答已采纳

1回答

python美观汤如果语句不能正常工作

、

我有一个问题，与网络刮代码下面。代码可以工作，但是如果输入的产品不仅仅是一个单词，还包含一个像"Playstation 4“这样的数字，它就会失败。问题似乎就在这行if product in str(product_name):中我尝试了许多不同的变体，比如product_name.text或product_name.string，但是如果字符串product不仅仅是一个单词，它就不会正确地检查转换后的对象product_name中是否存在字符串product。如果我使用print(product_name.text)，我将得到我所期望的结果，但是为什么我不能在product_na

浏览 3提问于2021-02-02得票数 1

回答已采纳

1回答

BeautifulSoup中的unicode函数从什么编码转换而来？

、

当我在BeautifulSoup中使用unicode函数时-它会转换成Unicode什么编码？它是否自动使用soup.originalEncoding from BeautifulSoup import BeautifulSoup doc = "<html><h1>Heading</h1>Text" soup = BeautifulSoup(doc) print unicode(soup) 谢谢

浏览 0提问于2010-07-07得票数 1

1回答

如何解决ValueError不在列表中？它在列表中

、

如何解决ValueError不在列表中的问题？我不明白我的代码出了什么问题。 from urllib.request import urlopen from bs4 import BeautifulSoup html = urlopen("http://uk.reuters.com/business/quotes/financialHighlights? symbol=AAPL.O") bsObj = BeautifulSoup(html,"html.parser") tag = bsObj.findAll("td")

浏览 0提问于2017-02-02得票数 1

1回答

Python: BeautifulSoup在读取时会自动更改文本？

、、、

我正在使用BeautifulSoup对XML文件进行更改，但我注意到，如果我读取该文件，将其放入构造函数，然后在不对其进行任何更改的情况下将其吐出，BeautifulSoup已经对代码进行了一些更改。例如，标记和属性名称都是小写的，标签中属性的顺序也会改变。实际上，我知道这不应该是一个问题，但是必须读取XML文件的程序非常挑剔，不会接受这些更改。我发现我可以在不使用BeautifulSoup的情况下使用普通字符串操作进行更改，但这是不方便的。是否有一种方法可以防止BeautifulSoup在读取XML时对其进行更改？

浏览 3提问于2014-07-19得票数 2

回答已采纳

1回答

如何使用美丽汤从url中的表中返回多页数据

、、

我试图检索代码以及标题，但不知怎么我无法检索网站is 在这里，我试图从表中得到值。 import requests unspsc_link = "https://www.unspsc.org/search-code/default.aspx? CSS=51%&Type=desc&SS%27" link = requests.get(unspsc_link).text from bs4 import BeautifulSoup soup = BeautifulSoup(link, 'lxml

浏览 0提问于2019-08-18得票数 1

回答已采纳

1回答

如何使用Python查找包含特定文本的特定html行

、、、

我正在通过HTML查找存储在一行中的名称值对。我不知道如何在漂亮的soup find命令中指定要搜索的文本。 from bs4 import BeautifulSoup html = '''\ <tr> <td>Project ID:</td> <td> 112120</td> </tr> ''' soup = BeautifulSoup(html) for element in soup.

浏览 111提问于2018-08-02得票数 0

回答已采纳

2回答

如何在python中获取json数据

、、

我有这段代码，在这段代码中，我从url(ajax)中得到一个json对象，我需要获取内部数据，这是我的代码： url = URL_BASE9 req = requests.get(url) statusCode = req.status_code if statusCode == 200: html = BeautifulSoup(req.text, "html.parser") #print(html) 这是我的结果 `{'FiltroFechaInicio': '/Date(-62135586000000)/', 'Pagina

浏览 3提问于2017-06-16得票数 0

回答已采纳

1回答

如何在不知道标签/类的情况下使用搜索词来抓取网页？

、、、、

我正在使用Python3.7和BeautifulSoup(4)进行一个项目来实现刮取解决方案。注意:我搜索了一个解决我的问题的方法，但是我找不到任何解决方案，因为它不同于我们通常需要的抓取方法。所以，这就是为什么，不要标记为重复，请！该项目分为两部分：我们已经抓取了谷歌搜索结果URL(例如，前5)的基础上的搜索词。然后，我们必须从这些页面中抓取搜索结果的URL，以获取搜索词的相关信息，因此我们不知道这些结果页面的实际类/标记。那么，我们如何在不知道实际标签/类的情况下，从网页中获取搜索词的相关信息呢？以下是我迄今所做的工作： soup = Beautiful

浏览 0提问于2019-06-13得票数 3

1回答

如何在Python中提取html表的单个值？

、、、、

我想要将从网站上抓取的表中的数据保存到SQLite数据库中。这是我到目前为止所能做的。最好是将一个值保存到变量中，然后将其加载到数据库中。 import requests from lxml import etree from bs4 import BeautifulSoup response = requests.get("https://www.boerse.de/historische-kurse/Daimler-Aktie/DE0007100000") # storing content of page src = response.content # creat

浏览 0提问于2020-03-18得票数 0

1回答

如何在python中清理此df列，然后获取与字符串对应的行索引？

、、、

我有以下数据集： import pandas as pd from bs4 import BeautifulSoup import requests import re url = "https://www.ecb.europa.eu/press/key/date/2021/html/index_include.en.html" req = requests.get(url) soup = BeautifulSoup(req.text) titles = soup.select(".title a") dates = soup.select(".da

浏览 4提问于2021-04-13得票数 0

2回答

如何只将股票名称和实时价格导出到.txt文件，中间不会有任何额外的行或不需要的数据？

、

我从一个网站上抓取实时股票价格使用BeautifulSoup，并使用Python导出到一个文本文件。该代码返回价格以及其他行和信息。如何只选择要导出到.txt文件的特定信息？我对python还不是很精通。尝试搜索stackoverflow，但找不到任何对我有用的东西。 from bs4 import BeautifulSoup import requests import time while True: result = requests.get("https://liveindex.org/s&p-futures/") src = res

浏览 13提问于2019-10-11得票数 0

回答已采纳

1回答

将列表元素“随机-无重复”附加到多个html文件

、、、、

我正在尝试用regex的结果值替换href url，我也尝试了Beautifulsoup模块，但是没有success.keep在所有html文件中得到一个和相同的url class RandomChoiceNoImmediateRepeat(object): def __init__(self, lst): self.lst = lst self.last = None def choice(self): if self.last is None: self.last = random.choice(sel

浏览 0提问于2020-01-03得票数 2

1回答

如何在Python中使用BeautifulSoup解析HTML链接中的嵌套表？

、、、、

全, 我正在尝试从这个链接中解析表。请注意:在“学校/体育搜索”下搜索“2005-2006年学校全部”，体育-Football，I部。我试图分析的专栏是“学校名称”，如果您单击“学校Name.More”信息将输出。从这个环节/表格中，我想分析一下每一所学校的“体育场容量”。我的问题是这样的可能性吗？如果是，怎么做？我刚接触过python和BeautifulSoup，如果你能给出解释的话，那就太棒了！注:有239项结果，总结一下:基本上，我想解析学校名称和体育场容量，并将其转换为Pandas数据帧。 import requests from bs4 import BeautifulSoup

浏览 1提问于2019-01-19得票数 2

回答已采纳

3回答

如何提取带有标签的标签内的文本？

、

我想使用beautifulsoup解析html页面。我希望在不删除html标签的情况下提取标签中的文本。例如，示例输入： <a class="fl" href="https://stackoverflow.com/questio..."> Angular2 Router link not working </a> 样本输出： 'Angular2 Router link not working' 我试过这样做： from bs4 import

浏览 10提问于2019-10-11得票数 2

回答已采纳

2回答

使用Python和BeautifulSoup解析表

、、、

我正在尝试使用Python和BeautifulSoup访问某些td标签中的内容。我可以获得满足条件的第一个td标记(使用find)，也可以获取所有的td标记(使用findAll)。现在，我可以只使用findAll，获取所有内容，并从中获取我想要的内容，但这似乎效率很低(即使我对搜索进行了限制)。有没有办法转到满足我想要的条件的某个td标签？比如说第三个，还是第十个？到目前为止，我的代码如下： from __future__ import division from __future__ import unicode_literals from __future__ import print

浏览 0提问于2011-06-21得票数 1

回答已采纳

1回答

子类化美景汤html解析器，获取类型错误

、

我用非常棒的html解析器写了一个小包装器。最近，我试着改进代码，使所有漂亮的汤方法直接在包装器类中可用(而不是通过类属性)，我认为对美丽汤解析器进行子类化将是实现这一点的最好方法。下面是这个类： class ScrapeInputError(Exception):pass from BeautifulSoup import BeautifulSoup class Scrape(BeautifulSoup): """base class to be subclassed basically a subclassed BeautifulSoup wr

浏览 0提问于2011-10-07得票数 3

回答已采纳

1回答

findall中的findall对字符串无效

、

我试图在我抓取的HTML页面中搜索特定的字符串。我在bs4中使用了find_all()方法并提供了字符串参数，但它不起作用。网页：https://news.google.com/topics/CAAqJggKIiBDQkFTRWdvSUwyMHZNRGx6TVdZU0FtVnVHZ0pKVGlnQVAB?hl=en-IN&gl=IN&ceid=IN%3Aen from bs4 import BeautifulSoup import requests def search(soup):

浏览 34提问于2020-03-22得票数 0

回答已采纳

1回答

如何在AWS S3桶中搜索？

、、

我对AWS非常陌生，最近我了解到了S3和Kendra。经过大量的努力，我将文件上传到我的S3桶中，并尝试使用S3桶中提供的搜索，其中说“键入前缀并按Enter进行搜索。按ESC以清除”“。我真的没有办法搜索任何文件。不管我输入什么，它都只写着“找不到前缀搜索的键”。我找到了一些答案，要求在桶名和文件名之间添加一个"/“。我没有任何运气，搜索抛出一个错误，说“前缀搜索不支持字符'/‘"。如果有人能为我指出正确的资源来了解这个问题，或者在S3桶中教我这个搜索概念，我会非常感激。谢谢。

浏览 2提问于2020-08-07得票数 0

回答已采纳

1回答

TypeError:应为类似字符串或字节的对象

、、

我已经编写了一个来解析html并仅打印文本内容。我想忽略标签。但是我的程序有一个问题。我不确定这是什么。请帮帮我。 import urllib.request import re from bs4 import BeautifulSoup url = "www.example.com" def hi(): dep = urllib.request.urlopen(url) soup = BeautifulSoup(dep, 'html.parser') for link in soup.find_all('p',

浏览 0提问于2016-03-11得票数 2

回答已采纳