Python ()函数在使用.strip (BeautifulSoup)时给出变量错误

文章/答案/技术大牛

发布

2回答

、

我想去掉这个变量，它包含HTML的空格， span = soup.find("span", id="productTitle") print(span

浏览 38提问于2020-07-27得票数 0

回答已采纳

1回答

在BeautifulSoup Find()函数中正确使用变量

、

如何正确使用BeautifulSoup的.find()函数中的变量？当您将字符串变量指定为参数时，使用find()函数似乎失败了。HTML <h3 id="ourId">Something</h3>prodT

浏览 3提问于2022-07-27得票数 -1

2回答

Python -如何在漂亮的汤中获取内部类文本(TripAdvisor)

、

我试图从python网络刮刮程序中获得在特定日期范围内的特定地区的所有酒店的价格在TripAdvisor。我的程序加载带有selenium的站点，选择日期范围，并在解析数据时将其转换为BeautifulSoup。价格数据位于站点的内部类中。我正在使用这段代码，并给出了ResultSet对象没有属性错误。'}) foo=item.find_all('div', attrs={&

浏览 0提问于2018-09-10得票数 0

2回答

如何创建一个循环来遍历URL列表，抓取所有的数据。类似页面的所有URL都保存在一个file.txt中(一行中的每个URL)？

、、、

from bs4 import BeautifulSoupimport requestsfrom bs4 import Comment with open('F:\Python\Python-FilePy-Thesis-DownLoad/Thesis2.txt'

浏览 8提问于2021-10-06得票数 1

回答已采纳

2回答

当我不使用的时候，为什么我会得到与strip()相关的错误？(Python)

、、

我正在使用BeautifulSoup完成Python中的一个刮擦任务，并得到了一些奇怪的错误。它提到了脱衣舞，我没有使用，但我猜可能与BSoup的进程有关？在任务中，我尝试转到原始网址，找到第18个链接，点击该链接7次，然后在第7页上返回第18链接的名称结果。我试图使用一个函数从第18链接获得href，然后调整全局变量，每次使用不同的url进行递归。我将列出代码和错误： from bs4 impor

浏览 5提问于2016-06-20得票数 1

回答已采纳

1回答

使用BeautifulSoup AttributeError进行Python抓取：'NoneType‘对象没有属性'text’

、、

我不知道为什么要收到错误消息AttributeError：'NoneType‘对象在使用BeautifulSoup在WebScraping上运行Python 2中的代码时没有属性'text’？错误信息：在()AttributeError：'NoneType‘对象没

浏览 0提问于2019-01-09得票数 2

回答已采纳

1回答

函数在python中搜索文本中的特定单词。

、、

我想知道那个人是否在另一所大学学习。我只是随便给了一个网站 soup = BeautifulSoup(r.content,'lxml'

浏览 4提问于2022-11-01得票数 1

回答已采纳

2回答

使用BS4 vs预置数据问题对抓取的列表进行筛选(为什么它不一样？)

、、、

User-Agent': 'Mozilla/5.0'})webpage = web_byte.decode('utf-8')我试着添加了sys.setrecursionlimit(1000000)，结果没有什么不同(仅供参考)，我得到了这个错误“酸洗对象时超过了最大递归深度”，但是当我运行下面的代码时：else:

浏览 2提问于2020-04-13得票数 0

3回答

如何获取换行符<br>前后的字符串

、、、

html看起来像这样 <a> <br></a> 我怎么才能单独拿到1447英亩， “Adams County，ID”和"1,190,000“

浏览 51提问于2020-08-24得票数 1

2回答

正在向txt文件写入多个字符串，是否仅保存最后一个字符串？

、、

我知道这是一个重复的问题，但是从网上所有的答案中，我找不到解决方案，因为所有抛出的错误。简单地尝试从web上抓取标题并将其保存到txt文件。以下是我的代码 def nytscrap(): import requests for head

浏览 6提问于2020-05-03得票数 0

回答已采纳

3回答

我的代码出错了，还有漂亮的汤

、

import requestsfrom mysql import connector page = BeautifulSoup(response.text, 'html.parser: {} ----------------------------

浏览 2提问于2019-02-12得票数 0

回答已采纳

3回答

在Python保存的文件中，如何在包含某些文本的行后打印一行？

、、、

我已经编写了一个Python程序来查找给定号码的手机运营商。它下载的源代码(其中1112223333是要查找的电话号码)并将其保存为carrier.html。在源代码中，载体位于div class="carrier_result“标记之后的行中。(切换到和的<和>，因为stackoverflow认为我正在尝试使用html进行格式化，所以不会显示它。)

浏览 1提问于2010-02-28得票数 0

回答已采纳

5回答

使用Python和BeautifulSoup基于属性解析a标记

、、、、

使用这部分html： <a class="playerLink" href="http://bbroto.baseball.cbssports.comnews-note-recent.gif" width="10"/> </span> </br>

浏览 0提问于2013-12-06得票数 2

回答已采纳

1回答

Beautifulsoup无法从网站抓取数据

、

我一直在使用Python Beautifulsoup来抓取数据。到目前为止，已经成功地抓取了。但是坚持使用下面的网站。我的目标是从提到的网站上抓取歌词。但它总是给出空白结果或非类型对象没有属性类型错误。以下是我正在使用的代码。('h1').text.strip() targetContent=soup.fin

浏览 0提问于2020-04-11得票数 5

1回答

如何用python抓取h4信息从网站抓取表格

、、

python的抓取表是新手，我想要抓取犯罪率表:我使用的包： from bs4 import BeautifulSoupimport pandas as pdpage = requests.get("http://www.city-data.com/city/Belmont-Massachusetts.html") soup = BeautifulSoup(), cols[1].tex

浏览 21提问于2019-08-22得票数 0

1回答

用Javascript元素抓取网页

、、、、

所以为了给我的网站做前言，我似乎使用了javascript代码(关于web开发之类的术语我不太确定)，并且我在不同的页面上尝试抓取不同的表格也取得了不同的成功。我使用的代码是： url = 'http://www.minorleaguesplits.com/tennisabstract/cgi-bin/frags/NovakDjokovic.js'soup = BeautifulSoup(

浏览 28提问于2020-07-08得票数 0

回答已采纳

3回答

不能使用美汤抓取网站

、、

我遵循中关于使用Python和BeautifulSoup抓取网站的教程。我试图从我的政府抓取网站(用于研究目的)，但它给我的错误如下: Traceback (最近一次调用)： name = name_box.text.strip() AttributeError: 'NoneType' object ha

浏览 0提问于2018-05-07得票数 0

1回答

web抓取求职网站的问题

、

我在网上搜索Monster的工作网站，搜索目标是“软件开发人员”，我的目标是简单地打印出那些在Python终端的描述中列出了"python“的作业，而放弃所有其他的Java，HTML，CSS等作业。然而，当我运行这段代码时，我最终打印出了页面上的所有作业。为了解决这个问题，我创建了一个变量(名为'search')，它使用'python‘搜索所有作业，并将其转换为小写。我还创建了一个变量(名为'p

浏览 8提问于2021-01-21得票数 0

回答已采纳

2回答

AttributeError：“”NoneType“”对象没有属性“”text“”- Python，BeautifulSoup错误

、

我刚刚开始了一个python网络课程，在尝试使用BeautifulSoup解析HTML数据时，我遇到了这个错误。我研究了，但找不到任何精确和确定的解决方案。= soup.find(" span", {"itemprop ": "price ", "class": "now-price"}) string_price = (element.text.stripprin

浏览 0提问于2016-12-25得票数 0

回答已采纳

3回答

(Python统一测试失败(?)由于马尔廷字符串中的前导空格)

、、、

我试图在HTML中构建一个月的标题行。我有一个测试用例，当我目视地检查比较或代码生成的部分时，我会得到一个断言错误(例如。我的案子没有通过)。奇怪的是，当我目视时，输出似乎是相同的。dateobj.strftime('%B') return TOP_OF_TABLE.format(month, year) 下面是我得到的错误和差异

浏览 4提问于2015-11-11得票数 3

回答已采纳

点击加载更多