在python BS4中提取某些文本？_Python - BS4:提取div之间的文本_如何提取列中的某些文本 - 腾讯云开发者社区

、、

我正在尝试提取BS4中的某些文本。下面是HTML示例。

浏览 18提问于2020-10-23得票数 2

回答已采纳

1回答

如何在Python中从Google功能中提取文本？

、、、

我所说的谷歌功能是指，例如，当你在谷歌上输入“我感到好奇”，第一个结果是一个随机的事实，之后你就会得到基本的结果。我要做的是在Python中提取随机数的文本。我尝试使用requests和bs4库。我注意到在requests库中找不到随机事实特性。有没有其他的方法来提取文本？

浏览 46提问于2018-07-11得票数 1

回答已采纳

1回答

如何使用网络抓取在网页上获得可见的文本？

、、、、

这是我想刮的网页的链接：这就是点击标题后网页的样子。url = "https://www.tripadvisor.in/Hotels-g494941-Indore_Indore_District_Madhya_Pradesh-Hotels.html"html_bytes = page.read() html = html_bytes.decode("utf-8")

浏览 5提问于2021-01-01得票数 0

1回答

数据抓取本地存储的HTML文件-使用Python

、、、

我有一个很大的Excel文件，在每个单元格中都有各种HTML内容，其中包含数据库用户所做的注释。每个单元格中的内容都是唯一的，并且长度各不相同。我需要去掉所有HTML语法/标记，这样我才能将此内容上传到数据库表中。如何使用Python (如果没有Python的答案，则使用Java )抓取这些数据？你能提供一个代码示例吗？

浏览 0提问于2016-10-14得票数 0

1回答

我想用python脚本废弃javascript函数创建的DIV内容。我尝试过使用BS4，但我无法获得动态数据。相反，它只显示源代码。示例代码：from bs4 import BeautifulSoup URL = "https://rawgit.com/skysoft999/tableauJS/masterfor row in soup.findAll('div', attrs = {'class':&#x

浏览 0提问于2018-04-20得票数 3

回答已采纳

2回答

使用python中的美观汤从具有更多文本内容的Web页面中提取数据

、、、、

我一直在尝试提取网页中数据丰富的节点。有没有办法从网页中提取文本？import requestsfrom bs4 import BeautifulSoupurl = "http://www.amazon.in"r = requests.get(url)print html.title.text 我可以打印网页的

浏览 7提问于2015-04-22得票数 1

回答已采纳

1回答

用python获得美汤的具体路线

、

我看过这段视频，他在上从他的网站上抓取了一篇文章，但视频中缺少的是，他并没有解释我是如何在文章中用循环的方式把刮掉的。from bs4 import BeautifulSoupimport csv source = requests.get('http://coreyms.com')

浏览 2提问于2021-07-01得票数 0

回答已采纳

2回答

Python BS4美汤HTML.Parser在网站上不起作用

、

我有Python3.7代码，尝试从以下网站()提取足球统计数据。看起来我在BS4美丽汤中使用的超文本标记语言解析器根本没有提取网站中的任何标签。我首先尝试提取特定的标签，比如表示主队和客队的两个不同的div标签，以及包含球员姓名的标签。当这呈现了一个空的标签列表时，我只是简单地尝试提取该网站上的所有div标签，但我仍然得到了一个空列表。下面是我使用的代码：from bs4</

浏览 26提问于2019-07-13得票数 2

回答已采纳

3回答

使用Python将维基百科中的数据提取到txt文件

、、、、

我实现了以下代码来从维基百科页面提取数据import sysfor i in wiki.select('p'):这段代码按照我的要求从页面中提取所有数据但是，我想使用Python将其存储

浏览 0提问于2020-05-16得票数 1

1回答

代码不会在使用BeautifulSoup的网站上显示所有剥离的、提取的文本

、

对Python来说非常新。下面的代码只允许我显示从提取的网站中的单个p条目(第一个条目，0，是当前的示例)。from urllib.request import urlopen as uReqparagraph = paragraphs[

浏览 0提问于2019-01-20得票数 0

回答已采纳

1回答

从html页面不显示数据的url读取数据

、

main__': import requests from bs4如何提取它们？

浏览 1提问于2020-02-05得票数 0

2回答

BeautifulSoup - lxml和html5lib解析器之间的差异

、、、、

我使用的是BeautifulSoup 4和Python2.7。我想从一个网站中提取某些元素(数量，见下面的例子)。由于某些原因，lxml解析器不允许我从页面中提取所有想要的元素。它只打印前三个元素。/usr/bin/pythondata = """ <td class="size-price last first" cols

浏览 1提问于2014-03-27得票数 7

4回答

如何使用python检测网页内容的语言

是否有任何方法可以通过使用Python语言返回网页中的内容语言？就像如果页面是中文的，那么它应该返回`“中文”。我用langdetect模块检查了它，但是无法得到我想要的结果。内容显示在<releasehigh>下

浏览 13提问于2015-06-25得票数 1

回答已采纳

4回答

BeautifulSoup查找特定文本的所有匹配项

、、、

我将分析许多网站与不同的BeautifulSoup，我试图找到所有行，其中包含特定的文本(在html内)使用html。) if "price" in text:这种方法不起作用(即使在html

浏览 0提问于2015-10-17得票数 2

1回答

文本提取:使用了所有的方法，但仍然停滞不前。

、、、、

我想从一个网页中提取几个文本。我搜索了StackOverFlow (以及其他网站)，以找到一个合适的方法。我使用HTML2TEXT、BEAUTIFULSOUP、NLTK和其他一些手动方法进行提取，例如： NLTK不会处理我的波斯文

浏览 3提问于2015-01-16得票数 0

回答已采纳

4回答

从包含其他标签的“a”标签中提取文本的漂亮问题

、

我想从下面显示的HTML 'a‘标签中提取“气候8/17/2019下午2:00”。我编写了一些代码，我认为这些代码将从'a‘标记中提取所有文本，稍后，我将使用字符串操作来提取所需的子字符串。{"class": "class_a"}) 我检查了bar变量的类型是类bs4.element.Tag (不是字符串) from urllib.request import urlopen from bs4

浏览 22提问于2019-10-11得票数 1

回答已采纳

2回答

为什么我的网络抓取代码没有提取任何内容？

、、

我正在写一个点燃的评论，并试图让我们，Python，web，抓取摘要等信息，关于其他研究在一个网站。例如，我想从这个网页中提取“Transcript”的内容，并编写了一个Python代码，但它似乎根本不起作用，也没有提取任何内容：importhtml.text,'html.parser') item = soup.find('span', {'data-id': &#

浏览 15提问于2022-09-15得票数 2

2回答

(Python)

、、

我正在使用BeautifulSoup完成Python中的一个刮擦任务，并得到了一些奇怪的错误。它提到了脱衣舞，我没有使用，但我猜可能与BSoup的进程有关？在任务中，我尝试转到原始网址，找到第18个链接，点击该链接7次，然后在第7页上返回第18链接的名称结果。我试图使用一个函数从第18链接获得href，然后调整全局变量，每次使用不同的url进行递归。我将列出代码和错误：import urllib nameList = []

浏览 5提问于2016-06-20得票数 1

回答已采纳

4回答

尝试使用python和bs4从特定td中抓取所有“a”文本

、、、

我正在尝试抓取，以提取'a‘标记中包含的文本，特别是在带有类的表中，" table -main"，然后针对其中的每一行。第一个td包含两个团队名称的文本，带有一个td类“h- text -左侧”。不确定问题是否与我的循环有关，但我得到的错误消息似乎是我在循环的最后一行中错误地使用了bs4。我可以用类、" table -main“来刮表中的每个tr，然后再用类”h-text-左侧

浏览 1提问于2019-04-08得票数 1

回答已采纳

2回答

用漂亮的汤擦网

、

我昨天在python上开始了我的旅程，我正在尝试自动提取某些页面的值。这是我的密码 from bs4 import BeautifulSoup url = 'https://www.jpg.store/collection

浏览 10提问于2022-04-12得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云