使用python从HTML获取文本

文章/答案/技术大牛

发布

3回答

、、

我有HTML数据，我想要获取标记，并将其放入dataframe中进行进一步处理。<div class="someclass" itemprop="text"> </div> 使用

浏览 66提问于2019-01-05得票数 0

1回答

尝试使用python解析html时重定向到主页

、、、、

www.csgolounge.com/api/mathes"data = page.text我尝试使用此代码从获取文本，但每次尝试从页面获取文本时，我都会被重定向到主页，并且我的代码会从主页输出html。

浏览 0提问于2016-11-02得票数 0

4回答

Python:使用Beautifulsoup从html中获取文本

、、、、

我正在尝试从这个链接中提取排名文本号。在图像中更清晰：我使用以下代码： sourceCode = requests.get(item_url)soup.findAll('h4',{'data-bind':"text: rankingText"})输出：但是，在链接的<em

浏览 0提问于2015-12-17得票数 4

回答已采纳

1回答

使用Python中的美观汤从元素中获取文本值

、

我正在制作python脚本，它从在线站点获取文本数据。这是一个简单的web抓取脚本，语言只是python。我不使用硒，只使用漂亮的汤。而且我可以从<p>或<div>，甚至<h>和<a>中抓取文本，但是当我试图从<td>获取文本时，代码不起作用。下面我分享了我的代码。detailPage = requests.get(SUBURL, head

浏览 5提问于2021-07-16得票数 1

回答已采纳

2回答

如何使用python从html中更改captchas

我一直在尝试使用条带()从HTML文件中获取文本，但这对我来说没有用，我不知道如何使用python从一个长的html页面中获取文本？name=BMX') as response: html = str(html) 而我需要得到的上限，以完成挑战，并得到关键，请帮助:D谢谢

浏览 1提问于2018-02-17得票数 0

回答已采纳

2回答

如何将python程序转换为web服务？

、、、

我有一个python程序。它从一个文本文件(A)中获取一些文本作为输入，进行一些文本注释，并将带注释的文本作为输出存储在另一个文件(B)中。现在，我的计划是让它像web服务一样。我可以使用php并从php调用python程序来做到这一点。具体地说，我的php代码就是这样做的---将文本保存到文件A中。 --运行

浏览 0提问于2015-08-16得票数 0

2回答

需要使用python BeautifulSoup从html获取文本。

、、、、

我被卡住了，无法获得所需的数据，这是html代码<div class=Initial Phase</div> </div> </

浏览 2提问于2022-01-14得票数 0

1回答

将Python字符串转换为HTML变量

、

我正在尝试使用python读取一个文本文件，并从该文件中获取数据的内容，然后将其写入HTML网页。我在Python中读取文件并存储所需的字符串没有任何问题，当尝试将存储的字符串传递到HTML中以写入网页时，问题就来了。下面是从文本文件中获取所需字符串的python代码，该文本文件将字符串存储在“desired_string”中。d = open('d', &#x

浏览 0提问于2021-06-18得票数 0

2回答

如何将Python的urllib2.urlopen()转换为文本？

、

我在python上做了一个程序，它做了以下工作： urllib2.urlopen()获取HTML。但是我想要写在文本上的HTML，我不想要HTML代码！！我现在的节目：import time url = urllib2.urlopen(&

浏览 6提问于2015-12-08得票数 3

回答已采纳

2回答

如何将Google文档作为markdown导入Python应用程序？

、、、

我正在编写一个Python应用程序，它需要从Google Drive获取一个Google文档作为markdown。据我所知，谷歌不提供出口降价。编辑:我想避免使用非python软件，以使设置尽可能简单。

浏览 0提问于2016-07-18得票数 1

1回答

如何使用网络抓取在网页上获得可见的文本？

、、、、

为此，我使用。这是我的代码：page = urlopen(url)html = html_bytes.decode("utf-8") print(html)

浏览 5提问于2021-01-01得票数 0

1回答

如何从SQL (例如MySQL)中提取文本以填充文本模板？感谢一般意见

、

我想使用MySQL数据来填写文本模板。我有数以千计的记录，并希望每个记录信息插入到模板上的特定位置。我想要“生成”数千篇文章，而不是手动插入它们。

浏览 1提问于2022-02-22得票数 -1

1回答

如何使用BeautifulSoup bs4获取HTML的内部文本值？

、、

在使用BeautifulSoup bs4时，如何从HTML标签中获取文本？当我运行这行代码时：我得到的title标签如下：现在我只想得到它的内部文本，page name

浏览 0提问于2015-01-14得票数 7

回答已采纳

2回答

我有大约一百万的网页列表，我想有效地从这些网页上提取文本。目前我正在使用python中的BeautifulSoup库从HTML中获取文本，并使用请求命令来获取网页的html。这种方法除了文本之外还提取一些额外的信息，比如在body中是否列出了任何javascript。你能给我推荐一些合适而有效的方法来完成这项工作吗？我看了scrapy，但它看起来像爬行特定的网站。我们可以将特定网页的列表传递给它以

浏览 24提问于2019-05-22得票数 0

2回答

如何在给定python中的URL的情况下从HTML类中获取纯文本？

、

在python中，如何从类名为calendardescription的any标记中获取纯文本(去除HTML)？不同标签中的匹配文本也应该用空行分隔。这是用于文本到语音的目的。提前谢谢。

浏览 1提问于2011-04-01得票数 0

回答已采纳

2回答

HTML解析最佳Python模块

、、

我有一个网站更新程序(人们可以更新内容(文本)，而不是网站的外观)，它有HTML，javascript作为前端语言，python作为后端/服务器端。我发现从前端更新HTML非常困难，因为当我从ele.innerHTML或$(Ele)获取更新的HTML时，.html()会根据浏览器(该死的IE)进行修改。因此，我决定从后端更新，即用Python更新。您认为解析HTML和抓取信息的最好的<e

浏览 8提问于2011-10-04得票数 5

回答已采纳

1回答

Python web抓取<a>之间的访问值</a>

、

假设我有这样的html代码：<a aria-current="page" aria-label="Current page" href="https://name_webpage.com/">1</a>如何使用python访问<a> </a>之间的值，即1？

浏览 2提问于2021-02-18得票数 0

2回答

用BeautifulSoup解析一小段HTML代码

、

chrome中检查它时，我看到了我需要的数据，时间，当我在chrome上检查时，它是这样的：然而，当我在python中定位到这个特定的文本时，时间无处可见(我怀疑它是隐藏的)(见附件中的第二张图片)，这些数据显然在不断更新，有没有办法在python中找到这些数据？

浏览 1提问于2019-04-03得票数 0

1回答

漂亮的Soup解析分析

、、

我试着用漂亮的汤从HTML中获取某些类的文本。我已经成功地得到了文本，但是，其中有一些异常(无法识别的字符)，如下图所示。如何使用python代码来解决这个问题，而不是手动删除这些异常。 try: except: try:soup = BS(html.tex

浏览 0提问于2020-03-13得票数 0

回答已采纳

1回答

将xml文件从python脚本发送到php脚本以供下载

、、

我在一个使用PHP和python将文本文件转换为xml的项目中。我使用的是ubuntu和apache2服务器。到目前为止，我已经做到了：将所选文件从PHP传递到python脚本，以将其转换为xml。在转换文本文件之后，xml的内容将存储在本地计算机中的一个新创建的xml文件中(从/var/www/ht

浏览 6提问于2016-04-21得票数 0

回答已采纳

点击加载更多