腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
从
列表
BeautifulSoup
中
提取
文本
python
、
list
、
text
、
beautifulsoup
我正在尝试
从
以"a href"开头的
列表
中
提取
文本
。 整个
列表
都在一个名为team"的变量
中
。如果我写team[0].a.text,我会得到第一个
文本
。但是当我执行team[0:14].a.text时,我得到了这样的响应: AttributeError: 'list' object has no attribute 'a'` 我猜这意味着a.text函数在
列表
上不起作用如何从中获取<
浏览 11
提问于2020-07-29
得票数 0
回答已采纳
1
回答
(Python、
BeautifulSoup
)创建或修改不带锚点标记的锚点
文本
列表
python
、
list
、
web-scraping
、
beautifulsoup
、
python-requests
我是Python的新手,我正在尝试构建一个
从
网站
提取
一些
文本
并将其粘贴到Google电子表格
中
的脚本。
文本
是用标签包装在网站上的标题。我使用
BeautifulSoup
(也导入了pygspread )来
提取
标题,如下所示: target_url = 'WEBSITE URL' r = requests.get(target_url)soup =
BeautifulSoup
(r.text, 'html.parser
浏览 16
提问于2019-12-24
得票数 0
回答已采纳
1
回答
如何在
BeautifulSoup
中
捕获内部
文本
和内部标记
python
、
html
、
beautifulsoup
、
screen-scraping
我正在解析一个文档,它是一个包含div标记的
列表
,但它有时也只有
文本
内联。我需要知道如何
从
它们中
提取
内容。说我有以下几点:<div>1</div>3</div> 我需要
提取
上面所有的
文本
,这样它就可以读到1234了。我有下面的代码,它获取所有的div标记,但不会单独获得
文本</
浏览 0
提问于2014-02-28
得票数 1
回答已采纳
1
回答
使用Python
从
HTML5网站抓取
文本
python
、
html
、
screen-scraping
我需要从一个使用python的网站上抓取
文本
。我已经安装了
BeautifulSoup
4、HTML和NLTK,但我似乎无法找到如何抓取。我真的需要一个简单的代码片段,我可以插入任何URL并获得纯
文本
。我正试着从那里得到它
浏览 1
提问于2014-09-17
得票数 0
回答已采纳
3
回答
使用
BeautifulSoup
从
表
中
抽取选定的列
python
、
html-parsing
、
beautifulsoup
我正在尝试使用
BeautifulSoup
提取
的第一列和第三列。
从
超
文本
标记语言看,第一列有一个<th>标记。感兴趣的另一列具有as <td>标记。在任何情况下,我所能得到的只是一个带有标签的列的
列表
。但是,我只想要
文本
。 table已经是一个
列表
,所以我不能使用findAll(text=True)。我不确定如何以另一种形式获得第一列的
列表
。from
BeautifulSoup
import
Beauti
浏览 0
提问于2012-10-26
得票数 14
回答已采纳
2
回答
如何在没有额外信息的情况下有效地
从
网页簇中
提取
文本
java
、
python
、
web-scraping
、
beautifulsoup
、
scrapy
我有大约一百万的网页
列表
,我想有效地从这些网页上
提取
文本
。目前我正在使用python
中
的
BeautifulSoup
库
从
HTML
中
获取
文本
,并使用请求命令来获取网页的html。这种方法除了
文本
之外还
提取
一些额外的信息,比如在body
中
是否列出了任何javascript。 你能给我推荐一些合适而有效的方法来完成这项工作吗?我看了scrapy,但它看起来像爬行特定的网站。我们可以将特定网页的
列表<
浏览 24
提问于2019-05-22
得票数 0
2
回答
使用python
中
的美观汤
从
具有更多
文本
内容的Web页面中
提取
数据
python
、
html
、
python-2.7
、
web-scraping
、
beautifulsoup
我一直在尝试
提取
网页
中
数据丰富的节点。有没有办法
从
网页中
提取
文本
?import requestsfrom bs4 import
BeautifulSoup
url = "http://www.amazon.in"r = requests.get(url)print html.title.text 我可以打印网页的
浏览 7
提问于2015-04-22
得票数 1
回答已采纳
1
回答
如何通过将变量与python
中
的标记值匹配来
提取
数据
python-2.7
从
第一个表
中
,我
提取
了4个i,分别是abc1、abc2、abc3和abc4。现在,我要检查在与第二个表
中
的ids匹配后,这些ids是否出现在第二个表
中
(确实如此),我想
提取
扬声器和这些扬声器的
文本
。你可以看到我想要
提取
数据的第二个表rom的代码结构。
浏览 3
提问于2013-08-07
得票数 0
2
回答
Python BS4美汤HTML.Parser在网站上不起作用
python
、
beautifulsoup
我有Python3.7代码,尝试
从
以下网站()
提取
足球统计数据。看起来我在BS4美丽汤中使用的超
文本
标记语言解析器根本没有
提取
网站
中
的任何标签。我首先尝试
提取
特定的标签,比如表示主队和客队的两个不同的div标签,以及包含球员姓名的标签。当这呈现了一个空的标签
列表
时,我只是简单地尝试
提取
该网站上的所有div标签,但我仍然得到了一个空
列表
。下面是我使用的代码:from bs4 impor
浏览 26
提问于2019-07-13
得票数 2
回答已采纳
1
回答
用
BeautifulSoup
从
XML文档中
提取
unicode
文本
python
、
xml
、
beautifulsoup
我有这样的代码: url = open(fileid, 'r').read() print fileid它从本地xml文件
中
获取某个元素。然后,它从中
提取
xml代码并打印一个
列表
。下面是该
列表
的一个片段集。您可以看到其中分配了
浏览 1
提问于2017-05-16
得票数 0
2
回答
当我不使用的时候,为什么我会得到与strip()相关的错误?(Python)
python
、
web-scraping
、
beautifulsoup
我正在使用
BeautifulSoup
完成Python
中
的一个刮擦任务,并得到了一些奇怪的错误。它提到了脱衣舞,我没有使用,但我猜可能与BSoup的进程有关?在任务
中
,我尝试转到原始网址,找到第18个链接,点击该链接7次,然后在第7页上返回第18链接的名称结果。我试图使用一个函数
从
第18链接获得href,然后调整全局变量,每次使用不同的url进行递归。我将列出代码和错误:import urllib nameList = []
浏览 5
提问于2016-06-20
得票数 1
回答已采纳
1
回答
如何用python阅读网站内容
rss
、
html-parsing
、
python-2.7
、
beautifulsoup
、
lxml
我考虑使用RSS/ Atom提要作为
提取
内容的基础。但是,由于RSS/ Atom提要通常不会包含整个网站的文章,我认为可以使用feedparser
从
提要
中
收集所有“帖子”链接,然后
从
相应的URL中
提取
文章内容。即提要
中
显示的文章内容),但我想访问整个文章数据,我必须使用相应的URL。 我遇到了各种各样的库,比如
BeautifulSoup
、lxml等。
浏览 2
提问于2012-05-15
得票数 0
回答已采纳
1
回答
我正在尝试用python脚本在页面中找到一个特定的链接
python
、
beautifulsoup
、
urllib2
我试图找出如何
从
给定的站点中
提取
出只有链接到特定
文本
的from
BeautifulSoup
import
BeautifulSoup
import rehtml_page = urllib2.urlopen("https://www.example.net/")linkContent链接是这样的 <a class=&
浏览 3
提问于2020-10-10
得票数 0
1
回答
Python美丽汤如何将JSON解码成“命令”?
python
、
web-scraping
、
beautifulsoup
我对Python
中
的
BeautifulSoup
很陌生,我正在尝试
从
BeautifulSoup
中
提取
dict。我使用
BeautifulSoup
提取
JSON,并获得了
beautifulsoup
.
beautifulsoup
变量soup。我试图
从
soup
中
获取值,但当我执行result = soup.findAll("bill")时,会得到一个空
列表
[]。如何
提
浏览 0
提问于2013-11-11
得票数 9
回答已采纳
4
回答
如何使用python检测网页内容的语言
python
是否有任何方法可以通过使用Python语言返回网页
中
的内容语言?就像如果页面是中文的,那么它应该返回`“中文”。 我用langdetect模块检查了它,但是无法得到我想要的结果。
浏览 13
提问于2015-06-25
得票数 1
回答已采纳
3
回答
如何使用
BeautifulSoup
查找第一个锚标签的
文本
python
、
beautifulsoup
abc.com"> </a> <a href="xyz.com">comments</a></p>下面是我如何使用
Beautifulsoup
从
锚标记中
提取
文本
soup = <e
浏览 1
提问于2016-04-28
得票数 1
4
回答
使用Python
从
HTML中
提取
可读
文本
?
python
、
html
、
text-extraction
我知道像html2text,
BeautifulSoup
等工具,但问题是他们也
提取
javascript并将其添加到
文本
中
,这使得分离它们变得很困难。htmlDom =
BeautifulSoup
(webPage) 或者,extract= html2text(webPage) 这两个都
提取
了页面上的所有javascript,这不是我们想要的。我只想把你可以
从</
浏览 2
提问于2010-07-04
得票数 4
回答已采纳
1
回答
从
多个网站中
提取
文本
python
、
web-scraping
、
web-crawler
from bs4 import
BeautifulSoup
import urllib2list_open = open("weblist.txt")line_in_list: beautiful for news in soup: print
浏览 0
提问于2018-09-16
得票数 1
回答已采纳
1
回答
当元素确实存在时,
BeautifulSoup
返回'None‘
python
、
beautifulsoup
基本上,我试图收集
文本
的网站是这样的: url = 'https://www.otcmarkets.com/stock/MNGG/overview'soup =
BeautifulSoup
(page.content, "html.parser") ticker = soup.find
浏览 34
提问于2021-02-27
得票数 0
1
回答
使用
BeautifulSoup
将
文本
从一个超
文本
标记语言文档传输到另一个文档
python
、
html
、
beautifulsoup
我正在尝试从上的页面中
提取
类别名称和问题/答案
文本
,并使用Python将它们插入到我自己的HTML文档
中
。我已经能够使用soup.find_all("td", class_="clue_text)
提取
线索
文本
,理论上我知道如何
提取
其他数据,但我不知道如何将这些数据插入到我自己的HTML文档
中
,特别是考虑到
BeautifulSoup
输出一个
列表
,并且我的
文本
格式与源文件不同。例如
浏览 1
提问于2018-03-21
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Excel中批量提取摘要文本
Excel数字提取技巧:从混合文本中提取数字的方法
如何用Python从PDF文件中提取文本词汇
从有年月日的 Excel 列表中,提取某年某月的所有数值并求和
从 Excel 列表中逐行提取单元格内的所有数字,没有数字的空行去除
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券