<>已更改为&lt；&gt；，find_all("a")无法提取python中带有漂亮汤的链接

python、beautifulsoup

我正在尝试使用BeautifulSoup来提取一些链接。all_links = soup.find_all("a") print(link["href"]) 下面是我用print("soup")得到的一个超文本标记语言代码示例aria-labelledby="tab_0" class="seq_contents tex2jax

浏览 12提问于2017-03-05得票数 1

2回答

解析包含HTML片段的XML文件，重命名HTML类名，然后将XML文件写回

python、html、xml、beautifulsoup

我有包含HTML片段的XML文件。我试图编写一个Python脚本，该脚本打开这样的XML文件，搜索包含HTML的元素，重命名类，然后将新的XML文件写回文件。下面是一个XML示例： </div>

浏览 1提问于2022-12-03得票数 0

1回答

用BeautifulSoup在蒸汽中抓取多个页面

python、html、beautifulsoup

我的目标是抓取动作游戏的信息，如游戏名称，标签，价格。用过的图书馆是请求，漂亮的汤。网址：我设法把它编码到第一页，然后我试着刮掉15页。我的计划是，当我将url中的"/Action/#p=0“替换为"/Action/#p=1”并发送get请求时，我将从下一页收到带有游戏的html响应。接下来，我开始在“检查>网络选项卡”中<

浏览 11提问于2022-04-19得票数 1

回答已采纳

2回答

我正在努力学习报废，我面临的一个问题是识别正确的类名，是否有任何特定的规则/方法来识别正确的类名--例如，在下面的代码中，我试图从堆栈溢出页面中得到问题列表，因为我在第一个问题上点击检查&我可以看到类名为question-hyperlink，但是当我尝试下面的代码时，我得到了空的结果，类似地，如果iI尝试使用divname摘要，我会得到同样的空结果指南，说明我如何修复这个问题，并避免在将来的情况下。

浏览 6提问于2022-01-17得票数 0

回答已采纳

2回答

为什么django模板没有显示任何输出？

python、django、python-3.x、django-templates、django-views

因此，我在这里使用django编写了一个简单的新闻应用程序，但是模板似乎不起作用，它没有显示从views.py传递的任何输出。news.title.text }} </h3> {% endfor %}我试着检查列表是空的还是零的，但是没有，它不是空<e

浏览 1提问于2020-02-05得票数 0

回答已采纳

1回答

从内联javaScript中提取数据

javascript、python、selenium、web-scraping

我正在抓取的网页上的内联java脚本正在生成数据，并向相应的div提供电话号码。网页源没有显示数字，所以我无法使用x路径、漂亮汤等来抓取数据。在分析页面源时，我发现JavaScript只有在页面源的脚本中生成数字，而且它们是不可见的，无法将页面源保存起来。这是一个特殊的脚本：QuidditaEnvironment.CurrentContactData={"ContactInf

浏览 2提问于2017-06-20得票数 0

回答已采纳

3回答

如何防止Django基本内联自动转义

python、django、django-templates、django-template-filters

Django Basic Inline应用程序根据app/model/id组合从伪HTML语法呈现预先确定的模板。例如，如果您正在撰写博客文章，则可以插入保存在图像模型中的图像：This is the body of my post.<p><img src="..."><p>。根

浏览 1提问于2012-03-30得票数 3

回答已采纳

2回答

`.find(‘li’)‘on `bs4.element.Tag`对象没有给出任何消息，即使`<li>`标记存在于汤中

python、html、python-3.x、web-scraping、beautifulsoup

在requests.get()未在代码中显示之后，我正在尝试使用漂亮汤解析url内容。正在使用的解析器是"html.parser"。我在一个大脚本中有下面的代码片段。, '__doc__', '__eq__', '__format__', '__ge__', '__getattr__', '__getattribute__', '__getitem__',

浏览 20提问于2022-10-17得票数 0

3回答

ckeditor可以更新数据库内容吗？

php、javascript、mysql、ckeditor

你能给我一种把ckeditor的内容保存到数据库的方法吗？<

浏览 0提问于2012-12-23得票数 0

回答已采纳

2回答

如何从维基百科信息盒中提取信息？

wikipedia、dbpedia、wikipedia-api、structured-data、wikidata

里面有个花哨的。我如何获得

浏览 2提问于2015-11-23得票数 25

回答已采纳

1回答

在Twitter上搜索Alexa技能

twitter、oauth、alexa-skills-kit、alexa-skill、alexa-voice-service

我正在研究一个相当基本的Alexa技能，本质上，它搜索一个特定的Twitter提要，寻找一个主题标签，解析该推文，并将其读取回来。--从Twitter中提取数据的最简单方法是什么？使用一个漂亮的接口添加一个调用、一些意图和一个带有我想要的数据的插槽类型。因为我比JavaScript更了解Python。实现在应用程序中使用纯文本中的</em

浏览 4提问于2017-08-22得票数 0

1回答

找到抓取网站的正确元素

python、python-3.x、web-scraping、beautifulsoup

更确切地说，我只想从分页的媒体和分页的、、、、、，以及那些用英语写的文章中抓取文章。sub_atag.get('href') print("\t"+sub_href) 我尝试过的一些事情是将基本链接更改为子链接接下来，我想从子链接中提取以下信息。当我

浏览 2提问于2020-01-16得票数 1

回答已采纳

3回答

utf8编解码器不能解码python中的字节0x96

python

我试图检查一个特定的词是否在一个网页上的许多网站。脚本运行良好，比如15个站点，然后就停止了。UnicodeDecodeError：'utf8‘编解码器无法解码位置为15344的字节0x96 :无效的开始字节ht

浏览 5提问于2011-10-24得票数 26

回答已采纳

6回答

在使用Eclipse/CDT调试C++代码时更好地探索变量

c++、eclipse、gdb、eclipse-cdt

使用Eclipse和CDT调试C++代码的变量窗口很麻烦，而且对于在标准模板库或boost (例如shared_ptr)中定义的类型来说，信息不是很丰富。这只是一个std：：vector的示例： std::_Vector_base<TSample<MyTraits>, std::allocator<TSample<MyTraits_M_finish 0x00007ffff7fd4410 _M_end_of_storage 0x0000

浏览 48提问于2010-09-06得票数 71

回答已采纳

1回答

在提取/分解一些“td”标记后，无法访问表第一行以外的“td”标记

python、python-3.x、web-scraping、beautifulsoup

在这个有两行四列的示例表中，每一行的前两个单元格包含PDF文件，这就是我想要提取的。每一行中的另外两个是ZIP文件。我知道我可以在“findAll”方法中直接过滤PDF文件，但是这个表只是一小部分。但是，如果我打印整个汤，第二行中的PDF文件仍然存在。我只是不能使用findAll访问它们。打印'soup.contents‘也只给我第一行。当我使用“提取”而不是“分解”时，同样，只有第一行

浏览 3提问于2016-05-22得票数 3

2回答

自定义图标和应用程序名称不填充码头或顶部菜单

gnome、nautilus、launcher、icons

所有这一切都可以在链接的屏幕截图中看到:应用程序名为Lexitron，它自己的窗口位于最前端，它的.desktop文件(带有自定义图标)显示在Nautilus中，您可以在Dock中看到通用的‘bar’图标(我的自定义图标也正确地出现在显示中，但我无法截图。)但这也解决不了这个问题:单击固定的自定义图标仍会显示带有“未知”标记的已标记的</

浏览 0提问于2020-04-27得票数 0

回答已采纳

5回答

维基百科Mediawiki API从URL获取Pageid

mediawiki、wikipedia-api、mediawiki-api、mediawiki-extensions

我有一套完整的urlshttp://en.wikipedia.org/wiki/Monte_Lauro http:/我尝试从URL中提取页面标题，方法是接受lastindexof("/")和最后一个字符的子字符串，然后查询API以获得pageid。en.wikipedia.org/wiki/Lago_Cecita --

浏览 2提问于2015-07-28得票数 14

17回答

列出对象的属性

python、class、python-3.x

是否有一种方法可以获取存在于类实例上的属性列表？= int(number) * 2print(', '.join(a.SOMETHING)) 期望的结果是输出

浏览 6提问于2010-04-20得票数 445

18回答

Python：(1,2,3)和[1,2,3]有什么区别，我应该在什么时候使用它们？

python、list、tuples

在许多地方，(1,2,3) (元组)和[1,2,3] (列表)可以互换使用。

浏览 7提问于2008-08-05得票数 56

回答已采纳

1回答

不调用模型方法的夹层/django模板呈现

python、django、python-3.x、mezzanine

有时错误的结果(没有来自方法的打印消息)和有时正确的结果(来自方法的打印消息)。我是新的夹层(更习惯金字塔)，并有一个奇怪的不确定的问题与一些模板渲染。我创建了一个带有内部Django应用程序的夹层项目，用于添加3种新类型:实验(Page，RichText)，工具(Page，RichText)，DailyStatus (可显示的，所有者的，RichText我在ForeignKey

浏览 0提问于2015-05-23得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

解析包含HTML片段的XML文件，重命名HTML类名，然后将XML文件写回

用BeautifulSoup在蒸汽中抓取多个页面

如何识别美丽汤的正确类别？

为什么django模板没有显示任何输出？

从内联javaScript中提取数据

如何防止Django基本内联自动转义

`.find(‘li’)‘on `bs4.element.Tag`对象没有给出任何消息，即使`<li>`标记存在于汤中

ckeditor可以更新数据库内容吗？

如何从维基百科信息盒中提取信息？

在Twitter上搜索Alexa技能

找到抓取网站的正确元素

utf8编解码器不能解码python中的字节0x96

在使用Eclipse/CDT调试C++代码时更好地探索变量

在提取/分解一些“td”标记后，无法访问表第一行以外的“td”标记

自定义图标和应用程序名称不填充码头或顶部菜单

维基百科Mediawiki API从URL获取Pageid

列出对象的属性

Python：(1,2,3)和[1,2,3]有什么区别，我应该在什么时候使用它们？

不调用模型方法的夹层/django模板呈现

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐