腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(182)
视频
沙龙
1
回答
<>
已
更
改为
&
lt
;&
gt
;,
find_all
("a")
无法
提取
python
中
带有
漂亮
汤
的
链接
python
、
beautifulsoup
我正在尝试使用BeautifulSoup来
提取
一些
链接
。all_links = soup.find_all("a") print(link["href"]) 下面是我用print("soup")得到
的
一个超文本标记语言代码示例aria-labelledby="tab_0" class="seq_contents tex2jax
浏览 12
提问于2017-03-05
得票数 1
2
回答
解析包含HTML片段
的
XML文件,重命名HTML类名,然后将XML文件写回
python
、
html
、
xml
、
beautifulsoup
我有包含HTML片段
的
XML文件。我试图编写一个
Python
脚本,该脚本打开这样
的
XML文件,搜索包含HTML
的
元素,重命名类,然后将新
的
XML文件写回文件。下面是一个XML示例: &
lt
;/div&
gt
;
浏览 1
提问于2022-12-03
得票数 0
1
回答
用BeautifulSoup在蒸汽
中
抓取多个页面
python
、
html
、
beautifulsoup
我
的
目标是抓取动作游戏
的
信息,如游戏名称,标签,价格。用过
的
图书馆是请求,
漂亮
的
汤
。网址: 我设法把它编码到第一页,然后我试着刮掉15页。我
的
计划是,当我将url
中
的
"/Action/#p=0“替换为"/Action/#p=1”并发送get请求时,我将从下一页收到
带有
游戏
的
html响应。接下来,我开始在“检查>网络选项卡”
中<
浏览 11
提问于2022-04-19
得票数 1
回答已采纳
2
回答
如何识别美丽
汤
的
正确类别?
python
、
beautifulsoup
我正在努力学习报废,我面临
的
一个问题是识别正确
的
类名,是否有任何特定
的
规则/方法来识别正确
的
类名--例如,在下面的代码
中
,我试图从堆栈溢出页面
中
得到问题列表,因为我在第一个问题上点击检查&我可以看到类名为question-hyperlink,但是当我尝试下面的代码时,我得到了空
的
结果,类似地,如果iI尝试使用divname摘要,我会得到同样
的
空结果指南,说明我如何修复这个问题,并避免在将来
的
情况下。
浏览 6
提问于2022-01-17
得票数 0
回答已采纳
2
回答
为什么django模板没有显示任何输出?
python
、
django
、
python-3.x
、
django-templates
、
django-views
因此,我在这里使用django编写了一个简单
的
新闻应用程序,但是模板似乎不起作用,它没有显示从views.py传递
的
任何输出。news.title.text }} </h3> {% endfor %}我试着检查列表是空
的
还是零
的
,但是没有,它不是空<e
浏览 1
提问于2020-02-05
得票数 0
回答已采纳
1
回答
从内联javaScript中
提取
数据
javascript
、
python
、
selenium
、
web-scraping
我正在抓取
的
网页上
的
内联java脚本正在生成数据,并向相应
的
div提供电话号码。网页源没有显示数字,所以我
无法
使用x路径、
漂亮
汤
等来抓取数据。在分析页面源时,我发现JavaScript只有在页面源
的
脚本中生成数字,而且它们是不可见
的
,
无法
将页面源保存起来。这是一个特殊
的
脚本:QuidditaEnvironment.CurrentContactData={"ContactInf
浏览 2
提问于2017-06-20
得票数 0
回答已采纳
3
回答
如何防止Django基本内联自动转义
python
、
django
、
django-templates
、
django-template-filters
Django Basic Inline应用程序根据app/model/id组合从伪HTML语法呈现预先确定
的
模板。例如,如果您正在撰写博客文章,则可以插入保存在图像模型
中
的
图像:This is the body of my post.&
lt
;p&
gt
;&
lt
;img src="..."&
gt
;&
lt
;p&
gt
;。 根
浏览 1
提问于2012-03-30
得票数 3
回答已采纳
2
回答
`.find(‘li’)‘on `bs4.element.Tag`对象没有给出任何消息,即使`<li>`标记存在于
汤
中
python
、
html
、
python-3.x
、
web-scraping
、
beautifulsoup
在requests.get()未在代码
中
显示之后,我正在尝试使用
漂亮
汤
解析url内容。正在使用
的
解析器是"html.parser"。我在一个大脚本中有下面的代码片段。, '__doc__', '__eq__', '__format__', '__ge__', '__getattr__', '__getattribute__', '__getitem__',
浏览 20
提问于2022-10-17
得票数 0
3
回答
ckeditor可以更新数据库内容吗?
php
、
javascript
、
mysql
、
ckeditor
你能给我一种把ckeditor
的
内容保存到数据库
的
方法吗?<
浏览 0
提问于2012-12-23
得票数 0
回答已采纳
2
回答
如何从维基百科信息盒中
提取
信息?
wikipedia
、
dbpedia
、
wikipedia-api
、
structured-data
、
wikidata
里面有个花哨
的
。我如何获得
浏览 2
提问于2015-11-23
得票数 25
回答已采纳
1
回答
在Twitter上搜索Alexa技能
twitter
、
oauth
、
alexa-skills-kit
、
alexa-skill
、
alexa-voice-service
我正在研究一个相当基本
的
Alexa技能,本质上,它搜索一个特定
的
Twitter提要,寻找一个主题标签,解析该推文,并将其读取回来。--从Twitter中
提取
数据
的
最简单方法是什么?使用一个
漂亮
的
接口添加一个调用、一些意图和一个
带有
我想要
的
数据
的
插槽类型。 因为我比JavaScript
更
了解
Python
。实现在应用程序中使用纯文本
中
的</em
浏览 4
提问于2017-08-22
得票数 0
1
回答
找到抓取网站
的
正确元素
python
、
python-3.x
、
web-scraping
、
beautifulsoup
更
确切地说,我只想从分页
的
媒体和分页
的
、、、、、,以及那些用英语写
的
文章
中
抓取文章。sub_atag.get('href') print("\t"+sub_href) 我尝试过
的
一些事情是将基本
链接
更
改为
子
链接
接下来,我想从子
链接
中
提取
以下信息。当我
浏览 2
提问于2020-01-16
得票数 1
回答已采纳
3
回答
utf8编解码器不能解码
python
中
的
字节0x96
python
我试图检查一个特定
的
词是否在一个网页上
的
许多网站。脚本运行良好,比如15个站点,然后就停止了。UnicodeDecodeError:'utf8‘编解码器
无法
解码位置为15344
的
字节0x96 :无效
的
开始字节ht
浏览 5
提问于2011-10-24
得票数 26
回答已采纳
6
回答
在使用Eclipse/CDT调试C++代码时更好地探索变量
c++
、
eclipse
、
gdb
、
eclipse-cdt
使用Eclipse和CDT调试C++代码
的
变量窗口很麻烦,而且对于在标准模板库或boost (例如shared_ptr)
中
定义
的
类型来说,信息不是很丰富。这只是一个std::vector
的
示例: std::_Vector_base<TSample<MyTraits>, std::allocator<TSample<MyTraits_M_finish 0x00007ffff7fd4410 _M_end_of_storage 0x0000
浏览 48
提问于2010-09-06
得票数 71
回答已采纳
1
回答
在
提取
/分解一些“td”标记后,
无法
访问表第一行以外
的
“td”标记
python
、
python-3.x
、
web-scraping
、
beautifulsoup
在这个有两行四列
的
示例表
中
,每一行
的
前两个单元格包含PDF文件,这就是我想要
提取
的
。每一行
中
的
另外两个是ZIP文件。 我知道我可以在“findAll”方法中直接过滤PDF文件,但是这个表只是一小部分。但是,如果我打印整个
汤
,第二行
中
的
PDF文件仍然存在。我只是不能使用findAll访问它们。打印'soup.contents‘也只给我第一行。当我使用“
提取
”而不是“分解”时,同样,只有第一行
浏览 3
提问于2016-05-22
得票数 3
2
回答
自定义图标和应用程序名称不填充码头或顶部菜单
gnome
、
nautilus
、
launcher
、
icons
所有这一切都可以在
链接
的
屏幕截图中看到:应用程序名为Lexitron,它自己
的
窗口位于最前端,它
的
.desktop文件(
带有
自定义图标)显示在Nautilus
中
,您可以在Dock中看到通用
的
‘bar’图标(我
的
自定义图标也正确地出现在显示
中
,但我
无法
截图。)但这也解决不了这个问题:单击固定
的
自定义图标仍会显示
带有
“未知”标记
的
已
标记
的</
浏览 0
提问于2020-04-27
得票数 0
回答已采纳
5
回答
维基百科Mediawiki API从URL获取Pageid
mediawiki
、
wikipedia-api
、
mediawiki-api
、
mediawiki-extensions
我有一套完整
的
urlshttp://en.wikipedia.org/wiki/Monte_Lauro http:/我尝试从URL中
提取
页面标题,方法是接受lastindexof("/")和最后一个字符
的
子字符串,然后查询API以获得pageid。en.wikipedia.org/wiki/Lago_Cecita --
浏览 2
提问于2015-07-28
得票数 14
17
回答
列出对象
的
属性
python
、
class
、
python-3.x
是否有一种方法可以获取存在于类实例上
的
属性列表?= int(number) * 2print(', '.join(a.SOMETHING)) 期望
的
结果是输出
浏览 6
提问于2010-04-20
得票数 445
18
回答
Python
:(1,2,3)和[1,2,3]有什么区别,我应该在什么时候使用它们?
python
、
list
、
tuples
在许多地方,(1,2,3) (元组)和[1,2,3] (列表)可以互换使用。
浏览 7
提问于2008-08-05
得票数 56
回答已采纳
1
回答
不调用模型方法
的
夹层/django模板呈现
python
、
django
、
python-3.x
、
mezzanine
有时错误
的
结果(没有来自方法
的
打印消息)和有时正确
的
结果(来自方法
的
打印消息)。 我是新
的
夹层(
更
习惯金字塔),并有一个奇怪
的
不确定
的
问题与一些模板渲染。我创建了一个
带有
内部Django应用程序
的
夹层项目,用于添加3种新类型:实验(Page,RichText),工具(Page,RichText),DailyStatus (可显示
的
,所有者
的
,RichText我在ForeignKey
浏览 0
提问于2015-05-23
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何用Python 编写知乎爬虫?So easy!
维基百科中的数据科学:亲自教你阅读世界上最大的Python百科全书
这才是简单快速入门Python的正确姿势!
你可能不知道的 Python 技巧
手把手教你Tableau高级数据分析功能
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券