腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
解析
HTML
发现
数据
的
妙方
和
python
、
、
我想用漂亮
的
汤来提取this page上
的
关键信息。特别是,我希望在.booking-list中使用.booking-item/s。期望
的
结果是: [{"FERRY TYPE": "Traghetto", "DEPARTURE TIME":"06:40", "DEPARTURE DATE": "25/02/2019","DEPARTURE
浏览 11
提问于2019-02-24
得票数 0
回答已采纳
1
回答
基于动态内容
和
隐藏
数据
表
的
Selenium Web抓取
、
、
、
、
真的需要这个社区
的
帮助!
html
=browser.execute_script('return document.body.innerHTML') sel_soup=BeautifulSoup(
html
, '
html
.parser'
浏览 15
提问于2018-02-14
得票数 2
1
回答
在BeautifulSoup 4中将标签内容提取为文本(相当于QUOTE_TAGS)
、
、
HTML
3有一个很好
的
特性,那就是它不会试图将<textarea>标签
的
内容解释为BeautifulSoup --它会将其引用为文本。通过修改QUOTE_TAGS属性,可以将此行为应用于其他标记。下面的展示了它是如何有用
的
。 在BeautifulSoup 4中,没有QUOTE_TAGS属性,我认为如果不自己创建
html
.parser子类,就无法获得相同
的
功能。我是不是遗漏了什么?您将如何使用BS4解决上面链接
的
问题?
浏览 1
提问于2013-05-01
得票数 1
2
回答
网页上动画地图
的
好工具
、
、
、
我想在网页内
的
地图上展示区域。该区域应可点击,并在盘旋时突出显示。我使用django,所以我倾向于使用matplotlib
和
其他
python
工具。网上有一些有趣
的
项目: 问题是,我不知道在哪里获得有关控制
和
区域
的
GeaJson
数据
。有没有人建议不要在复杂
的
应用程序中过多地使用tim。谢谢
浏览 10
提问于2010-12-31
得票数 3
回答已采纳
2
回答
在模板中显示模型
的
功能
我正在尝试将
数据
功能集成到现有系统中,我基本上是Django
的
新手。我对这两个函数有点困惑。SchoolStudentMixin,template_name = 'dashboard/grades.
html
'paginate_by = None
html
{% if some_func
浏览 0
提问于2018-03-27
得票数 0
1
回答
我
的
Jsonobject会返回null吗?
、
、
我正在与一个我似乎无法理解
的
问题作斗争。我叫它
的
方式有问题吗?编辑: 好
的
--看起来我刚刚算出来了。该对象出现为null
的
原因是Json没有包含所有必需<
浏览 0
提问于2012-02-05
得票数 0
1
回答
在c#上一次得到Facebook页面的喜欢
、
、
我想得到所有粉丝
的
基本
数据
,谁喜欢我
的
Facebook页面。我有一个请求到这个网址(),我得到了100名粉丝在一次随机
的
反应。我需要所有的球迷一次或其他100个独特
的
成员,但不是随机
的
。有没有机会一次得到所有53k
的
球迷。我们能不能用Graph来解决这个问题。请帮帮我。谢了尼尔。
浏览 2
提问于2013-08-23
得票数 0
回答已采纳
1
回答
从网站中指定
的
div区域复制文本
、
、
这是链接: (你应该从下拉列表中选择'all‘来查看完整
的
课程列表) 此链接包含我
的
学校
的
课程代码
和
课程名称。我正在做一个学校项目(网站),在这个网站上,其他学生应该能够选择他们
的
课程。问题是,有太多
的
课程,我不能用手打字。所以,我在想某种脚本,它将从网站上获取必要
的
信息并保存到一个文本文件中,从那里我可以编写一个脚本来将课程复制到我
的
数据
库中。我检查了源代码,我看到课程代码写在一个p标记中,它
的
类名为&q
浏览 0
提问于2015-05-19
得票数 0
4
回答
在
Python
中
解析
格式错误
的
html
时,lxml
和
libxml2中
的
哪一个更好?
、
、
、
对于格式错误
的
html
,哪一个更好、更有用?谢谢。
浏览 0
提问于2012-02-17
得票数 8
回答已采纳
1
回答
我应该在
Python
中使用哪个Microdata
解析
器?
、
、
我正在寻找一个高质量
的
HTML
微
数据
解析
器
的
Python
。它不需要太快,但我希望它能支持尽可能多
的
,包括itemref。 你用过这些图书馆吗?我还对
解析
格式不佳
的
HTML
文档感到好奇。您是否找到了一个处理杂乱输入
的
微
数据
解析
器,或者您是否首先通过类似于
的
东西来
浏览 3
提问于2013-04-02
得票数 6
回答已采纳
1
回答
对于web抓取
和
xml
解析
,这是最好
的
学习库。
、
、
、
、
对于相同
的
工作,我被多个库弄混了。我想学习一个库,它将同时处理xml
和
html
解析
。Do元素树与
html
解析
兼容。我听说了lxml,xml.elementtree,漂亮汤,迷你,刮刮。有人能帮我吗。
浏览 4
提问于2020-02-03
得票数 0
回答已采纳
2
回答
通过
python
获取浏览器对象?
、
我已经准备好写一个程序来分析网页中
的
一些静态
数据
,然而,我
发现
很难通过
python
访问浏览器对象,如window对象。可以像javascript一样使用
python
来获取浏览器对象吗?有什么想法吗?谢谢
浏览 1
提问于2011-05-30
得票数 1
3
回答
如何
解析
不严格
的
HTML
文档?
、
我今天还有一个问题据我所见,这类分析器是在web浏览器中构建
的
。我
的
意思是,应该有一个
解析
器能够很好地处理输入文档,允许在xhtml
和
xml中出现以下任何无效情况: 没有引号
的
属性:<span class=hi
浏览 0
提问于2009-09-24
得票数 1
回答已采纳
1
回答
Javascript / jQuery post问题
、
、
、
我编写了一个基于POST请求返回
数据
的
API。print "Content-Type: text/json" print
浏览 2
提问于2014-03-26
得票数 0
回答已采纳
1
回答
从网页中提取主题/关键字
、
、
我正在寻找一个系统,以提取主题或简单
的
关键字从一个网页,只有从指定
的
网页,没有跟随所包含
的
链接。要分析
的
页面属于不同
的
站点,特别是我想分析一个人在Facebook上共享
的
链接,并从这些页面中提取主题或简单
的
关键字。非常感谢。
浏览 5
提问于2014-04-11
得票数 0
7
回答
用
Python
3
和
示例
解析
HTML
的
最佳库?
我对
Python
完全陌生,并且在Windows上使用
Python
3.1 (pywin)。我需要
解析
一些
HTML
,本质上是特定
HTML
标记之间
的
额外值,并且对我
的
选项数组感到困惑,我
发现
的
所有东西都适合
Python
2.x。我读过关于Beautiful、
HTML
5Lib
和
lxml
的
文章,但是我不知道如何在Windows上安装它们。 您推荐什么
HTM
浏览 13
提问于2010-03-24
得票数 26
回答已采纳
2
回答
HTML
解析
最佳
Python
模块
、
、
我有一个网站更新程序(人们可以更新内容(文本),而不是网站
的
外观),它有
HTML
,javascript作为前端语言,
python
作为后端/服务器端。我
发现
从前端更新
HTML
非常困难,因为当我从ele.innerHTML或$(Ele)获取更新
的
HTML
时,.
html
()会根据浏览器(该死
的
IE)进行修改。因此,我决定从后端更新,即用
Python
更新。 您认为
解析
HTML
<e
浏览 8
提问于2011-10-04
得票数 5
回答已采纳
1
回答
将
数据
流读取到托管对象上下文中?
、
、
我看到了一种将用户
数据
从一个iOS应用升级到另一个沙箱
的
巧
妙方
法;目标应用注册为一个特殊
的
URL处理程序,而原始应用base64 64-编码整个文件并将其作为明文字符串发送到专门
的
URL,目标应用对其进行解码并保存到文件系统是否有可能对源
的
托管对象上下文进行编码&发送它&让目标
解析
到它
的
托管对象上下文中?也就是说,不是重写目的地
数据
,而是合并传入
的
数据
?这个问题
的
答
浏览 0
提问于2012-02-19
得票数 0
回答已采纳
3
回答
从xml中提取
HTML
、
、
我想从xml文件中提取
html
页面。有什么想法吗? <first> </second> <
html
>.....some
html
code here </xhtml> 我想提
浏览 1
提问于2013-04-15
得票数 0
1
回答
使用
Python
以编程方式将DOCX转换为
HTML
、
我已经在
Python
中实现了
HTML
to DOCX,在那里我使用BeautifulSoup
解析
了
HTML
。我递归地遍历了每个
HTML
标签,然后使用
Python
-Docx库创建了Docx文档。现在我想做相反
的
事情,将Docx转换为
HTML
字符串。我读到了有关使用
Python
Docx库()读取现有文档
的
内容。但是,我找不到一种方法来遍历每个文档对象并将它们转换为
HTML
字符串。有没有办法可以做这样<
浏览 3
提问于2019-09-06
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券