腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如
何在
Python
中
解析
高效
的
Html
?
python-3.x
、
parsing
我将在没有外部库
的
情况下
解析
Html
代码
的
效率。 我已经用for做好了所有的尝试,并检查了是哪个符号。是这样
的
: list = []m = 0 if a == "<"
浏览 12
提问于2019-05-23
得票数 1
回答已采纳
1
回答
在java
中
采用漂亮格式
的
XML
的
格式属性
java
、
xml
、
dom
、
sax
我希望所有属性都打印在一行
中
。>2140</id> <description>ghj</description></feeds> 下面是我用于格式化xml
的
代码我也尝试过SAX
解析
器。我不想使用DOM4J。)); return new Strin
浏览 21
提问于2021-07-23
得票数 1
2
回答
动态获取urls
的
python
抓取
python
、
web-crawler
、
web-scraping
我是数据抓取领域
的
新手,之前使用
python
进行web和桌面应用程序开发。我只是在想,如果有任何方法可以从页面
中
获取urls,然后查看它
的
具体信息,
如
电话号码,地址等。目前我使用
的
是BeautifulSoup和built方法,其中我将urls作为方法
的
一个参数。有什么建议可以让它变得更快、更自驱动吗?
浏览 1
提问于2011-04-22
得票数 2
回答已采纳
3
回答
如何删除
Python
中
两个双括号之间
的
文本
python
、
string
、
parsing
、
beautifulsoup
、
markdown
我正在进行一些标记,将其转换为
html
,然后在没有标记
的
情况下
解析
出文本,只给我留下一组清晰
的
字母数字字符。 return cleaned 这对于标记
中
的
所
浏览 3
提问于2020-03-31
得票数 1
回答已采纳
1
回答
python
中
的
Regex字符串检索
python
、
regex
、
string
如
何在
python
中
解析
这个正则表达式? - View all <a href="http://www.indeed.com/l-Houston,-TX-jobs.
html
">Houston
浏览 1
提问于2012-04-27
得票数 0
1
回答
支持
python
中
的
POSIX openat函数
python
、
python-3.x
、
posix
有一个可以将对POSIX 函数(以及其他*at函数(
如
)
的
支持)添加到用
解析
fixed标记为closed
的
python
标准库
中
,但是os、posix和platform模块目前并不包括任何这些方法。这些方法是用等语言
高效
、无竞争条件解决C等问题
的
标准方法。 这些是否包含在标准库
中
?如果没有,是否有计划在未来将此包括在内。
浏览 1
提问于2018-08-15
得票数 2
回答已采纳
2
回答
在不使用BeautifulSoup或urlib库
的
情况下,
解析
和提取
html
web内容
中
的
urls。
python
、
html
、
arrays
、
string
、
html-parsing
我是
python
的
新手,如果我
的
问题是非常基本
的
,我很抱歉。在我
的
程序
中
,我需要
解析
一个
html
网页并提取其中
的
所有链接。(
如
、或 )
解析
网页
的
内容,但其中许多人使用了库(
如
urlib或urlib2或BeautifulSoup )和请求,而在我
的
程序
中
无法使用这些库。因为我
的
应用程序将运行在没有安装这些库<em
浏览 0
提问于2017-09-17
得票数 0
回答已采纳
1
回答
如
何在
Symfony
的
Twig模板
中
查找非I18N字符串
php
、
symfony
、
internationalization
、
translation
如何以编程方式确定模板
中
的
字符串不会被翻译?我指的是消息没有包含在{% trans %}或trans()
中
的
情况。如下所示:实际上,我
的
应用程序中有大量
的
模板,我需要知道哪条消息和哪个模板
中
我可能遗漏了一个trans。
浏览 1
提问于2017-05-31
得票数 3
3
回答
如何使用BeautifulSoup从
html
中
清除标记
python
、
python-3.x
、
beautifulsoup
我完成了第一步,但是在执行第二步时,我得到了以下错误:我尽了最大努力去纠正它,但我又犯了同样
的
错误=True)这是我
的
错误 File "C:\
python
\lib\site-p
浏览 9
提问于2018-01-10
得票数 4
回答已采纳
1
回答
在
python
中
高效
解析
破碎
的
XML/
HTML
python
、
xml
、
parsing
、
lxml
、
elementtree
我希望能够在
Python
中
高效
地
解析
大型
HTML
文档。我知道和。但是,这两种方法都不能处理损坏XML,
HTML
读取这些XML也是如此。此外,文档可能包含其他损坏
的
XML。类似地,我知道像这样
的
答案,它建议根本不使用任何形式
的
迭代
解析
,事实上,这就是我正在使用
的
。但是,我正在尝试优化我
的
程序中最大
的
瓶颈,即文档
的
解析
。此外,我使用用于lxml<em
浏览 0
提问于2014-01-26
得票数 2
1
回答
Python
lxml,在输出
HTML
之前删除父元素(使用fragment_fromstring)
python
、
html-parsing
、
lxml
、
lxml.html
我正在使用lxml
解析
一些
HTML
片段(来自RSS提要),为了
高效
地完成这项工作,我使用了create_parent='div'。当我稍后输出
HTML
时,我不希望包含父div,因为在我
的
html
布局
中
,它最终成为div
中
的
一个div,这是完全不安全
的
。现在
的
代码是:
h
浏览 0
提问于2013-06-29
得票数 4
1
回答
具有不可变字符串
的
高效
字符串构建
python
、
string
、
optimization
即使没有它,我们也可以在摊销
的
O(n)
中
构建一个字符串。 我们如
何在
字符串不可变
的
语言(
如
python
)中
高效
地构建字符串?在O(n)
中
的
C++
中
,一次添加原子
的
天真方法似乎是O(n^2),为gc生成O(n^2)垃圾。
浏览 2
提问于2015-04-20
得票数 0
回答已采纳
1
回答
从网页中提取主题/关键字
python
、
web-scraping
、
keyword
我正在寻找一个系统,以提取主题或简单
的
关键字从一个网页,只有从指定
的
网页,没有跟随所包含
的
链接。要分析
的
页面属于不同
的
站点,特别是我想分析一个人在Facebook上共享
的
链接,并从这些页面中提取主题或简单
的
关键字。非常感谢。
浏览 5
提问于2014-04-11
得票数 0
1
回答
检查包是否从源树中导入
python
、
package
、
python-import
用户应该通过pip安装我们
的
python
包,或者可以从github克隆并从源代码
中
安装。用户不应该在源树目录
中
运行import Foo,原因有很多,例如缺少C扩展(numpy有相同
的
问题:)。因此,我们希望检查用户是否在源树
中
运行import Foo,但是如
何在
支持
Python
3和2
的
情况下做到干净、
高效
和可靠?我们考虑了以下几点: 检查setup.py或其他文件(
如
PKG-INFO ),这些文
浏览 1
提问于2019-04-29
得票数 10
2
回答
滚动您自己
的
web爬虫来抓取一个有多个条目的特定网站。
php
、
web-crawler
什么样
的
语言能够处理编写自己
的
网页爬虫?但是如果我需要的话,我想有一个很好
的
理由去学习一门新
的
语言。这个想法是抓取一个有多个条目的特定网站,就像一个RSS提要,但是他们不提供该站点
的
RSS提要.
浏览 0
提问于2011-08-02
得票数 0
回答已采纳
7
回答
如何用C#编写
解析
器?
c#
、
parsing
、
xml-parsing
、
interpreter
如何编写
解析
器(递归下降?)在C#?现在,我只需要一个简单
的
解析
器来
解析
算术表达式(并读取变量?)。尽管稍后我打算编写一个xml和
html
解析
器(用于学习目的)。我之所以这样做,是因为
解析
器在很多方面都很有用:网页开发、编程语言解释器、内部工具、游戏引擎、地图和图块编辑器等。那么,编写
解析
器
的
基本理论是什么?我如
何在
C#
中
实现
解析
器?C#是
解析
器
的</em
浏览 0
提问于2011-09-11
得票数 68
回答已采纳
2
回答
计算出现次数并使用C/STL打印前K个
c++
、
stl
、
unordered-map
我有一个很大
的
文本文件,每行都有标记。我想计算每个令牌出现
的
次数,并对其进行排序。我如
何在
C++中
高效
地做到这一点,最好是使用内置函数和最短
的
代码(当然也是最
高效
的
)?我知道如
何在
python
中
做到这一点,但不确定如
何在
STL中使用unordered_map。
浏览 0
提问于2012-10-05
得票数 2
回答已采纳
2
回答
PHP正则表达式到引号到属性
php
、
regex
、
html-parsing
我需要通过regex函数运行一个
html
字符串,该函数检查属性是否用引号括起来,如果没有,则将其关闭。
浏览 0
提问于2010-05-16
得票数 0
回答已采纳
5
回答
以稳定和有效
的
方式从网页
中
获取数据
data
、
parsing
最近我了解到,使用regex
解析
网站
的
HTML
来获取所需
的
数据并不是最好
的
做法。假设数据是普通文本,显示在
html
页面的表
中
。 我目前正在为我
的
项目使用
python
,但是一个独立于语言
的
解决方案/提示会更好。一个附带
浏览 0
提问于2012-06-06
得票数 10
回答已采纳
1
回答
字符数据
的
验证问题
jquery
、
html
使用直接输入到W3schools验证器
中
,我得到了许多错误,但其中许多错误非常相似,声明如下:var $tr = $("<tr class='optionAndAnswer' align='center'>");另外,我在下面不断得到这样
的
信息,我不太明白问题是什么: 这个怎么样?
浏览 0
提问于2013-02-02
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python对XML和HTML的解析
Python爬虫解析html:lxml的HtmlElement对象获取和设置inner html
解析python中的if
给人用的 Python 网页解析工具 Requests-HTML
Python爬虫实战入门三:简单的HTML解析——爬取腾讯新闻
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券