首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >打印某些HTML Python机械化

打印某些HTML Python机械化
EN

Stack Overflow用户
提问于 2011-10-14 14:07:03
回答 3查看 6.9K关注 0票数 1

我正在制作一个自动登录到网站的小python脚本。但是我被卡住了。

我希望将html的一小部分打印到终端中,位于站点上html文件中的以下标记中:

代码语言:javascript
复制
<td class=h3 align='right'>&nbsp;&nbsp;John Appleseed</td><td>&nbsp;<a href="members_myaccount.php"><img border=0 src="../tbs_v7_0/images/myaccount.gif" alt="My Account"></a></td>

但是我该如何提取并打印John Appleseed这个名字呢?

顺便说一句,我正在mac上使用Pythons的机械化。

EN

Stack Overflow用户

发布于 2011-10-14 14:23:10

您可以使用解析器提取文档中的任何信息。我建议你使用lxml模块。

下面是一个示例:

代码语言:javascript
复制
from lxml import etree
from StringIO import StringIO

parser = etree.HTMLParser()

tree = etree.parse(StringIO("""<td class=h3 align='right'>&nbsp;&nbsp;John Appleseed</td><td>&nbsp;<a href="members_myaccount.php"><img border=0 src="../tbs_v7_0/images/myaccount.gif" alt="My Account"></a></td>"""),parser)


>>> tree.xpath("string()").strip()
u'John Appleseed'

有关lxml here的更多信息

票数 1
EN
查看全部 3 条回答
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/7763691

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档