因为要用python做学校网络的认证程序,需要解析服务器传回的html,本以为会像javascript里操作DOM那样简单,结果发现并不是 这样。 其实python里面有xml.dom模块,但是这次却不能用,为啥呢? SGMLParser 将 HTML 分解成有用的片段, 比如开始标记和结束标记。一旦它成功地分解出某个数据为一个有用的片段,它会根据 所发现的数据,调用一个自身内部的方法。 为了使用这个分析器,您需要子类化 SGML- Parser类,并且覆盖这些方法。 中的所有连接(标签)中的地址(href属性的值)提取出来,放到一个list里面,很实 用的功能。