使用此网页的http://www.westminster.ac.uk/schools/computing/undergraduate。我正在使用hpple检索数据(刚刚开始学习)。我想特别从主页检索href,我该怎么做呢?
我有这样一行代码--“href *elements = xpathParser search:@"//a";”能够检索页面中的所有href链接,但是我如何才能只检索主内容中的链接呢?例如:"BSc荣誉企业信息系统“?它的语法是什么?
发布于 2011-08-17 22:38:00
看起来所有的“主要内容”都可以在具有id属性的元素下找到,比如"content_div_XXXX“,其中XXXX是一些随机生成的序列。您也许能够使用如下所示的XPath获取您想要的内容:
//div[starts-with(@id,'content_div')]//a
你应该能够让这样的东西工作,尽管你必须尝试它,也许还需要稍微调整一下,让它完全按照你想要的那样工作。有关一组很好的XPath教程,请参阅W3Schools XPath page
https://stackoverflow.com/questions/7094449
复制相似问题