在Python中,可以使用正则表达式从HTML <a>
标签中提取Facebook页面URL。下面是一个示例代码:
import re
html = '<a href="https://www.facebook.com/example">Facebook</a>'
pattern = r'<a\s+href="([^"]+)"[^>]*>Facebook</a>'
match = re.search(pattern, html)
if match:
url = match.group(1)
print(url)
解释代码:
re
模块,用于正则表达式操作。<a>
标签。re.search()
函数在HTML字符串中搜索匹配模式的内容。match.group(1)
提取捕获的URL部分。这个代码片段可以提取出HTML <a>
标签中的Facebook页面URL。如果需要提取其他网页的URL,只需修改正则表达式模式中的Facebook
部分即可。
领取专属 10元无门槛券
手把手带您无忧上云