如何在Python3中删除HTML标签

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (1)
  • 关注 (0)
  • 查看 (73)

我正在编写一个简单的脚本来打印终端中的IP地址。我无法从print语句中删除HTML标记。

我尝试过使用urllib库中的.strip()函数。我不明白正则表达式输入这段代码。

import re
import urllib.request, urllib.parse, urllib.error
import json


data = urllib.request.urlopen('http://checkip.dyndns.org')
for line in data:
    print(line.decode().strip())

我希望输出只是我的IP(xxx.xx.xx.xxx),而是得到以下内容

“<html> <head> <title>当前IP检查</ title> </ head> <body>当前IP地址:XXX.XX.XX.XXX </ body> </ html>”

提问于
用户回答回答于

你要做的不是一个困难的字符串操作问题,但是使用不同的服务有一个更清洁的方法。一个是ipify.org

import json
from urllib import request

with request.urlopen('https://api.ipify.org?format=json') as response:
    print(json.loads(response.read())['ip'])

扫码关注云+社区

领取腾讯云代金券