我有以下测试字符串: test_str = `It isn't directed at all,' said the White Rabbit; 我当前的正则表达式使用re.sub过滤掉标点符号,这样我就可以进行自己的操作了我当前的正则表达式是re.sub(r"[^A-Za-z0-9'\s]", '', test_str) 上面的输出是: ['It', "isn't", 'directed',
似乎使用网址之王正则表达式来解析用户帖子中的骗局。它不需要协议,并且可以忽略标点符号。例如:如果我发布"I like plus.google.com.",网站会将其转换为"I like “。因此,如果有人知道有一个regex可以在有协议和无协议的情况下解析URL,并且擅长忽略标点符号,请用它回答。
我不认为这个问题是一个骗局,因为我看到的所有类似问题的答案似乎都需要URL中的协议。