我写了一个正则表达式来查找文本中的所有链接。
(?s)(?m)(?i).*(http://[0-9a-z.%/_-]+).?".*如何排除对图像、脚本等的引用?
发布于 2014-01-20 12:27:50
这件事很乱,但要把工作做好:
(?!https?:\/\/[\w%\/_.-]+\.(jpg|js|gif))(https?:\/\/[\w%\/_.-]+\.\w+)这是一个消极的前景,排除不必要的链接,然后是一个“所有链接”捕获。也许不是最优雅的解决方案,但它有效。
还允许https。将不需要的链接类型添加到(jpg/js/gif)列表中(用竖直栏分隔)。
我对java不太确定,但它适用于regex101提供的口味。使用全局标志。
https://stackoverflow.com/questions/21232093
复制相似问题