我正在HTML字符串上执行regex来获取URL,我想获取所有不是javascript的href和src。在另一篇这样的文章中,我有以下模式:
/(href|src)?\="http:\/\/www\.mydomain\.com\/(?:(?!\.js).)*"/这给我带来了如下结果:
src="http://www.mydomain.com/path/to/resource/image.gif" alt="" border="0"这很好,因为它缺少.js结果。这很糟糕,因为它正在获取元素中的附加标记。我尝试了下面的修改,以在第一个"停止
/(href|src)?\="http:\/\/www\.mydomain\.com\/(?:(?!\.js).)[^"]*"/它的工作原理是返回href="$url",但返回以.js结尾的结果。是否有一种将负面展望结合起来的方法:
" -即[^"]*;和.js"结尾,则不匹配它提前感谢您的帮助/提示/提示。
发布于 2013-09-16 22:08:17
加上"?“最后一句之前的"*“。这将使"*“不再贪婪,即:它将在第一次引用时停止匹配,而不是最后一次引用。
/(href|src)?\="http:\/\/www\.mydomain\.com\/(?:(?!\.js).)*?"/https://stackoverflow.com/questions/18838071
复制相似问题