我有一个95MB的XML文件的内容,这是从一个旧的CMS (Drupal通过Wordpress)到一个新的CMS (Squarespace)。
Squarespace导入过程不断中断&它似乎归结为试图在新服务器中执行PHP的链接。
例如:<img src="/generate-image.php">
在导入过程中,新的CMS将其识别为内部链接,并尝试执行该URL以导入内容,将其视为攻击或尝试代码注入,并关闭该过程。
所以我想找到一种方法来找到以"/“开头并包含"php”的URL,这样我就可以删除它们。
我应该清楚,我只想识别内部链接&而不是到其他网站的外部链接。
这可以通过Regex实现吗?如果我可以在Atom中插入一条Regex语句& Find/Replace,我真的希望避免编写脚本来做这件事。
发布于 2019-05-30 05:43:52
是的,使用正则表达式可以做到这一点。试试这个:
(\/*)[\w.]+(?:\.[\w\.-]+)+[\w\-\._~:/?#[\]@!\$&'\(\)\*\+,;=.]+\b.php\b
它将匹配有效URL所有可能字符。
https://stackoverflow.com/questions/56368707
复制相似问题