我没有使用正则表达式的经验,我希望得到一些关于删除csv文件中包含的部分文件名的可能解决方案的帮助和建议。
问题:
导出的文件名列表包含需要隔离的随机唯一标识符。唯一标识符没有可预测的模式,但是需要删除do的方面。每个文件名以下列变体之一结尾:
V,-V,或%20V,后面跟着带有可能空格的随机数序列,附加"-“、"”并以.PDF结尾
例子:
GTD-LVOE-43-0021 V10 0.PDF GTD-LVOE-43-0021-V34-2.PDF GTD-LVOE-43-0021_V02_9.PDF GTD-LVOE-43-0021 v49.PDF
解决方案:
我的计划是编写一个脚本,从字符串的末尾选择V的第一次出现,然后删除它及其右边的所有内容。然后,可以通过删除字符串末尾出现的任何"-“或"_”和空白来清除文件名。
问题:
我如何使用正则表达式来完成这个任务,我的思路是否接近解决这个问题的正确方法?
发布于 2012-04-30 02:42:54
REGEX:[\s\-_]V.*?\.PDF
也许能起作用。你仍然需要替换掉所有的前导和_,但希望它能让你走上这条路。
这是如下所示。
从whitespace
、-
或_
开始,然后是V
。然后带上所有的东西直到你到达第一个.PDF
https://stackoverflow.com/questions/10377809
复制相似问题