我试图识别(并最终省略)以制表符分隔的文件的所有行,其中分号分隔的列中指定的子字段中的条目满足特定条件。最终,我寻找的是碱基对序列,它由一个短子序列组成,在字符串的长度上重复。为了让人对我所说的事情有个印象(因为文本墙不像示例那样容易渗透),这里有几个我可能考虑的情况,为了说明的目的,附带的元上下文被简化了:
A 1 FOO=BLAH;BAR=BLAH;FIELD据我所知,这个问题可以归结为:“我如何编写一个正则表达式,只允许在一系列重复的尾部对back-ref进行部分匹配”,但我希望避免将确切的细节简化为可能具有误导性的概要,并提供完整的细节