我正在处理放射学报告的文本文件。如果文档有两页,则在所有页面的顶部重复包含患者姓名和其他元数据的文本块,页面的其余部分包含报告的内容。我已经将页面合并到一个文本对象中。保留第一个块,我想删除所有其他重复的块。有没有办法以编程方式从所有这样的文件中删除这些块?重复的块看起来像这样:
Patient ID x
我想从文件中删除一个特定的文本块。我希望找到要删除的文本块的开始,并删除所有内容,直到找到特定的模式。characters with various special characters -- / ending with another \n---\n that I dont want to remove
我想删除所有内容deployment.yaml\n# template file\napiVersio