我有一个txt文件,单列,摘自excel,类型如下:
阿曼达(大声讲话)杰夫史蒂文(开玩笑地)阿曼达DOC布赖恩格林
作为输出,我希望:
阿曼达杰夫史蒂文阿曼达布莱恩格林
我尝试在所有列上使用for循环,然后:
if (str[i] == '('):
return str.split('(')但显然不起作用。你有什么可能的解决办法吗?然后,我需要一个输出文件作为我的原始txt,因此每一行的每个名称都在一个列中。
谢谢大家!(我使用的是PyCharm 3.2)
发布于 2017-04-03 09:55:38
在这种情况下我会用regex。\w将替换字母,*将选择0或更多。然后我们检查它是否在圆括号之间。
import re
fi = "AMANDA (LOUDLY) JEFF STEVEN (TEASINGLY) AMANDA"
with open("mytext.txt","r") as fi, open("out.txt", "w") as fo:
for line in fi:
fo.write(re.sub("\(.*?\)", "", line))发布于 2017-04-03 10:00:11
可以使用与括号或完整单词中的所有内容匹配的正则表达式将字符串拆分为列表,从包含括号的列表中删除所有元素,然后再次将列表加入到字符串中。优点是在结果字符串中不存在删除parantheses中的一个单词的双空格。
import re
text = "AMANDA (LOUDLY SPEAKING) JEFF STEVEN (TEASINGLY) AMANDA DOC BRIAN GREEN"
words = re.findall("\(.*?\)|[^\s]+",text)
print " ".join([x for x in words if "(" not in x])https://stackoverflow.com/questions/43181490
复制相似问题