如果我在csv第二列中的值以"(“或”结束“)开头,那么我如何删除某个字符呢?
示例:
0023632fa4a860be8bc85ddf39fc19c3c4c2e6fe,(Java Archive (JAR) 4049-0),Not Supported,
005c41fc0f8580f51644493fcbaa0d2d468312c3,(WIN32 EXE 7-2),Ransom.Win32.TRX.XXPE50FFF027,
至
0023632fa4a860be8bc85ddf39fc19c3c4c2e6fe,Java Archive (JAR) 4049-0,Not Supported,
005c41fc0f8580f51644493fcbaa0d2d468312c3,WIN32 EXE 7-2,Ransom.Win32.TRX.XXPE50FFF027,
我使用数据信息来编写这段代码
TRIM(TRAILING ')' FROM TRIM(LEADING '('
如何在我的代码中应用它:
with open(fullPath, 'rb') as file:
csv_data = csv.reader(file)
next(csv_data)
发布于 2018-11-15 08:14:05
一种使用lstrip()
和rstrip()
的解决方案
import csv
new_rows = []
with open('test.csv', 'rt') as file:
csv_data = csv.reader(file, delimiter=',')
for row in csv_data:
new_rows.append([row[0],row[1].lstrip('(').rstrip(')'),row[2]])
print(new_rows) # Outputs ['0023632fa4a860be8bc85ddf39fc19c3c4c2e6fe,Java Archive (JAR) 4049-0Not Supported', '005c41fc0f8580f51644493fcbaa0d2d468312c3,WIN32 EXE 7-2ansom.Win32.TRX.XXPE50FFF027']
编辑
要将编辑保存在新的.csv文件中,只需添加:
with open('test2.csv', 'wt') as file:
writer = csv.writer(file)
for row in new_rows:
writer.writerow(row)
发布于 2018-11-15 08:00:22
这里有一种方法,我已经替换了字符串中“(‘和’)”的第一次和最后一次。希望能帮上忙。
s = '''0023632fa4a860be8bc85ddf39fc19c3c4c2e6fe,(Java Archive (JAR) 4049-0),Not Supported,
005c41fc0f8580f51644493fcbaa0d2d468312c3,(WIN32 EXE 7-2),Ransom.Win32.TRX.XXPE50FFF027,'''
def last_replace(s, old, new, occurrence):
'''Replaces the last occurence of the character'''
li = s.rsplit(old, occurrence)
return new.join(li)
new_string = [last_replace(line, ')', '', 1).replace('(', '', 1) for line in s.split('\n')]
print(new_string)
输出:
['0023632fa4a860be8bc85ddf39fc19c3c4c2e6fe,Java Archive (JAR) 4049-0,Not Supported,',
'005c41fc0f8580f51644493fcbaa0d2d468312c3,WIN32 EXE 7-2,Ransom.Win32.TRX.XXPE50FFF027,']
发布于 2018-11-15 08:04:29
这是一个学习正则表达式的好机会!正则表达式是识别和处理文本中模式的一种方法。Python有一个正则表达式包作为其标准库的一部分。我将假设您在这个答案的其余部分使用Python3,其中包名为re
。
TLDR对你的问题的回答是:
import re
string_without_parens = re.sub(r'(^\()|(\)$)', '', string_maybe_has_parens)
不过,这是怎么回事?re.sub()
函数接受三个参数,一个正则表达式字符串(由前面的r
表示)、一个要替换每个匹配项的字符串以及要替换的字符串。这里的正则表达式是(^\()|(\)$)
。那这是什么意思?让我们一步一步地走:
()
表示一个捕获组,可以用来获取匹配项,但我已经使用它们来分组我们正在寻找的字符。这个正则表达式中有两个捕获组:(^\()
和(\)$)
。|
字符,在正则表达式语言中表示OR,因此它正在寻找与(^\()
或(\)$)
匹配的内容。(^\()
:有两个东西在里面(好吧,三个真的,但我们会讲到这一点)。第一个是^
,这就是所谓的锚,这个特别地说,“只看字符串的开头”。第二个(和第三个)字符是\(
,它表示“我想寻找一个开头的括号”。因为括号在正则表达式中使用,所以我们必须使用反斜杠来“转义”它。(\)$)
:包含一个转义结束括号、\)
和其他锚点。这个锚点代表字符串的末尾,就像^
表示开始一样。re.sub()
函数用'‘替换任何与此模式匹配的内容(即没有)。希望这能帮上忙!如果你想玩更多的正则表达式,你可以试试雷杰斯,它帮我把我的头绕在它们周围。
https://stackoverflow.com/questions/53314447
复制相似问题