嗨,我有一个熊猫数据帧和一个文本文件,看起来有点像这样: df:| Description我想要检查df中的每一行,用‘’拆分,对于每个单词,如果单词在文本中,则保留它,否则删除它。示例: 假设我的文本文件如下所示 helloistest 描述如下所示 "hello this is a great test $5435"
寻找一些正则表达式的帮助。我正在寻找Java中的一种方法,可以按单词拆分一些输入文本,同时保留分隔符(空格、标点符号)。另一种方法是将单词拆分到它们自己的索引中,其他非单词字符可以在数组的其他索引中。"Hello, this isn't working!"我在Python中使用下面的代码做了基本相同的事情:
def s