我将一个列从pandas df转换为list: subsectors = df['subsectors'].tolist() 我想把这样的字符串:'BuyMeADrink‘分隔成'Buy Me因此,我使用了以下方法之一: [' '.join(re.findall('[A-Z][^A-Z]*', s)) for s in subsectors] 或 li = re.compile) for string in subsectors] 或
我有两个数据帧,一个包含屏幕名称/显示名称,另一个包含个人,我正在尝试创建第三个数据帧,每次屏幕名称/显示名称中出现姓氏时,在新行中包含来自每个数据帧的所有数据。从功能上讲,这将创建一个可能匹配的名称列表。我当前的代码运行得很好,但运行速度非常慢,如下所示:
# Original Social Media Screen Nam