如何将所有表情添加到RegEx中的字母数字中,如下所示
pattern = r'\w+'发布于 2020-10-21 22:31:23
您可以使用emoji包(pip install emoji)获取表情符集,并通过以下方式将其与\w+组合:(?:\w|<emoji_pattern>)+
from emoji import UNICODE_EMOJI
import re
e_list = UNICODE_EMOJI.keys()
word_emoji_rx = re.compile(r"(?:\w|{})+".format("|".join(map(re.escape, sorted(e_list,key=len,reverse=True)))))
print(word_emoji_rx.findall(r'?abc def gh?i'))
# => ['?abc', 'def', 'gh?i']https://stackoverflow.com/questions/64460641
复制相似问题