import stopwords
# 你第一次需要下载停止词的集合
import nltk
nltk.download('stopwords')
'''
[nltk_data] Downloading...park']
# 加载停止词
stop_words = stopwords.words('english')
# 展示停止词
stop_words[:5]
# ['i', 'me', 'my',...'myself', 'we']
# 移除停止词
[word for word in tokenized_words if word not in stop_words]
# ['going', '...'meeting']
词干提取通过识别和删除词缀(例如动名词)同时保持词的根本意义,将词语简化为词干。...text_tagged
# [('Chris', 'NNP'), ('loved', 'VBD'), ('outdoor', 'RP'), ('running', 'VBG')]
输出是一个元组列表,包含单词和词性的标记