你好,我有两列的数据(Id,Review文本),我需要基于id对数据进行分组,并计算reviewText中出现的单词(廉价还是轻巧)的次数。我怎么能这么做?
发布于 2022-01-11 12:02:48
我试着根据你提到的细节复制数据。
数据文件的创建:
df = pd.DataFrame(columns=["id", "reviewText"])
为dataframe分配虚拟值:
df["id"] = [1,1,3]
df["reviewText"] = ["Cheap boy", "Light dead", "Green wood"]
创建新列"check“,如果"reviewText”中出现“reviewText”,则该列将为True。
df['check'] = (df.reviewText.str.contains("Cheap")) | (df.reviewText.str.contains("Light"))
然后,做这个组:
df.groupby("id")["check"].value_counts()
https://stackoverflow.com/questions/70665959
复制相似问题