我想对文本进行分类,而不使用任何ML模型。我的想法是找到一个关键字列表,我将分配给每个类。然后,当我需要对一个新的文本进行分类时,我可以将它与我的关键字列表进行比较,并计算出文本中每个类的关键字数量;拥有最多对应关键字的类将是我的最终预测。(Points => A : 2, B : 0, C : 1)
问题是,为了建立基于数千个不同
我已经导出了有关大量报告的sql server信息。excel列是ReportPath、DataSourceName、DataSetName和命令文本。接下来,我创建了一个python脚本,它转换熊猫数据文件中的xls,并在dataframe的列命令文本中查找特定的单词。Command Text'].str.contains(table,na=False)]
res = x