我有一个csv文件,其中有10列。我的项目是使用nlp将我文件中的评论分类为好的或坏的。当我使用re.sub方法对存储评论的列(评论文本列)进行标记化时,它给出了一个名为“expected or bytes like object”的错误。我已经附上了我的csv文件和我在jupyter笔记本中尝试过的代码。
这是我的。我的代码现
我是Scikit-Learn的新手,我想将我已经标记的数据集合转换为数据集。我已经将数据的.csv文件转换为NumPy数组,但是我遇到的一个问题是根据第二列中存在的标志将数据分类到训练集。我想知道如何使用Pandas实用程序模块访问.csv文件的特定行、列。以下是我的代码: import pandas as p