目标是:输入:作者致力于训练一个预测的种子。我有原始文本,一个包含几千行文本的平面文本文件。以下是我的文本:The Wild West\n Ha ha, ride\n All you see is the sun reflectin\' off of the
--SNIP本质上,我想从种子中生成文本。这是正确的做法吗?还是说更好
我想使用python 2实现一个分类应用程序,在进行分类之前,应该对文本进行预处理。分类器和预处理器在不同的包中。然后在分类包中在类中创建了一个preprocessing class对象。这是我的项目探险家preprocessing class
def预处理(self,file):inputFile = "text“outputFile = "plainText.txtstopWrdsObj.removeStopwords( text ) text= text