我试图为一个带有序号变量和名词变量的数据集(它们已经转换为数字变量)建立一个主成分分析模型(它们已经被转换为数字变量),阅读关于subject people 使用心理的文章,因为PCA使用pearson相关性(解释和推荐比仅仅使用多脉络图要长得多,但它是选项之一),所以我尝试使用多脉络图,并得到了错误:我正在寻找这个错误的原因,我可以找到两个答案,这个错误意味着变量的范围不一样,因为
我已经抓取了30个职务描述网站,并将它们存储在一个名为job_desc的列表中,其中的每个项目都是一个职务描述。tok = [nltk.word_tokenize(job.lower()) for job in job_desc]
from nltk.corpus import stopwords
stop = stopwords.words('english