首页
学习
活动
专区
圈层
工具
发布

sklearn: 利用TruncatedSVD做文本主题分析

本文是一个使用sklearn中的TruncatedSVD进行文本主题分析的简要demo。...我前面写的一篇数据分析 一文看评论里的中超风云 就用到了主题分析的一种: 下面介绍的形式是LSI(潜在语义分析),主题模型中较早也较为简单的一种,在sklearn库中以TruncatedSVD的形式实现...,使用非常方便,现在进入代码: In [1]: from sklearn.decomposition import TruncatedSVD # namely LSA/LSI(即潜在语义分析..., 'hopes', 'human', 'in', 'lie', 'middle', 'midst', 'night', 'of', 'our', 'the', 'when', 'where'] 使用TruncatedSVD...的新特征矩阵X2: (由于主题数一般比词汇数少,这一方法也可以用来降维,以进行分类或聚类操作) In [3]: n_pick_topics = 3 # 设定主题数为3 lsa = TruncatedSVD

3.2K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到
    领券