首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

sklearn: 利用TruncatedSVD做文本主题分析

本文是一个使用sklearn中的TruncatedSVD进行文本主题分析的简要demo。...我前面写的一篇数据分析 一文看评论里的中超风云 就用到了主题分析的一种: 下面介绍的形式是LSI(潜在语义分析),主题模型中较早也较为简单的一种,在sklearn库中以TruncatedSVD的形式实现...,使用非常方便,现在进入代码: In [1]: from sklearn.decomposition import TruncatedSVD # namely LSA/LSI(即潜在语义分析..., 'hopes', 'human', 'in', 'lie', 'middle', 'midst', 'night', 'of', 'our', 'the', 'when', 'where'] 使用TruncatedSVD...的新特征矩阵X2: (由于主题数一般比词汇数少,这一方法也可以用来降维,以进行分类或聚类操作) In [3]: n_pick_topics = 3 # 设定主题数为3 lsa = TruncatedSVD

3K30
您找到你想要的搜索结果了吗?
是的
没有找到
领券