ReadTheDocs与sklearn/umap相关的问题

文章/答案/技术大牛

发布

1回答

、

我有一个以前在ReadTheDocs上成功构建的包，但现在不是这样了。packaging import versionfrom scipy.sparse import coo_matrix from umap.umap','sklearn.neighbors','sklearn.linear_model','umap','

浏览 18提问于2021-01-18得票数 3

回答已采纳

1回答

我试图找出一般在几天内或在同一天内购买的产品组(考虑多次光顾商店)。例如，如果有人正在他们的房子做一个绘画DIY项目，他们会购买油漆，油漆滚筒，油漆工胶带，油灰，油灰刀等，在项目之前和期间。我的数据集如下所示：上面，你可以看到#332和#471产品是在几天内被所有3位客户购买的。所以这些产品是有关联的。这表明，客户谁正在做一个项目X，他们倾向于购买#332和#471在一起。📷执行Apriori。获得{A => B}的升降机使用电梯

浏览 0提问于2022-08-09得票数 2

1回答

关于研究点击流数据的建议

、、

所提供的数据为我提供了web URL、访问它的日期、访问该数据的用户的唯一ID。这意味着，对于给定的用户ID，我可以看到他们是如何浏览网站的，以及他们查看了哪些页面。我很想尝试将这些用户聚到不同的类别中(很明显，有些用户相对于其他用户来说看网站的某个特定部分)，但我真的不知道如何做到这一点。我看过的马可夫点击 -这允许我提供一个页面的点击流，并得到一个马尔可夫概率矩阵。我已经将页面的数量压缩到了60页左右，但是这个库不允许比

浏览 0提问于2021-06-18得票数 0

2回答

如何随着时间的推移聚在一起？

、

我遇到了一个问题，我有一套对象(比如智能手机，以便于解释)。对于每部手机，我们收集了几个特征特征(比如通话的持续时间，打了多少次电话，接收到的电话等等)，为期3个月(比如说)。现在，根据收集到的数据集，我们需要将手机分组成集群。情况大致如下所示：我的第一个想法是遵循我们在处理图像的过程中所做的事情。从图像矩阵中提取一个向量，然后进行聚类。在我的例子中，我们通过保持时间序列来生成向量。因此，对于每个电话，如果数据集的大小是m，并且

浏览 0提问于2019-07-31得票数 2

1回答

如何评价tfidf和kmeans的结合

、、、

对于我的nlp问题，我使用了一个TF下手和KMeans的组合从学习包。tfidf获取向量，然后使用Kmeans对文本进行基于向量的聚类。我有一些类似于n_gram、输入特性和stop_words之类的TFIDF参数。问题是如何评估这个模型？我的猜测是，我不需要评估KMeans模型，因为它的作用只是计算点之间的距离，而我只需要专注于TFIDF模型和我最终使用的参数。这是正确的吗？我基本上是把看起来像集

浏览 0提问于2022-12-06得票数 0

1回答

如何用Google安装umap和umap.plot

、

我为这个问题提前道歉，但我陷入了GitHub问题讨论和!pip install ...尝试之间的循环。问题是我不能在Google Colab中导入包umap，更具体地说，它给了我一个警告，在安装umap之前我需要安装holoview、datashader和bokeh，并且我确实确保了所有必需的包都安装好了由于它仍然无法运行带有所有导入命令的单元格，所以我更改了包的顺序，最后留下了umap，这没有帮助。事实上，突然之间

浏览 9提问于2020-05-20得票数 4

1回答

BERTopic可视化

、、

我很难让任何类型的可视化在PyCharm中与BERTopic一起工作。以下是我的当前代码：from umap import UMAPfrom bertopic import BERTopicfrom sent2vec.vectorizer import Vectorizerfrom sklearn.featur

浏览 0提问于2023-01-16得票数 1

1回答

以巧妙的方式添加另一个数据格式作为注释

、、、、

我用UMAP可视化数据，并且不能添加适当的注释。如何使用同一长度的另一个数据来将悬停文本添加到一个缓慢的表示散射中？据我所知，我只能从data_2d中指定一列。

浏览 2提问于2021-07-01得票数 1

回答已采纳

1回答

sklearn random_state工作不正常

、、、

我阅读了所有与此相关的内容，但仍然不明白问题的真正所在。基本上，我在random_state中使用random_state，然后为它打印explained_variance_ratio_.sum()。这是正常的吗？from sklearn.decomposition import TruncatedSVD

浏览 1提问于2019-12-16得票数 0

回答已采纳

1回答

基于市场的聚类-1501数据集

、、

我所采用的方法如下：使用深度优先搜索版本，将集群数据(而不是培训集的一部分)搜索到各个类中。虽然ReID模型的等级-1、等级-5指标很好，但聚类的总体效果却相当令人失望。我也在努力寻找相关的文献，可以帮助我。有没有人对我至少可以找到相关文献(比如Person-Reid，然后是聚类)有任何指点。提前谢谢。 PS:我在Stackoverflow上发布了同样的问题。我认为这将是一

浏览 0提问于2022-09-06得票数 1

回答已采纳

1回答

相同密钥的unordered_map迭代顺序

、、

当在std::unordered_map上循环时，STL无法保证考虑哪一个特定的元素顺序。我的问题是关于具有相同键的元素的顺序，我用不同的编译器尝试过，如果它们有相同的键，我总是一个接一个地接收它们(例如下面的例子)。我搜过了，但找不到。它是在标准中提到的，还是与实现相关的？unordered_multimap<int, int> umap; umap</em

浏览 0提问于2015-03-10得票数 4

回答已采纳

1回答

Umap导入导致异常: Numba需要NumPy 1.20或更少

、

我试图在我的实验室工作中导入UMAP库，但是我得到了一个错误ImportError: Numba needs NumPy 1.20 or less。这是我的代码：import numpy as npfrom sklearn</

浏览 3提问于2021-12-02得票数 1

1回答

如何微调UMAP中的n_components参数？

、、、

我使用UMAP进行聚类。但是，我找不到任何关于微调n_components参数的方法的信息(这是非常重要的)。据我所知，对于PCA，我不能使用解释的方差。那么有什么可供选择的呢？

浏览 0提问于2022-07-04得票数 0

1回答

单击某个点后，使用相关数据对表进行实际分散更新

、、、

我希望能够在单击Plotly散点图中的一个点( Python )之后，用相关信息更新表。换句话说，当我单击散点图(UMAP图)中的一个点时，表将显示我正在使用的Scikit-learn数据集(物种)的数据集。from umap import UMAPfrom sklearn.datasets import load_iris feat

浏览 4提问于2021-11-24得票数 0

3回答

如何在python中加快嵌套交叉验证？

、、、、

根据我所发现的，还有另外一个类似的问题()，但是在尝试了这个站点和微软也建议的几个修复之后，安装MPI并不适用于我，所以我希望这个问题有另一个软件包或答案。我希望比较多个算法和网格搜索范围广泛的参数(可能是太多的参数？)，除了mpi4py，还有什么方法可以加速我的代码运行？据我所知，我不能使用n_jobs=-1，因为这不是嵌套的吗？另外要注意的是，我无法在我试图查看的许多参数(运行时间比我的时间长)

浏览 1提问于2019-04-23得票数 6

回答已采纳

1回答

在c++中使用无序映射时，[]运算符和erase函数有什么区别？

、、、、

我在C++中创建了一个无序映射，并使用umap.erase(num) = 0从我的哈希表中删除了该元素。这是在一个循环中运行的，并给了我一个超过时间限制的错误，但当我使用umap[num] = 0来执行相同的任务时，它工作了。这两个在时间复杂度上有如此巨大的差异以至于给我一个错误吗？

浏览 6提问于2021-10-30得票数 0

1回答

这是维度过大的情况吗? 1881个样本，2562个特征。

、、、

我的班级分布如下：有人能告诉我这个数据集将如何影响我的模型的性能吗？我已经做了一些研究，这可能会导致问题的维度，但我希望得到一些澄清，如果这是主题，我将如何解决它。我仍然是相对较新的工作与人工智能模型，所以绝对任何帮助是非常感谢，让我知道，如果你需要更多的信息。

浏览 0提问于2022-10-22得票数 0

1回答

标识符:语法错误C2061: C++

、

我有一个非常奇怪的问题。在我的头文件"compier.h“中，我有以下原型：在cpp中，我这样声明：该声明与""void CCompiler::WriteMap(FILE *outfile，&uMap)“”不兼容(在“m：\app\piler.h”的第30行中声明)“”。FeedFea

浏览 0提问于2013-05-06得票数 1

回答已采纳

2回答

为什么UMAP与其他聚类算法结合使用？

、、、

我注意到UMAP经常与其他聚类算法结合使用，例如K-means、DBSCAN、HDBSCAN。然而，据我所理解，UMAP可以用于集群任务。那么，为什么我注意到人们主要把它作为一种降维技术呢？这里是我所说的一个例子：https://medium.com/grabngoinfo/topic-modeling-with-deep-learning-using-python-bertopic-cf91f5676504我是不是出什么问题了？UMAP可以单独用于集群任务吗？将它

浏览 0提问于2023-03-29得票数 0

回答已采纳

1回答

如何提高最长子字符串实现的内存效率？(C++)

、、

我在练习我的编码。我实现了以下算法来解决最长的子字符串问题：public: int; if(umap.find(s[curs])==umap.end()){if(umap.size() > max){

浏览 0提问于2022-05-17得票数 0

回答已采纳

点击加载更多