腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
ReadTheDocs
与
sklearn
/
umap
相关
的
问题
、
我有一个以前在
ReadTheDocs
上成功构建
的
包,但现在不是这样了。packaging import versionfrom scipy.sparse import coo_matrix from
umap
.
umap
','
sklearn
.neighbors','
sklearn
.linear_model','
umap
','
浏览 18
提问于2021-01-18
得票数 3
回答已采纳
1
回答
如何在短时间内将相似的产品组合在一起?
、
我试图找出一般在几天内或在同一天内购买
的
产品组(考虑多次光顾商店)。例如,如果有人正在他们
的
房子做一个绘画DIY项目,他们会购买油漆,油漆滚筒,油漆工胶带,油灰,油灰刀等,在项目之前和期间。我
的
数据集如下所示:上面,你可以看到#332和#471产品是在几天内被所有3位客户购买
的
。所以这些产品是有关联
的
。这表明,客户谁正在做一个项目X,他们倾向于购买#332和#471在一起。📷执行Apriori。获得{A => B}
的
升降机 使用电梯
浏览 0
提问于2022-08-09
得票数 2
1
回答
关于研究*点击流*数据
的
建议
、
、
所提供
的
数据为我提供了web URL、访问它
的
日期、访问该数据
的
用户
的
唯一ID。这意味着,对于给定
的
用户ID,我可以看到他们是如何浏览网站
的
,以及他们查看了哪些页面。我很想尝试将这些用户聚到不同
的
类别中(很明显,有些用户相对于其他用户来说看网站
的
某个特定部分),但我真的不知道如何做到这一点。我看过
的
马可夫点击 -这允许我提供一个页面的点击流,并得到一个马尔可夫概率矩阵。我已经将页面的数量压缩到了60页左右,但是这个库不允许比
浏览 0
提问于2021-06-18
得票数 0
2
回答
如何随着时间
的
推移聚在一起?
、
我遇到了一个
问题
,我有一套对象(比如智能手机,以便于解释)。对于每部手机,我们收集了几个特征特征(比如通话
的
持续时间,打了多少次电话,接收到
的
电话等等),为期3个月(比如说)。现在,根据收集到
的
数据集,我们需要将手机分组成集群。情况大致如下所示:我
的
第一个想法是遵循我们在处理图像
的
过程中所做
的
事情。从图像矩阵中提取一个向量,然后进行聚类。在我
的
例子中,我们通过保持时间序列来生成向量。因此,对于每个电话,如果数据集
的
大小是m,并且
浏览 0
提问于2019-07-31
得票数 2
1
回答
如何评价tfidf和kmeans
的
结合
、
、
、
对于我
的
nlp
问题
,我使用了一个TF下手和KMeans
的
组合从学习包。tfidf获取向量,然后使用Kmeans对文本进行基于向量
的
聚类。我有一些类似于n_gram、输入特性和stop_words之类
的
TFIDF参数。
问题
是如何评估这个模型?我
的
猜测是,我不需要评估KMeans模型,因为它
的
作用只是计算点之间
的
距离,而我只需要专注于TFIDF模型和我最终使用
的
参数。这是正确
的
吗?我基本上是把看起来像集
浏览 0
提问于2022-12-06
得票数 0
1
回答
如何用Google安装
umap
和
umap
.plot
、
我为这个
问题
提前道歉,但我陷入了GitHub
问题
讨论和!pip install ...尝试之间
的
循环。
问题
是我不能在Google Colab中导入包
umap
,更具体地说,它给了我一个警告,在安装
umap
之前我需要安装holoview、datashader和bokeh,并且我确实确保了所有必需
的
包都安装好了由于它仍然无法运行带有所有导入命令
的
单元格,所以我更改了包
的
顺序,最后留下了
umap
,这没有帮助。事实上,突然之间
浏览 9
提问于2020-05-20
得票数 4
1
回答
BERTopic可视化
、
、
我很难让任何类型
的
可视化在PyCharm中
与
BERTopic一起工作。以下是我的当前代码:from
umap
import
UMAP
from bertopic import BERTopicfrom sent2vec.vectorizer import Vectorizerfrom
sklearn
.featur
浏览 0
提问于2023-01-16
得票数 1
1
回答
以巧妙
的
方式添加另一个数据格式作为注释
、
、
、
、
我用
UMAP
可视化数据,并且不能添加适当
的
注释。如何使用同一长度
的
另一个数据来将悬停文本添加到一个缓慢
的
表示散射中?据我所知,我只能从data_2d中指定一列。
浏览 2
提问于2021-07-01
得票数 1
回答已采纳
1
回答
sklearn
random_state工作不正常
、
、
、
我阅读了所有与此
相关
的
内容,但仍然不明白
问题
的
真正所在。基本上,我在random_state中使用random_state,然后为它打印explained_variance_ratio_.sum()。这是正常
的
吗?from
sklearn
.decomposition import TruncatedSVD
浏览 1
提问于2019-12-16
得票数 0
回答已采纳
1
回答
基于市场
的
聚类-1501数据集
、
、
我所采用
的
方法如下:使用深度优先搜索版本,将集群数据(而不是培训集
的
一部分)搜索到各个类中。虽然ReID模型
的
等级-1、等级-5指标很好,但聚类
的
总体效果却相当令人失望。我也在努力寻找
相关
的
文献,可以帮助我。有没有人对我至少可以找到
相关
文献(比如Person-Reid,然后是聚类)有任何指点。提前谢谢。 PS:我在Stackoverflow上发布了同样
的
问题
。我认为这将是一
浏览 0
提问于2022-09-06
得票数 1
回答已采纳
1
回答
相同密钥
的
unordered_map迭代顺序
、
、
当在std::unordered_map上循环时,STL无法保证考虑哪一个特定
的
元素顺序。我
的
问题
是关于具有相同键
的
元素
的
顺序,我用不同
的
编译器尝试过,如果它们有相同
的
键,我总是一个接一个地接收它们(例如下面的例子)。我搜过了,但找不到。它是在标准中提到
的
,还是
与
实现
相关
的
?unordered_multimap<int, int>
umap
;
umap</em
浏览 0
提问于2015-03-10
得票数 4
回答已采纳
1
回答
Umap
导入导致异常: Numba需要NumPy 1.20或更少
、
我试图在我
的
实验室工作中导入
UMAP
库,但是我得到了一个错误ImportError: Numba needs NumPy 1.20 or less。这是我
的
代码:import numpy as npfrom
sklearn</
浏览 3
提问于2021-12-02
得票数 1
1
回答
如何微调
UMAP
中
的
n_components参数?
、
、
、
我使用
UMAP
进行聚类。但是,我找不到任何关于微调n_components参数
的
方法
的
信息(这是非常重要
的
)。据我所知,对于PCA,我不能使用解释
的
方差。那么有什么可供选择
的
呢?
浏览 0
提问于2022-07-04
得票数 0
1
回答
单击某个点后,使用
相关
数据对表进行实际分散更新
、
、
、
我希望能够在单击Plotly散点图中
的
一个点( Python )之后,用
相关
信息更新表。换句话说,当我单击散点图(
UMAP
图)中
的
一个点时,表将显示我正在使用
的
Scikit-learn数据集(物种)
的
数据集。from
umap
import
UMAP
from
sklearn
.datasets import load_iris feat
浏览 4
提问于2021-11-24
得票数 0
3
回答
如何在python中加快嵌套交叉验证?
、
、
、
、
根据我所发现
的
,还有另外一个类似的
问题
(),但是在尝试了这个站点和微软也建议
的
几个修复之后,安装MPI并不适用于我,所以我希望这个
问题
有另一个软件包或答案。我希望比较多个算法和网格搜索范围广泛
的
参数(可能是太多
的
参数?),除了mpi4py,还有什么方法可以加速我
的
代码运行?据我所知,我不能使用n_jobs=-1,因为这不是嵌套
的
吗?另外要注意
的
是,我无法在我试图查看
的
许多参数(运行时间比我
的
时间长)
浏览 1
提问于2019-04-23
得票数 6
回答已采纳
1
回答
在c++中使用无序映射时,[]运算符和erase函数有什么区别?
、
、
、
、
我在C++中创建了一个无序映射,并使用
umap
.erase(num) = 0从我
的
哈希表中删除了该元素。这是在一个循环中运行
的
,并给了我一个超过时间限制
的
错误,但当我使用
umap
[num] = 0来执行相同
的
任务时,它工作了。这两个在时间复杂度上有如此巨大
的
差异以至于给我一个错误吗?
浏览 6
提问于2021-10-30
得票数 0
1
回答
这是维度过大
的
情况吗? 1881个样本,2562个特征。
、
、
、
我
的
班级分布如下:有人能告诉我这个数据集将如何影响我
的
模型
的
性能吗?我已经做了一些研究,这可能会导致
问题
的
维度,但我希望得到一些澄清,如果这是主题,我将如何解决它。 我仍然是相对较新
的
工作与人工智能模型,所以绝对任何帮助是非常感谢,让我知道,如果你需要更多
的
信息。
浏览 0
提问于2022-10-22
得票数 0
1
回答
标识符:语法错误C2061: C++
、
我有一个非常奇怪
的
问题
。在我
的
头文件"compier.h“中,我有以下原型:在cpp中,我这样声明:该声明
与
""void CCompiler::WriteMap(FILE *outfile,&
uMap
)“”不兼容(在“m:\app\piler.h”
的
第30行中声明)“”。FeedFea
浏览 0
提问于2013-05-06
得票数 1
回答已采纳
2
回答
为什么
UMAP
与其他聚类算法结合使用?
、
、
、
我注意到
UMAP
经常与其他聚类算法结合使用,例如K-means、DBSCAN、HDBSCAN。然而,据我所理解,
UMAP
可以用于集群任务。那么,为什么我注意到人们主要把它作为一种降维技术呢?这里是我所说
的
一个例子:https://medium.com/grabngoinfo/topic-modeling-with-deep-learning-using-python-bertopic-cf91f5676504我是不是出什么
问题
了?
UMAP
可以单独用于集群任务吗?将它
浏览 0
提问于2023-03-29
得票数 0
回答已采纳
1
回答
如何提高最长子字符串实现
的
内存效率?(C++)
、
、
我在练习我
的
编码。我实现了以下算法来解决最长
的
子字符串
问题
:public: int; if(
umap
.find(s[curs])==
umap
.end()){if(
umap
.size() > max){
浏览 0
提问于2022-05-17
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券