腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
并行
化
KMeans
?
pyspark
显然它很慢,但我不能真正地
并行
化
它。我试过使用Window和pandas_udf,但它不适用于标量函数。index, t in enumerate(types): # then I apply
kmeans
但是我不知道
如何
以可伸缩的方式做到这一点。
浏览 70
提问于2021-02-11
得票数 0
2
回答
KMeans
=
KMeans
用于火种的情感分析
scala
、
apache-spark
、
machine-learning
、
k-means
、
apache-spark-mllib
为此,我使用了word2vec和
KMeans
集群。在word2Vec中,我在100维空间中收集了20k个单词/向量,现在我正在尝试将这个向量空间聚类。当我使用默认
并行
实现运行
KMeans
时,该算法工作了3个小时!但如果采用随机初始
化
策略,则需要8分钟的时间。我做错了什么?我有machine机器,有4个内核处理器和16 GB内存。= new
KMeans
()
kmeans
.setInitializationMode(
KMeans
.K_MEANS_PARA
浏览 7
提问于2016-01-05
得票数 2
回答已采纳
1
回答
KMeans
并行
处理失败
python
、
parallel-processing
、
scikit-learn
、
k-means
、
gil
我把它设成这样:km =
KMeans
(n_clusters=500, max_iter = 1, n_init=1, init
浏览 2
提问于2014-10-16
得票数 2
1
回答
Apache火花MLLib -运行带IDF向量的
KMeans
. Java堆空间
scala
、
apache-spark
、
out-of-memory
、
k-means
、
apache-spark-mllib
无论我使用的
并行
化
程度
如何
(通过合并函数),
KMeans
.train总是在下面返回一个OutOfMemory异常。对
如何
解决这个问题有什么想法吗?:422)at org.apache.spark.mllib.clusteri
浏览 0
提问于2014-10-19
得票数 4
4
回答
在星火中使用剪影聚类
machine-learning
、
apache-spark
、
cluster-analysis
、
distributed-computing
、
k-means
我希望在星火中使用
KMeans
聚类时,使用剪影来确定k的最优值。有什么最佳的方法
并行
化
吗?即使其具有可伸缩性
浏览 4
提问于2015-08-06
得票数 10
回答已采纳
3
回答
R中的
并行
k-均值
r
、
parallel-processing
、
parallel-foreach
我试图理解
如何
使用R
并行
化
我的一些代码,因此,在下面的示例中,我想使用k-方法来使用2,3,4,5,6个中心对数据进行聚类,同时使用20个迭代。以下是代码:library(BLR)
kmeans
( X[, nstart=i )我们
如何
浏览 3
提问于2013-12-06
得票数 6
回答已采纳
1
回答
如何
分发小批量
kmeans
(scikit-learn)的处理?
python
、
machine-learning
、
multiprocessing
、
scikit-learn
MBK比
KMeans
更快,但在大样本集上,我们希望它将处理分布在多处理(或其他
并行
处理库)上。 MKB的部分拟合是答案吗?
浏览 0
提问于2013-06-12
得票数 6
1
回答
计算大数据的不同矩阵
r
、
cluster-computing
、
r-daisy
此外,如果有人能帮助我在
并行
内核中运行这个函数,那也是很棒的。下面可以找到计算虹膜数据集上的不同矩阵的函数:d <- daisy(iris)
浏览 1
提问于2017-12-01
得票数 3
1
回答
来自
并行
包的clusterMap -对多个参数进行迭代
r
、
parallel-processing
、
k-means
我在大型数据集(636,688行x7列)上执行k-方法,因此转向
并行
化
。我想迭代的中心数目,并包括一个例子,我试图迭代超过2至5个中心,每个2次。iris.cluster <- iris[,-5] worker <- function(data, nclus, nstarts){总结已经告诉我有些地方不对劲: Length Class
浏览 1
提问于2014-02-11
得票数 2
回答已采纳
1
回答
寻找火花中的“for循环”替代方案
r
、
apache-spark
、
for-loop
、
sparklyr
使用for循环来调优参数并不像预期的那样
并行
化
,而且花费了大量的时间。有什么可以替代的方法来
并行
工作吗?id_wss <- NA id_cluster <- ml_
kmeans
(id_ip4, centers = i, seed = 1234, features_col
浏览 0
提问于2018-04-25
得票数 2
1
回答
如何
在星火中的groupby之后运行RDD操作?
apache-spark
、
pyspark
、
bigdata
本质上,我会先做一个groupby,然后运行
KMeans
。我看到了两个解决办法,但我希望有一个更好的解决办法。1)手动遍历控制器中的所有数千名用户(当事情变得更大时,可能会有数百万人),并为每个用户运行
kmeans
。 2)在控制器中执行群,然后在地图中运行由外部库提供的非
并行
的方法。
浏览 4
提问于2016-05-09
得票数 1
回答已采纳
3
回答
如何
保存Accord.Net K-Means的集群结果以供重用?
c#
、
k-means
、
accord.net
我试图保存Accord.Net K-Means的集群结果,这样我就不必每次运行程序时都要重新计算。
浏览 9
提问于2015-09-23
得票数 4
回答已采纳
1
回答
正在尝试
并行
运行sklearn
KMeans
的多个实例
python
、
scikit-learn
、
multiprocessing
、
k-means
我正在尝试
并行
运行
Kmeans
(from sklearn)的多个实例。我有以下代码: with concurrent.futures.ProcessPoolExecutor() as executor: for f in concurrent.futures.as_completed(
k
浏览 18
提问于2020-08-06
得票数 0
2
回答
python中的加权k-means
python
、
k-means
这
如何
在python中实现呢?
浏览 6
提问于2018-06-11
得票数 0
1
回答
如何
在SPSS中可视
化
运行
kmeans
算法的效果?
visualization
、
k-means
、
spss
如何
在SPSS中可视
化
运行
kmeans
算法的效果?我真的看不到任何额外的图形选项,但我想我已经看到了一些在SPSS中制作的
kmeans
结果的可视
化
,它似乎专门用于
kmeans
过程。我想要可视
化
集群中心的值。
浏览 0
提问于2013-05-21
得票数 1
1
回答
如何
将params传递给ML Pipeline.fit方法?
python
、
apache-spark
、
pyspark
、
apache-spark-mllib
、
apache-spark-ml
random'}, {'k':5,'initMode':'
kmeans
||''initMode':'
kmeans
||'},{'k':7,'initMode
浏览 2
提问于2016-02-07
得票数 4
回答已采纳
2
回答
具有多处理能力的Sklearn
python
、
parallel-processing
、
scikit-learn
、
k-means
我不明白n_jobs是
如何
工作的:k_means = sklearn.cluster.
KMeans
(n_clusters=10, max_iter=3, n_jobs=1).fit(data)使用n_jobs =(我有8个核心) 对于
并行
化
是
如何
工作的,有什么我不明白的吗?
浏览 0
提问于2018-12-07
得票数 0
回答已采纳
1
回答
如何
加快R中单行码的计算速度?
r
、
cluster-analysis
、
parallel-processing
起初,我认为
并行
化
可能是一个很好的解决方案,但后来有人告诉我,对单个调用进行
并行
化
是不可能的。NbClust)) nc = clusterApply(cl,2,function(min.nc) fun=NbClust(mydata,min.nc=min.nc,max.nc = 8,method = "
kmeans
浏览 1
提问于2016-11-15
得票数 0
回答已采纳
1
回答
MATLAB是否支持有监督机器学习算法的
并行
化
?替代方案?
matlab
、
parallel-processing
、
data-mining
、
multicore
、
rapidminer
AFAIK RapidMiner
并行
处理扩展只适用于企业版--不幸的是,我仅限于社区版。MATLAB或其他库是否支持数据挖掘算法的
并行
化
?
浏览 0
提问于2015-06-12
得票数 0
1
回答
为什么这个地块是平坦的?
python
、
matplotlib
我正在尝试可视
化
一个有3列的数据帧,如下所示: Recency Frequency Revenue 382 130144280.48 383 20 126129.37 为了在2d中可视
化
,我正在应用PCA变换,并得到以下结果: sklearn_pca = PCA(n_components下面的代码用于可视
化
K-means聚类和数据,但我得到的是一个扁平图。=
KMeans
(n_clusters=3, random_state=0)
浏览 15
提问于2020-01-28
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
OpenCL环境下的并行化编程
GO编程多核并行化运行实例
聊聊在Python如何实现并行
GO程序多核并行化运行实例
掌握核心:多核CPU如何并行处理任务?
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券