首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >ValueError:在Python3.X的SpectralCoclustering中,数组不能包含infs或NaNs

ValueError:在Python3.X的SpectralCoclustering中,数组不能包含infs或NaNs
EN

Stack Overflow用户
提问于 2017-07-20 02:55:17
回答 1查看 2K关注 0票数 1
代码语言:javascript
运行
复制
data = np.genfromtxt("breastCancer.txt", delimiter=',').astype(np.float32)
data = data[~np.isnan(data).any(axis=1)]

ROW, COLUMN = data.shape

label = data[:, -1]
input = data[:, 1:COLUMN - 1]

scaler = preprocessing.MinMaxScaler(feature_range=(-1.0, 1.0))
scaler.fit(input)
input = scaler.transform(input)

model = SpectralCoClustering(n_clusters=3, random_state=0)
model.fit(input)

我试图获得(-1.0,1.0)范围内的数据集的双聚类。在我的数据中,我没有任何inf或nan。但是它抛出了一个ValueError: array must not contain infs or NaNs in SpectralCoclustering错误。你能帮帮我吗?我需要一个范围(-1,1)的数据集,所以我不想将其更改为正范围。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-02-08 00:33:45

我花了两天时间解决同样的问题。我的解决方案是:在执行model.fit(input)之前,我从input中删除了只有0的列

代码语言:javascript
运行
复制
remaining_collumns=input.getnnz(1)>0
input=input[remaining_collumns,:]
model.fit(input)

还要注意,在我的例子中,input是由TfidfVectorizer.fit_transform返回的,并且是以sparse.csr.csr_matrix的形式返回的

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45198876

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档