如何在对文档进行聚类时获得model.predict()的概率百分比

在对文档进行聚类时，获得model.predict()的概率百分比是一种评估聚类模型对文档分类准确度的方法。在使用该方法之前，需要先进行以下步骤：

数据预处理：对文档进行清洗和预处理，例如去除停用词、标点符号和数字，进行词干化或词形还原等操作。
特征提取：将文档表示为机器学习算法能够理解的数值特征。常用的特征提取方法包括词袋模型（Bag of Words）、TF-IDF（Term Frequency-Inverse Document Frequency）等。
训练聚类模型：选择适当的聚类算法，例如K-means、层次聚类（Hierarchical Clustering）等，并使用预处理后的文档特征进行训练。
模型评估：通过计算模型的评估指标（如轮廓系数、内部评价指标等）来评估聚类模型的效果。

在训练完聚类模型后，可以使用model.predict()方法对新的文档进行分类。该方法返回每个文档所属类别的标签，同时也可以通过调用model.predict_proba()方法获取每个类别的概率百分比。

model.predict_proba()方法可以返回一个数组，其中每个元素表示文档属于对应类别的概率。可以根据这些概率值来评估模型对文档分类的置信度。

以下是腾讯云相关产品和产品介绍链接地址：

腾讯云自然语言处理（NLP）：提供了文本分类、情感分析、关键词提取等功能，可用于文档聚类场景。产品介绍链接：https://cloud.tencent.com/product/nlp
腾讯云机器学习平台（ML-Platform）：提供了丰富的机器学习算法和工具，可用于构建和训练聚类模型。产品介绍链接：https://cloud.tencent.com/product/mlplatform

请注意，以上链接仅作为参考，实际选择产品时应根据需求和具体情况进行评估和决策。

CNN中不相关图像的极限概率百分比

、、

我正在使用keras库训练一个有五个类的cnn模型。使用model.predict函数，我得到了类的预测百分比。我的问题是对于不属于这些类并且完全无关的图像，预测类仍然根据类预测百分比。我该如何预防呢？我如何识别它是不相关的？

浏览 0提问于2020-06-11得票数 1

2回答

如何在python的Kmeans++聚类中找到适合度

、、、

如何在K-均值++聚类中找到适合度，以便显示输入与每个集群对齐的百分比。例如，输入A在第1组中为0.4，在第2组中为0.6。

浏览 3提问于2017-09-13得票数 0

回答已采纳

1回答

假设我已经创建了一个模型，并且我的目标变量是0、1或2。如果我使用predict，答案似乎是0，或1或2。 model = ... Classifier # It could be any classifier m1 = model.predict(mytest) m2= model.predict_proba(mytest) # Now suppose m1[3] = [0.6, 0.2, 0.2] 假设我同时使用了预测和predict_proba。如果在索引3中，我得到上述结果与predict_proba的结果，在指数3的预测结果，我应该看到0。是这

浏览 4提问于2020-04-13得票数 14

回答已采纳

1回答

如何在对文档进行聚类时获得model.predict()的概率百分比

、

text = "Some random text string that I want to cluster" Y = vectorizer.transform([text]) prediction = model.predict(Y) print(prediction) 上面传递的值是一个字符串，然后它返回它认为属于的群集组(三个中的一个)。我怎样才能知道它的预测准确率是多少呢？即。此特定文本与组1的一致性为90%，下一个文本可能与组2的一致性为45%，但仍将进入组2。我希望能够以较低的准确率捕获项目。

浏览 13提问于2019-03-01得票数 0

回答已采纳

2回答

我想得到我的深度学习-CNN-模型的概率的具体预测。

、、、、

我训练了一个模型来对7种不同类型的图片进行分类。我的模型只能做一个特定的预测(在我的例子中是numpy.ndarray)，但是我感兴趣的是一个更像概率的预测(例如90%的class1和80%的class2 ...etc)。我现在应该修改的代码部分在哪里？如何使用列车模型得到正确的概率值？ import tensorflow as tf from tensorflow.keras.layers import Input, Lambda, Dense,Flatten from tensorflow.keras.models import Model from tensorflow.keras.ap

浏览 10提问于2022-05-03得票数 -1

回答已采纳

2回答

使用Keras中的functional来预测模型类的更好方法是什么？

、、、

我们可以使用predict_classes()函数在Keras中使用序列分类模型来预测新数据实例的类。如何预测使用functional开发的模型的类？例如，我有一个模型(基于函数API )，在最后一层激活了sigmoid，以获得多标签分类中的概率。当我应用model.predict()时，我得到了一系列的概率，即使损失是binary_crossentropy。我知道我可以手动进行这个分类，例如采用以下方法。 test_predict_proba = model.predict(x_test, batch_size=batch_size) class_predict = (test_pred

浏览 0提问于2020-04-29得票数 3

1回答

如何对r中充满字符串变量的数据集进行K-means聚类

、、

现在，我有一个充满字符串变量的数据集，但我想在此基础上做一个集群项目。在我对所有变量应用as.factor()后，nbclust()仍然不能工作，我该怎么办？

浏览 63提问于2018-05-31得票数 -1

回答已采纳

1回答

如何使用tf与转换方法相结合？

、、、、

我有个问题。我有一篇免费的课文，例如：“今天天气好”，这篇免费的课文我想预测它是哪一类的。为此，我想使用tf serving。我不把自由文本直接放入模型，但我首先清理句子，然后将其连接到向量。但是，如何将这些步骤合并到tf serving流程中。进入model.predict(x_ready)的model.predict(x_ready)如下所示： [[ 0 0 0 0 0 0 0 0 1 5 987 54 ]] 如何调用我的方法，然后将tf serving传递给我的x？另外，我想得到概率。如何使用tf serving获得类和概率我就是这样预测单个类的 def predict

浏览 11提问于2022-07-08得票数 0

1回答

keras tensorflow2获得训练数据的结果

、、

在keras中，我们可以使用fit命令来训练模型，然后使用predict。 Dcnn=model.fit(x_train, y_train, epochs=5, batch_size=32) model.predict(test_dataset,verbose=True) 当我们使用fit方法时，我们得到了如下精确的结果。经过5次训练，训练数据的准确率达到98.62%。现在，如果我们使用model.predict(x_train,verbose=True)，我们会得到完全相同的精度和完全相同的预测，如拟合方法的结果所示吗？如果没有，为什么？ Epoch 5/5 61/61 - 11s - lo

浏览 2提问于2020-03-03得票数 2

回答已采纳

1回答

重叠聚类的结果

、、、、

我使用Matlab中的函数fcm进行重叠聚类。该函数的输出是一个大小为kxn的矩阵，其中k是聚类的数量，n是示例的数量。现在我的问题是，我如何为一个例子选择集群？对于每个示例，我都有所有集群的分数，所以我可以很容易地找到最匹配的集群，但其他集群呢？非常感谢。

浏览 1提问于2017-03-01得票数 1

1回答

Mallet :获取文档集合的概率分布

、、

我想得到一个单一的概率分布的文件集合，因为我需要能够使用KL-散度，这可能吗？在这个例子中：使用getTopicProbabilities()方法，我得到每个实例的概率分布，但是如果我想得到一个文档集合的单一分布呢？这可能是文件的主题分发吗？ TopicInferencer inferencer = model.getInferencer(); double[] testProbabilities = inferencer.getSampledDistribution(testing.get(0), 10, 1, 5);

浏览 4提问于2014-06-13得票数 0

回答已采纳

1回答

如何用百分比来显示预测结果？

、、、、

输出的结果总是以keras中的一种热格式显示： [[ 0. 0. 0. 0. 0. 0. 1. 0]] [[ 0. 1. 0. 0. 0. 0. 0. 0]] 但是我希望每种分类都有一个概率百分比，例如 [[ 0.54 0.80 0.34 0.041]] 下面给出了我的简单代码 import numpy as np from keras.models import load_model from new_get_data_for_test import load_my_data try : X_test = load_my_data() model = lo

浏览 2提问于2017-01-02得票数 3

1回答

如何利用现有的K-means模型对新数据进行分割？

、、

我已经使用k-means聚类建立了一个分割模型。有人能描述一下将新数据分配到这些数据段的过程吗？目前，我正在应用与构建模型时相同的转换/标准化/异常值，然后计算欧几里德距离。最小距离是记录落入的区段。但是，我看到大多数都落入了一个特定的部分，我想知道我是不是在这个过程中错过了什么？谢谢

浏览 0提问于2013-08-09得票数 2

2回答

如何获得属于特定聚类的样本的概率/贴近度？

、、、、

我是新手，所以请告诉我比较cosine similarity和k-means的逻辑是否不正确我从k-means那里得到了一组D3，现在我对Cluster No. 1感兴趣。对于这个集群，我使用average of all values for each column并将其放在一边。现在，我有了一个测试样本，我运行k-means prediction并以1的形式获得输出，这意味着它属于对我有好处的Cluster No. 1，但是这里的用例是计算即使这个样本不属于Cluster 1，它离落入这个Cluster No. 1有多近？因此，为了解决这个问题，我考虑在我的测试样本和我使用averag

浏览 0提问于2020-06-13得票数 2

3回答

使用从潜在Dirichlet分配派生的主题对文档进行聚类

、、

我想对一个项目使用潜在的Dirichlet分配，我正在使用Python和gensim库。在找到主题之后，我希望使用k-方法这样的算法对文档进行聚类(理想情况下，我希望对重叠的集群使用一个很好的方法，因此欢迎任何建议)。我设法得到了这些主题，但它们的形式如下： 0.041*部长+0.041*关键+0.041*瞬间+0.041*有争议的+0.041*首相为了应用聚类算法，并纠正我的错误，我相信我应该找到一种方法，使用tfidf或word2vec将每个单词表示为一个数字。你有什么想法，我如何“删除”文本信息，例如，从一个名单，这样做，然后把他们回来，以作出适当的乘法？例如，在我看来，如果“部长

浏览 0提问于2014-11-13得票数 9

1回答

model.predict_proba()和model.predict()冲突行为

、、、

我有两班一班和二班： model.predict_proba()的输出： [0.333,0.6667] model.predict()的输出： 1 在10个lac的测试数据中，大约200个测试值正在发生这种情况。对于所有其他记录，这两个函数的输出并不冲突。即使2类的概率较高，预测函数也给出最后一类为1。对于这200个记录，model.predict()和model.predict_proba()的输出不同步的原因是什么？

浏览 0提问于2019-07-25得票数 1

2回答

为什么我们使用numpy.argmax()从一个numpy预测数组返回一个索引？

、、、、

首先，我要说，我对神经网络非常陌生，这是我第一次使用numpy，tensorflow或keras。我写了一个神经网络来识别手写数字，使用MNIST数据集。我跟踪的Sentdex，并注意到他正在使用print(np.argmax(predictions[0]))打印第一个索引从numpy数组的预测。我试着用print(predictions[i])替换了这一行程序(我被设置为0)，但是输出不是数字，而是：[2.1975785e-08 1.8658861e-08 2.8842608e-06 5.7113186e-05 1.2067199e-10 7.2511304e-09 1.6282028

浏览 0提问于2019-05-30得票数 2

回答已采纳

2回答

训练朴素贝叶斯分类器

、、

我正在开发一个朴素的贝叶斯分类器使用简单的包词概念。我的问题是在朴素的贝叶斯或任何其他机器学习老师‘训练’分类器是一个重要的事情。但是，当我已经有了一个不同类的bag_of_words时，如何训练朴素的贝叶斯分类器。

浏览 6提问于2015-04-18得票数 1

1回答

如何解释tf.keras.Model.predict()输出？

、、、

我很难找到我需要的文件。为了总结这个问题，我训练了一个tf.keras模型，使用两类图像，标记为'0‘或'1’。现在我想用这个模型来预测新图像是'0‘还是'1’。我的问题如下：model.predict()返回一个介于1到0之间的数字，但我似乎找不到这到底是什么。正确的说法是，这是它的预测(即，接近1意味着图像可能是1，而接近0表示图像可能是0)吗？或者这里还发生了什么。我已经包括了下面的代码和一些输出。在这种情况下，pred是概率，图像是1，1 - pred是概率，图像是0吗？谢谢你的帮助。 for img_path in test_filenames:

浏览 8提问于2020-09-18得票数 1

2回答

Keras/Tensorflow: model.predict()返回一个列表。如何将输出与类名匹配？

、、、

我在凯拉斯建了个CNN。我已经保存了它，现在使用model.predict()函数对其进行预测。每当我运行以下代码时， def prediction(path): import keras from keras.preprocessing.image import load_img, img_to_array from keras.models import load_model import PIL import numpy as np img = load_img(path) img = img.resize((224,

浏览 0提问于2021-02-19得票数 0

回答已采纳

1回答

错误分类度量，不能处理二进制和连续目标的混合

、、

嗨，我很困惑地解决这个问题。这是我第一次尝试深入学习。我已经核对过其他问题的任何问题和答案，但仍然没有得到任何解决办法。如何解决这一错误 ValueError: Classification metrics can't handle a mix of binary and continuous targets 这是我的密码： In>>y_pred = model.predict(seq_array, batch_size=200, verbose=1) In>>y_true = label_array In>>print('Confusion

浏览 12提问于2022-06-15得票数 0

1回答

如何了解使用model.predict()后结果数组的维数

、、、

我正在递归一段代码来检索项目，但是当我在model.predict函数中调试时，我发现这个函数的输入是维度(1,224,224，3)，但输出是(1，7，7,2048)。model.predict()的结果不应该是一个一维数组，它给出了对象属于每个类别的概率，而不是4D吗？如何理解这个结果数组的维数？ model_features = model.predict(x, batch_size=1) 具体代码如下：(这只是整个代码的一部分，不能直接运行) import keras.applications.resnet50 import numpy as np import os impo

浏览 189提问于2021-08-05得票数 0

回答已采纳

1回答

WEKA中的集群评估是什么？

、、、

当我们说我们正在评估WEKA框架中的集群时，我们是什么意思？聚类是一种对对象进行分组的无监督方法。当我们说我们想要评估结果是什么意思？此外，当我们说我们是在训练数据本身之上评估聚类时，这是什么意思？谢谢Abhishek S

浏览 6提问于2012-06-04得票数 7

回答已采纳

1回答

要群集的文档的最大限制

、

通过弹性搜索通过carrot2插件进行聚类时，文档是否有任何限制？也就是说，我们可以使用carrot2在最多10000个文档上进行集群，有这样的限制吗？

浏览 5提问于2014-02-27得票数 0

回答已采纳

2回答

如何用纸袋法对文档进行排序

、、、

我想对我为谷歌学者搜索获得的文档进行聚类，使用单词包模型。我想用Java作为语言。假设关键字k，谷歌学者给我50个结果。如果我有一组预定义的词w1，w2，w3.wn，我怎样才能对最有预定义词集的文档进行排序呢？我怎样才能应用包字模型呢？我需要像k均值这样的聚类算法吗？我也需要执行NLP技术吗？假设单词w1有几个同义词。对于文档排名，我如何考虑这些同义词？我需要创建一个包含所有缩写、同义词等的语料库吗？有什么好的教程可供使用吗？选择Java而不是Python将是一个劣势，因为大多数资源(Ex - Scikit)都是Python的吗？

浏览 0提问于2015-08-28得票数 2

1回答

如何在模型拟合后使用模型来预测单个字符串的类？

、、、、

在建立了模型之后，如何使用它来预测单个字符串的类？ model.predict()正在返回类似于[[0.41100174 0.5889983 ]]的内容，而不是它的预测类(0或1)。假设我刚刚构建的model是这样的： hist = model.fit(data.x_train, data.y_train, validation_data=(data.x_test, data.y_test), epochs=500, batch_size=50,

浏览 0提问于2018-10-31得票数 1

回答已采纳

1回答

在Keras的多个分类中有多个预测？

、、、

我正在学习使用Keras设计卷积神经网络。我开发了一个以VGG16为基础的简单模型。我在数据集中有大约6类图像。这是我的模型的代码和描述。 model = models.Sequential() conv_base = VGG16(weights='imagenet' ,include_top=False, input_shape=(IMAGE_SIZE, IMAGE_SIZE, 3)) conv_base.trainable = False model.add(conv_base) model.add(layers.Flatten()) model.add(layers.De

浏览 2提问于2017-08-04得票数 7

回答已采纳

4回答

model.predict和model.predict_proba的区别是什么？

、、、

我发现model.predict和model.predict_proba都给出了一个相同的2D矩阵，表示每行每个类别的概率。这两个函数的区别是什么？

浏览 6提问于2016-11-23得票数 26

1回答

如何将预测的类别和概率与实际标签进行匹配

、、、、

我已经训练了一个基于双向LSTM和密集层输出的深度学习模型。使用model.predict(x)获得的输出概率与我的实际标签(一个热编码标签)匹配是非常令人困惑的。此外，model.predict_classes(x)输出(0,1,2)也是令人困惑的。如何将这些输出与我的原始标签相关联。下面是我的代码片段供参考： model = Sequential() model.add(Embedding(MAX_NB_WORDS, EMBEDDING_DIM, input_length=X.shape[1])) model.add(SpatialDropout1D(0.5)) model.add

浏览 34提问于2020-12-01得票数 0

3回答

如何在Weka中计算聚类评估的精度

、、、、

我们如何使用Weka计算集群的准确性？我可以使用这个公式： Accuracy (A) = (tp+tn)/Total # samples 但是我如何知道Weka工具中实验输出中的真阳性、假阳性、真阴性和假阴性是什么？

浏览 0提问于2015-03-17得票数 2

1回答

计算多标签分类问题的ROC曲线、分类报告和混淆矩阵

、、、、

我正在尝试理解如何为我的多标签分类问题制作混淆矩阵和ROC曲线。我正在构建一个神经网络。以下是我的类： mlb = MultiLabelBinarizer() ohe = mlb.fit_transform(as_list) # loop over each of the possible class labels and show them for (i, label) in enumerate(mlb.classes_): print("{}. {}".format(i + 1, label)) [INFO] class labels: 1. class1 2.

浏览 100提问于2020-03-26得票数 4

回答已采纳

1回答

如何在随机森林分类器中获得'predict‘预测的类的'predict_proba’？

、、、

from sklearn import ensemble model = ensemble.RandomForestClassifier(n_estimators=10) model.fit(x,y) predictions = model.predict(new) 我知道predict()使用predict_proba()来获得预测，通过计算森林中树木的预测类别概率的平均值。我想要获得predict()方法预测的类的predict_proba()结果。我要做的是:首先像上面的代码一样调用predict()，对于概率，我从树中提取最大概率，如下所示： all_probabilities

浏览 87提问于2020-10-29得票数 2

回答已采纳

1回答

使用model.predict()输出创建手动混淆矩阵

、、、

我有一个模型已经工作，并有一个循环它的训练。您可以在这里看到循环： for idx, (x, y) in enumerate(train_dataset): pred = model.predict_on_batch(x) print(model.test_on_batch(x, pred, reset_metrics=False, return_dict=True)) print(model.train_on_batch(x, y, reset_metrics=False)) print(f"After {idx} entries") 我想要创建一个自定义混淆

浏览 5提问于2022-03-21得票数 -1

回答已采纳

2回答

文档及其结构的聚类

、、、、

我正在通过查看文档的结构来对文档进行聚类。我在下面的代码中提取了BERT嵌入变量X中的结构。我正在尝试的是： for num_clusters in np.arange(2,200): model = KMeans(n_clusters=num_clusters) model.fit(X) pred = model.predict(X) centers = model.cluster_centers_ cluster_sum = 0 for i , c in enumerate(centers): use = []

浏览 0提问于2020-05-13得票数 2

1回答

使用XGBoost根据输入预测重要性或百分比

、、、

我正在解释我的XGBoost模型。例如，下面两个数据集trainInput和trainOutput： df.trainInputs input1 input2 input3 0 1 0 0 1 1 1 0 2 0 1 1 .. df.trainOutputs output 0 1 1 0 2 1 ... 用户输入是一个热编码，输出数据是用户输出模式的列表。我正在用这些训练我的XGBoost模型，然后根据另一个数据集的一个热编码用户输入数据的另一个矩

浏览 2提问于2017-05-30得票数 2

回答已采纳

1回答

用CNN预测图像类别

、、

我试图在经过训练的模型上预测单个图像的类别，但是我得到了一个奇怪的输出，所以这是我的代码： from tensorflow.keras.models import load_model from tensorflow.keras.preprocessing import image import matplotlib.pyplot as plt import numpy as np import os def load_image(img_path, show=False): img = image.load_img(img_path, target_size=(300, 300))

浏览 4提问于2020-05-18得票数 0

回答已采纳

2回答

理解角蛋白model.predict

、、

我读过和的帖子。但是，我的问题是非常具体的:如果我的model.predict()函数输出的类标记为0和1的分类问题类似于： array([[0.5147758 ], [0.48530805], [0.5122566 ], [0.4839405 ], [0.49831972], [0.4886117 ], [0.5130876 ], [0.50388396]], dtype=float32) 我在最后一层中使用了binary_crossentropy丢失，如： Dense(1, activatio

浏览 0提问于2019-08-25得票数 2

回答已采纳

2回答

在哪个列上创建布隆过滤器- cassandra

我想知道bloom过滤器是在哪一列上构建的。聚类键是否也启用了bloom filter？聚类键是否有助于在杂乱的列上进行更快的搜索

浏览 1提问于2020-09-18得票数 1

3回答

只使用正数据和未标记数据构建二进制分类器

、

我有两个数据集，一个具有我想要检测的正实例，另一个带有未标记的实例。我能用什么方法？例如，假设我们希望了解基于一些结构化电子邮件特征的垃圾邮件检测。我们有一个10000封垃圾邮件的数据集和一个100000封垃圾邮件的数据集，我们不知道它们是否是垃圾邮件。我们如何解决这个问题(不手动标记任何未标记的数据)？如果我们有关于垃圾邮件在未标记数据中所占比例的额外信息(即，如果我们估计100000封未贴标签的电子邮件中有20-40%是垃圾邮件)，我们能做些什么？

浏览 0提问于2014-07-07得票数 11

1回答

朴素贝叶斯文档分类器的长度归一化

、、、

我试图实现一个朴素的Bayes分类器来对本质上是特征集(而不是袋子)的文档进行分类，也就是说，每个特性都包含一组独特的特性，每个特征最多只能在文档中出现一次。例如，您可以将这些特性视为文档的唯一关键字。我一直在密切关注et的伦尼。阿尔。的论文，但我遇到了一个似乎没有得到解决的问题。也就是说，对短文档进行分类，由于文档具有较少的特征，因此产生了更高的后验概率；而对于长文档，则相反。这是因为后验概率被定义为(忽略分母)： P(class|document) = P(class) * P(document|class) 它会扩展到 P(class|document) = P(class) * P

浏览 1提问于2011-09-09得票数 5

回答已采纳

1回答

确定最佳簇数和Davies-Bouldin指数？

、

我正在尝试评估对某些数据进行集群所需的正确集群数量。我知道这可以使用Davies-Bouldin Index (DBI)。要使用DBI，您必须为任意数量的集群计算它，最小化DBI的集群对应于所需的正确数量的集群。问题是：如何知道使用DBI的两个集群是否比一个集群更好？那么，当我只有一个集群时，我如何计算DBI呢？

浏览 0提问于2013-01-18得票数 7

回答已采纳

1回答

WEKA如何评估星系团？

、、、

嗨，在链接中找到了这个解释：使用培训集(默认)。生成聚类后的Weka 将训练实例分类为按集群表示并计算实例的百分比。在每个星系团中坠落。在所提供的测试集或百分比split中可以评估如果聚类表示是概率的(例如，对于EM)，则对单独的测试数据进行聚类。类到集群评估。在这种模式下，Weka首先会忽略类属性并生成集群。然后在它根据每个集群中类属性的大多数值将类分配给集群的测试阶段。在此基础上计算分类误差，并给出相应的混淆矩阵。一个例子对于k-均值，如下所示。但是，我不清楚WEKA是如何对集群中的一个新实例进行分类的，以及它如何度量是否应该将该实例分类到该集群中。

浏览 0提问于2018-11-29得票数 1

1回答

滑雪板的“log_loss”和“LogisticRegression”的区别？

、、、、

我是一个新手，目前正在从头开始学习数据科学，我有一个相当愚蠢的问题要问。我目前正在学习二进制分类，我知道逻辑函数是一个有用的工具。我查阅了文档，注意到我可以导入两个与物流相关的函数，即sklearn.metric.log_loss和sklearn.linear_model.LogisticRegression。我应该何时何地使用它们，有什么区别吗？更广泛地说，度量和模型之间有什么区别，为什么日志丢失函数是度量？抱歉，如果这个问题听起来完全没有意义，但这是一个真正的根源，我的困惑！

浏览 0提问于2018-11-22得票数 0

回答已采纳

1回答

如何计算多类多标签分类的f1_score

、、、、

我用了一个热编码器一千零零0 0 0 1作为我的functional classification model。测试数据yprob = model.predict(testX)的预测概率告诉我： yprob = array([[0.18120882, 0.5803128 , 0.22847839], [0.0101245 , 0.12861261, 0.9612609 ], [0.16332535, 0.4925239 , 0.35415074], ..., [0.9931931 , 0.09328955, 0.01351734],

浏览 0提问于2021-04-19得票数 1

1回答

如何在数组中制作model.predict？

、

我有两个类别的类别狗和猫。我为这些类别做了一个列表： labels = ["cats", "dogs"] 我试过用 pred_name = labels[np.argmax(prob)] 给我看标签。但我对model.predict有一个问题。它只显示1，而不是数组0。1.. import cv2 import numpy as np img = cv2.imread('D:cat.jpg') img = cv2.resize(img,(150,150)) img = np.reshape(img,[1,150,150,3]) labe

浏览 15提问于2019-09-26得票数 0

2回答

用于内容推荐的PredictionIO (例如Tweets )

、、

我最近安装了PredictionIO。我想要实现的是：，我想对文本中包含的单词进行分类。，但是我如何将原始Tweets这样的数据导入PredictionIO呢？是否有可能让PredictionIO浏览内容并找到强有力的单词并将它们按类别进行排序？我想得到的是:应该出现的Query for Boston Red Sox -->关键字是：baseball, Boston, sports, ...

浏览 0提问于2015-05-12得票数 1

1回答

Keras:用于图像分类的model.predict()解释

、、、、

我已经创建了一个使用keras的图像分类器，并且我正在尝试对单个图像使用model.predict()。我的代码如下所示： path = 's.jpg' from keras.preprocessing import image img_width, img_height = 224,224 img = image.load_img(path, target_size = (img_width, img_height)) img = image.img_to_array(img) img = np.expand_dims(img, axis = 0) a =mode

浏览 2提问于2020-06-03得票数 0

1回答

朴素Bays分类器:输出百分比太低

、、

我正在为一个类项目编写一个朴素的bayes分类器，我刚刚开始工作.说大也大吧。虽然我确实获得了一个无错误输出，但获奖输出标签的输出概率为3.89*10^-85。哇。我对我可能做错了什么有几个想法。首先，我没有规范类的输出百分比，所以所有的百分比实际上都是零。虽然这会给我一些看起来不错的数字，但我不知道这样做是否正确。我的第二个想法是减少功能的数量。我们的输入数据是一个以非常长的文本文件形式出现的伪图像列表。目前，我们的特征只是图像中每一个像素的二进制值，有一个28x28的图像，这是很多特征。如果我把图像切成块大小，比如说，7x7，那么实际输出百分比会提高多少呢？ tl；博士，这里是我想要

浏览 2提问于2016-12-17得票数 0

2回答

训练后如何使用角神经网络对数据进行分类？

、、、、

我已经定义，训练和拯救了我的张量角神经网络。现在已经完成了，如何将它输出到非培训数据？ import tensorflow as tf import numpy as np from tensorflow.keras import layers from syslog import syslog_pred model = tf.keras.Sequential() # Adds a densely-connected layer with 64 units to the model: model.add(layers.Dense(128, activation='relu')

浏览 0提问于2019-04-25得票数 3

回答已采纳

1回答