perplexity_如何在Keras中实现Perplexity？_执行perplexity函数评估LDA模型时出现错误 - 腾讯云开发者社区

、、

你好，为了获得一个聊天机器人，我正在尝试测试下面的Seq2Seq模型，我正在遵循本教程：这是主要代码：我遇到的问题是在火车时间，在下载批准语料库后，我运行了以下代码来训练： python execute.py 按照存储库指令，模型开始训练，这是输出，主要问题是，我的计算机已经计算了大约2天零9小时的结果，使用所有处理器，我的计算机的规格如下： Processors: Intel® Core™ i7-6600U CPU @ 2.60GHz × 4 Ram: 15.3 GiB 考虑到这些事实，我想感谢曾经训练过这个模型的人的反馈，如果我有某种错误，或者它是正常的，因为它是一个非常复

浏览 4提问于2017-02-26得票数 1

回答已采纳

2回答

Python:处理大数

、、、

我需要计算困惑，我试着用 def get_perplexity(test_set, model): perplexity = 1 n = 0 for word in test_set: n += 1 perplexity = perplexity * 1 / get_prob(model, word) perplexity = pow(perplexity, 1/float(n)) return perplexity 经过一些步骤后，我的perplexity等于无穷大。我需要获取数字，作为pow(perplexity, 1

浏览 25提问于2018-12-17得票数 1

1回答

Keras:无法在我的模型中使用自定义丢失函数

、、、

我正在用Keras构建一个语言模型，我想用困惑作为我的损失函数，但是当我试图用我的损失函数编译我的模型时，我得到了一个值错误，说损失函数是未知的。我的损失函数如下： def perplexity_loss(y_true, y_pred): """ The perplexity metric. Why isn't this part of Keras yet?! https://stackoverflow.com/questions/41881308/how-to-calculate-perplexity-of-rnn-in-tensor

浏览 5提问于2020-05-30得票数 2

回答已采纳

1回答

用pytorch和“`TypeError: NoneType对象不可调用”训练NoneType

我试图用cpu训练mac上的，具体步骤如下：环境规划署: python3.5，Pytorch 0.1.10.1 步骤1 预处理数据，并将src和tgt缩小为只有前100句的句子，方法是在 in preprocess.py后插入以下行 `shrink = True if shrink: src = src[0:100] tgt = tgt[0:100]` 然后，我跑了 python preprocess.py -train_src data/src-train.txt -train_tgt data/tgt-train.txt -valid_src

浏览 2提问于2017-03-30得票数 0

1回答

tensorflow rnn模型路径

、、

我已经使用Tensorflow训练了语言模型，如本所示为了进行训练，我使用了以下命令。 bazel-bin/tensorflow/models/rnn/ptb/ptb_word_lm --data_path=./simple-examples/data/ --model small 训练是成功的，最后的o/p如下。 Epoch: 13 Train Perplexity: 37.196 Epoch: 13 Valid Perplexity: 124.502 Test Perplexity: 118.624 但我仍然对训练模型存储在哪里以及如何使用它感到困惑。

浏览 9提问于2015-11-29得票数 2

1回答

在Keras/Tensorflow中计算复杂性和内存问题

、、、、

我想在每个训练阶段之后用困惑来评估我的模型。我正在使用带有Tensorflow后端的Keras。问题是，在每次评估之后，越来越多的内存被使用，但从未被释放。所以在几个时期之后，我的系统崩溃了。如果我不使用keras和tensorflow函数，它可以在没有内存问题的情况下工作。但那就太慢了。代码如下： def compute_perplexity(self, modelName, sentences): all_labels, all_predictions = self.predictLabels_for_perplexity_evaluation(self.models[model

浏览 26提问于2018-12-30得票数 0

1回答

Keras损失函数值错误: ValueError:操作的梯度为“`None`”。浅谈LSTM网络

、、、

因此，我试图训练我的LSTM网络语言模型，并使用一个困惑函数作为我的损失函数，但是我得到了以下错误： ValueError: An operation has `None` for gradient. Please make sure that all of your ops have a gradient defined (i.e. are differentiable). Common ops without gradient: K.argmax, K.round, K.eval. 我的损失函数如下： from keras import backend as K def perplexit

浏览 3提问于2020-05-30得票数 1

回答已采纳

1回答

执行perplexity函数评估LDA模型时出现错误

、、、

我正在尝试评估主题建模(LDA)。退出perplexity函数时出现错误，如下所示: error in (function (classes，fdef，mtable)：找不到用于签名‘“LDA_Gibbs”，“numeric”’的函数‘perplexity’的继承方法。请帮助解决此问题。

浏览 61提问于2018-07-28得票数 2

1回答

不能赋值给文本

、、

在我的代码中，我只想创建包含[tsne_results_50,tsne_results_30,tsne_results_50,tsne_results_100]的tsne_results列表。但我不能，因为上面写的是Cannot assign to literal。我怎么才能修复它？ perplexity_values=[5,30,50,100] tsne_results=[] for value in perplexity_values: tsne = TSNE(n_components=2, verbose=1, perplexity=value, n_iter=250) f

浏览 98提问于2021-10-07得票数 0

回答已采纳

1回答

如何将列添加到现有的填充数据格式中

、、

我试图为现有数据框架的新列添加值： val_df["perplexity"][10]=14 没有名为perplexity的列，我认为这将创建该列。我猜到也是这样说的，但是我得到了以下错误： KeyError: 'perplexity'

浏览 1提问于2019-03-06得票数 1

回答已采纳

1回答

第三次观测点R上的黄土曲线拟合

、、、、

我用LOESS平滑器在散点图上跟踪this tutorial，但我希望能够将二阶导数应用于LOESS平滑线，以检查它在哪里达到最大值，这样我就可以分辨出有多少簇是最优的，就好像它是k均值的肘部一样。 perplexi <- structure(list(Perplexity = c(NA, NA, 660, 596, 552, 480, 464, 415, 399, 370, 349, 340, 327, 314, 288), Clusters = c(1, 2, 3, 4, 5, 6, 7,

浏览 16提问于2020-03-31得票数 0

回答已采纳

1回答

Keras:如何对日志进行一次性编码以匹配损失函数的标签

、、、

我正在尝试为我的LSTM语言模型实现一个困惑损失函数。然而，我得到了以下错误： InvalidArgumentError: logits and labels must have the same first dimension, got logits shape [32,3345] and labels shape [107040] [[{{node loss_9/dense_10_loss/perplexity/SparseSoftmaxCrossEntropyWithLogits/SparseSoftmaxCrossEntropyWithLogits}}]] 现在，我认为解决这

浏览 9提问于2020-06-01得票数 1

回答已采纳

1回答

如何修复freeze_support()错误，用于计算LDA的计算复杂性和一致性？

、、、、

我将为LDA计算文本数据的复杂性和连贯性。我运行以下代码 # Compute Perplexity print('\nPerplexity: ', lda_model.log_perplexity(corpus)) # a measure of how good the model is. lower the better. # Compute Coherence Score coherence_model_lda = CoherenceModel(model=lda_model, texts=data_lemmatized, dictionary=id2word, cohe

浏览 48提问于2021-04-14得票数 0

1回答

当维数大于数据数时，我可以使用than吗？

、

我正在使用the与这个网站()的matlab代码.但是，当我运行这个程序时，当数据的维度大于数据的数量时，就会出现错误。下面的代码是我目前使用的代码，错误总是发生在这里。 M = M(:,ind(1:initial_dims)); 错误是 Index exceeds matrix dimensions. Error in tsne (line 62) M = M(:,ind(1:initial_dims)); 我用matlab中的命令调用这个tsne函数。 output = tsne(input, [], 2, 640, 30); 输入尺寸为( 162×640 )，尺寸为640，数据数

浏览 2提问于2016-02-29得票数 2

回答已采纳

1回答

如果给定双图的概率为0，如何寻找双图的困惑

、、、

给出计算双图的困惑性的公式(加-1平滑的概率)，概率当句子中每一个单词预测的概率之一是0时，如何进行？ # just examples, don't mind the counts corpus_bigram = {'<s> now': 2, 'now is': 1, 'is as': 6, 'as one': 1, 'one mordant': 1, 'mordant </s>': 5} word_dict = {'<s>&#

浏览 8提问于2021-03-31得票数 0

2回答

CSV中的结果应该在列表中，而不是字符串中

、

在我的脚本中，我计算每个文本文件的某些特征。然后，我将结果写入CSV文件。但是，我似乎不能将它们放到列表中，我最终只能使用字符串。我省略了特征计算，只是发布了我用来编写CSV文件的代码。我是一个初学者:) fnew = open('results.csv', 'w+') fnew.write('fileid,feature,resultaat\n') .计算特征。 fnew.write(cat+','+sentstr+',perplexity (bigram),'+str(lmbi.perplexit

浏览 1提问于2013-06-18得票数 1

回答已采纳

3回答

如何在Keras中实现Perplexity？

、、、、

我一直在尝试评估语言模型，我需要跟踪困惑度量。我尝试的是:由于困惑是2^-J，其中J是交叉熵： def perplexity(y_true, y_pred): oneoverlog2 = 1.442695 return K.pow(2.0,K.mean(-K.log(y_pred)*oneoverlog2)) 但奇怪的是，在几个批次的训练过程中，这是无限的。有没有什么错误的实现方式或者其他方式来实现perplexity？

浏览 9提问于2017-06-22得票数 1

1回答

使用text2vec的困惑问题

、、

正如我经常提到的，我正在使用text2vec处理23万个文档。我正在尝试使用perplexity为我的文档术语矩阵找到最佳主题编号。当我一个接一个地使用它时，它工作得很好，但是当我尝试使用一个循环来获得从2到25的范围时，它不能工作，我不知道为什么，有人能告诉我哪里出了问题吗？ ##Using perplexity for hold out set t1 <- Sys.time() perplex <- c() for (i in 2:25){ set.seed(17) lda_model <- LDA$new(n_topics = i) doc_to

浏览 19提问于2019-10-24得票数 0

回答已采纳

1回答

NLTK困惑错误

、

我收到了这个错误消息 Traceback (most recent call last): File "C:/Users/shengrong/Desktop/bigram", line 55, in <module> bg = bigram(file) File "C:/Users/shengrong/Desktop/bigram", line 43, in bigram return tt1.perplexity(my_bigrams) File "C:\Python27\

浏览 4提问于2013-07-24得票数 1

3回答

如何使用KenLM计算困惑？

、、、、

假设我们在此基础上建立了一个模型： $ wget https://gist.githubusercontent.com/alvations/1c1b388456dc3760ffb487ce950712ac/raw/86cdf7de279a2b9bceeb3adb481e42691d12fbba/something.txt $ lmplz -o 5 < something.txt > something.arpa 从困惑公式()出发应用逆对数公式之和得到内部变量，然后取第n根，困惑数异常小： >>> import kenlm >>> m = ke

浏览 18提问于2017-05-08得票数 5

回答已采纳

1回答

用最优主题数确定log_perplexity

、、、、

我试图使用python中的日志困惑来确定我的LDA模型的最佳主题数量。也就是说，我正在绘制一系列主题的日志困惑，并确定最低限度的困惑。然而，我得到的图对于日志困惑有负值，当它应该有0到1之间的正值时。 #calculating the log perplexity per word as obtained by gensim code ##https://radimrehurek.com/gensim/models/atmodel.html #parameters: pass in trained corpus #return: graph of perplexity per word fo

浏览 7提问于2017-06-27得票数 2

1回答

NgramModel错误。需要计算困惑

、、

我收到一个NGramModel错误...请告诉我我可能出错的地方。 Traceback (most recent call last): File "ai7.py", line 87, in <module> tt=NgramModel(1, tText, estimator) NameError: name 'NgramModel' is not defined 我的目标是计算文本的困惑程度。 f_in = open("science.txt", 'r'); ln = f_in.read() w

浏览 3提问于2012-11-20得票数 0

回答已采纳

1回答

如何使用nltk计算困惑

、

我试着对一篇文本做一些处理。这是我代码的一部分： fp = open(train_file) raw = fp.read() sents = fp.readlines() words = nltk.tokenize.word_tokenize(raw) bigrams = ngrams(words,2, left_pad_symbol='<s>', right_pad_symbol=</s>) fdist = nltk.FreqDist(words) 在旧版本的nltk中，我在perplexity的上找到了以下代码 estimator = lambda

浏览 4提问于2019-03-01得票数 3

回答已采纳

1回答

为什么填充词汇表的困惑在nltk.lm二元语法中是不定式？

、

我正在测试一个文本的语言模型的perplexity度量： train_sentences = nltk.sent_tokenize(train_text) test_sentences = nltk.sent_tokenize(test_text) train_tokenized_text = [list(map(str.lower, nltk.tokenize.word_tokenize(sent))) for sent in train_sentences] test_tokenized_text = [list(map(str.lo

浏览 13提问于2019-03-05得票数 3

2回答

在penn treebank上计算训练LSTM的困惑

、、

我在penn treebank上实现了语言模型训练。我为每个时间步添加损失，然后计算困惑。这给了我几千亿的莫名其妙的困惑，即使在训练了一段时间之后。损失本身减少了，但最多只能减少到20左右。(我需要一位数的数字来表示损失，以获得合理的困惑)。这让我怀疑我的困惑计算是否被误导了。它是否应该基于每个时间步的损失，然后进行平均，而不是将它们全部相加？我的batch_size是20，num_steps是35。 def perplexity(loss): perplexity = np.exp(loss) return perplexity ... loss = 0 x =

浏览 41提问于2017-12-29得票数 9

回答已采纳

1回答

控制台中的tqdm在每个进程中创建新行

、

我看到，对于笔记本电脑环境，人们应该使用from tqdm.notebook import tqdm来解决这些问题 Epoch 1: 5%|▌ | 13147/259217 [1:15:33<23:34:11, 2.90it/s, lm_acc_train=0.756, lm_acc_val=0.725, lm_loss_train=1.05, lm_loss_val=1.31, loss=1.594, lr=2e-5, perplexity_train=3.53, per plexity_val=444, tdm_acc_train=0.5, tdm_acc_v

浏览 37提问于2020-06-12得票数 0

1回答

有没有办法为数据表绘制UMAP或t-SNE图？

、、、

我有一个很大的文件(下面是一小组数据)，如下所示，我想画一个PCA，我可以使用PCA函数来绘制PCA，但它看起来有点混乱，因为我有200列，所以我认为t-SNE或UMAP可能更好，但我不能使用它们绘制。我想在图中显示列(列名)之间的关系和聚类。事实上，我从不同的研究中收集了A，B和...data，我喜欢检查它们之间是否存在批量效应。如果有人能帮助我，我将不胜感激！ DF： A B C D 1:540450-541070 0.12495878 0.715

浏览 7提问于2019-10-28得票数 3

1回答

我们可以将tdqm进度条与t-sne函数一起使用吗？

、

我正在运行一个程序，使用t-sne将MNIST数据的维度从784维减少到2维。该程序需要很长时间才能完成，我想使用tqdm进度条来跟踪进度。我想知道如何使用t-sne函数添加tqdm进度条。tqdm可以很好地处理循环。我不知道如何使用它的功能。 # TSNE from sklearn.manifold import TSNE # Picking the top 1000 points as TSNE takes a lot of time for 15K points data_1000 = standardized_data[0:30000,:] labels_1000 = lab

浏览 23提问于2019-04-10得票数 1

1回答

每个字符的位是什么？

、、、

什么是Bits per Character (bpc)度量，它已经被用来测量模型的精度参照text8和enwiki8数据集。我在transformer -XL paper 这里中遇到了bpc这个术语。它与作为度量标准的perplexity有多大的不同？

浏览 0提问于2019-07-22得票数 4

0回答

使用import_meta_graph恢复图形时未创建变量？

、

我正在尝试从我用训练的模型中恢复图形，然后尝试恢复模型： import tensorflow as tf import reader from ptb_word_lm import PTBInput, PTBModel, get_config, run_epoch def main(_): checkpoint_path = "/Users/roger/data/ptb_out" checkpoint_path = tf.train.latest_checkpoint(checkpoint_path) raw_data = reader.ptb_ra

浏览 0提问于2017-06-16得票数 0

1回答

有没有办法从SciKit-Learn中找到K-means聚类中的数据点？

、、

我有一个包含观鸟者评论的数据集。我使用TF-IDF向量器将文本注释转换为向量特征，然后运行K-means聚类将我的数据分成多个簇。我有一组清晰的簇。然而，我一直在努力寻找一种方法来找出哪些单词进入了哪些聚类。我知道如何获取特征标签/名称，但我希望看到每个特征下的实际数据点，然后将它们转换回原始单词。我使用的是Python和Scikit-Learn的K-means算法。 def final_k_model(X, finalk): final_k_mod = KMeans(n_clusters=finalk, init='random', n_init=10, max_i

浏览 7提问于2020-08-23得票数 0

6回答

对于python，有什么现成的语言模型吗？

、、

我正在建立一个应用程序的原型，我需要一个语言模型来计算一些生成的句子的困惑。在python中有任何经过训练的语言模型我可以很容易地使用吗？一些简单的事情，比如 model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') assert p1 < p2 我看过一些框架，但找不到我想要的。我知道我可以用这样的方法：

浏览 0提问于2018-09-20得票数 16

回答已采纳

1回答

AttributeError：“张量”对象没有属性“_keras_shape”

、、

我正在尝试运行下面的代码来生成一个JSON文件，并使用它构建一个带有一组图像的t。然而，我在Keras和机器学习方面的经验有限，我无法在下面运行代码并得到错误: AttributeError：‘张量’对象没有属性'_keras_shape‘ import argparse import sys import numpy as np import json import os from os.path import isfile, join import keras from keras.preprocessing import image from keras.applications

浏览 0提问于2018-11-13得票数 3

回答已采纳

1回答

不使用主管时，Tensorflow会冻结

、

没有GPU，没有队列，Tensorflow 1.1.0 这里有一个示例LSTM代码：这个密码起作用了。它打印训练过程信息，很酷。现在，我尝试使用freeze_graph()将经过训练的模型图写入磁盘，最后我发现本教程使用Supervisor来训练模型，Supervisor冻结了图形，而冻结的图形不能在freeze_graph()过程中使用。我试图从Supervisor切换到使用普通会话。只对进行的更改是在main()过程中进行的(除了导入一些东西)。现在看起来是这样的(更改的部分被高亮显示，我删除了所有与图形保存相关的内容，这里不是问题)： with tf.Graph().as_defa

浏览 2提问于2017-04-27得票数 1

回答已采纳

2回答

基于Mallet困惑的Gensim主题建模

、、、、

我是主题模特儿哈佛图书馆的书名和主题。我使用Gensim Mallet包装与Mallet的LDA建模。当我试图得到一致性和困惑值来看模型有多好时，困惑无法计算出下面的例外。如果我使用Gensim的内置LDA模型而不是Mallet，我就不会得到相同的错误。我的语料库中包含的7M+文档长达50字，平均20字，所以文档很短。下面是我代码的相关部分： # TOPIC MODELING from gensim.models import CoherenceModel num_topics = 50 # Build Gensim's LDA model lda_model = gensim

浏览 5提问于2019-03-21得票数 1

1回答

你好，我想用我的数据集在R中创建tsne图。但是当我写命令的时候，我得到了这个错误

library(Rtsne) setwd("n/g") expression_data <- read.table(file = "zdata.matrix.xlsx", row.names = 1, sep=',', header = T) meta_data <- read.table(file = "atac_v1_pbmc_10k_singlecell.xlsx", row.names = 1, sep=',', header = T) tsne_realData <- Rtsne

浏览 20提问于2020-04-06得票数 0

1回答

移除g-图轴标签中斜体周围的间距

、

我正在复制下面的情节。但是，当我在标签中斜体n时，它会在标签后面添加空格。如何控制斜体周围的间距？下面是代码的一个最低版本： ggplot(data.frame()) + labs(labs(x=expression("Proportion of "~italic(n)-"gram Model (1-"*gamma*")"))) 这就是真正的情节：完整代码(数据太大，无法发布)： ggplot(all_pplx, aes(x=(1-Weight), y=perplexity_val)) + geom_line(aes(c

浏览 0提问于2018-09-13得票数 1

回答已采纳

1回答

NLTK中的Ngram模型及其困惑

、、

为了把我的问题放在上下文中，我想训练和测试/比较几个(神经)语言模型。为了专注于模型而不是数据准备，我选择使用来自nltk的Brown语料库，并训练nltk提供的Ngram模型作为基线(与其他LM进行比较)。所以我的第一个问题实际上是关于nltk的Ngram模型的一个行为，我觉得可疑。由于代码相当简短，我将其粘贴到以下位置： import nltk print "... build" brown = nltk.corpus.brown corpus = [word.lower() for word in brown.words()] # Train on 95% f th

浏览 0提问于2013-05-13得票数 13

1回答

为什么我的sklearn t-sne函数在达到最大迭代之前就退出了？

、、、

我试着对正方形距离矩阵进行to分析。这些是我正在使用的命令。 model = TSNE(n_components = 2,perplexity = 32, verbose = 10,n_iter = 1000, metric = "precomputed") embeddings = model.fit_transform(D) 这是我收到的输出：看起来这个程序正在运行75次迭代，然后说它很好，然后退出了。当我绘制来自the的数据时，它基本上只是一个密集的小块。为什么程序会提前退出，我怎样才能让它运行得更长？

浏览 4提问于2017-07-27得票数 0

回答已采纳

1回答

NLTK复杂性测度反演

、、

我给出了一个训练文本和一个测试文本。我想做的是通过训练数据来训练语言模型，以计算测试数据的困惑程度。这是我的代码： import os import requests import io #codecs from nltk.util import everygrams from nltk.lm.preprocessing import pad_both_ends from nltk import word_tokenize, sent_tokenize fileTest = open("AaronPressman.txt","r"); with io.

浏览 11提问于2019-03-05得票数 0

回答已采纳

1回答

tensorflow session.run()试图基于教程代码恢复rnn模型时挂起

、、

我一直在TenserFlow教程中遍历RNN代码：原始RNN代码如下：我把训练过的RNN模型保存为“列车模型”。 if FLAGS.save_path: print("Saving model to %s." % FLAGS.save_path) sv.saver.save(session, FLAGS.save_path, global_step=sv.global_step) 现在，我试图恢复保存的模型，并通过以下方法运行附加测试 with tf.name_scope("Test"): test_input = PTBInput(

浏览 3提问于2017-02-24得票数 1

2回答

有没有办法从PySpark PipelineModel中的各个阶段访问方法？

、、、、

我已经在Spark2.0中创建了一个用于进行LDA的PipelineModel (通过PySpark API)： def create_lda_pipeline(minTokenLength=1, minDF=1, minTF=1, numTopics=10, seed=42, pattern='[\W]+'): """ Create a pipeline for running an LDA model on a corpus. This function does not need data and will not actually

浏览 13提问于2016-07-30得票数 8

回答已采纳

1回答

TSNE来自sklearn与mahalanobis

、、

使用sklearn的TSNE 和mahalanobis度量，我得到了以下错误 from sklearn.manifold import TSNE tsne = TSNE( verbose=1, perplexity=40, n_iter=250,learning_rate=50, random_state=0,metric='mahalanobis') pt=data.sample(frac=0.1).values tsne_results = tsne.fit_transform(pt) ValueError: Must provide either V or V

浏览 0提问于2018-08-09得票数 3

回答已采纳

1回答

使用Image.fromarray()时元组索引超出范围PIL

、、、

我正在尝试将一些CIFAR10图像数据处理成图像瓦片，以便在黑色画布上使用PIL绘图。在从经过训练的模型中提取特征时，我已经成功地做到了这一点，但在使用Image.fromarray时，我一直在使用IndexError: Tuple Index out of range。我的特征被塑造成形状(10000,3072)的测试数据。数据为32x32x3图像。我加载了cifar10数据，然后扁平化了数据，但一直收到这个错误。这是我的代码。其中一些是从https://medium.com/@pslinge144/representation-learning-cifar-10-23b0d9833c

浏览 72提问于2020-08-26得票数 0

1回答

在运行Gensim建议的用于选择迭代和传递的LDA时，无法看到“文档聚合的数量”信息的调试日志

、、

在正式的中，提到了如何设置迭代和传递的次数：我建议使用以下方法来选择迭代和传递。首先，启用日志记录(如许多Gensim教程所述)，并在eval_every中设置LdaModel =1。在训练模型时，请在日志中查找如下所示的一行： 2016-06-21 15:40:06,753 - gensim.models.ldamodel - DEBUG - 68/1566 documents converged within 400 iterations 不过，在我的LDA日志中，我从来没有见过这样的情况。。我写过。我正在进行这样的调试： logging.basicConfig(format=

浏览 5提问于2022-04-22得票数 1

回答已采纳

1回答

scRNA-seq:如何使用预先计算的PCA分数/负载来使用TSNE python实现？

、、、、

来自此资源的Python sne实现：顺便说一句，我是个初学者。我要做的是:使用scRNA-seq数据集并在其上运行scRNA，但使用以前计算过的PCAs (我有PCA.score和PCA.load文件)。 Q1:我应该能够在tSNE中使用所选的计算出的PCA，但是在运行Y= tsne.tsne(X)?时，使用pca.score还是pca.load呢？ Q2:我尝试删除/替换部分PCA计算代码，以尝试删除PCA预处理，但似乎总是会出现错误。为了正确地使用我已经使用的PCA数据，并且不再从它中计算PCA，我应该更改什么？ PCA处理代码的一部分是它的原始形式： def pca(X=np.ar

浏览 0提问于2021-03-18得票数 1

1回答

方法logLikelihood和logPerplexity不适用于Spark，如何进行测量？

、、、、

我试图获得一个星火LDA模型的困惑和日志可能性(与Spark2.1)。下面的代码不工作(方法logLikelihood和logPerplexity找不到)，尽管我可以保存模型。 from pyspark.mllib.clustering import LDA from pyspark.mllib.linalg import Vectors # construct corpus # run LDA ldaModel = LDA.train(corpus, k=10, maxIterations=10) logll = ldaModel.logLikelihood(corpus) perplex

浏览 2提问于2018-01-22得票数 1

回答已采纳

2回答

基于TPU的CloudML调优

、、

TPU是否支持分布式超参数搜索？我使用的是库，它的用于超参数搜索，例如，以下是我在GPU上对语言模型进行超参数搜索的工作方式： t2t-trainer \ --model=transformer \ --hparams_set=transformer_tpu \ --problem=languagemodel_lm1b8k_packed \ --train_steps=100000 \ --eval_steps=8 \ --data_dir=$DATA_DIR \ --output_dir=$OUT_DIR \ --cloud_mlengine \ --hp

浏览 3提问于2018-07-24得票数 0

1回答

如何更改R中的t-sne距离？

、、、

我尝试在R中使用T-sne。我想用dtw代替欧几里得距离。如何在R中更改规范在精选数据上执行算法 library(Rtsne) tsne <- Rtsne(train[,-1], dims = 2, perplexity=30, verbose=TRUE, max_iter = 500) tSNE exeTimeTsne<- system.time(Rtsne(train[,-1], dims = 2, perplexity=30, verbose=TRUE, max_iter = 500))

浏览 1提问于2018-11-14得票数 2

1回答

如何解释Sklearn LDA困惑分数。为什么它总是随着主题数量的增加而增加？

、、、

我尝试使用sklearn的LDA模型找到最优的主题数量。为此，我通过引用上的代码来计算困惑。但是当我增加主题的数量时，困惑总是不合理地增加。是我在实现上错了，还是仅仅是它给出了正确的值？ from __future__ import print_function from time import time from sklearn.feature_extraction.text import TfidfVectorizer, CountVectorizer from sklearn.decomposition import NMF, LatentDirichletAllocation n_

浏览 12提问于2017-08-13得票数 5

回答已采纳