如何使用Tensorflow为结构化数据创建多类分类器？_如何使用多标签数据训练分类器？_如何使用vtkStreamTracer类为我的非结构化网格数据生成流线？ - 腾讯云开发者社区

kubeflow

我试图找出什么时候创建自己的Kubeflow MLOps平台是合理的：如果你是Tensorflow专卖店，你还需要Kubeflow吗？为什么不只是TFX？编曲可以用气流来完成。为什么要使用Kubeflow，如果您使用的都是scikit-学习，因为它不支持GPU，分布式训练方式？如果您确信要使用Kubeflow，云提供商(Azure和GCP)将提供ML管道概念(谷歌在幕后使用Kubeflow )作为托管服务。当部署自己的Kubeflow环境是有意义的时候？即使您需要部署on，也可以选择使用云资源(云上的节点和数据)来训练模型，并且只将模型部署到on。因此，使用Azure或GCP AI平台作为托

浏览 4提问于2020-03-21得票数 10

回答已采纳

1回答

神经网络是否有可能像不同形式的监督学习那样高分？

keras、scikit-learn、optimization、theory

我一直在使用来自UCI http://archive.ics.uci.edu/ml/datasets/adult的成人人口普查收入数据我创建了两个不同的模型，一个是使用梯度增强分类器，另一个是使用Keras/Tensorflow的神经网络。所以我对代码提示或什么都不感兴趣，但我有一个关于机器学习的一般性问题--我使用梯度增强分类器比使用神经网络的精度要高得多。一般来说，我的(或任何)神经网络是否有可能达到与任何其他类型的监督学习相同的精度？是否只需要大量的努力工作和肘部的油脂就可以很好地调节神经网络？我使用相同的数据集，对神经网络和梯度增强分类器都使用相同的特征工程。

浏览 0提问于2019-04-10得票数 3

回答已采纳

2回答

监督学习方法-创建我自己的标签

scikit-learn、machine-learning-model、supervised-learning、data-science-model

场景--我有没有标签的数据，但是我可以创建一个函数，根据行为给数据贴上标签，然后部署模型，这样我就不用一直给数据贴标签了。这算是机器学习吗？目的:基于high、medium或low标签对具有容量峰值的账户进行分类，使其部署在大数据(数万亿条数据线)上。数据:我拥有的数据包括以下属性:帐户、时间、日期、卷金额。方法：创建一个名为spike的新功能列，并创建一个熊猫函数来标识大于5的尖峰。这是功能工程吗？接下来，我创建我的label列，并将其归类为low、medium或high spike。接下来，我将训练一个机器学习分类器，并将其部署到大数据中标记具有类似模式的未来帐户。关于这个过

浏览 0提问于2019-06-26得票数 2

1回答

我能用火车图书馆从检查点恢复训练吗？

python、keras

Keras是深度学习库TensorFlow Keras(和其他库)的轻量级包装器，用于帮助构建、训练和部署神经网络和其他机器学习模型。我能用火车图书馆从检查点恢复训练吗？

浏览 2提问于2020-07-01得票数 2

2回答

在Python或Matlab中构建模型之后，如何部署模型？

machine-learning、predictive-modeling

我一直在玩很多不同的机器学习模型(聚类，神经网络等等)，但是我有点纠结于理解在用Python或Matlab构建模型之后会发生什么。例如，假设我训练了一个二进制分类问题的基本神经网络模型。例如，如何将其部署到同事，以便他们可以在数据集中加载预测？我训练过一个模特，但是现在那个模型会怎么样呢？我如何“保存”我刚刚在Python中训练过的模型？我看到了很多关于如何预处理数据、训练模型、提供统计数据和预测的教程；但是，接下来会发生什么呢？很明显，Facebook、Google和任何其他大量参与机器学习/人工智能应用程序的人都在创建一个框架来使用他们的模型。但是，是否有允许您输入数据并将其应用于P

浏览 0提问于2017-03-10得票数 7

回答已采纳

1回答

当您手动创建自己的数据集时，您是保持类之间的真实分布，还是使其平衡？

dataset、data-science

(我有点纠结于标题的表达--请随意推荐另一个标题)。我有一个文本数据集，我需要对其进行分类，假设有三个类。我需要根据文本手动设置标签来创建目标(假设三个类是dog、cat、bird)。当我这样做的时候，我注意到，比如说，我们有70%的狗，20%的猫和10%的鸟。由于许多机器学习模型都在处理不平衡的数据，我的第一个想法是强制平衡数据集，忽略一些dog和cat文本(即“欠采样”)，从而得到(几乎)平衡的数据集，使模型更容易训练。我担心的是，如果我们想要训练一个神经网络并获得每个类的概率，不对数据的正确分布进行训练会导致过度/不自信的预测？

浏览 0提问于2021-07-08得票数 0

2回答

Dataset以及为什么使用度量衡()？

dataset、training、validation、test

我是从机器学习开始的，我对一些概念有疑问。我读过我们需要将数据集分成训练、验证和测试集。我会问四个与他们有关的问题。 1-训练集:在.fit()中用于学习神经网络中的权值等参数。 2-验证集:也可用于.fit()。验证集被使用，这样我们就可以在每个时代结束时验证我们的模型(调优一些超参数，比如隐藏层中的节点数)？ 3-如果2是正确的(即，验证集已经在.fit()中使用)，我们还需要使用.evalute()吗？为什么？测试集:模型从未见过的新输入(x)，所以我可以对它们进行预测？通过.predict()函数使用？

浏览 0提问于2021-12-03得票数 2

回答已采纳

1回答

韦卡:如果测试跑后是训练跑，那么训练有帮助吗？

classification、weka、bayesian

我有个疑问。我理解了交叉验证和分裂的概念，分类器将从训练数据学习和测试测试数据分裂。如果我首先使用“使用培训数据”运行分类，然后在分类选项卡中使用"SUpplied测试集“选项，然后再次运行，会发生同样的情况吗？为了在分类选项卡中更清楚地说明，我运行了两次...first，训练数据集被上传到预处理选项卡下，然后在分类选项卡“提供测试集”中运行测试集。那么，在测试数据上执行时，模型是否使用了以前所做的培训？我用了朴素的贝叶斯分类器。我也怀疑是否所有的分类器都是从训练数据中学习，还是仅仅从神经网络、决策树这样的分类器中学习？

浏览 0提问于2013-10-05得票数 0

1回答

无法理解特征提取

machine-learning、neural-network、deep-learning、feature-engineering、feature-extraction

我正在学习人工智能课程，我们刚刚进入了深入学习的章节。说到经典机器学习模型和深度学习模型的区别，最有利于神经网络的一点是它不需要特征提取阶段。这是因为它可以直接在数据上隐式地学习什么是最重要的特性，我们给它作为输入。相反，机器学习系统在开始训练之前，严重依赖于特征提取。我在这个网站上找到了一些关于这个主题的有用的问题，但是我还是有点不明白什么是特征提取。所以我请我的老师给我举个例子。他给了我这个例子:假设我们有一个巨大的图像数据集，我们希望根据图片中至少有一棵树的存在与否来对它们进行分类。因此，如果图像包含一棵树，它将被归类为1，否则为-1。在神经网络的情况下，我们简单地将图像用标签传送

浏览 0提问于2021-01-18得票数 2

回答已采纳

2回答

用于聊天机器人训练的深度学习

networking、deep-learning、chatbot

我们正在尝试创建一个智能聊天机器人来为客户服务。我们有一个客户服务问题和答案的语料库，每个对话都有一个标记的意图。我们正在探索使用深度学习来训练我们的模型，但我们遇到了几个问题： 1-如何在文本数据上进行特征工程来训练模型。具体地说，如何将语言转换为向量？ 2-如何使用非单词特征，作为意图识别深度学习分类器的输入？你如何容纳客户产品名称?3-如何为文本输入的深度学习选择神经网络体系结构?4-我们如何处理数据不足的情况？使用贝叶斯技术？

浏览 2提问于2017-02-14得票数 3

5回答

是否总是更好地使用整个数据集来训练最终模型？

machine-learning、dataset、training、accuracy

在对机器学习模型进行训练、验证和测试之后，一种常用的技术是使用完整的数据集(包括测试子集)来训练最终模型，以便将其部署到产品上。我的问题是:这样做是否总是为了最好？如果表演真的变坏了呢？例如，让我们假设模型在分类测试子集时得分在65%左右。这可能意味着要么模型训练不够，要么测试子集由异常值组成。在后一种情况下，使用它们来训练最终模型会降低其性能，并且只有在部署它之后才会发现。重新表述我最初的问题：如果你曾经对模型进行过一次演示，比如在一次昂贵的火箭实验中将其部署在嵌入式电子设备上，那么你会相信一个在最后一步使用测试子集重新训练过的模型，而没有重新测试它的新性能吗？

浏览 0提问于2018-06-12得票数 53

2回答

在对机器学习和深入学习项目进行分析之前，我应该重组培训和测试集吗？

python、pandas、machine-learning、scikit-learn、deep-learning

我通过在机器学习和深度学习领域做项目来训练自己。为此，我向Kaggle竞赛(如 )注册。当我们加载数据时，有两个数据集:火车和测试。现在，我只对火车集执行分析，每次我创建一个新特性或执行一些更改时，我都会通过进行相同的操作对这两个数据集执行循环。现在，我将对缺失的值进行估算，并执行一些预处理操作，因此，我将对数据使用一些聚合，对分类特征进行编码等等。但是，我不知道是否应该同时使用训练集和测试集来计算这些特征的平均值或标记，或者仅仅使用训练集。因为据我所知，测试集应该用来衡量模型在它从未见过的数据上的表现，所以我认为到目前为止，我只应该使用训练集来做出决策。但是有时它可能是“错误的”，例

浏览 0提问于2019-07-26得票数 0

回答已采纳

3回答

此场景的文本分类技术

machine-learning、classification、cluster-analysis、data-mining

我对机器学习算法完全陌生，我有一个关于数据集分类的快速问题。目前有一个由两列消息和标识符组成的培训数据。消息--从包含时间戳和一些文本标识符的日志中提取的典型消息--应该根据消息内容对类别进行分类。培训数据是通过从工具中提取特定类别并相应地加上标签来编制的。现在，测试数据只包含消息，我正试图获得相应的分类。在这种情况下，哪种方法最有帮助？是监督学习还是非监督学习？我有一个经过训练的数据集，我正试图预测测试数据的类别。谢谢你，亚当

浏览 4提问于2017-08-30得票数 0

回答已采纳

1回答

混合卷积神经网络与常规神经网络

machine-learning、neural-network、deep-learning

卷积神经网络通常是图像分类和语义分割的最佳选择。分类/数字数据(年龄、身高、城市等)另一方面，传统的机器学习模型，如(深度)随机森林模型、支持向量机模型或传统神经网络模型处理效果最好。是否有将卷积神经网络和传统神经网络相结合的混合结构来对图像和分类数据集进行分类？我确信这个问题以前已经解决过，我特别希望在一个公共库(PyTorch、Tensorflow、Keras等)中寻找研究论文、教程和实现。这种“混合”数据集的一个很好的例子是ISIC数据集，它包含数千张皮肤生长的图像，以及每幅图像的患者年龄和性别等信息。假设情况下，包含这些分类/数值信息的混合模型在检测皮肤癌方面可能比仅仅使用图像的模

浏览 0提问于2018-06-12得票数 1

4回答

ML模型是否有可能执行比随机分类更糟糕的操作？

machine-learning

我在具有二进制数据的矩阵上实现了不同的机器学习算法来预测两个类别的单变量目标。随机森林(精度= 62.01) 神经网络(acc= 58.9) 支持向量机-径向核(精度= 58.02) 线性判别分析(精度= 57.9) logistic回归(准确性= 57.6)。我的基线精度是52.55。但是在相同的情况下，朴素的Bayes只给出了48.5的精度，只识别了y中的一个类。机器学习模型有可能比随机分类更糟糕吗？

浏览 0提问于2017-08-11得票数 6

3回答

Google上GPU的Tensorflow

machine-learning、tensorflow、gcloud、google-cloud-ml-engine

我有一个关于使用tensorflow的谷歌机器学习的模型，这是可以的。现在我想用GPU做一些预测。我看到了这个，但是它讲述了使用GPU进行训练的过程，而不是预测。在预测会话中，GPU没有任何信息。有人知道用GPU用谷歌机器学习引擎做预测的可能性吗？或者，如果我使用GPU的训练，我的预测自动运行与GPU？我使用以下命令行： gcloud ml-engine predict --model ${MODEL_NAME} --json-instances request.json 这个命令可以工作，但它使用的是CPU。更多信息:我的模型是在美国东1区发布的，我的比例是自动的。

浏览 1提问于2017-05-10得票数 4

回答已采纳

1回答

机器学习中的特征提取

machine-learning、deep-learning、object-detection

我对阅读遥感目标检测技术综述感到有点困惑。基于机器学习的目标检测由特征提取、特征融合+降维和分类器训练三部分组成。然后，他们列出了特征提取方法：定向梯度直方图，一袋袋话，纹理特征，还有更多。在本节的后面，他们列举了分类器培训的方法，例如：支持向量机 AdaBoost，最近的邻居，神经网络这与我对事物的理解不一致。我的经验主要是在CNN。当我使用卷积神经网络进行目标检测时，它们由特征提取器和分类器组成，不是吗？特征提取器是卷积(和/或其他)层。我从来没有遇到过一种算法/技术，它使用例如一袋单词来提取特征，然后将其提供给神经网络。我可以想象，例如一袋单词和k近邻或支持向量机。但我

浏览 0提问于2020-11-09得票数 0

2回答

给定一个机器学习算法，它的训练集的最小大小是多少？

machine-learning、dataset、training、reference-request

我知道我们拥有的数据越多，我们的模型就越可靠。我还了解到，机器学习模型的参数越多，所需的训练数据就越多。例如，深度神经网络需要比线性回归或支持向量机更多的数据。机器学习在文本和图像中的成功应用需要数百万的数据点。我阅读此尝试(链接)时，使用了5000引号的数据集来生成新的引号。提交人曾多次尝试失败，直到他意识到他的数据集太小，无法完成这项任务。他成功地使用了转移学习，使用了由Salesforce开发的AWD模型，该模型对维基百科的1亿令牌进行了培训。另一方面，我经常看到一些科学文章，这些文章用几百个数据(甚至更少)来训练机器学习模型，并夸耀它们的“伟大发现”。例如，本文(链接)使用的数据集

浏览 0提问于2019-09-04得票数 4

2回答

机器学习中的预测函数是否理解分类数据？

python、predictive-modeling、feature-engineering、data-science-model、encoding

据我所知，在进行特征工程之前，必须将数据集分成训练数据和测试数据，以避免分析中的偏差。我还了解到，机器学习模型除了数字数据之外不理解数据，因此需要编码，这是特征工程的一部分。我的问题是，我是单独编码测试数据，还是预测函数理解分类数据。

浏览 0提问于2019-11-06得票数 1

回答已采纳

2回答

橙色红外

machine-learning、python、neural-network、convolutional-neural-network、orange

我必须说，在机器学习的世界里，橙色真的做得很好。我有三个问题。 (1)我发现最近加入了“橙色红外线”。但我还没有找到任何关于红外光谱的数据。我想知道如何获取红外数据？高斯软件的红外光谱数据能否在橙中进行训练？ (2)我看到一个视频橙色有神经网络分类器，但我下载并安装了橙色3.3.12，没有发现任何神经网络模型。 (3)什么是CN2规则归纳，它与卷积神经网络有何联系？

浏览 0提问于2017-03-02得票数 1