保存预测模型而不保存原始数据集

是一种常见的做法，它有以下几个优势和应用场景：

优势：

节省存储空间：原始数据集通常会占据大量的存储空间，而预测模型通常只是一小部分数据的表示，因此只保存预测模型可以节省大量的存储空间。
保护数据隐私：原始数据集可能包含敏感信息，如个人身份信息或商业机密等。只保存预测模型可以减少数据泄露的风险，提高数据安全性。
提高数据处理效率：在实际应用中，预测模型的使用频率通常远高于原始数据集的访问频率。只保存预测模型可以减少数据读取和处理的时间，提高系统的响应速度。

应用场景：

机器学习模型部署：在机器学习领域，训练模型通常需要大量的原始数据集，但在实际应用中，只需要使用已经训练好的模型进行预测。因此，保存预测模型而不保存原始数据集可以减少存储开销。
移动应用开发：在移动应用开发中，通常需要使用预测模型进行数据分析和预测，而不需要保存原始数据集。只保存预测模型可以减少应用的安装包大小，提高用户下载和使用的便利性。
云端计算服务：云计算平台通常提供机器学习模型的训练和部署服务，用户可以将原始数据集上传到云端进行模型训练，然后只保存预测模型进行实时预测。这样可以节省用户的存储空间和计算资源。

腾讯云相关产品和产品介绍链接地址：

腾讯云机器学习平台（https://cloud.tencent.com/product/tiia）
腾讯云云函数（https://cloud.tencent.com/product/scf）
腾讯云人工智能引擎（https://cloud.tencent.com/product/aiengine）
腾讯云对象存储（https://cloud.tencent.com/product/cos）
腾讯云云数据库（https://cloud.tencent.com/product/cdb）
腾讯云容器服务（https://cloud.tencent.com/product/tke）
腾讯云区块链服务（https://cloud.tencent.com/product/bcs）
腾讯云物联网平台（https://cloud.tencent.com/product/iotexplorer）
腾讯云移动开发平台（https://cloud.tencent.com/product/mpe）
腾讯云音视频处理（https://cloud.tencent.com/product/mps）

保存预测模型而不保存原始数据集

r、save

我想保存我的模型以供外部复制。我使用下面的代码训练模型并保存它。bmi, data=discovery1, family=binomial(link="logit"))save(F10y, file = "F10y1.rda") 当我加载模型时，我还可以看到在其上构建数据的原始数据集(本例中为discovery1)。由于隐私，我想保存模型，但不能看到这个原始

浏览 21提问于2020-03-30得票数 0

1回答

用预训练分类模型预测数据

classification、machine-learning-model、logistic-regression、preprocessing、beginner

我有预先训练的分类模型(保存为泡菜文件)来预测员工流失。我的问题是，当我使用新的数据集预测使用Pickle文件时，我是否需要对新的测试数据集进行所有预处理步骤(如转换和编码)，还是可以使用原始数据集？

浏览 0提问于2022-06-21得票数 0

1回答

使用Pickle文件预测数据

python、machine-learning、data-science、pickle、data-science-experience

我有预先建立机器学习模型(保存为泡菜文件)来预测分类。我的问题是，当我使用新的数据集来预测使用Pickle文件，我需要做所有的预处理步骤(如转换和编码)到新的测试数据集，或者我可以使用原始数据集。

浏览 2提问于2022-06-21得票数 0

2回答

SPSS自动线性回归-运行最佳函数

function、formula、linear-regression、spss

我有一个具有目标和200+自变量的数据集，并运行了一个自动线性回归来确定可解释70-80%的方差的可预测因素。我现在要做的就是对数据运行该函数，并查看每一行的预测值。有没有一种方法可以将回归公式应用于数据集？

浏览 3提问于2015-10-22得票数 0

2回答

利用星火mlLib构建协同过滤推荐引擎

apache-spark、pyspark、collaborative-filtering

在输入文件中添加了一些数据之后，如何重新加载模型。我试图使用另一个函数重新加载模型，该函数试图保存模型，但它将错误作为org.apache.hadoop.mapred.FileAlreadyExistsException。一种方法是侦听并行线程上的传入数据，使用model.save(sc, "target/tmp/<some target>")保存数据，然后在收到重要数据后重新加载模型。

浏览 2提问于2016-03-01得票数 1

1回答

使用经过训练的ML模型作为服务进行预测的同时进行特征工程

python、machine-learning、flask、deployment、pickle

我正在尝试构建一个对回归问题进行预测的flask服务。我有构建模型所需的数据，该模型有大约20列。使用这些数据，我已经建立了一个很好的回归模型。但是在数据上训练模型，我做了很多特征工程，比如对数盒cox变换，一次热编码，由于高度多重共线性而丢弃了几列等，现在特征的数量是35。我在这35个特征上训练了模型，检查了性能，并使用pickle保存了模型。我在flask服务中加载了我的腌制模型。但是现在模型的

浏览 15提问于2021-05-30得票数 1

回答已采纳

1回答

如何解决加载模型以获得新预测的问题？

python、tensorflow、keras、model、save

我训练了一个模型并将它保存为import os model.save('')，我想使用我的模型对新的测试集进行预测，所以我用model = tf.keras.models.load_model('')加载它它向我展示了在加载Keras模型时检测到Tf2.5之前保存的这个waring (WARNING:tensorflow:SavedModel。请确保使用model.save()或tf.keras.models.save_model

浏览 2提问于2021-08-26得票数 3

1回答

如何使用经过训练的神经网络模型？

python、neural-network、keras

我不能理解如何使用已经训练好的神经网络模型。我在python上编程，我使用的是库keras。我分析时间序列。训练神经网络，保存模型。我需要提前预测，比如说，10天。那么，从今天开始如何提前10天进行预测呢？

浏览 18提问于2018-01-24得票数 0

1回答

将机器学习预测链接回原始数据集

scala、apache-spark

我正在使用一些机器学习算法对零售交易数据进行POC，并提出一个脱销分析的预测模型。我的问题可能听起来很愚蠢，但如果你或其他人能回答我，我会非常感激。到目前为止，我已经能够获得一个数据集，并将特征转换为(标签点，特征向量) ==>训练ML模型，然后在==> DataSet上运行模型，然后==>获得预测结果。问题1：由于我没有使用任何JAVA/Python/Scala语言的经验，因此我将在数据库中构建我的特性，并将该数据保存为CSV文

浏览 0提问于2015-08-07得票数 3

1回答

如何在KnowledgeFlow中使用TimeSeriesForecasting？

weka

Weka Explorer提供了时间序列预测透视图，并且易于使用。如果我想保存包含预测的原始数据集，该怎么办？

浏览 5提问于2016-11-30得票数 0

1回答

如何在ML中保存特征工程模型

machine-learning、pickle、joblib

在构建模型之后，我们保存模型以进行实时预测。但是，如果没有特征工程，保存模型将很简单，例如，我已经做了一些chisquare，Randomforest来获得一些对模型精度有贡献的特征。但当我保存此模型时，用于构建此模型的功能将与在训练模型期间传递的原始数据完全不同。提前使用tnx。

浏览 0提问于2019-12-19得票数 0

1回答

基于部分名称的变量选择

variables、syntax、macros、export-to-excel、spss

我正在尝试创建一个代码来执行对多个数据集的预测分析。我正在使用专家建模的过程。为了能够做到这一点，我将对我的数据集进行细分。问题是，它们是否可以在不显式写入整个变量名的情况下提取变量？TRANSLATE = "Predicted.sav" /KEEP Predicte

浏览 0提问于2019-01-31得票数 1

回答已采纳

1回答

给定值的预测间隔不在SAS的数据集中

statistics、sas、prediction

我使用proc reg计算出了我的预测区间： model y = x / cli;下面是我对proc reg的输出对于

浏览 3提问于2021-11-19得票数 1

1回答

Tensorflow / Keras -使用ModelCheckpoint: save_best_only和EarlyStopping: restore_best_weights

machine-learning、neural-network、keras、tensorflow、early-stopping

ModelCheckpointrestore_best_weights:是否以监测量的最佳值从时代恢复模型权重。如果是假的，则使用训练的最后一步得到的模型

浏览 0提问于2023-02-02得票数 0

回答已采纳

2回答

如何对train_test_split从pandas.DataFrame创建的numpy数组中缺少的值进行推断？

pandas、cross-validation、scikit-learn

我正在使用sklearn和pandas.DataFrame处理大量NA值的数据集。对于基于dataFrame的列名的不同列，我实现了不同的估算策略。例如，NAs预测器'var1' I用0's计算，'var2'用平均值计算。当我试图使用train_test_split交叉验证我的模型时，它会返回一个没有列名的nparray。我不会把丢失的值计算在原始数据集中，然后再故意分割，所以我会分别保存测试集和验证集。

浏览 0提问于2014-08-06得票数 2

回答已采纳

1回答

如何在spark中缓存随机森林模型

apache-spark、machine-learning、random-forest

现在我有了大约100个随机森林多分类模型，我已经将它们保存在HDFS.There中--这些数据集也保存在HDFS中。我想用相应的model.If来预测数据集，模型和数据集都缓存在内存中，预测速度会快10倍以上。谢谢!

浏览 1提问于2018-05-27得票数 1

回答已采纳

1回答

在tensorflow 2.0中计算每个组的AUC

python、tensorflow、auc

我们有一个简单的数据集users U & of items I & binary outcomes Y。数据集很大(10万个用户，1000万个项目，15亿次交互)，并按时间顺序排序。我们正在训练一些模型，比如说一个简单的MF模型，它给出了预测f(U, I) = Yhat。当训练完成后，我们希望在曲线pér项下有一个面积。因此，我们希望有一个项目i到AUC的映射。真正起作用的是为每个项目保存另一个数据集并进行预测，保存

浏览 107提问于2021-07-08得票数 2

1回答

如何使用tensorflow模型检查点将tensorflow模型保存为.h5格式？

tensorflow、deep-learning、python-3.5

我已经成功地使用python flask进行了训练、测试和预测。但为了每次进行预测，我必须再次使用检查点加载完整的模型。如果我保存模型.h5格式，我不需要加载数据集来预测数据集。我不知道如何使用检查点将tensorflow模型保存为.h5格式。如果有人知道如何做，请帮助我或转发给我任何链接，如果可能的话。谢谢。

浏览 1提问于2019-04-06得票数 1

1回答

在MXnet中使用自定义Iterator时，如何预测测试集的标签？

r、image-processing、deep-learning、mxnet

我有一个大数据集(大约20 2GB用于培训，2GB用于测试)，我想使用MXnet和R。由于内存不足，我搜索迭代器来加载由自定义迭代器设置的培训和测试集，并找到了解决方案。现在，我可以使用本页上的代码对模型进行培训，但问题是，如果我使用保存迭代器读取测试集，如下所示： test.iter <- CustomCSVIter$new(iter = NULL, data.csv= "test.csv", data.shape = 480, batch.size = batch.size)

浏览 2提问于2017-04-28得票数 0

回答已采纳

4回答

用保存的火花模型评价新数据

scala、apache-spark、apache-spark-mllib

我成功地构建了将数据转换为LibSVM文件的过程，并在Spark的MLlib包中对决策树模型进行了培训。MSE和学习树模型。，并让它预测标签？:0.0 7:0.0 8:0.0 9:0.0 10:0.0 11:0.0 12:0 13:0 14:0 15:6 16:7根据以下建议，我正在尝试使用预测函数如果我给它一个'0‘值，那么他们都返回为'0.0'，所以似乎没有什么东西是正确的预测。

浏览 2提问于2017-08-31得票数 3

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

保存预测模型而不保存原始数据集

相关·内容

保存预测模型而不保存原始数据集

用预训练分类模型预测数据

使用Pickle文件预测数据

SPSS自动线性回归-运行最佳函数

利用星火mlLib构建协同过滤推荐引擎

使用经过训练的ML模型作为服务进行预测的同时进行特征工程

如何解决加载模型以获得新预测的问题？

如何使用经过训练的神经网络模型？

将机器学习预测链接回原始数据集

如何在KnowledgeFlow中使用TimeSeriesForecasting？

如何在ML中保存特征工程模型

基于部分名称的变量选择

给定值的预测间隔不在SAS的数据集中

Tensorflow / Keras -使用ModelCheckpoint: save_best_only和EarlyStopping: restore_best_weights

如何对train_test_split从pandas.DataFrame创建的numpy数组中缺少的值进行推断？

如何在spark中缓存随机森林模型

在tensorflow 2.0中计算每个组的AUC

如何使用tensorflow模型检查点将tensorflow模型保存为.h5格式？

在MXnet中使用自定义Iterator时，如何预测测试集的标签？

用保存的火花模型评价新数据

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐