resampling - 腾讯云开发者社区

python、class、machine-learning、deep-learning、pytorch

if sample_rate != sr: waveform = torchaudio.transforms.Resample(sample_rate, sr)(waveform) sample_rate = sr 我想知道这里的Resamle是怎么工作的。所以看看torchaudio的文档。我以为会有__call__函数。因为重采样被用作函数。我是说那个Resample()(waveform)。但在内部，只有__init__和forward函数。我认为forward函数是工作函数，但我不知道为什么它被命名为'forward‘而不是__call__。我遗

浏览 4提问于2020-08-19得票数 2

1回答

如何为嵌套超参数调整的内循环设置固定的随机种子？

mlr

我正在尝试使用嵌套的交叉验证进行超参数调优。这是我对两个学习者lrn1和lrn2的内部循环： inner = makeResampleDesc("CV", iters = 3L) tune_lrn1 <- makeTuneWrapper(lrn1, resampling = inner, par.set = ps, control = ctrl) tune_lrn2 <- makeTuneWrapper(lrn2, resampling = inner, par.set = ps, control = ctrl) 有没有办法在每次实例化“内部”之前设置随机种子的

浏览 1提问于2019-04-26得票数 0

2回答

学习者基准比较的结果取决于重采样的实例化。我该如何解释这个问题呢？

machine-learning、resampling、mlr3

我运行下面的代码。如果我停用实例化(如图所示)，我的基准测试比较结果将不同于三个基准测试实验，并且哪个学习者表现更好的结论可能会不同。我如何解决这个问题？一种方法可能是对大量的重采样进行平均。我可以为此编写代码，但当调用"benchmark“时，这可能已经是一个选项了？ resampling = rsmp("cv", folds=20) #resampling$instantiate(task) # results below will (and shall) differ, if instantiation is not performed here de

浏览 30提问于2021-04-20得票数 0

回答已采纳

1回答

如何使用嵌套超参数优化在mlr3中测试我们的模型

mlr3

我刚刚开始学习mlr3，并且已经读过mlr3的书(参数优化)。在书中，他们提供了一个嵌套超参数的例子，但我不知道如何提供最终的预测，即预测(模型，测试数据)。以下代码提供了learner、task、内部重采样(holdout)、外部重采样(3倍CV)和网格搜索来进行调整。我的问题是： (1) Dont we need to train the optimized model i.e. at in this case like train(at, task) ? (2) After train, how to predict the data with test data as I am n

浏览 34提问于2020-12-16得票数 0

1回答

错误：“使用mlr3优化参数”消息

hyperparameters、mlr3

我使用参数优化(随机搜索)与mlr3，但它给了我以下错误。我也尝试过其他型号(kknn)，但同样的错误也出现了。 Error: Resampling 'cv' may not be instantiated ///My code is here data = readARFF("xerces.arff") index= sample(1:nrow(data), 0.7*nrow(data)) train= data[index,] test= data[-index,] task = TaskRegr$new("data", backend

浏览 5提问于2022-05-28得票数 0

3回答

带样本函数的过采样

r、sample、resampling

我想创建一个mtcars数据集，其中所有的圆柱都有100个观测。为此，我将用替换现有的观察结果作为样本。我尝试了以下代码，由于某种原因，它不会产生300个观察结果。 library(data.table) mtcars <- data.table(mtcars) resampling <- list() set.seed(3) cyl <- sort(unique(as.character(mtcars$cyl))) for (i in 1:length(cyl)){ min_obs_cyl <- 100 dat_cyl <- mtcars[cyl

浏览 7提问于2018-10-15得票数 1

回答已采纳

1回答

如何确定哪一种褶皱最终被用作简历中的测试？

r、mlr

如何确定在mlr包中哪一种折叠最终被用作测试，哪种折叠作为5倍交叉验证中的培训？方法$resampling$train.inds和$resampling$test.inds在没有最终达到训练和测试目的的信息的情况下返回全部5倍。 library("mlr") regr_task = makeRegrTask(data = mtcars, target = "hp") learner = makeLearner("regr.ranger", importance = "impurity"

浏览 9提问于2019-10-09得票数 1

回答已采纳

1回答

mlr3:在优化模型(即AutoTuner对象)中使用benchmark()

benchmarking、hyperparameters、mlr3

我想比较几种机器学习算法的性能(例如，rpart、xgb、.的决策树)。包括他们使用mlr3进行的超参数调整。换句话说，我想比较已经调优的不同算法的实例，而不是算法的默认超参数值。 mlr3提供自动调谐器对象来执行嵌套重采样和超参数调优.还有一个基准()函数来对几个学习者进行比较。benchmark()函数依次使用benchmark_grid()来设置基准测试。根据，可以将“AutoTuner对象传递给mlr3 3：：resample()或mlr3 3：：AutoTuner()”。我不明白如何将AutoTuner对象传递给benchmark_grid()。以下代码(根据中的代码对优化的决策树

浏览 10提问于2021-08-17得票数 0

回答已采纳

1回答

如何预测`tune_nested`之后的新数据集？

mlr3

# retrieve task task = tsk("pima") # load learner and set search space learner = lrn("classif.rpart", cp = to_tune(1e-04, 1e-1, logscale = TRUE)) # nested resampling rr = tune_nested( method = "random_search", task = task, learner = learner, inner_resampling = rsmp

浏览 4提问于2022-02-18得票数 1

1回答

是否可以从重采样结果中获得对训练数据的预测？

mlr3

执行下面的代码后，可以使用rr$predictions()[[1]]获得测试分区上的预测。但是，有可能获得训练分区上的预测吗？ task = tsk("penguins") learner = lrn("classif.rpart") resampling = rsmp("holdout") rr = resample(task, learner, resampling) 谢谢!

浏览 15提问于2021-08-17得票数 0

回答已采纳

1回答

在插入符号中拟合bartMachine获取长度为零/维数不正确的参数

r、machine-learning、r-caret、bartmachine

我正在尝试在Caret中模拟bartMachine使用的一个很好的例子，但我似乎不能用Caret正确地模拟bartMachine，谁能告诉我，主要的错误到底是什么？或者，BART建模有简单的可重现的代码吗？下面是我使用HouseVotes84和cars数据集的一些虚拟数据对bartMachine进行建模的代码片段： library(mlbench) library(caret) data("HouseVotes84") #Using HouseVotes84 as Classification Task Dataset and mtcars as Regression T

浏览 32提问于2020-07-17得票数 3

回答已采纳

1回答

mlr3、基准测试和嵌套重采样:如何从基准对象中提取调优模型以计算特性重要性

r、xgboost、feature-selection、hyperparameters、mlr3

我正在使用mlr3中的benchmark()函数来比较几种ML算法。其中之一是带有超参数调优的XGB。因此，我有一个外部重采样来评估总体性能(保持样本)和内部重采样用于超参数调整(5倍交叉验证)。除了对所有ML算法的准确性进行估计外，我还希望看到调优的XGB特性的重要性。为此，我必须访问调优模型(在基准测试对象中)。我不知道怎么做。benchmark()返回的对象是一个深嵌套的列表，我不理解它的结构。这个没有帮助我，因为它使用的是不同的设置(在管道中学习，而不是基准对象)。这个没有帮助我，因为它展示了如何一次提取关于基准测试的所有信息，而不是如何提取基准测试中的一个学习者的一个(调优)模型

浏览 5提问于2021-11-03得票数 0

回答已采纳

1回答

置换重采样

r、sampling、statistics-bootstrap

我正在尝试获取我的模型的(引导)输入数据。源文件： library("dplyr") library("readr") library("reshape2") library("ggplot2") sub <- read_csv("EddyData_2010.csv", col_types = list(col_integer(), col_integer(), col_double(), col_doub

浏览 2提问于2015-10-14得票数 1

回答已采纳

1回答

如何在嵌套交叉验证中转换“2级ParamUty”类？

r、machine-learning、mlr3

在生存分析方面，我使用了R. 我的数据集包括39个特性(连续和因子，我将其全部转换为整数和数字)和目标(时间和状态)。我想调优超参数: num_nodes，在Param_set中。这是一个默认值为32,32的32,32类参数。所以我决定改变它。我编写了以下代码，用于使用“嵌套交叉验证”优化surv.deephit学习者的超参数(10个内折叠和3个外折叠)。 #task definition task.mlr <- TaskSurv$new(id = "id", backend = main.dataset, event = 'status', ti

浏览 0提问于2021-04-16得票数 1

回答已采纳

1回答

在IndentationError中使用gdalwarp重采样:意外缩进

python、bash、resampling、sentinel2

我处理Sentinel2图像，并试图重新整理它们。我尝试了以下代码： import os, fnmatch INPUT_FOLDER = "/d/afavro/Bureau/test_resampling/original" OUTPUT_FOLDER = "/d/afavro/Bureau/test_resampling/resampling_10m" def findRasters (path, filter): for root, dirs, files in os.walk(path): for fi

浏览 1提问于2019-04-24得票数 2

回答已采纳

1回答

以参数作为数据格式的多处理

python、multiprocessing、python-multiprocessing

我有一个名为list1的列表，其中包含5个数据格式。我想把这些数据并发地传递给一个函数，它将计算一些数学计算。我在为下面的代码而挣扎- import multiprocessing import pandas as pd tcn=[df1,df2,df3,df4,df5] def resampling(tick): data_k = tick['price'].resample('1Min').ohlc() return data_k if __name__ == '__main__': with mul

浏览 4提问于2020-08-15得票数 0

回答已采纳

1回答

nnet中的参数优化

我使用以下R代码来训练我的数据 >mygrid = expand.grid(.decay=seq(0.01,0.1,0.01), .size=c(10:20)) >set.seed(25000) >nnetfit = train(logprice ~ ., data=traindata, method="nnet", maxit=5000, #max number of iteration

浏览 0提问于2018-04-15得票数 0

回答已采纳

1回答

重采样图像rasterio/gdal，Python

python、gis、raster、gdal、rasterio

如何使用双线性插值对单频带GeoTIFF进行重采样？ import os import rasterio from rasterio.enums import Resampling from rasterio.plot import show,show_hist import numpy as np if __name__ == "__main__": input_Dir = 'sample.tif' #src = rasterio.open(input_Dir) #show(src,cmap="magma&#

浏览 72提问于2020-07-20得票数 0

1回答

sbf()是否使用度量参数来优化模型？

r、machine-learning、classification、r-caret、rfe

将ROC作为metric参数值传递给caretSBF函数我们的目标是使用ROC摘要度量来进行模型选择，同时通过过滤sbf()函数来进行特征选择。将BreastCancer数据集用作mlbench包中的可复制示例，以便使用metric = "Accuracy"和metric = "ROC"运行train()和sbf()。我们希望确保sbf()接受train()和rfe()函数应用的metric参数来优化模型。为此，我们计划使用train()函数和sbf()函数。caretSBF$fit函数调用train()，caretSBF被传递给sbfControl。从

浏览 2提问于2016-10-07得票数 1

回答已采纳

1回答

为什么相同的机型运行两次，mlr包的性能指标会不一样？

r、mlr

当我连续运行这段代码两次时，我得到了两个不同的性能指标？我不确定我是否理解为什么会发生这种情况，因为我使用的是相同的训练和测试集。我也在一开始就埋下了种子。 set.seed(42) data(BostonHousing, package = "mlbench") regr.task = makeRegrTask(id = "bh", data = BostonHousing, target = "medv") lrn = makeLearner("regr.ctree") outer=makeResampleInstance

浏览 0提问于2019-08-19得票数 1

1回答

光栅重采样-网格间距的简单修正

python、geopandas、rasterio

我正在使用Python的rasterio重采样光栅数据。查看rasterio.enums.Resampling类，似乎唯一的方法是在相邻的栅格网格之间进行插值，实质上是平滑数据。有什么方法可以简单地重采样，有效地将一个栅格网格划分成多个，并保留所有子网格的原始值？我的重采样脚本如下--目前使用的是双线性方法： with rasterio.open(str(rasterpath+filename), crs="EPSG:4326") as src: data = src.read( out_shape=( src.count,

浏览 3提问于2021-06-03得票数 0

回答已采纳

1回答

如何对不同大小的不同任务使用自定义重采样，尊重时间顺序？

r、resampling、mlr3

我有一些任务，其中行有时间顺序(例如，每月数据)。我想执行"loo“类型的重采样，但培训数据必须总是早于测试数据。因此，我所做的是以以下方式生成自定义重采样： # Instantiate Resampling resampling_backtest = rsmp("custom") train_sets = list(1:30) # n.b. we just deliberately call the list of splits "train_sets" and "test_sets" test_sets = list(31)

浏览 1提问于2021-11-18得票数 0

回答已采纳

1回答

插补训练公式与非公式的不同效果

r、random-forest、r-caret

我注意到在训练中使用公式法和非公式法会产生不同的效果。此外，公式法所需时间几乎是非公式法所需时间的10倍。这是意料之中吗？ > z <- data.table(c1=sample(1:1000,1000, replace=T), c2=as.factor(sample(LETTERS, 1000, replace=T))) # SYSTEM TIME WITH FORMULA METHOD # ------------------------------- > system.time(r <- train(c1 ~ ., z, method="rf"

浏览 2提问于2014-03-05得票数 5

回答已采纳

4回答

Python (图像库)：将字符串重采样为参数

python、python-imaging-library

Python初学者问题。下面的代码应该可以解释我的问题： import Image resolution = (200,500) scaler = "Image.ANTIALIAS" im = Image.open("/home/user/Photos/DSC00320.JPG") im.resize(resolution , scaler) 结果： Traceback (most recent call last): File "<stdin>", line 1, in <module> File "

浏览 2提问于2009-09-02得票数 3

1回答

MLR -使用嵌套重采样的基准实验。如何访问内部重采样调优结果？

r、machine-learning、mlr

我正在对一项任务使用基准实验。我使用的是嵌套重采样策略()。我使用内部重采样策略创建了一个学习器。例如，下面是一个用于c50的粗略代码： ### C50 ############################################################################################################################ classif_c50 = makeLearner("classif.C50", predict.type="prob") ##The wrappers are

浏览 11提问于2018-02-13得票数 2

回答已采纳

2回答

C++：从main()调用模板化函数

c++、templates、gcc、undefined-reference

这是我第一次尝试在我的函数中使用模板，但我似乎无法使它们工作。我在一个名为ddc.hpp的文件中定义了函数 #ifndef __DIGITAL_DOWN_CONVERTER_H__ #define __DIGITAL_DOWN_CONVERTER_H__ namespace ddc { template <class T> void perform_resampling(std::vector<T> &, unsigned int, unsigned int); } #endif 并用ddc.cpp实现了它 #include "ddc.hpp&#

浏览 1提问于2013-05-26得票数 0

回答已采纳

1回答

使用mlr的嵌套重采样+ LASSO (regr.cvglment)

r、resampling、lasso-regression、mlr

我试图使用regr.cvglment对10个内部CVs和10个外部循环CVs进行嵌套重采样。Mlr使用包装器函数()提供代码。现在，我从他们提供的代码中交换了两样东西: 1) "regr.cvglmnet“，而不是支持向量机(ksvm) 2)内循环和外循环的迭代次数。在lrn函数之后，我得到下面指定的错误。有人能给我解释一下吗？我对编码和机器学习完全陌生，所以我可能在代码中做了一些很愚蠢的事情. ps = makeParamSet( makeDiscreteParam("C", values = 2^(-12:12)), makeDiscreteParam(

浏览 0提问于2018-06-22得票数 4

回答已采纳

1回答

不进行一次热编码的SMOTENC过采样

one-hot-encoding、imbalanced-data、catboost、oversampling、smotenc

我使用SMOTENC对不平衡的数据集进行过采样。我认为SMOTENC的目的是给出对分类特性进行过度采样的选项-- without一个热编码它们。我不想使用一个热编码的原因是为了避免维度的诅咒，让CatBoost通过使用池级定义分类特征来处理分类特征。但是，当试图使用SMOTENC进行过度采样时，我仍然会得到以下错误： could not convert string to float 首先，我对我的数字和分类特征进行了一些预处理。预处理 numerical_transformer = Pipeline( steps=[ (

浏览 0提问于2023-02-17得票数 0

3回答

C++：命名空间中函数的未定义引用

c++、g++、undefined-reference

我在这里，试图找出我的代码出了什么问题，但没有成功:(我正在编写一个重放程序，但我想这一点都没有意义，我只是想让这个愚蠢的警告消失。)总之，这是我的密码： ddc.hpp #ifndef __DIGITAL_DOWN_CONVERTER_H__ #define __DIGITAL_DOWN_CONVERTER_H__ #include <vector> #include "interpolator.h" namespace ddc { void decimate(std::vector<float> &, unsigned int);

浏览 0提问于2013-05-22得票数 7

回答已采纳

1回答

精确度SD未显示在R中

r、r-caret

我尝试遵循https://machinelearningmastery.com/tune-machine-learning-algorithms-in-r/的示例代码，但我的输出没有显示准确性和kappa sd。我遗漏了什么？我的插入符库在Windows10专业版上是3.5.2。我的输出是： Random Forest 208 samples 60 predictor 2 classes: 'M', 'R' No pre-processing Resampling: Cross-Validated (10 fold, repeated 3 ti

浏览 20提问于2019-01-29得票数 1

回答已采纳

1回答

错误:不是可识别的重采样方法

r、resampling、imbalanced-data

我在运行模型来平衡我的数据帧时遇到了问题。它告诉我你不认识重采样的方法。我做什么好？ > # Criando funcao controle para o treino > ctrl <- trainControl(method = "repeateadcv", + number = 10, + repeats = 5, + summaryFunction = twoClassSummary, +

浏览 18提问于2021-11-30得票数 0

1回答

集成模型预测AUC 1

r、r-caret、xgboost、auc、ensemble-learning

我试图把三个模型组合成一个整体模型：型号1- XGBoost 型号2- RandomForest 模型3- Logistic回归注意:这里的所有代码都使用插入包的train()函数。 > Bayes_model No pre-processing Resampling: Cross-Validated (10 fold) Summary of sample sizes: 75305, 75305, 75306, 75305, 75306, 75307, ... Resampling results: ROC Sens Spec 0.

浏览 0提问于2017-07-14得票数 2

回答已采纳

1回答

R --我可以将插入符号中的训练函数应用于数据帧列表吗？

r、machine-learning、r-caret、mapply

我正在使用优秀的R包，插入符号，并且我想在多个训练数据集的列表上运行训练函数。现在，我意识到train函数的文档说data参数必须是一个数据框，所以我尝试做的事情可能是不可能的，这可能更好地建议作为对脱字符的增强，但我想看看是否有人尝试过这样做。出于说明的目的，我使用Sonar数据创建了一个由两个数据帧组成的列表(命名为both)，每个数据帧都是一个单独的训练数据集。然后，我使用mapply将train函数应用于列表中的每个元素。不幸的是，我得到了可怕的结果。具体地说，我希望pls1.3..A[2]中的指标与pls1.3..B2中的指标相同。正如您所看到的，它们不是。奇怪的是，请1.3..A

浏览 2提问于2015-05-31得票数 1

1回答

auc在mlr基准实验中给出了错误(要求预测类型为：'prob')

r、resampling、auc、mlr

我正在使用mlr包进行基准分析，并希望使用auc作为性能度量。我已经指定了predict.type = "prob"，并且仍然收到以下错误消息： 0001: Error in FUN(X[[i]], ...) : Measure auc requires predict type to be: 'prob'! 我的代码： #define measures meas <- list(acc, mlr::auc, brier) ##random forest p_length <- ncol(training_complete) - 1 lrn_

浏览 0提问于2018-10-22得票数 0

回答已采纳

1回答

如何用concurrent.futures来利用python多处理的所有核心？

python、multithreading、multiprocessing

我正在编写一个简单的脚本来对图像数据集进行一些预处理，这涉及到调整大小和添加过滤器。这是我的代码： def preprocessing(tar_ratio, img_paths, label_paths, save_dir="output", resampling_mode=None): # with concurrent.futures.ThreadPoolExecutor() as executor: with concurrent.futures.ProcessPoolExecutor() as executor:

浏览 0提问于2022-10-08得票数 0

1回答

将指标添加到插入符号包的默认train()输出中

r、r-caret

我想在我用插入符号包创建的线性模型的输出中添加RMSE和Rsquared以外的其他指标。据我所知，下面的代码将输出反复交叉验证的RMSE和Rsquared： library(caret) lm_reg1 <- train(log1p(mpg) ~ log1p(hp) + log1p(disp), data = mtcars, trControl = trainControl(method = "repeatedcv", n

浏览 0提问于2016-08-18得票数 0

回答已采纳

1回答

安装oily_png时生成本机扩展失败

ruby、rubygems、devkit

我很难安装Ruby项目所需的gem (基于Cucumber和SitePrism的自动化测试，但我认为这与此无关)。输出提示了本机扩展的问题，但我确实安装了devkit，并且以前使用它时没有遇到任何麻烦。 $ gem install oily_png -v '1.1.2' Temporarily enhancing PATH to include DevKit... Building native extensions. This could take a while... ERROR: Error installing oily_png: ERROR: F

浏览 3提问于2015-05-01得票数 0

回答已采纳

1回答

如何解释mlr3中嵌套重采样的聚合性能结果？

r、resampling、hyperparameters、mlr3

最近，我正在学习mlr3包中的嵌套重采样。根据mlr3的书，嵌套重采样的目标是为学习者获得一个无偏的性能评估。我进行了如下测试： # loading packages library(mlr3) library(paradox) library(mlr3tuning) # setting tune_grid tune_grid <- ParamSet$new( list( ParamInt$new("mtry", lower = 1, upper = 15), ParamInt$new("num.trees", lower = 50, upp

浏览 1提问于2021-02-20得票数 1

回答已采纳

1回答

为什么RSquared在k-折叠交叉验证中随折叠数的增加而增加？

machine-learning、cross-validation、r-caret

我正在调整一个使用k折叠交叉验证的模型，并注意到RSquared的准确性似乎随着折叠数的增加而提高--例如，与使用10倍相比，使用30倍时的RSquared值更高。我希望对两个问题有所了解：为什么会发生这种情况？是否有理由相信RSquared for k=10比使用k=30更好地估计模型的准确性？或者，它们都与我在一个看不见的测试集上可以预期的未来错误率无关吗？下面是我所指的效果的一个简单例子： ############### k = 10 ##################### > data(iris) > train_control <- tr

浏览 5提问于2015-10-10得票数 0

1回答

插入训练如何确定概率阈值以最大限度地提高特异性？

r、r-caret

我使用插入符号的twoClassSummary函数来确定最优的模型超参数，以最大限度地提高的特异性。然而，该函数如何确定最大特异性的概率阈值？对于每个模型，是否从本质上来说，超参数/折叠计算0到1之间的每个阈值，并返回最大的特异性？在下面的示例中，您可以看到模型已经降落在cp = 0.01492537上。 # load libraries library(caret) library(mlbench) # load the dataset data(PimaIndiansDiabetes) # prepare resampling method control <- trainCont

浏览 1提问于2017-08-18得票数 4

回答已采纳

1回答

ArcGIS光栅金字塔的Rasterio版本

python、raster、arcgis、gdal、rasterio

在ArcGIS中，当您加载一个栅格时，您可以选择构建金字塔。就像这样：我发现可以使用以下Python代码和Rasterio库复制这些文件： import rasterio from rasterio.warp import Resampling with rasterio.Env(TIFF_USE_OVR=True): with rasterio.open('new_new.tif', "w", **meta_data) as dest: dest.write(raster_data) overviews

浏览 0提问于2019-07-12得票数 1

2回答

使用插入符号包进行交叉验证的最终模型

r、classification、random-forest、cross-validation、r-caret

我在卡雷特软件包中用随机森林方法对我的数据进行了交叉验证，R说最后的模型是用mtry=34建立的，这是否意味着在最终的随机森林(交叉验证)中，我的数据集中的参数中只有34个变量被用来分割树？ > output Random Forest 375 samples 592 predictors 2 classes: 'alzheimer', 'control' No pre-processing Resampling: Cross-Validated (3 fold) Summary of sample sizes: 250,

浏览 0提问于2018-02-05得票数 2

回答已采纳

1回答

mlr3简单问题。如何设置固定的超参数值？

mlr3

希望是一个简单的问题，但令人难以置信的是，在mlr3的书中缺少信息！因此，我有一个调优学习者(regr.bart)，我想简单地将一个超参数设置为一个固定的(而不是调优的)值。问题中的对白是“冗长的”，令人恼火的是，它被设置为真，所以我会被我不想要的愚蠢信息淹没。我找不到一个简单的示例，可以将详细设置为FALSE。请帮帮忙。

浏览 6提问于2021-12-17得票数 0

1回答

R中带有Caret的朴素贝叶斯分类器的整定

r、r-caret、naivebayes

我用下面的代码训练一个模型，但是，我找不出如何更改调整器，因为FL和调整器一直保持在特定的值。 Activity_nb <- train(Actx, Acty,data = Dact, method = "nb", trControl = myc1,metric = "Accuracy",importance = TRUE) Naive Bayes 2694 samples 4 predictor 4 classes: 'CC', 'CE', 'CW', 'HA' No pre-p

浏览 1提问于2017-02-15得票数 0

回答已采纳

1回答

使用evaluate!()时出现MLJ预测类型确定性错误

machine-learning、julia

我在MLJ运行evaluate!()命令时遇到了问题。我正在使用多项式朴素贝叶斯分类器对一堆推文中的情绪进行分类。当我像这样运行单个案例时，它运行得很好， using MLJ X = coerce(wordCountVec,Count) y = coerce(data.sentiment_labels, Multiclass) train_idx,test_idx = partition(eachindex(y), 0.7,shuffle = true) nb_m = @load MultinomialNBClassifier pkg = "NaiveBayes"

浏览 23提问于2021-01-28得票数 3

1回答

mlr遗传算法初始种群的选择

r、genetic-algorithm、mlr

我想从mlr包中选择带有makeFeatSelControlGA()函数的遗传算法的初始种群。是可行的吗？编辑由于它没有实现，为此，我对selectFeaturesGA函数进行了肮脏的编辑。这是代码，如果对任何人有帮助的话。 library(R.utils) reassignInPackage("selectFeaturesGA","mlr",function (learner, task, resampling, measures, bit.names, bits.to.features,

浏览 0提问于2019-05-17得票数 0

回答已采纳

1回答

如何在mlr3调优过程中使用nloptr时添加梯度函数

r、nonlinear-optimization、mlr3

在mlr3调优步骤中，我尝试使用bfgs作为优化问题的求解器。我检查了文档，以了解如何添加求解程序所需的渐变。虽然我能够将它添加到纯nloptr中，但我无法在bbotk或mlr3级别上这样做。一个极小的例子说明了我的意思： library(mlr3) library(paradox) library(mlr3tuning) inner_resampling = rsmp("cv", folds = 5) terminator <- trm("evals",n_evals = 10) tsk <- tsk("pima") learn

浏览 5提问于2022-02-23得票数 2

1回答

如果我使用“保持”重采样，如何访问列车集的度量(例如：“classif.acc”或其他度量)？

r、mlr3

我正在学习R中用于机器学习的mlr3包。我使用“保持”重采样将数据分成训练集和测试集，我如何才能获得训练集的度量？即使我将"predict_set“指定为"train”，它似乎也只给出了测试集的度量。 > library(mlr3) > task <- tsk("iris") > learner <- lrn("classif.rpart") > rs <- rsmp("holdout") > rr <- resample(task, learner, rs) INFO [

浏览 30提问于2020-10-22得票数 1

1回答

如何在插入符号中计算95% CI的准确性和kappa

r、random-forest、r-caret、confidence-interval、cohen-kappa

我正在使用插入符号包运行k倍重复训练，并希望计算我的准确性指标的置信区间。本教程打印一个插入符号训练对象，该对象显示准确性/kappa指标和相关的SD：。然而，当我这样做时，所有列出的都是度量平均值。 control <- trainControl(method="repeatedcv", number=10, repeats=3, search="grid") set.seed(12345) tunegrid <- expand.grid(.mtry=4) rf_gridsearch <- train(as.factor(gear)~., d

浏览 24提问于2021-03-01得票数 2

回答已采纳

1回答

mrl3集成模型中的重复cv

r、mlr3

我有一个用于二进制预测的漂亮的mlr3集成模型(结合了glmnet和glm)，请参阅详细信息here library("mlr3verse") library("dplyr") # get example data data(PimaIndiansDiabetes, package="mlbench") data <- PimaIndiansDiabetes # add an additional predictor "superdoc" which is not entered in the glmnet but i

浏览 28提问于2021-03-21得票数 1

回答已采纳