首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

VBA实战技巧04: 一个用于两个列表区域比较自定义函数

目的 在Excel中,经常会碰到比较两个列表问题,以查看列表中不同项目。...实现 下面的VBA用户自定义函数(UDF)——IsInList2调用了6个方法: 1.对LookIn列表进行排序并使用二分搜索来比较LookFor列表中项目 2.在LookIn列表中使用线性搜索LookFor...为简单起见,该函数假设两个列表都是至少包含2个项目的区域,因此,第一个任务是从区域中获取值到变体数组。然后,创建输出数组为调用单元格和LookFor列表较小者。...接着,如果完全匹配,则数据被排序,添加到集合或字典。随后,该函数使用适当过程方法遍历LookFor列表,并将结果存储到输出数组中。...,但进行排序 '=1 数据已排序 - 使用二分搜索 '=-1 使用线性搜索 '=2 使用集合 '=3 使用字典 Dim nLookFor As Long

1.2K10
您找到你想要的搜索结果了吗?
是的
没有找到

基于Google Earth Engine云平台构建多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP

在此,我们采用最优 ML 方法,使用单一输入数据类型构建不同森林 AGB 模型,并构建多源遥感变量与最优单一变量进行比较。...本文发现,GBDT 方法具有更高森林 AGB 预测精度,尤其是当训练数据样本点数量较多时。...通过比较不同变量组合建立生物量模型,结果表明变量数量与模型精度并无直接关系,两个变量组合模型精度优于三个或更多变量组合模型。...相比之下,针叶林大多分布在人烟稀少高海拔地区,这增加了森林资源清查数据收集难度,也是本研究用于训练和验证样本量有限原因。...森林生物量预测应用程序以上述应用程序为基础,但对其进行了扩展,允许用户使用本分析中使用 30 种多源变量组合选择不同 ML 方法进行生物量模型预测,并可在线比较森林 AGB 估计值和准确性(即 R2

28210

【ML】一文详尽系列之模型评估指标

添加描述 优缺点 MSE、RMSE、MAE、R^2 主要用于回归模型。...添加描述 通过以上证明我们可以看出来,余弦距离是不满足距离定义。 优缺点 我们知道余弦相似度关注两个向量之间角度关系,并不关心其绝对大小。...t 检验 也称学生检验,主要用于样本含量较小(例如 n<30),总体标准差 σ 未知正态分布。目的在于比较样本均数,所代表未知总体均数 μ 和已知总体均数 μ 比较。...z 检验 z 检验是一般用于样本(即样本容量大于 30)平均值差异性检验方法。它是用标准正态分布理论来推断差异发生概率,从而比较两个平均数差异是否显著。...卡方检验 前两个都是正态分布检验,卡方检验属于非参数检验。主要是比较两个两个以上样本率(构成比)以及两个分类变量关联性分析。其根本思想就是在于比较理论频数和实际频数吻合程度问题。

81420

【机器学习】一文详尽系列之模型评估指标

准确率、精确率、召回率、F1值 定义 准确率(Accuracy):正确分类样本个数占总样本个数, 精确率(Precision):预测正确正例数据占预测为正例数据比例, 召回率(Recall):预测为正确正例数据占实际为正例数据比例...MSE 和 RMSE 可以很好反应回归模型预测值和真实值偏离成都,但如果存在个别离群点偏离程度非常大时,即使其数量非常少也会使得RMSE指标变差(因为用了平方)。...t 检验 也称学生检验,主要用于样本含量较小(例如 n<30),总体标准差 σ 未知正态分布。目的在于比较样本均数,所代表未知总体均数 μ 和已知总体均数 μ 比较。...z 检验 z 检验是一般用于样本(即样本容量大于 30)平均值差异性检验方法。它是用标准正态分布理论来推断差异发生概率,从而比较两个平均数差异是否显著。...卡方检验 前两个都是正态分布检验,卡方检验属于非参数检验。主要是比较两个两个以上样本率(构成比)以及两个分类变量关联性分析。其根本思想就是在于比较理论频数和实际频数吻合程度问题。

67020

一文详尽系列之模型评估指标

准确率、精确率、召回率、F1值 定义 准确率(Accuracy):正确分类样本个数占总样本个数, 精确率(Precision):预测正确正例数据占预测为正例数据比例, 召回率(Recall):预测为正确正例数据占实际为正例数据比例...MSE 和 RMSE 可以很好反应回归模型预测值和真实值偏离成都,但如果存在个别离群点偏离程度非常大时,即使其数量非常少也会使得RMSE指标变差(因为用了平方)。...t 检验 也称学生检验,主要用于样本含量较小(例如 n<30),总体标准差 σ 未知正态分布。目的在于比较样本均数,所代表未知总体均数 μ 和已知总体均数 μ 比较。...z 检验 z 检验是一般用于样本(即样本容量大于 30)平均值差异性检验方法。它是用标准正态分布理论来推断差异发生概率,从而比较两个平均数差异是否显著。...卡方检验 前两个都是正态分布检验,卡方检验属于非参数检验。主要是比较两个两个以上样本率(构成比)以及两个分类变量关联性分析。其根本思想就是在于比较理论频数和实际频数吻合程度问题。

1.6K11

R语言结合新冠疫情COVID-19股票价格预测:ARIMA,KNN和神经网络时间序列分析

对于COVID-19之后数据集,KPSS测试给出p值为 0.01,该值小于0.05,这说明时间序列数据 不是平稳。 因此,我们可以从以上两个测试得出结论,时间序列数据 不是平稳。...这项研究目的是说明不同预测工具,对其进行比较并分析预测行为。在我们KNN研究之后,我们提出可以将其用于分类和回归问题。...尽管没有用于计算隐藏层数特定方法,但时间序列预测遵循最常见方法是通过计算使用以下公式: 其中Ns:训练样本数Ni:输入神经元数No:输出神经元数a:1.5 ^ -10 #隐藏层创建 hn\_before...: accuracy accuracy ---- 8.所有模型比较 现在,我们使用参数诸如RMSE(均方根误差),MAE(均值绝对误差)和MAPE(均值绝对百分比误差)对所有三个模型进行分析 。...1.0 KNN 45.9 35.7 3.3 神经网络 14.7 9.8 1.0 因此,从以上模型性能参数总结中,我们可以看到神经网络模型在两个数据集上性能均优于ARIMA和KNN模型。

1.4K30

【机器学习】一文详尽介绍模型评估指标

准确率、精确率、召回率、F1值 定义 准确率(Accuracy):正确分类样本个数占总样本个数, 精确率(Precision):预测正确正例数据占预测为正例数据比例, 召回率(Recall):预测为正确正例数据占实际为正例数据比例...MSE 和 RMSE 可以很好反应回归模型预测值和真实值偏离成都,但如果存在个别离群点偏离程度非常大时,即使其数量非常少也会使得RMSE指标变差(因为用了平方)。...t 检验 也称学生检验,主要用于样本含量较小(例如 n<30),总体标准差 σ 未知正态分布。目的在于比较样本均数,所代表未知总体均数 μ 和已知总体均数 μ 比较。...z 检验 z 检验是一般用于样本(即样本容量大于 30)平均值差异性检验方法。它是用标准正态分布理论来推断差异发生概率,从而比较两个平均数差异是否显著。...卡方检验 前两个都是正态分布检验,卡方检验属于非参数检验。主要是比较两个两个以上样本率(构成比)以及两个分类变量关联性分析。其根本思想就是在于比较理论频数和实际频数吻合程度问题。

1.1K10

结合新冠疫情COVID-19股票价格预测:ARIMA,KNN和神经网络时间序列分析

对于COVID-19之后数据集,KPSS测试给出p值为 0.01,该值小于0.05,这说明时间序列数据 不是平稳。 因此,我们可以从以上两个测试得出结论,时间序列数据 不是平稳。...这项研究目的是说明不同预测工具,对其进行比较并分析预测行为。在我们KNN研究之后,我们提出可以将其用于分类和回归问题。...尽管没有用于计算隐藏层数特定方法,但时间序列预测遵循最常见方法是通过计算使用以下公式: 其中Ns:训练样本数Ni:输入神经元数No:输出神经元数a:1.5 ^ -10 #隐藏层创建 hn\_before...: accuracy accuracy ---- 8.所有模型比较 现在,我们使用参数诸如RMSE(均方根误差),MAE(均值绝对误差)和MAPE(均值绝对百分比误差)对所有三个模型进行分析 。...1.0 KNN 45.9 35.7 3.3 神经网络 14.7 9.8 1.0 因此,从以上模型性能参数总结中,我们可以看到神经网络模型在两个数据集上性能均优于ARIMA和KNN模型。

83640

11个重要机器学习模型评估指标

以上两个表中可以看出,阳性预测值很高,但阴性预测值很低,而敏感度和特异度一样。这主要由选择阈值所造成,如果降低阈值,两对截然不同数字将更接近。 通常,大家关注上面定义指标中一项。...在3分位数和7分位数之间,任何升力在100%以上模型(@十分位数)都是好模型。否则可能要先考虑采样。 提升图或增益图表广泛应用于目标定位问题。...因此,请确保在使用此指标之前已从数据集中删除了异常值。 6.与平均绝对误差相比,RMSE提供更高权重并惩罚大错误。 RMSE指标由以下公式给出: 其中,N是样本总数。 10....在分类问题情况下,如果模型准确度为0.8,可以衡量模型对随机模型有效性,哪个准确度为0.5。因此,随机模型可以作为基准。但是在谈论RMSE指标时,却没有比较基准。...上图显示了如何使用及时样本集验证模型。简单地将人口分成2个样本,在一个样本上建立模型。其余人口用于及时验证。 上述方法会有不好一面吗? 这种方法一个消极面就是在训练模型时丢失了大量数据

1.5K10

一文深度解读模型评估方法

用于最终评估模型还是可以。...② 量纲差异:不同于MSE做了平方,RMSE(平方后又开根号)及MAE对于原量纲是不变,会更直观些。而RMSE 与 MAE 尽管量纲相同,RMSE比MAE实际会大一些。...简单来说:AUC对样本正负比例情况是不敏感,即使正例与负例比例发生了很大变化,ROC曲线面积也不会产生大变化 AUC是ROC曲线面积,其数值物理意义是:随机给定一正一负两个样本,将正样本预测分值大于负样本概率大小...而我们期望模型预测好坏间隔尽量大,如负样本预测为0.1以下,正样本预测为0.8以上,此时虽然auc一样,但这样模型拟合效果更好,比较有鲁棒性。...PSI值在实际应用中优点在于其计算便捷性,但需要注意是,PSI计算受分组数量及方式、群体样本量和现实业务政策等多重因素影响,尤其是对业务变动剧烈样本来说,PSI值往往超出一般经验水平,因此需要结合实际业务和数据情况进行具体分析

1.3K60

机器学习笔试题精选(二)

关于特征选择,下列对 Ridge 回归和 Lasso 回归说法正确是?** A. Ridge 回归适用于特征选择 B. Lasso 回归适用于特征选择 C. 两个都适用于特征选择 D....因此,比较来说,Lasso 回归更容易得到稀疏回归系数,有利于舍弃冗余或无用特征,适用于特征选择。 **Q3. 如果在线性回归模型中增加一个特征变量,下列可能发生是(多选)?** A....下面两张图展示了两个拟合回归线(A 和 B),原始数据是随机产生。现在,我想要计算 A 和 B 各自残差之和。注意:两种图中坐标尺度一样。 !...加入使用逻辑回归对样本进行分类,得到训练样本准确率和测试样本准确率。现在,在数据中增加一个新特征,其它特征保持不变。然后重新训练测试。则下列说法正确是? A. 训练样本准确率一定会降低 B....以上说法都不对 答案:C 解析:异常值(Outlier)指样本个别值,其数值明显偏离它(或他们)所属样本其余观测值,也称异常数据,离群值。

93120

你知道这11个重要机器学习模型评估指标吗?

我们案例准确率达到88%。从以上两个表中可以看出,精确率较高,而真负率较低。灵敏度和特异度也一样。这主要是由我们选择阈值驱动。如果我们降低阈值,这两对完全不同数值会更接近。...它避免使用绝对误差值,这在数学计算中是非常不希望。 当我们有更多样本时,使用RMSE重建误差分布被认为更可靠。 RMSE受到异常值影响很大。因此,请确保在使用此指标之前已从数据集中删除了异常值。...在分类问题情况下,如果模型准确率为0.8,我们可以衡量我们模型对随机模型有效性,随机模型精度为0.5。因此随机模型可以作为基准。但是当我们谈论RMSE指标时,我们没有比较基准。...上图显示了如何使用及时样本集验证模型。我们简单地将人口分成2个样本集,并在一个样本集上建立模型。其余人口用于及时验证。 上述方法会有消极一面吗? 这种方法一个消极方面训练模型中丢失了大量数据。...我们有n个样本集合和并重复建模n次,只留下一个样本集进行交叉验证。 通常,对于大多数目的,建议使用k = 10值。 总结 在训练样本上评估模型没有意义,但留出大量样本以验证模型则比较浪费数据

2.8K40

JCIM|XGraphBoost:基于图神经网络提取特征一种更好分子特性预测模型

每个数据集通过分层策略随机分成训练、验证和测试数据集,分别按 0.8、0.1 和 0.1 比例。因此,对于一个原始数据集,训练、验证和测试数据集中样本分布是相同。...DMPNN 在 10 个数据集中 9 个数据集中优于其他两个 GNN,表明 DMPNN 提取特征更显着 与分子性质关系。...表2 三种 GNN 性能比较 4.2 与流行 Morgan 指纹特征比较 作者进一步研究,将DMPNN 特征和监督学习器 XGBoost 二重奏与所有数据集上流行 Morgan 指纹特征和 XGBoost...GCN 模型在 FreeSolv 数据集上改进最大,RMSE值从RMSE=3.499(GCN模型)降低到1.975(GCN+XGBoost模型),这两个模型标准差分别为0.111和 分别为 0.274...4.4 与两项研究比较 该研究在同一数据集上对两项研究进行了评估,如图 5 所示。

1.6K20

机器学习中分类与回归差异

教程概述 本教程共分为 5 个部分,分别是: 函数逼近 分类 回归 分类与回归之间比较 分类与回归之间转换 函数逼近 预测建模问题,是基于历史数据来开发一个模型问题,这个模型可以对新数据(我们没有相应答案...对于分类,它输入可以是实值,也可以是离散变量。 分为两个问题,通常被称为两类或二元分类问题。 多于两个类别的问题通常被称为多类分类(Multi-class classification)问题。...) RMSE = 0.412 RMSE 优点在于其误差值单位与预测值单位是相同。...分类与回归之间比较 分类预测建模问题不同于回归预测建模问题。 分类任务是预测离散类标签。 回归任务是预测连续数量。...另外一些算法则不能(或者说不能轻易地)同时用于两种问题类型(例如用于回归预测建模线性回归,和用于分类预测建模 Logistic 回归)。

1.8K90

机器学习入门 5-5 衡量线性回归指标mse,rmse,mae

前面在kNN算法中,为了评估训练kNN算法好坏,我们将数据集划分为训练集合测试集两个部分: 训练集,训练拟合模型; 测试集,评估训练好模型。...下面使用简单线性回归算法为例,当然无论是分类问题还是回归问题,我们都需要将数据集划分为训练集和测试集,因此对于简单线性回归来说,也分成两个部分: 目标是找到a和b,使得优化目标函数在训练集上尽可能小,得到使得优化函数最小参数...AB两个人在具体衡量时候,测试集样本数量是多少,总而言之,上面的衡量标准和测试集数量m有关。...此时如果错误值非常大的话,比如两个样本之间差距是100的话,经过平方操作以后,差距就被扩大到了10000,也就是说RMSE有放大预测结果和真实结果之间较大那个差距趋势。...,哪个最大错误值相应比较小,我们在训练模型时候使用目标函数就是使用RMSE中根号里面没有除以m那一部分,这一部分其实和优化RMSE本质是一样,当然在训练时候使用是训练集而不是测试集。

2.7K00

实测盘古气象模型在真实观测场中预报效果如何

本项目中 ECMWF 实时预报数据作为盘古模型对比预报数据(陪跑),用于对比盘古模型预报效果。由于该数据空间分辨率为0.4°。...它既可以用于连续型预测,也可用于分类预测误差评估。RMSE是机器学习中回归模型及时间序列预测常用评估指标之一。总体来说,RMSE是一个简单直观而有效预测误差评价指标。...测评结果 气温 盘古在气温上测评结果相比于其他两个预报系统来说,具有比较明显优势。具体来看,盘古气温 RMSE 总体上是略优于 ECMWF ,且比较稳定地优于 GFS。...从风级准确率来看,盘古结果还是逊色于其他两个预报系统。 再看风速和风向评分,盘古结果依旧是不敌其他两个系统。...总结 总体来说,盘古预报相对于 ECMWF 和 GFS 在气温上具有比较明显且稳定优势,而在风相关预报效果基本上全面逊色于其他两个系统,但其预报效果与其他两个系统也已经相当接近。

1.1K40

MLK | 模型评估一些事

两个指标是矛盾,为了提高Precision,分类器需要尽量把"更有把握"样本预测为正样本,但这样子会漏掉一些"不怎么有把握"样本,导致Recall比较低。...RMSE(平方根误差) RMSE,Root Mean Squared Error,一般都是用来衡量回归模型好坏,但是这个指标往往对离群点特别地敏感,即便大多数预测都很准,但如果存在小部分离群点,都会把这个指标变得很大...余弦相似度,其取值范围为[-1, 1],当两个相同方向向量比较,其取值为1,相反方向取值为-1。 而余弦距离,则是1-余弦相似度,所以其取值范围为[0, 2],相同向量之间余弦距离为0。 ?...Holdout检验 其实就是我们常用37分,把数据集随机分成3:7,分别用于训练模型和验证模型,但这存在明显问题,那就是随机性比较大,你换一个随机种子,可能会得到完全不一样结论。...自助法 当样本比较时候,使用自助法会比较好,它是基于自动采样法检验方法,对于总数为m样本集合,进行m次有放回随机抽样,得到大小为n训练集,n次采样过程中,有的样本会被抽过很多次,有的样本会没被抽到过

57770

回归评价指标---MSE、RMSE、MAE、R-Squared

MSE和MAE适用于误差相对明显时候,大误差也有比较权重,RMSE则是针对误差不是很明显时候;MAE是一个线性指标,所有个体差异在平均值上均等加权,所以它更加凸显出异常值,相比MSE; RMSLE...: 主要针对数据集中有一个特别大异常值,这种情况下,data会被skew,RMSE会被明显拉大,这时候就需要先对数据log下,再求RMSE,这个过程就是RMSLE。...其实实质是一样。只不过用于数据更好描述。 例如:要做房价预测,每平方是万元(真贵),我们预测结果也是万元。那么差值平方单位应该是 千万级别的。那我们不太好描述自己做模型效果。怎么说呢?...对于这样一个拟合模型,如果我们使用MSE来对它 进行判断,它MSE会很小,因为大部分样本其实都被完美拟合了,少数样本真实值和预测值巨大差异在被均 分到每个样本上之后,MSE就会很小。...如果预测结果为1400, 那么RMSE=400, RMSLE=0.336 可以看出来在均方根误差相同情况下,预测值比真实值小这种情况错误比较大,即对于预测值小这种情况惩罚较大。

73010

R语言第六章机器学习①R中逐步回归要点

注意, 前向选择和逐步选择可以应用于高维配置,其中样本数n不如预测变量p数量,例如在基因组数据中。 向后选择要求样本数n大于变量数p,以便可以拟合整个模型。...以下示例使用swiss数据集执行向后选择(method =“leapBackward”),以根据社会经济指标确定用于预测生育率最佳模型。...我们将使用10倍交叉验证来估计5个模型中每个模型平均预测误差(RMSE)(参见章节@ref(交叉验证))。 RMSE统计度量用于比较5个模型并自动选择最佳模型,其中最佳定义为最小化RMSE模型。...,用于比较5种最佳模型准确性。...nvmax:模型中变量数量。 例如,nvmax = 2,指定最佳2变量模型 RMSE和MAE是衡量每个模型预测误差两个不同指标。 RMSE和MAE越低,模型越好。

3.4K20
领券