拓端tecdat

拓端(tecdat.cn)分享最in的大数据资讯,提供“一站式”的数据分析学习和咨询体验。
417 篇文章
20 人订阅

全部文章

拓端

R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测

在本文中,我们使用了逻辑回归、决策树和随机森林模型来对信用数据集进行分类预测并比较了它们的性能。数据集是

5520
拓端

spss modeler用决策树神经网络预测ST的股票

之前在某社区中看到一篇帖子《一张价值几十万个跌停的统计表》,主要是预测即将被ST的股票,虽然有些标题党,但是还有有一些参考价值的。文章中使用了净利润指标来对可能...

4820
拓端

R语言动量和马科维茨Markowitz投资组合(Portfolio)模型实现

动量和马科维茨投资组合模型使 均值方差优化 组合成为可行的解决方案。通过建议并测试:

3720
拓端

matlab使用经验模式分解emd 对信号进行去噪

对于这个例子,考虑由具有明显频率变化的正弦波组成的非平稳连续信号。手提钻的振动或烟花声是非平稳连续信号的例子。

5320
拓端

r语言使用rjags R2jags建立贝叶斯模型

本文是通过对area,perimeter,campactness几个变量的贝叶斯建模,来查看他们对groovelength这个变量的影响.

4920
拓端

R语言BUGS/JAGS贝叶斯分析: 马尔科夫链蒙特卡洛方法(MCMC)采样

在许多情况下,我们没有足够的计算能力评估空间中所有n维像素的后验概率 。在这些情况下,我们倾向于利用称为Markov-Chain Monte Carlo 算法的...

4510
拓端

R语言实现MCMC中的Metropolis–Hastings算法与吉布斯采样

作为第一步,我们创建一些测试数据,用于拟合我们的模型。让我们假设预测变量和响应变量之间存在线性关系,因此我们采用线性模型并添加一些噪声。

5230
拓端

R语言ARMA-GARCH-COPULA模型和金融时间序列案例

最近我被要求撰写关于金融时间序列的copulas的调查。从读取数据中获得各种模型的描述,包括一些图形和统计输出。 > oil = read.xlsx(temp...

3010
拓端

R语言文本主题模型之潜在语义分析(LDA:Latent Dirichlet Allocation)

另一种方法是通过主题搜索和探索文档。广泛的主题可能与文章中的各个部分(国家事务,体育)有关,但这些部分内或之间可能存在特定主题。

3710
拓端

R语言网络分析友谊悖论案例

例如,这在 Feld(1991),Zuckerman&Jost(2001)中进行了讨论。首先,让我们获取数据集的副本

3810
拓端

R语言分层线性模型案例

有许多分层数据的例子。例如,地理数据通常按层次分组,可能是全球数据,然后按国家和地区分组 。一个生物学的例子是按物种分组的动物或植物的属性,或者属于一个级别的属...

5320
拓端

R语言中使用RCPP并行计算指数加权波动率

指数加权波动率是一种波动率的度量,它使最近的观察结果有更高权重。我们将使用以下公式计算指数加权波动率:

4320
拓端

Python金融应用编程:衍生品定价和套期保值的随机过程

随机过程对定量融资的许多方面都很有用,包括但不限于衍生品定价,风险管理和投资管理。这些应用程序将在本文后面进一步详细讨论。本节介绍了量化融资中使用的一些流行的随...

6010
拓端

SAS用K-Means 聚类最优k值的选取和分析

坐在餐馆的用餐者。假设餐厅中有两个桌子。桌子1中的人可能彼此相关,可能是一组家庭成员或同事。

6720
拓端

R语言基于copula的贝叶斯分层混合模型的诊断准确性研究

在对诊断测试准确性的系统评价中,统计分析部分旨在估计测试的平均(跨研究)敏感性和特异性及其变异性以及其他测量。灵敏度和特异性之间往往存在负相关,这表明需要相关数...

5810
拓端

R语言用Rshiny探索lme4广义线性混合模型(GLMM)和线性混合模型(LMM)

随着软件包的进步,使用广义线性混合模型(GLMM)和线性混合模型(LMM)变得越来越容易。由于我们发现自己在工作中越来越多地使用这些模型,我们开发了一套R sh...

7410
拓端

Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析

在训练集中,我们有1017209个观察值和9列/变量。 在测试集中,我们有41088个观测值和8列/变量。 在商店集中,我们有1115个观察值和10列/变量。

6220
拓端

R语言股市可视化相关矩阵:最小生成树

6420
拓端

R语言 线性混合效应模型实战案例

处理分组数据和复杂层次结构的分析师,从嵌入在参与者中的测量,嵌套在州内的县或嵌套在教室内的学生,经常发现他们需要建模工具来反映他们数据的这种结构。在R中,有两种...

3410
拓端

R语言估计时变VAR模型时间序列的实证研究分析案例

上述症状数据集包含在R-package 中,并在加载时自动可用。加载包后,我们将此数据集中包含的12个心情变量进行子集化:

3410

扫码关注云+社区

领取腾讯云代金券