首页
学习
活动
专区
工具
TVP
发布

大数据风控

专栏成员
57
文章
133810
阅读量
60
订阅数
R聚类算法-DBSCAN算法
DBSCAN算法(Density-Based Spatial Clustering of Application with Noise)密度聚类算法 基于密度的聚类算法,K-means和层次聚类对于球状的簇聚类效果很好,DBSCAN可以用于更多复杂形状簇的聚类。
Erin
2022-05-09
6010
信用标准评分卡模型开发及实现
版权声明:本文为博主原创文章,未经博主允许不得转载。
Erin
2019-07-02
2.3K0
R分类算法-决策树算法
本文介绍了R语言中的决策树分类算法,包括决策树的基本原理、优点和缺点、实现方法和代码示例。同时,还通过一个数据集,演示了如何使用决策树算法进行分类预测。最后,还讨论了如何使用交叉验证来评估决策树模型的性能。
Erin
2018-01-09
1.4K0
R聚类算法-(K-Means算法)
本文介绍了聚类算法中的R聚类算法和K-Means算法,以及如何使用R语言进行聚类分析。首先介绍了R聚类算法,然后描述了K-Means算法的基本原理和实现方法,并通过一个示例展示了如何使用R语言进行聚类分析。最后,文章对K-Means算法的优化进行了介绍,包括使用主成分分析和崖底碎石法进行优化。
Erin
2018-01-09
1.3K0
R分类算法-Logistic回归算法
本文介绍了逻辑回归(Logistic Regression)算法,这是一种用于分类问题的统计方法。文章首先解释了逻辑回归的基本概念,然后详细阐述了如何在R语言中使用glm函数进行逻辑回归建模。最后,文章通过一个实际案例展示了如何使用逻辑回归模型进行预测。
Erin
2018-01-09
9310
R聚类算法-层次聚类算法
本文介绍了层次聚类算法的基本概念、原理、方法和应用。层次聚类算法是一种基于树形结构的聚类方法,包括距离矩阵计算、数据转换、聚类树构建和剪枝等步骤。该算法可以自动处理大规模数据集,但计算量较大,且结果不稳定。在实际应用中,需要根据数据特点和需求选择合适的聚类算法。
Erin
2018-01-09
1.6K0
R关联规则算法(支持度、自信度、提升度)
本文介绍了关联规则算法,包括Apriori算法和FP-growth算法,并给出了在R语言中的实现方法。以啤酒-尿布为例,进行了关联规则挖掘,并分析了挖掘结果的价值。
Erin
2018-01-09
9540
R中协同过滤算法
本文介绍了协同过滤算法,包括基于用户的协同过滤和基于项目的协同过滤,以及推荐系统的应用,重点讲解了基于用户的协同过滤算法。
Erin
2018-01-09
1.1K0
评分卡模型开发-用户数据异常值处理
本文介绍了定量数据、定性数据和状态指标这三种数据类型,以及如何在技术社区中处理缺失值和异常值。首先,介绍了定量数据的特征和类型,包括数值型和类别型两种;然后,介绍了定性数据的特征和类型,包括有序分类数据和无序分类数据两种;最后,介绍了状态指标数据的特征和类型,包括数值型和类别型两种。在处理缺失值和异常值时,可以使用数据填充策略和数据清洗方法,以保证数据的准确性和质量。
Erin
2018-01-09
1.4K0
评分卡模型开发-用户数据缺失值处理
本文讲述了如何利用Python和R语言对数据集进行缺失值和异常值处理,包括利用均值、中位数、众数、插值、基于邻近算法、基于模型的回归、聚类、分类等多种方法。同时,还介绍了一种基于Knime的缺失值处理方法。
Erin
2018-01-09
1.3K0
评分卡模型开发-定性指标筛选
本文介绍了评分卡模型开发过程中,定性指标筛选的常用方法,包括基于信息增益、基于互信息、基于基尼指数的方法,以及基于决策树、随机森林、支持向量机等机器学习算法的方法。同时,介绍了在R语言中,如何使用informationvalue包和klaR包实现定性指标的筛选。最后,本文总结了入模指标筛选的原则和步骤,以及定量和定性指标的筛选方法,包括基于分段的方法和基于机器学习算法的方法。
Erin
2018-01-09
1.1K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档