开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

我如何知道这里使用的是哪种类型的GLM？如果我不知道家庭的类型。(考虑因变量性质是未知的)

GLM是广义线性模型（Generalized Linear Model）的缩写，是一种统计学中常用的回归分析方法。它通过将线性回归模型的假设放宽，适用于更广泛的数据类型和分布情况。

在了解家庭类型的情况下，可以通过以下步骤确定使用的GLM类型：

确定因变量的性质：首先需要确定因变量的性质，即它是连续型变量还是离散型变量。这将决定GLM的类型。
连续型变量的GLM类型：如果因变量是连续型变量，可以选择使用线性回归模型（正态分布的GLM）。线性回归模型适用于因变量与自变量之间存在线性关系的情况。
离散型变量的GLM类型：如果因变量是离散型变量，需要根据具体情况选择适当的GLM类型。常见的离散型GLM类型包括二项分布GLM（适用于二分类问题）、泊松分布GLM（适用于计数数据）、多项分布GLM（适用于多分类问题）等。

如果不知道家庭的类型，即因变量的性质未知，可以考虑以下方法：

数据探索：通过对数据的初步探索，可以观察因变量的分布情况，进而初步判断其性质。例如，可以绘制直方图、箱线图等图表，观察因变量的分布形态。
统计检验：可以使用统计检验方法对因变量进行假设检验，以确定其性质。例如，对于连续型变量，可以使用正态性检验；对于离散型变量，可以使用卡方检验等。
领域知识：根据对问题背景的了解，可以推测因变量的性质。例如，如果问题涉及到计数数据，可以初步判断因变量为离散型变量。

总之，确定GLM类型的关键是明确因变量的性质，可以通过数据探索、统计检验和领域知识等方法进行判断。根据具体情况选择适当的GLM类型，以进行进一步的分析和建模。

腾讯云相关产品和产品介绍链接地址：

腾讯云机器学习平台（https://cloud.tencent.com/product/tiia）
腾讯云人工智能开发平台（https://cloud.tencent.com/product/tencent-ai）
腾讯云数据库（https://cloud.tencent.com/product/cdb）
腾讯云服务器（https://cloud.tencent.com/product/cvm）
腾讯云存储（https://cloud.tencent.com/product/cos）
腾讯云区块链服务（https://cloud.tencent.com/product/tbaas）
腾讯云物联网平台（https://cloud.tencent.com/product/iotexplorer）
腾讯云移动开发平台（https://cloud.tencent.com/product/mpe）
腾讯云音视频处理（https://cloud.tencent.com/product/mps）
腾讯云云原生应用平台（https://cloud.tencent.com/product/tke）
腾讯云网络安全（https://cloud.tencent.com/product/ddos）
腾讯云多媒体处理（https://cloud.tencent.com/product/vod）
腾讯云元宇宙（https://cloud.tencent.com/product/tencent-vr）

相关搜索:如果我的实例是stl map，我如何获取模板的类型？我怎样才能让TypeScript知道我使用的是哪种proptypes？我不知道tkinter的after方法是如何工作的。如何辨别我使用的是哪种Markdown Flavor？我怎么写,"如果是类型类型a,那么a也是这个定义的b实例."如果单元格是浮点类型，我想使用lambda函数来更改它的类型 TypeScript说，尽管我试图严格定义我的道具，但道具类型是未知的如果我的事件是用for循环添加的，我如何使用removeClickEvents？[javascript]如果我不知道使用go的(结构)中的预期模式，我如何验证/读取yaml？我不知道我在哪里犯了错，我现在使用的是tweepy、python和twitter api 我可以知道如何在html中制作这样的表格吗?我是指这种类型的边框样式。我想知道这个值的类型，以及如何使用它？这是正确的实现吗，将道具放在this.setState中，也请考虑这里我使用的是componentDidMount()代码需要调试。我不知道值是如何四舍五入的我不知道如何解决以下问题:无法推断MyIterator<>的类型参数使用Selenium WebDriver时如何知道我使用的浏览器类型？exists操作符是如何工作的？我不知道为什么会这样我是VBA新手，所以我不知道如何删除对象的文件扩展名为什么我得到一个意外的类型，需要变量的错误？即使我使用的是变量如何知道我使用的django版本？是1.0,1.1还是1.2？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

你知道 HTTP 是如何使用 TCP 连接的吗？今天我就来告诉你！

1、HTTP 是如何使用 TCP 连接的；世界上几乎所有的 HTTP 通信都是由 TCP/IP 承载的，TCP/IP 是全球计算机及网络设备都在使用的一种常用的分组交换网络分层协议集。...TCP 是通过端口号来保持所有这些连接的正确运行的。端口号和雇员使用的电话分机号很类似。...这里需要我们注意的是，有些连接共享了相同的目的端口号，有些连接使用了相同的源 IP 地址，有些使用了相同的目的 IP 地址，但没有两个不同连接所有的 4 个值都一样。...TCP API 隐藏了所有底层网络协议的握手细节，以及 TCP 数据流与 IP 分组之间的分段和重装细节。 TCP 客户端和服务器是如何通过 TCP 套接字接口进行通信的 ?...TCP 慢启动 TCP 数据传输的性能还取决于 TCP 连接的使用期（age）。TCP 连接会随着时间进行自我“调谐”，起初会限制连接的最大速度，如果数据成功传输，会随着时间的推移提高传输的速度。

4.5K3 0

数据产品经理的硬核能力：用户画像带动用户增长

例如，用户使用成功创建了某种类型的商品，每个商品的售卖量和销量都不相同，在考虑该商品功能的使用时候如何进行综合处理？...这可能需要借助分析来看清楚，这里的因变量（用户的付费）和哪些自变量是相关联的。...在这里推荐一个算法：CHAID决策树，这类决策树专门用来找出这里面核心影响最终结果的变量是什么，也就是说，这么多功能，用户这么多行为，这么多属性，到底哪种属性类型的用户，哪种行为类型的用户，更容易转化！...决策树算法是如何计算的？ PART/05 假定我们需要了解的是用户如何能够付费，那付费与否就是要考察的因变量，也是需要决策树根据变量情况预测的值。...例如，我们的数据里有130个自变量，其中很多我们都不知道是否和用户是否付费相关，不知道用户每周活跃次数和用户付费是否相关，不知道用户尝试了某个功能是否和用户付费相关，这时就通过决策树的卡方检验通过距离来判断自变量和因变量之间是否相关

9914 2

R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析|附代码数据

这并不奇怪，因为如果我们知道一个人每天抽多少支烟就可以断言我们知道一个人是否是吸烟者! 第二个关联是cigsPerDay与男性的关系，但它并不强烈。因此，前者可以解释后者的较小的变化性。...一个非常重要的问题是，如何衡量这两个模型实例的性能以及如何比较它们？有各种方法来衡量性能，但我在这里选择了5折交叉验证法。为了进行交叉验证和评估模型实例，我们需要一个成本函数。...然而，如果我们考虑OOB的准确性，那么RandomForest模型比最佳逻辑回归模型好0.00120.0012。在RF中，模型的准确性有所提高，但代价是失去了可解释性。...RF是一个黑箱，我们无法解释预测因子和因变量之间的关系。 3.5 模型对个人数据如何预测？这里为了完成这个报告，我想在一个新的数据集上增加一个预测部分。...该数据集只有一条记录，其中包括我自己的个人数据。换句话说，我已经创建了一个模型，我想知道它是否预测了我的CHD。

5610 0

R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析|附代码数据

这并不奇怪，因为如果我们知道一个人每天抽多少支烟就可以断言我们知道一个人是否是吸烟者! 第二个关联是cigsPerDay与男性的关系，但它并不强烈。因此，前者可以解释后者的较小的变化性。...一个非常重要的问题是，如何衡量这两个模型实例的性能以及如何比较它们？有各种方法来衡量性能，但我在这里选择了5折交叉验证法。为了进行交叉验证和评估模型实例，我们需要一个成本函数。...然而，如果我们考虑OOB的准确性，那么RandomForest模型比最佳逻辑回归模型好0.00120.0012。在RF中，模型的准确性有所提高，但代价是失去了可解释性。...RF是一个黑箱，我们无法解释预测因子和因变量之间的关系。 3.5 模型对个人数据如何预测？这里为了完成这个报告，我想在一个新的数据集上增加一个预测部分。...该数据集只有一条记录，其中包括我自己的个人数据。换句话说，我已经创建了一个模型，我想知道它是否预测了我的CHD。

7320 0

R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析|附代码数据

这并不奇怪，因为如果我们知道一个人每天抽多少支烟就可以断言我们知道一个人是否是吸烟者!第二个关联是cigsPerDay与男性的关系，但它并不强烈。因此，前者可以解释后者的较小的变化性。...一个非常重要的问题是，如何衡量这两个模型实例的性能以及如何比较它们？有各种方法来衡量性能，但我在这里选择了5折交叉验证法。为了进行交叉验证和评估模型实例，我们需要一个成本函数。...然而，如果我们考虑OOB的准确性，那么RandomForest模型比最佳逻辑回归模型好0.00120.0012。在RF中，模型的准确性有所提高，但代价是失去了可解释性。...RF是一个黑箱，我们无法解释预测因子和因变量之间的关系。3.5 模型对个人数据如何预测？这里为了完成这个报告，我想在一个新的数据集上增加一个预测部分。该数据集只有一条记录，其中包括我自己的个人数据。...换句话说，我已经创建了一个模型，我想知道它是否预测了我的CHD。

8101 0

【视频】什么是非线性模型与R语言多项式回归、局部平滑样条、广义相加GAM分析工资数据|数据分享|附代码数据

p=9706 最近我们被客户要求撰写关于的研究报告，包括一些图形和统计输出。在这文中，我将介绍非线性回归的基础知识。非线性回归是一种对因变量和一组自变量之间的非线性关系进行建模的方法。...最小二乘法是一种通过最小化给定数据集中观察到的因变量与线性函数预测的因变量之间差异的平方和来估计线性回归模型中未知参数的方法。什么是非线性回归？...首先，我怎样才能以简单的方式知道问题是线性的还是非线性的？要回答这个问题，我们必须做两件事。首先是直观地确定关系是线性的还是非线性的。最好用每个输入变量绘制输出变量的双变量图。...我们要做的第二件事是当我们无法准确地建模与线性参数的关系时，使用非线性回归而不是线性回归。第二个重要问题是，如果我的数据在散点图上显示为非线性，我应该如何建模？...我们也可以使用交叉验证来选择多项式次数。在这里，我们实际上看到的最小交叉验证误差是针对4次多项式的，但是选择3次或2次模型并不会造成太大损失。接下来，我们考虑预测个人是否每年收入超过25万。

1.2K0 0

R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析|附代码数据

这并不奇怪，因为如果我们知道一个人每天抽多少支烟就可以断言我们知道一个人是否是吸烟者! 第二个关联是cigsPerDay与男性的关系，但它并不强烈。因此，前者可以解释后者的较小的变化性。...一个非常重要的问题是，如何衡量这两个模型实例的性能以及如何比较它们？有各种方法来衡量性能，但我在这里选择了5折交叉验证法。为了进行交叉验证和评估模型实例，我们需要一个成本函数。...然而，如果我们考虑OOB的准确性，那么RandomForest模型比最佳逻辑回归模型好0.00120.0012。在RF中，模型的准确性有所提高，但代价是失去了可解释性。...RF是一个黑箱，我们无法解释预测因子和因变量之间的关系。 3.5 模型对个人数据如何预测？这里为了完成这个报告，我想在一个新的数据集上增加一个预测部分。...该数据集只有一条记录，其中包括我自己的个人数据。换句话说，我已经创建了一个模型，我想知道它是否预测了我的CHD。

6150 0

R语言进阶之广义线性回归

在R语言中我们通常使用glm()函数来构建广义线性模型，glm实际上是generalized linear model（广义线性模型）的首字母缩写，它的具体形式如下所示： glm(formula, family...第一部分逻辑回归逻辑回归主要应用于因变量（y）是二分类变量而自变量（x）是连续型变量的情形，当然这里的自变量和因变量也可以都是分类变量。...这里我先和大家介绍一下数据的信息，这个数据主要包括三部分信息：treatment代表对患者采取的治疗措施，分成1、2、3三类，1代表被认可的有效药，2代表新药A，3是指新药B；outcome是指患者治疗之后的结局...注意这里不使用安慰剂作为空白对照的原因主要是考虑到伦理学问题，原则上要使患者利益最大化。...那么只能说这两个新药和现行药的疗效差不多，并不是新药的效果更好。当然，如果拟合模型的残差比自由度大很多，这个时候最好使用quasipossion()。

1.8K4 1

R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析|附代码数据

这并不奇怪，因为如果我们知道一个人每天抽多少支烟就可以断言我们知道一个人是否是吸烟者! 第二个关联是cigsPerDay与男性的关系，但它并不强烈。因此，前者可以解释后者的较小的变化性。...一个非常重要的问题是，如何衡量这两个模型实例的性能以及如何比较它们？有各种方法来衡量性能，但我在这里选择了5折交叉验证法。为了进行交叉验证和评估模型实例，我们需要一个成本函数。...然而，如果我们考虑OOB的准确性，那么RandomForest模型比最佳逻辑回归模型好0.00120.0012。在RF中，模型的准确性有所提高，但代价是失去了可解释性。...RF是一个黑箱，我们无法解释预测因子和因变量之间的关系。 3.5 模型对个人数据如何预测？这里为了完成这个报告，我想在一个新的数据集上增加一个预测部分。...该数据集只有一条记录，其中包括我自己的个人数据。换句话说，我已经创建了一个模型，我想知道它是否预测了我的CHD。

6020 0

R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析|附代码数据

这并不奇怪，因为如果我们知道一个人每天抽多少支烟就可以断言我们知道一个人是否是吸烟者!第二个关联是cigsPerDay与男性的关系，但它并不强烈。因此，前者可以解释后者的较小的变化性。...一个非常重要的问题是，如何衡量这两个模型实例的性能以及如何比较它们？有各种方法来衡量性能，但我在这里选择了5折交叉验证法。为了进行交叉验证和评估模型实例，我们需要一个成本函数。...然而，如果我们考虑OOB的准确性，那么RandomForest模型比最佳逻辑回归模型好0.00120.0012。在RF中，模型的准确性有所提高，但代价是失去了可解释性。...RF是一个黑箱，我们无法解释预测因子和因变量之间的关系。3.5 模型对个人数据如何预测？这里为了完成这个报告，我想在一个新的数据集上增加一个预测部分。该数据集只有一条记录，其中包括我自己的个人数据。...换句话说，我已经创建了一个模型，我想知道它是否预测了我的CHD。

7490 0

快速选择合适的机器学习算法

一个初学者面临各种机器学习算法的典型问题是“我应该使用哪种算法？”问题的答案取决于许多因素，包括：数据的大小、质量和性质。可用计算时间。任务的紧迫性。...稍后将会添加其他算法，因为我们的库增长包含一套更完整的可用方法。如何使用速查表将图表上的路径和算法标签读为“如果则使用”。例如：如果要进行降维，则使用主成分分析法。...重要的是要记住，这些路径旨在作为有经验的建议，因此有些建议并不准确。我谈到的几位数据科学家说，找到最好算法的唯一方法就是尝试所有的算法。机器学习算法的类型本节提供最受欢迎的机器学习类型的概述。...当被提供一个数据集时，首先要考虑的是如何获得结果，无论这些结果如何。初学者倾向于选择易于实现的算法，并可以快速获得结果。这样做很好，因为这只是过程的第一步。...如果因变量不是连续的而是分类的，则可以使用logit链接函数将线性回归转换为逻辑回归。逻辑回归是一种简单，快速而强大的分类算法。这里我们讨论二进制的情况，其中因变量y只取二进制值 ?

6402 1

MADlib——基于SQL的数据挖掘解决方案（12）——回归之广义线性模型

用曲线拟合数据首先要解决的问题是回归方程中的参数如何估计。下面以一元非线性回归为例，讨论解决这一问题的基本思路。对于曲线回归建模的非线性目标函数 ? ，通过某种数学变换 ?...一般线性模型中，自变量的线性预测值就是因变量的估计值，而广义线性模型中，自变量的线性预测值是因变量的连接函数估计值。...表2 glm函数参数说明列名数据类型描述 TEXT 分组列，取决于grouping_col输入，可能是多个列。 coef FLOAT8[] 线性预测的回归系数向量。...link：TEXT类型，连接函数字符串，应该与训练函数使用相同的连接函数。三、示例 1....涉及到似然函数的许多应用中，更方便的是使用似然函数的自然对数形式，即“对数似然函数”。求解一个函数的极大化往往需要求解该函数的关于未知参数的偏导数。

9472 0

variance-covariance matrices

用variance-covariance matrices计算了土壤性质的空间变化。最近有读者问，我搜了一下。 ? ?...1.啥是variance-covariance matrices：即把方差和协方差写在一个矩阵里。方差在对角线上，协方差在非对角线上。 ? ? 2.如何实现：搜到一个函数vcov可以算。...输入只有一个，是经过各种模型拟合之后的结果。如lm,glm,aov等的结果。随便找了个数据试了一下。...我的结果有正有负，而原文都是正的。另外我得到的这些数值好像也不太对劲。原文方法写的比较简洁。 1.不知道环境因子是如何做的标准化。 2.不清楚用什么模型进行的拟合。 3.自变量和因变量都是啥。...4.最后这个表如何画图。这个问题Mark一下。。经过讨论我发现我应该是想错了，原文好像没有做拟合。所以环境因子直接用cov算协方差矩阵就好了。。。 ?

8854 1

手把手教你使用R语言做LASSO 回归

大家好，又见面了，我是你们的朋友全栈君。...在新格兰文献中，有大牛提出，对于变量过多而且变量数较少的模型拟合，首先要考虑使用LASSO 惩罚函数。今天我们来讲讲怎么使用R语言通过LASSO 回归构造预测模型。...(x, y, family="binomial", nlambda=100, alpha=1) #这里alpha=1为LASSO回归，如果等于0就是岭回归 #参数 family 规定了回归模型的类型：...适用于非负次数因变量（count） family="binomial" 适用于二元离散因变量（binary） family="multinomial" 适用于多元离散因变量（category）我们这里结局指标是...λ值，一个是距离均方误差最小时一个标准误的λ值，有点拗口没关系，我们只要知道它是多少就可以了 cvfit$lambda.min#求出最小值 cvfit$lambda.1se#求出最小值一个标准误的λ值

3.3K4 0

有限混合模型聚类FMM、广义线性回归模型GLM混合应用分析威士忌市场和研究专利申请数据

下面我们考虑有限混合密度 h(·|·) 与 K 个分量、因变量 y 和（可选）自变量 x：其中 ∀w, α：和我们假设分量分布 f(·|·) 来自具有分量特定参数 ϑk 的相同分布族。...它包含去年使用威士忌品牌的所有家庭，并提供了今年 21 个威士忌品牌的品牌使用情况的二元关联矩阵。我们首先加载包和数据集。威士忌数据集包含来自 2218 个家庭的观察结果。...图 1 中给出了每个品牌的相对使用频率。提供了其他品牌信息，表明威士忌的类型：混合威士忌或单一麦芽威士忌。 R> set.seed(102) 图 1：威士忌品牌的相对频率。...Wang等人选择的最佳模型(1998) 是三个泊松回归模型的有限混合，其中专利作为因变量，对数化的研发支出 lgRD 作为自变量，每个销售 RDS 的研发支出作为伴随变量。...该模型可以使用特定于成分的模型驱动程序在 R 中拟合，拟合 GLM 的有限混合。作为伴随变量模型，用于多项 logit 模型，其中后验概率是因变量。

1.5K1 0

R语言有限混合模型聚类FMM、广义线性回归模型GLM混合应用分析威士忌市场和研究专利申请、支出数据|附代码数据

下面我们考虑有限混合密度 h(·|·) 与 K 个分量、因变量 y 和（可选）自变量 x：其中 ∀w, α：和我们假设分量分布 f(·|·) 来自具有分量特定参数 ϑk 的相同分布族。...它包含去年使用威士忌品牌的所有家庭，并提供了今年 21 个威士忌品牌的品牌使用情况的二元关联矩阵。我们首先加载包和数据集。威士忌数据集包含来自 2218 个家庭的观察结果。...Wang等人选择的最佳模型(1998) 是三个泊松回归模型的有限混合，其中专利作为因变量，对数化的研发支出 lgRD 作为自变量，每个销售 RDS 的研发支出作为伴随变量。...该模型可以使用特定于成分的模型驱动程序在 R 中拟合，拟合 GLM 的有限混合。作为伴随变量模型，用于多项 logit 模型，其中后验概率是因变量。...可以获得拟合混合物的更多详细信息，返回拟合值以及近似标准偏差和显着性检验，参见图 6。标准偏差只是近似值，因为它们是为每个成分单独确定的，而不是采用考虑到成分已被同时估计。图 7 中给出了估计系数。

1963 0

不想去健身房的我，最后被贝叶斯分析说服了...

我们不知道β0和β1是多少，所以将它们视为未知参数。在大多数标准线性回归模型中，我们进一步假设给定X = x的情况下，Y的条件分布是正态分布的。这就是基本的线性回归模型： ? 可以被改写成： ?...总结：因变量Y遵循由平均数μi和精度参数τ决定的正态分布。μi是由β0和β1决定的X的线性函数。最后，我们还需假设未知方差不依赖于x；这种假设称为同方差性。...使用这些数据，我们的目标是推断不知道的事情，包括β0，β1（在图片中的蓝色虚线）和σ（它决定了在给定一个y值的时候，红色正态分布密度的宽度）。注意，每个黑点周围的正态分布看起来完全相同。...最终的参数估计虽然取决于数据和先验分布，但是如果数据中包含的信息越多，那先验的影响就越小。那么我该如何选择先验分布这是个好问题，因为这里存在着无数种可能。...如果选取了这种类型的先验分布，那么我们就不用考虑在这类分布中哪种分布更好，因为分布几乎都很平坦，在每个地方的概率都可以忽略不计。此外，后验分布不会受这种分布的影响。

8050 0

一文通解如何选择最合适的机器学习算法

初学者面对各种机器学习算法，一个典型的问题是：我应该使用哪种算法？问题的答案取决于许多因素，包括：数据的大小，质量和性质。可接受的计算时间。任务的紧迫性。你想用数据做什么。...随着我们的库不断增长以包含一套更完整的方法，其他算法也会被陆续添加进来。如何使用小抄表将图表上的路径和算法标签解读为“如果需要则使用 ”。...机器学习算法的类型本节提供广为流行的机器学习类型的概述。如果你已经熟悉这些算法，并希望继续讨论特定算法，则可以跳过本节并转到下面的“何时使用特定算法”。...许多用户将准确度放在第一位，而初学者则倾向专注于他们最了解的算法上。拿到数据集时，首先要考虑的是如何获得结果，先不管这些结果怎么样。初学者倾向于选择易于实现的算法，并可以快速获得结果。...如果因变量不是连续的而是分类的，则可以使用对数变换将线性回归转换为逻辑回归。逻辑回归是一种简单、快速而强大的分类算法。

6144 0

机器学习面试

简单举例，如果调查流感的影响因素，结局当然是流感的例数，如果调查的人有的在同一个家庭里，由于流感具有传染性，那么同一个家里如果一个人得流感，那其他人可能也被传染，因此也得了流感，那这就是具有聚集性，这样的数据尽管结果是个数...但是这里的数据存在聚集性怎么办呢，幸亏logistic回归之外又有了更多的扩展，你可以用多水平logistic回归模型，也可以考虑广义估计方程。...不过我还是建议看下去。为什么呢？相信大家都知道参数检验和非参数检验，而且可能更喜欢用参数检验，如t检验，而不喜欢用非参数检验，如秩和检验。...，我们有是也将其称为“对象游离”；垃圾回收机制的算法 java语言规范没有明确的说明JVM 使用哪种垃圾回收算法，但是任何一种垃圾回收算法一般要做两件基本事情：（1）发现无用的信息对象；（2）回收将无用对象占用的内存空间...由上述性质可知大顶堆的堆顶的关键字肯定是所有关键字中最大的，小顶堆的堆顶的关键字是所有关键字中最小的。

6494 0

Logistic回归模型、应用建模案例

这两个指标都能够评价logistic回归模型的效果，只是分别适用于不同的问题：如果是类似信用评分的问题，希望能够尽可能完全地识别出那些有违约风险的客户（不使一人漏网），我们需要考虑尽量增大TPR（覆盖率...），同时减小FPR（减少误杀），因此选择ROC曲线及相应的AUC作为指标；如果是做类似数据库精确营销的项目，希望能够通过对全体消费者的分类而得到具有较高响应率的客户群，从而提高投入产出比，我们需要考虑尽量提高...3）相关R应用包普通二分类 logistic 回归用系统的 glm 因变量多分类 logistic 回归有序分类因变量：用 MASS 包里的 polrb 无序分类因变量：用 nnet 包里的 multinom...，一种是将两种结果的向量合并做为因变量，如anes2模型。...逻辑回归我们用glm函数实现，该函数提供了各种类型的回归，如：提供正态、指数、gamma、逆高斯、Poisson、二项。我们用的logistic回归使用的是二项分布族binomial。

3.3K4 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭