首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

深度解读|如何构建用户分级体系实现精细化运营?附案例实操

对客户细分,我们往往通过事后分类维度做客户分类,保证分类深入性,再通过事前分类维度进行描述与验证,保证分类客户差异性和可接触性。...第一个维度为例,我们发现4个公因子对原始第一个维度解释程度分别为:0.418,-0.046,0.697,0.293,表明公因子1与公因子3之间存在一定相关性,达不到因子分析既定效果,因此需要进行旋转...层次聚类(Hierarchical Clustering)是聚类算法一种,通过计算不同类别数据点间相似度来创建一棵有层次嵌套聚类树。...对于类别型数据我们用占比比较,对于数值型数据我们用均值进行比较,然后根据保费金额以及因子类别对细分类型命名。...客户吸引力包括两个方面,一是客户规模,二是保费金额,根据其公司需要,权重6:4进行计算,得出客户吸引力。

84100

卡方分布分析与应用

独立性检验一般采用列联形式记录观察数据, 列联是由两个以上变量进行交叉分类频数分布,是用于提供基本调查结果最常用形式,可以清楚地表示定类变量之间是否相互关联。...独立性检验理论频数计算公式为: [图片] 公式中,fxi表示横行各组实际频数总和;fyi表示纵列各组实际频数总和;N表示样本容量总和; 例题:为了解男女在公共场所禁烟上态度,随机调查100...首先,两种检验抽取样本方法不同。如果抽样是在各类别中分别进行,依照各类别分别计算其比例,属于拟合优度检验。...如果抽样时并未事先分类,抽样后根据研究内容,把入选单位两类变量进行分类,形成列联,则是独立性检验。 其次,两种检验假设内容有所差异。...拟合优度检验原假设通常是假设各类别总体比例等于某个期望概率,而独立性检验中原假设则假设两个变量之间独立。 最后,期望频数计算不同。

2.6K70
您找到你想要的搜索结果了吗?
是的
没有找到

2022年财产保险行业研究报告

如果保险金额总和超过保险价值,各保险人承担赔偿金额总和不得超过保险价值。这是补偿原则在重复保险中运用,以防止被保险人因重复保险而获得额外利益。...(1)可保财产 企业财产项目类别包括房屋、建筑物及附属装修设备,机器及设备,工具、仪器及生产用具,交通运输工具及设备,管理用具及低值易耗品,原材料、半成品、在产品、产成品或库存商品、特种储备商品,建造中房屋...因此,财险承保利润实际上是已赚保费与赔付支出和保单获取成本之间差额。...许多保险公司已着手加大对话式人工智能或聊天机器人投资力度,促进各利益相关方之间沟通,缩短等待时间。...2021年以来,我国保险资金大类资产配置总体保持稳定,其他投资和债券仍是保险资金配置规模最大两个资产类别

75220

卡方检验

简介 卡方检验是一种统计方法,用于确定观察到数据与期望数据之间是否存在显著差异。它通常用于分析两个或多个分类变量之间关联性。...卡方检验常用于以下情况: 检验两个分类变量之间是否存在关联性,例如性别和吸烟习惯之间关联性。 检验一个分类变量在不同组之间分布差异,例如不同年龄组中偏好。...列联 两个分布,分别划分了互斥 bin,将样本联合分布发生实际次数填入一个二维中,这个就是列联。 用途 两种“皮尔森卡方检定”常用比较情境:拟合度检验和独立性检定。...计算卡方统计量 上述场景都需要用同样方法计算卡方统计量,这里独立性检验例子为例描述。 假设 H_0 成立。...}(1) 倘若 具体计算显著性水平下的卡方值可以查表 推广 可以推广到R×C列联中,同样地,要求行列变量是无序分类变量: 组别\属性 $Y_1$ $Y_2$ … $Y_C$ 总和 $G_1$ $A

49760

机器学习-04-分类算法-03KNN算法

) euclidean_distance函数计算多维空间中两点(x1和x2)之间欧氏距离,函数工作原理如下: 从x1元素中减去x2,得到对应坐标之间差值。...使用**2运算将差值平方。 使用np.sum()对差平方求和。 使用math.sqrt()取总和平方根。 欧几里得距离是欧几里得空间中两点之间直线距离。...K近邻算法一般流程 数据准备:这包括收集、清洗和预处理数据。预处理可能包括归一化或标准化特征,确保所有特征在计算距离时具有相等权重。...我们很容易发现,当计算样本之间距离时数字差值最大属性对计算结果影响最大,也就是说,每年获取飞行常客里程数对于计算结果影响将远远大于上表中其他两个特征-玩视频游戏所耗时间占比和每周消费冰淇淋公斤数影响...优化: 基于性能评估结果,可能需要返回并调整某些参数,如K值、距离度量方法等,获得更好性能。

8310

OA系统保险行业解决方案

进入“产品手册”首页之后,通过分类方式,展业人员可以通过险种类别、业务渠道等方面来快速查询所需险种。...针对以上情况,泛微通过搭建统一短保定价模块,达到全集团标准化,统一化效果。 短险定价平台用于客户保险业务中团险等渠道保费计算和提报审批。...通过OA系统与总公司保费计算系统做集成对接,业务员可以随时通过手机端填报短险定价信息,将具体计算数值回调到流程表单页面,来实现业务数据实时传递。...3短险定价流程.png 经过统一和标准保费计算页面,得到最终保费信息;再垂直化经由各层级领导审批,得到最终审核结果。...3、集中财务管理 在保险行业,收到保费和发生退保、赔付时,款项流进流出十分频繁;与客户对应收帐业务核销发生频繁,要求财务部门能够快速准确进行应收应付、预收、预付等业务之间对冲处理。

96730

【运营】任意两个时间段复购率?Power BI一招帮你搞定

前一个日期范围和后一个日期范围,所以需要同时有两个切片器。 那么问题来了,我们知道同一个字段切片器相互之间是有影响,所以一个日期是不能解决问题,我们需要第二张日期。...日期2 = '日期' 新建-输入以上内容,就这么简单,它会复制日期全部内容到日期2中。 同样,日期日期字段也要和订单建立关联: ? 我们将两个日期字段都添加为切片器: ?...根据函数描述,也就是求两个交集。再用COUNTROWS计算多少行,就是复购数量,再除以日期1客户数量,就得到了【复购率%】。 放到矩阵中: ?...这样,我们随意拖动两个滑竿,就能实现年、季度、月、周等任意时间段复购情况。 如果想查看明细,可以添加一个客户ID字段来下钻: ? 在查看不同维度复购率时,发现了一个有趣事情: ?...当左侧切片为地区时,发现只有华东和中南复购分别为2和3,总和应该为5,但是总计行是20,20也是用类别做切片器时总和,这是怎么回事呢?

2.6K41

如何以正确方法做数据建模?

一般情况下,建模规律,我们可以分为三种不同类型:如下: ? 当报表要求简单且不复杂时,对一组数据建模最简单方法有时是将其转换为一个单一平面:你可以添加一列值,或者通过其他列进行过滤。...如上图,这些数据如果存储在Excel表格中,你可以“订单日期”列进行筛选,并将数量、单位成本和单价相加。还可以对“公司名称”、“类别”或“产品名称”列应用筛选器。...实体具有描述特定属性属性。在数据分析中,实体通常被具体化为维度,每个属性都是一个列或字段。 事实包含用于汇总和聚合度量值数字列,以及与维度表相关列。...你将注意到,从每个维度到事实关系是一对多,并在一个方向上过滤记录,如关系行上箭头所示。例如,“客户信息”与“在线销售”之间关系基于这两个“客户Key”列。...可以使用事实字段来执行诸如计算两个日期类型列之间差值计算具有未来日期行等操作。另外在“视情况而定”情况,你必须根据业务报告需求做出判断,在简单性和可维护性与复杂性和灵活性之间取得平衡。

3.2K10

【数据库设计和SQL基础语法】--查询数据--聚合函数

GROUP_CONCAT(employee_name SEPARATOR ', ') AS employee_names FROM employees GROUP BY department_id; 逗号分隔合并产品类别...性能测试: 对包含 NULL 值进行性能测试,特别是在数据量较大情况下,确保查询效率和性能。...*避免 SELECT : 只选择需要列,而不是使用 SELECT *,减少数据传输和提高查询效率。 结构设计 范式化 vs....反范式化: 根据实际情况选择合适范式化级别,有时反范式化可以提高查询性能。 垂直分割和水平分割: 将大型拆分为更小减少查询数据量。...在大数据环境下,可能需要考虑其他方法来达到相同目的,保证查询性能。 八、总结 聚合函数是SQL中重要工具,用于对数据进行汇总和计算

46410

【数据库设计和SQL基础语法】--查询数据--聚合函数

GROUP_CONCAT(employee_name SEPARATOR ', ') AS employee_names FROM employees GROUP BY department_id; 逗号分隔合并产品类别...性能测试: 对包含 NULL 值进行性能测试,特别是在数据量较大情况下,确保查询效率和性能。...*避免 SELECT : 只选择需要列,而不是使用 SELECT *,减少数据传输和提高查询效率。 结构设计 范式化 vs....反范式化: 根据实际情况选择合适范式化级别,有时反范式化可以提高查询性能。 垂直分割和水平分割: 将大型拆分为更小减少查询数据量。...在大数据环境下,可能需要考虑其他方法来达到相同目的,保证查询性能。 八、总结 聚合函数是SQL中重要工具,用于对数据进行汇总和计算

40310

持续时间偏移日期时间

可以如下方式计算日期时间偏移持续时间:yx + yxyDateDateTimeDateTimeZoneTime 如果指定了日期时间自纪元值以来天数,则使用以下信息元素构造一个新日期时间: 计算自纪元以来新天数...计算自午夜以来新滴答声,相当于将 y 大小添加到自午夜起 x 滴答声中, 24 小时周期内 100 纳秒滴答声数量为模。如果 x 没有指定自午夜以来刻度值,则假定值为 0。...传播评估任一操作数时引发错误。 数值差异 使用减法运算符计算两个数字之间差值,产生一个数字。...结果标度是两个操作数标度中较大一个。 时长差异 两个持续时间差值是表示每个持续时间所代表 100 纳秒滴答数之差持续时间。...两个日期时间, t并且u可以减去t - u用于计算它们之间持续时间。

2.7K20

R如何与Tableau集成分步指南

在你现在可以看到图表中,排名是根据月份数量分配。但是,我们需要他们在细分市场基础上。因此,右键点击排名在行, 并转到编辑计算。 由于我们希望使用段计算,请将配置更改为: ?...最后,将销售额拖放到标签 - >快速计算 - >总计百分比上,获得我们期望凹凸图。 1.3甜甜圈图 圆环图是小学图另一种表现形式。...这具有作为X轴类别和作为Y轴销售。图表降序排列: ? 接下来,将销售额拖放到图表上,直到您看到绿色突出显示条形和最右边虚线轴: ? 在此处下降销售创建双轴。...以下描述了Tableau和R之间控制流程,实现此集成: R脚本作为计算写入Tableau ,并发送到RR服务包。在此模块执行必要计算并将结果返回给Tableau。...在这里,您可以通过不同度量获得总和。要获得离散值,请转至分析,并取消选中聚合度量,获取: ? 最后,要形成群集,请在标记窗格中将类维度拖到颜色上: ?

3.5K70

神经网络算法——损失函数(Loss Function)

损失函数接收这些预测值,并计算与真实值之间差异。 这个差异随后被用于向后传播阶段,更新模型参数并减少未来预测误差。...损失函数位置 2、损失函数原理 误差反映单个数据点预测偏差,损失则是整体数据集预测偏差总和。损失函数运用这两者原理,聚合误差优化模型,降低总体预测偏差。...其中,绝对误差是预测值与真实值之间差值绝对值,用于量化预测偏离真实值实际大小;平方误差则是预测值与真实值之间差值平方,常用于平方损失函数中,以便更显著地突出较大误差。...损失曲线 3、损失函数算法 损失函数算法 (1)均方差损失函数(MSE) 通过计算模型预测值与真实值之间差值平方平均值,衡量回归任务中预测结果准确性,旨在使预测值尽可能接近真实值。...(2)交叉熵损失函数(CE) 用于衡量分类任务中模型预测概率分布与真实标签之间差异,旨在通过最小化损失来使模型预测更加接近真实类别

1.7K10

52个数据可视化图表鉴赏

轴与线之间区域通常用颜色、纹理和图案填充来强调。通常一个面积图用于比较两个两个以上变量。 3.箭头图 箭头图可用作多个饼图替代品。...交叉表显示两个或多个变量联合分布,它们通常以矩阵中列联形式表示。 (由于和excel格式相仿,个人认为是Tableau里最体现造轮子特点一张图。)...桑基图最明显特征就是,始末端分支宽度总各相等,即所有主支宽度总和应与所有分出去分支宽度总和相等,保持能量平衡。 41.散点图 (全球各地进行 100 次地表温度 (°C) 观察。...每个数据点均表示为根据 1961-1990 平均值计算与中值差值或温度异常值。)...散点图通常用于比较跨类别的聚合数据。 42.分段条形图 当两个或多个数据集并排绘制并分组在同一轴上类别下时,可以使用如图条形图这种变化。

5.8K21

pay as you go:当程序员盯上了车险

如果无法获取用户每天,每个月行驶里程,那么,里程付保费就无从谈起。...因此,传统保险公司鲜有行驶里程来计算客户保费,即便有,也是很粗略地让客户估计一个使用区间,然后要求客户在每次保养时,上传保养报告,来获取近几个月来实际里程数。...那些经常开车客户,每次续保时候会经常威胁换保险获取对自己最有利条款和保费;而那些不经常开车客户,续保时也懒得折腾,你说啥就是啥。 多扯两句。...我们依旧需要考虑硬件稳定性,以及传输安全性,不过这两个问题前一个方案也有。...甚至,如果一个区域有足够多家庭使用这样保险,它还能进一步发掘出人和人之间关系,细思恐极。 这是互联网行业通病。

662110

人工智能在保险领域应用三个重要趋势

这个想法是,如果Neos提供技术可以减少天然气拿起泄漏,水损害和家庭被盗窃情况,那么他们将能够较低保费形式将这些方面的费用节省转移给他们客户。 ? 唯一收获?...UBI(使用付费)是一个新兴领域,因此对驾驶数据选择和解释以及如何将这些数据整合到现有或新价格结构中保持盈利能力仍存在很大不确定性“。 但大多数尝试过它顾客似乎都喜欢它。...一些保险公司为参与使用付费保险计划提供折扣,收集数千英里受监控驾驶数据。然后,他们可以使用这些数据对其他业务线上公司风险评分模型进行基准评估。 大约五分之一用户甚至没有兴趣。...对于人工智能在保险领域应用来说,这两个重点领域可能是最容易取得效果领域。 由于中国保险公司和医院之间数据共享有限,众安保险依靠人工智能解决方案处理大量保单持有人纸质信息。...结论:人工智能将成为保险领域标配 客户在获得保险公司赔付时需要评估保险产品,而不是在购买时进行评估。与其他产品或服务不同,客户只能对发生保险事件时保险公司价值形成判断。

4.9K110

消失两个数字(难度:困难)

一、题目 给定一个数组,包含从 1 到 N 所有的整数,但其中缺了两个数字。你能在 O(N) 时间内只用 O(1) 空间找到它们吗? 任意顺序返回这两个数字均可。...,有两个非常重要信息,分别是: • 1> 入参nums数组包含了从1到N所有整数,即:没有重复元素。...那么,以下图为例,计算完整体总和(数学家小高斯巧解一加到一百故事),我们就可以通过:(1 + 10) * 数组长度 / 2 ,即:55。...然后我们再遍历nums数组,获得所有元素总和等于44,那么我们就可以知道这个位置元素x和元素y总和就是:55 - 44 = 11了。...在获得完全体中小于等于5元素(即:1、2、3、4、5)总和于15,那么他们差值就是x了,即:x = 15 - 11 = 4。 而我们前面已经计算过x + y = 11,由于x等于4,则y = 7。

19720

机器学习学习笔记(3) --SparkMLlib部分算法解析

梯度下降停止条件: Ⅰ、当计算得到差值小于指定差值 Ⅱ、当迭代到指定次数   训练数据集一般分为两部分: Ⅰ、训练集 Ⅱ、测试集 一般训练集和测试集8|2分。   ...) 含有Viagra且是垃圾邮件概率   计算贝叶斯定理中每一个组成部分概率,我们必须构造一个频率: ?   ...KNN算法由邻居推断类别,就是距离衡量样本之间相似度。 ? ? ?   ...4、K-Means算法(无监督聚类算法) 聚类定义和思想:   聚类是一种无监督学习,就是对大量未知标注数据集数据内在相似性将数据集划分为多个类别,使类别数据相似度较大而类别相似度较小...,一个类别也叫一个簇,类别相似性越大,类别之间差别越大则聚类效果越好。

45820

系统调优助手,PyTorch Profiler TensorBoard 插件教程

这个按钮是最常用。 另外,在可视化界面的右上角有一个Flow Events按钮,有ac2g和fwdbwd两个按钮,前面这个按钮可以让我们获得CPU算子和CUDAKernel映射关系。...注意:以上所有类别的总结是端到端实际时间。 上述列表优先级从高到低排列。我们优先顺序计算时间。...最高优先级类别(Kernel)时间成本最先计算 ,然后是 Memcpy,然后是 Memset,...,最后是其他。...通过这种方式,一个step中所有 7 类别计算时间总和将与该step总实际时间相同。 Operator视图 此视图显示了在主机或设备上执行每个 PyTorch 操作符性能。...中间左侧面板是“计算/通信概览”。每个图例定义: 计算:GPU上kernel时间总和减去重叠时间。 重叠:计算和通信重叠时间。更多重叠代表计算和通信之间更好并行性。

33710
领券