大数据个人总结

31 篇文章
21K 次阅读
14 人订阅

全部文章

平常心

数据SLA服务保障

团队成员在数据SLA服务保障缺乏意识认识、行动的执行策略、以及事故的档案管理、进行经验积累与复盘。基于时间推演,复盘总结不断迭代完善,最终目标是达到服务可用性在...

14450
平常心

AB实验设计-通用内容说明

AB实验主要分为两部分,第一部分搞清楚自己需要实验的场景,第二部分是基于不同的场景如何设计和开展实验。

34772
平常心

订阅软件的销售指标

1.1 定义:月度订阅营业额 Monthly Recurring Revenue ,即每个付费用户平均到月的营业额的总和。

23310
平常心

AARRR模型的数据指标体系

AARRR是产品用户运营链路体系,从拉新 -> 促活 -> 留存 -> 传播 -> 收入形成一个用户链路,注重以用户为中心,关注用户生命周期的产品运营方式。也...

20920
平常心

留存和流失指标

关注产品对应用户的黏性,评判APP初期能否留下用户,以及活跃用户规模增长的情况,尤其在在AARRR模型,留存被单独说明为一个用户运营数据指标。

25530
平常心

NPS指标

以用户为中心,注重用户体验,衡量用户对产品是否真的满意 — NPS(NetPromoter Score)净推荐值。它的意义和核心就是调研用户是否愿意将这个产品推...

27430
平常心

常见的电商数据指标体系

32030
平常心

自建大数据迁移到云大数据整体方案

公司从自建大数据,服务器,网络,大数据技术组件经常出问题,基本每周异常达到2次,不能够很少的保障业务应用。同时因为投入人力在这块进行服务保障效果不好评估的情况下...

22300
平常心

Flink Mysql CDC 统计处理

说明: 该依赖已经内置了debezium进行处理mysql 变更数据并发送了,所以我们不需要额外的方式,简化了异常 mysql → debezium → kaf...

70530
平常心

指标数据运维流程

针对目前大数据异常响应效率低,解决处理定位难,运维压力集中在某几个人等不合理的现状。经过大家沟通讨论会商量和整理,目前初步的TODO和流程说明如下:

17400
平常心

数据仓库设计和规范—指标说明规范

指标说明是对指标统计口径、具体算法的抽象,防止统计口径,计算逻辑不一致导致的数据结果问题,同时指标的明确规范也可以减少业务沟通,提升研发效率。指标分为原子指标和...

45220
平常心

yarn任务简单的python钉钉告警

开通钉钉群自定义告警机器人,主要是否要加签和关键词,本次使用告警的关键词是Flink任务。

27840
平常心

实时数仓

一方面互联网行业对实时化服务的要求日益增多,尤其在信息流,短视频应用最为显著,同时随着实时技术引擎的发展能够提供高效,稳定的实时数据服务能力。另一方面初期实时计...

77420
平常心

数据仓库设计和规范—安全等级和说明

针对个人身份信息(PII, Personal Identity Information)和ISO/IEC 27018 PII 保护信息安全体系等要求,对重要和隐...

26720
平常心

Hive 基于GenericUDF创建UDF

38030
平常心

flink读取kafka报shaded ByteArrayDeserializer异常

可以看到提供的内容,对应进行maven pom文件去掉flink-connector-kafka就可以了,引用flink-sql-connector就可以解决这...

1.5K10
平常心

数据仓库设计和规范—数仓分层和规范

通常的命名方式是:ODS_应用系统名(或缩写)_数据库类型_(数据库名称可省略)_数据表名_加载方式(增量还是全量),表名不能太长,一般不超过30字。如:

1.6K23
平常心

数据仓库设计和规范—数仓的数据域,指标域体系结构梳理

针对数据统计,分析指标的开发,划分对应所属业务板块,数据域,指标域,建立统一的,规范化的数据仓库和数据内容,从而能够提供标准化的,共享的数据服务能力,降低数据互...

93210
平常心

数仓设计和规范—数仓构建流程

② 维度:维度是度量的环境,是我们观察业务的角度,如时间,地点等,用来反映业务的一类属性 。其中描述维度的是 属性,即维度属性,是查询约束条件、分组和报表标签生...

46920
平常心

Flink自定义OSS的Sink

基于上篇说明的OSS异常内容和功能弱的缘故,考虑自定义Sink处理的方式。主要关注点是文件命名的动态化和高效批写入。

44520

扫码关注腾讯云开发者

领取腾讯云代金券