数据社

66 篇文章
9 人订阅

全部文章

数据社

从0到1搭建大数据平台之调度系统

记得第一次参与大数据平台从无到有的搭建,最开始任务调度就是用的Crontab,分时日月周,各种任务脚本配置在一台主机上。crontab 使用非常方便,配置也很简...

27120
数据社

Flink 1.11:更好用的流批一体 SQL 引擎

许多的数据科学家,分析师和 BI 用户依赖交互式 SQL 查询分析数据。Flink SQL 是 Flink 的核心模块之一。作为一个分布式的 SQL 查询引擎。...

10010
数据社

从0到1搭建大数据平台之数据采集系统

当你需要搭建大数据平台的时候一定是传统的关系型数据库无法满足业务的存储计算要求了,所以首先我们面临的是海量的数据。

12230
数据社

从能力模型来讲数据产品经理的成长指南

数据产品经理是伴随着大数据、人工智能的火热,新兴起的热门岗位,也是集数据、产品、运营、技术等各方向知识能力的综合岗位。今天通过能力模型为大家分享数据产品经理的成...

13120
数据社

如何从0到1搭建大数据平台

大数据时代这个词被提出已有10年了吧,越来越多的企业已经完成了大数据平台的搭建。随着移动互联网和物联网的爆发,大数据价值在越来越多的场景中被挖掘,随着大家都在使...

16720
数据社

日志收集组件—Flume、Logstash、Filebeat对比

数据的价值在于把数据变成行动。这里一个非常重要的过程是数据分析。提到数据分析,大部分人首先想到的都是Hadoop、流计算、机器学习等数据加工的方式。从整个过程来...

76730
数据社

【数据说第十三期】数据驱动业务增长的底层逻辑

前面梳理交流了如何通过分析“新增”、“活跃”、“留存”等数据,本季主要深挖用户表面行为的背后真实、本质的需求,全面视角的分析产品的用户行为数据,展现驱动...

9030
数据社

关于数据库,程序员应该了解的那些事

对于很多程序员来说,公司选择什么样的数据库,基本不需要你来决定。当你加入一个公司的时候,公司的大部分技术选型已经确认,特别是数据库选型,因为数据库一旦选择,后期...

11540
数据社

spark常用的Transformations 和Actions

spark最长用的两个Transformations:map,filter,下面就来介绍一下这两个。

10240
数据社

一文了解GreenPlum

行式数据库是按照行存储的,行存储就是各行放入连续的物理位置,就行我们平时写字一样,一行一行的写,读取的时候也是一行一行的读取。像SQL server,Oracl...

14810
数据社

数据挖掘从入门到放弃(七):TensorFlow和keras实现线性回归LinearRegression

从实践出发学习TensorFlow和teras机器学习框架,分别用tf和keras实现线性模型,两者区别在于前者相当于手推了线性回归模型,后者使用单层的感知机,...

17730
数据社

数据中台设计方法论

横向规划即在数据中台规划初期,需要打通企业各个业务系,打破数据孤岛现象。其实就是我们建设数据仓库的阶段。比如电信业务,我们要把客户、账务、客服、营销等业务板块打...

24530
数据社

如何设计数据中台

横向规划即在数据中台规划初期,需要打通企业各个业务系,打破数据孤岛现象。其实就是我们建设数据仓库的阶段。比如电信业务,我们要把客户、账务、客服、营销等业务板块打...

32750
数据社

如何入门数据分析?

如果你刚开始学习数据分析,那么怎么入门呢?其实各大招聘网站的数据分析职位就是一个很好的参考。那么数据分析师究竟需要哪些技能呢?

20631
数据社

数据分析为什么火了

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和...

17920
数据社

数据挖掘从入门到放弃(二):决策树

“ 上篇内容介绍的是线性回归和逻辑回归模型,输入输出是连续值,分类模型的输出是一个有限集合,本篇介绍决策分类树算法”

11520
数据社

谈谈ETL中的数据质量

当我们把数据导入数据仓库时,ETL中的每个步骤中都可能会遇到数据质量错误。比如与源系统的连接错误,抽取数据可能会失败。由于记录类型冲突,数据转换可能会失败。即使...

19940
数据社

数据挖掘从入门到放弃(一):线性回归和逻辑回归

“ 数据挖掘算法基于线性代数、概率论、信息论推导,深入进去还是很有意思的,能够理解数学家、统计学家、计算机学家的智慧,这个专栏从比较简单的常用算法入手,后续研究...

8620
数据社

聊聊数据库

众所周知,文明的发展离不开信息的积累,而任何东西的积累离不开存储。因此,信息存储是文明发展的重要环节,从某种意义上讲,甚至可以说是人类迈入文明社会的标志之一。在...

13830
数据社

经典中的经典--泰坦尼克号的乘客生存预测

数据分析/挖掘是以概率论、线性代数、统计学、信息论为基础,根据之前接触到的数据挖掘流程,可定义为:数据准备-->数据探索--> 数据预处理-->特征工程-->模...

15530

扫码关注云+社区

领取腾讯云代金券