首页
学习
活动
专区
工具
TVP
发布

数据社

专栏作者
129
文章
177317
阅读量
35
订阅数
复盘一件关于数据的糟心事!
最近郑州的疫情挺严重的,已经居家一个月了,错过了整个秋天。从10月初小区封控到月末小区有几十例异常,上周才刚刚解封,可以下楼。
数据社
2023-01-04
3040
「原创」大数据岗位总结和相关书籍推荐
最近有几个群友问我大数据怎么入门,作为一个零基础大数据入门学习者该看哪些书呢?我结合自己看过的书和了解到的比较好的数据,给大家分享一下。
数据社
2022-04-08
4140
2022年始,这家大数据公司融资2.5亿美元,估值33.5亿美元!
2022年数据平台的风口到底在哪?今天看到了一个消息,Starburst 这家公司上周融资了2.5亿美元,最新估值达到33.5亿美元!
数据社
2022-02-17
8020
「原创」大数据采集的一些面试问题
数据采集是大数据的基石,不论是现在的互联网公司,物联网公司或者传统的IT公司,每个业务流程环节都会产生大量的数据,同时用户操作的日志也会产生大量的数据,为了将这些结构化和非结构化的数据进行采集,我们必须要有一套完整的数据采集方案流程,为后续的数据分析应用提供数据基础。
数据社
2022-02-17
8320
Flink在中原银行的实践
在构建实时场景的过程中,如何快速、正确的实时同步业务数据是最先面临的问题,本文主要讨论一下如何使用实时处理引擎Apache Flink和数据湖两种技术,来解决业务数据实时入湖的相关问题。两者的结合能良好的支持实时数据落地存储,借助Apache Flink出色的流批一体能力,可以为用户构建一个准实时数仓,满足用户准实时业务探索。
数据社
2021-09-23
1.1K0
五万字 | Hive知识体系保姆级教程
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。
数据社
2021-08-27
1.6K0
浅谈数据管理的DNA — 元数据
企业架构理论体系中,数据架构始终是企业架构的核心组成部分。TOGAF企业架构框架定义了数据架构位于业务架构与基础技术架构之间,通过数据架构的治理实现的业务和应用的有效衔接。
数据社
2021-07-30
7900
基于Flink CDC打通数据实时入湖
在构建实时数仓的过程中,如何快速、正确的同步业务数据是最先面临的问题,本文主要讨论一下如何使用实时处理引擎Flink和数据湖Apache Iceberg两种技术,来解决业务数据实时入湖相关的问题。
数据社
2021-07-09
1.4K0
智慧金融大数据平台总体架构方案
大家好,我是一哥,今天给大家分享一下智慧金融行业的大数据平台总体架构是如何设计的,包括:
数据社
2021-05-07
8640
一哥答疑,如何面对繁杂的数据需求?
大家好,我是一哥,最近有一位数据新人小伙伴伴私聊我:在平时的工作中会面临着大量的数据需求,不仅多,而且杂,请问如何处理面对这些问题?有没有什么好的提高工作效率的方法?
数据社
2021-03-09
3290
干货,主流大数据技术总结
互联网技术的发展让大多数企业能够积累大量的数据,而企业需要灵活快速地从这些数据中提取出有价值的信息来服务用户或帮助企业自身决策。然而处理器的主频和散热遇到了瓶颈,CPU难以通过纵向优化来提升性能,所以多核这种横向扩展成为了主流。也因此,开发者需要利用多核甚至分布式架构技术来提高企业的大数据处理能力。这些技术随着开源软件的成功而在业界得到广泛应用。
数据社
2021-01-08
5450
OLAP计算引擎怎么选?
大家好,我是一哥,今天聊一聊OLAP技术,一哥认为好的OLAP引擎应该具备以下三个条件:易开发、易维护、易移植。今天给大家分享一下常见的几种OLAP计算引擎,他们的特性、适用场景,优缺点等,希望对大家在选型应用上有帮助。
数据社
2020-12-08
2K0
数据分析必备——统计学入门基础知识
导读:要做好数据分析,除了自身技术硬以及数据思维灵活外,还得学会必备的统计学基础知识!因此,统计学是数据分析必须掌握的基础知识,即通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。统计学用到了大量的数学及其它学科的专业知识,其应用范围几乎覆盖了社会科学和自然科学的各个领域,而在数据量极大的互联网领域也不例外,因此扎实的统计学基础是一个优秀的数据人必备的技能。
数据社
2020-10-09
1.4K0
数据和业务的关系是什么?
数据和业务的关系,没有固定形态,就如兵无常势、水无常形。这和公司大boss的风格、业务boss的风格、数据boss的风格、公司组织架构紧密相关。
数据社
2020-09-25
7550
从0到1搭建自助分析平台
自助分析平台是构建在大数据平台之上的,依托于大数据平台的数据研发能力,通过统一的数据服务,实现对数据查询、分析的统一管理,为企业业务分析提供高效的数据决策支持,同时也避免数据工程师陷入繁杂的提数需求中。自助分析平台是有计算机基础的业务人员能够快速上手的前端产品,既要有大数据的处理性能,有需要有简单好用的可视化分析能力,只有让业务人员能够快速掌握使用方法,和公司的业务结合起来,自助分析平台才有价值。其实,一直以来,各大公司的数据分析平台都只有一个目标——干掉Excel。
数据社
2020-09-16
1.2K0
内含面试|一文搞懂HBase的基本原理
温馨提示:本文内容较长,如果觉得有用,建议收藏。另外记得分享、点赞、在看,素质三连哦!
数据社
2020-09-08
7920
数据驱动业务增长的底层逻辑2.0
漫漫人生路,向左,向右,方向心已确定,只是等车来,不管前行有多难,只要怀揣梦想,终能到达心所想的目的地。数据之路,与你同行!——数据说·梦想季
数据社
2020-08-27
9930
从能力模型来讲数据产品经理的成长指南
数据产品经理是伴随着大数据、人工智能的火热,新兴起的热门岗位,也是集数据、产品、运营、技术等各方向知识能力的综合岗位。今天通过能力模型为大家分享数据产品经理的成长指南,与同行专家一起交流心得,与想转行和进阶成长的同学分享一些经验。
数据社
2020-07-02
1.1K0
日志收集组件—Flume、Logstash、Filebeat对比
数据的价值在于把数据变成行动。这里一个非常重要的过程是数据分析。提到数据分析,大部分人首先想到的都是Hadoop、流计算、机器学习等数据加工的方式。从整个过程来看,数据分析其实包含了4个过程:采集,存储,计算,展示。大数据的数据采集工作是大数据技术中非常重要、基础的部分,具体场景使用合适的采集工具,可以大大提高效率和可靠性,并降低资源成本。Flume、Logstash和Filebeat都是可以作为日志采集的工具,本报告将针对这三者进行分析。
数据社
2020-06-28
9.7K0
【数据说第十三期】数据驱动业务增长的底层逻辑
前面梳理交流了如何通过分析“新增”、“活跃”、“留存”等数据,本季主要深挖用户表面行为的背后真实、本质的需求,全面视角的分析产品的用户行为数据,展现驱动业务实现增长的经验、案例以及方法论。
数据社
2020-06-24
1.1K0
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档