首页
学习
活动
专区
工具
TVP
发布

kk大数据

专栏成员
116
文章
219680
阅读量
43
订阅数
谈一谈 Kafka 在 CAP 三大特性之间做的妥协和改进
CAP 定理是分布式架构设计的基本理论,本身并不复杂。 是由三个单词组成,分别是:
kk大数据
2023-03-03
1.1K0
当 Redis 原生支持 JSON,大厂程序员都说它像德芙一样丝滑
喜大普奔,Redis 官方支持 JSON 操作了,当我看到这个消息时,我的脑海中立马闪过这些操作:
kk大数据
2021-12-20
8.2K0
一文彻底了解元数据管理与架构设计
数据治理很火,在 DAMA 数据管理知识体系指南中,数据治理位于 “数据管理车轮图” 的正中央,如下图:
kk大数据
2021-12-02
8K0
Flink SQL 核心概念剖析与编程案例实战
本次,我们从 0 开始逐步剖析 Flink SQL 的来龙去脉以及核心概念,并附带完整的示例程序,希望对大家有帮助!
kk大数据
2021-01-12
6780
大数据快速入门(07):数据仓库神器 Hive
上次,小K 介绍了 MapReduce 框架,大大简化了大数据编程的难度,即使是没有学过分布式技术的开发人员,也能用 MapReduce 开发出大数据分布式计算程序。
kk大数据
2020-11-03
5220
互联网性能优化利器-缓存
缓存是介于数据访问者和数据源之间的一种高速存储,当数据需要多次读取时,用于加快读取的速度。
kk大数据
2020-07-29
5160
Hive的常用优化
数据量大尽量避免使用 count(distinct) ,这会导致所有数据在一个 reduce 内去重,导致运行缓慢,使用 group by 来代替
kk大数据
2020-04-24
1.3K0
Python 基础数据结构,今年学好 Python,工作效率涨一倍
相信大家在工作中,会有一些头大的需求,特点是:一次性,稍微有点复杂,手工也能弄完。用 Java 写吧太笨重,代码多,不用 Java 写手工搞吧,痛不欲生。
kk大数据
2020-02-14
3170
Flink SQL DDL 和 窗口函数实战
2019 年 8 月 22 日,Flink 发布了 1.9 版本,社区版本的 Flink 新增 了一个 SQL DDL 的新特性,但是暂时还不支持流式的一些概念的定义,比如说水位。
kk大数据
2019-12-19
5.1K0
KK 软件大师
一共 300 款软件,承包了我一年的更新内容 只为了在你最需要的时候,把软件送到你手上 所有软件均本机测试通过,无毒无插件,放心使用 软件分类清单 办公软件 Office 实用工具 (Windows工
kk大数据
2019-10-29
1.8K0
Flink 编程接口
现实世界中,所有的数据都是以流式的形态产生的,不管是哪里产生的数据,在产生的过程中都是一条条地生成,最后经过了存储和转换处理,形成了各种类型的数据集。
kk大数据
2019-09-24
7690
实时计算数据架构的演变
存储层,主要是负责存储企业各种系统产生的数据,如 Web 业务系统、订单系统、CRM 系统,ERP 系统、监控系统,数据比如系统的订单交易量,网站的活跃用户数,每个用户的交易额。
kk大数据
2019-09-19
8970
数据分析:数据采集是根基
数据传输,指的是数据以何种方式流入到存储介质,比如日志是通过logstash还是filebeat采集到kafka的,前端的操作记录是通过http请求发送的
kk大数据
2019-08-14
6970
Hive 系列 之 基础知识和操作合集
今天,朋友圈和公众号被鸿蒙刷屏,作为开发者,由衷感叹人类科技已经发展得这么先进了,基于微内核的全场景分布式OS,虽然不太懂是什么意思,但仍然觉得高大上。
kk大数据
2019-08-14
6170
Hive 系列 之 UDF,UDTF,UDAF
Hive 的 类 sql 给 开发者和分析者带来了极大的便利,使用 sql 就可以完成海量数据的处理,但是有时候,hive 自带的一些函数可能无法满足需求,这个时候,就需要我们自己定义一些函数,像插件一样在MapReduce过程中生效。
kk大数据
2019-08-14
5K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档