kk大数据

LV0
发表了文章

flink 到底有什么优势值得大家这么热衷

flink 通过实现了 Google Dataflow 流式计算模型实现了高吞吐、低延迟、高性能兼具实时流式计算框架。

kk大数据
大数据分布式文件存储ApacheJVM
发表了文章

实时计算数据架构的演变

存储层,主要是负责存储企业各种系统产生的数据,如 Web 业务系统、订单系统、CRM 系统,ERP 系统、监控系统,数据比如系统的订单交易量,网站的活跃用户数,...

kk大数据
数据库SQL大数据存储微服务架构
发表了文章

图床来了,markdown和wordpress用户的福音,每月一块钱

相信大部分技术人写作都是用 markdown 轻量级标记语言进行博客写作,但是基本所有支持 markdown 本地写作工具都只能采用导入本地图片引用的方式,一旦...

kk大数据
https网络安全WordPressGitHubGit
发表了文章

数据分析:数据采集是根基

数据传输,指的是数据以何种方式流入到存储介质,比如日志是通过logstash还是filebeat采集到kafka的,前端的操作记录是通过http请求发送的

kk大数据
网站数据库SQLTCP/IP
发表了文章

Hive 系列 之 基础知识和操作合集

今天,朋友圈和公众号被鸿蒙刷屏,作为开发者,由衷感叹人类科技已经发展得这么先进了,基于微内核的全场景分布式OS,虽然不太懂是什么意思,但仍然觉得高大上。

kk大数据
编程算法大数据Hive数据库SQL
发表了文章

Java虚拟机:我们写的java代码究竟是如何运行起来的

首先假设咱们写好了一份Java代码,那这份Java代码中,是不是会包含很多的“.java”为后缀的代码文件?

kk大数据
JVMJava打包JAR
发表了文章

数据分析,你知道维度和指标的区别吗

指标,是衡量事务发展程度的单位和方法,通常需要经过加和、平均等聚合统计才能得到,并且是在一定条件下的。

kk大数据
发表了文章

Hive系列:分桶表

分桶将整个数据内容按照某列属性值的hash值进行区分,如要按照 name 属性分为3个桶,就是对 name 属性值的hash值对3取模,按照取模结果对数据分桶。

kk大数据
发表了文章

如何阅读源码,这一篇应该够了

很多人一定和我一样的感受:源码在工作中有用吗?用处大吗?很长一段时间,我也有这样的疑问,认为那些有事没事扯源码的人,就是在装,只是为了提高他们的逼格而已。

kk大数据
打包sparkScalaIDE
发表了文章

Hive 系列 之 开篇

细细品味这首诗,忽然发觉以前学这首诗的意义在于背诵和考试,如今细细品味这首诗,不禁感叹意境真好。天色微凉,牵着手,一起爬山那高高的山头看那天边的牵牛织女星,多么...

kk大数据
HiveMapReduce大数据JDBC数据库
发表了文章

Python 统计次数,我的方法和高手的方法

kk大数据
Python
发表了文章

Hive系列:二级分区、动态分区和混合分区

partitioned by (uyear string,umonth string);

kk大数据
数据库
发表了文章

Python每日一练:如何在列表、字典、集合中筛选数据

筛选出字典{'Lilei': 79,'Jim': 88,'Lucy':92}值大于90的

kk大数据
Python
发表了文章

分布式弹性数据集(下)

文章概述:RDD的其他几个知识点,依赖关系(Dependencies)、检查点(Checkpoint)、存储级别(Storage Level)和迭代函数(Ite...

kk大数据
spark缓存Java编程算法
发表了文章

分布式弹性数据集(上)

传统的 MapReduce 框架之所以运行速度缓慢,很重要的原因就是有向无环图的中间计算结果需要写入硬盘这样的稳定介质中来防止运行结果丢失。

kk大数据
存储分布式

个人简介

个人成就

  • 获得 46 次赞同
  • 文章被阅读 1.5K 次

扫码关注云+社区

领取腾讯云代金券