首页
学习
活动
专区
工具
TVP
发布

最新最全的大数据技术体系

专栏作者
717
文章
541056
阅读量
33
订阅数
学习笔记:StructuredStreaming入门(十二)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6wtQxLP6-1626354186973)(/img/image-20210506154426999.png)]
Maynor
2022-11-30
1.7K0
Cloudera Manager环境搭建【二】
swappiness是Linux的一个内核参数,控制系统在使用swap虚拟内存时,内存使用的相对权重。
Maynor
2022-11-28
5930
Cloudera Manager环境准备【一】
一般而言,一个集群上很少只跑一个业务,大多数情况都是多个业务共享集群,实际上就是共享系统软硬件资源。
Maynor
2022-11-28
6930
实时即未来,车联网项目之电子围栏分析【六】
通过关联两个数据流后CoFlatMap 后生成实体类—— ElectricFenceModel
Maynor
2022-10-04
9980
大数据运维之MySQL备份及恢复
能够防止由于机械故障以及人为误操作带来的数据丢失,例如将数据库文件保存在了其它地方。  冗余:  数据有多份冗余,但不等备份,只能防止机械故障还来的数据丢失,例如主备模式、数据库集群。
Maynor
2022-09-26
3910
Spark_Day07:Spark SQL(DataFrame是什么和数据分析(案例讲解))
在Spark中,DataFrame是一种以RDD为基础的分布式数据集,类似于传统数据库中的二维表格。 DataFrame与RDD的主要区别在于,前者带有schema元信息,即DataFrame所表示的二维表数据集的每一列都带有名称和类型。
Maynor
2022-05-08
2.5K0
程序员小sister的烦恼_快速上手大数据ETL神器Kettle(xls导入mysql)
一文快速搞懂系列讲究快速入门掌握一个新的大数据组件,帮助新手了解大数据技术,以下是系列文章:
Maynor
2022-05-08
1K0
Spark综合练习——电影评分数据分析
全部数据: 链接:https://pan.baidu.com/s/1qiO9aRb7yQeuHDtH1cWklw 提取码:nwxj
Maynor
2022-05-08
1.4K0
大数据面试题百日更新_Hive专题(Day13)
查询语言不同,传统数据库用的是SQL语句,hive是集成的HQL语句. 数据存储地方不同,不同于传统数据库存储在原始设备或本地文件系统(Raw Device or Local FS),Hive 存储在HDFS. 执行方式不同,传统数据库是Excutor单元执行,hive是MapReduce 同时hive执行延迟高,处理数据规模大,无索引(0.8版本后才加入位图索引,mysql有复杂的索引),都是hive与传统的区别.
Maynor
2022-05-08
2350
大数据繁荣生态圈组件之实时大数据Druid小传(一)
项目中采用的关系型数据库是mysql,那么关系型数据库有哪些优劣势,我们可以参考下面的分析: 关系型数据库的优点: 1.基于ACID,支持事务,适合于对安全性和一致性要求高的的数据访问 2.可以进行Join等复杂查询,处理复杂业务逻辑,比如:报表 3.使用方便,通用的SQL语言使得操作关系型数据库非常方便
Maynor
2022-04-21
3300
Mysql高级完整版
1.中央处理器(英文Central Processing Unit,CPU)是一台计算机的运算核心和控制核心。CPU、内部存储器和输入/输出设备是电子计算机三大核心部件。其功能主要是解释计算机指令以及处理计算机软 件中的数据。 CPU核心组件: 1.算术逻辑单元(Arithmetic&logical Unit)是中 央处理器(CPU)的执行单元,是所有中央处理器的核 心组成部分,由"And Gate"(与门) 和"Or Gate"(或门)构成的算术逻辑单元,主要功能是进行二位元的算术运算,如加减乘(不包括整数除法)。 2.PC:负责储存内存地址,该地址指向下一条即将执行的指令,每解释执行完一条指令,pc寄存器的值 就会自动被更新为下一条指令的地址。 3.寄存器(Register)是CPU内部的元件,所以在寄存器之间的数据传送非常快。 用途:1.可将寄存器内的数据执行算术及逻辑运算。 2.存于寄存器内的地址可用来指向内存的某个位置,即寻址。 3.可以用来读写数据到电脑的周边设备。4.Cache:缓存
Maynor
2022-04-15
5370
datax详细介绍及使用
DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、SQL Server、Oracle、PostgreSQL、HDFS、Hive、HBase、OTS、ODPS 等各种异构数据源之间高效的数据同步功能。
Maynor
2022-03-11
10.7K0
DolphinScheduler 之Docker 部署
这种方式需要先安装 docker-compose, docker-compose 的安装网上已经有非常多的资料,请自行安装即可
Maynor
2022-03-07
11.5K1
Mysql高级
1.中央处理器(英文Central Processing Unit,CPU)是一台计算机的运算核心和控制核心。CPU、内部存储器和输入/输出设备是电子计算机三大核心部件。其功能主要是解释计算机指令以及处理计算机软 件中的数据。 CPU核心组件: 1.算术逻辑单元(Arithmetic&logical Unit)是中 央处理器(CPU)的执行单元,是所有中央处理器的核 心组成部分,由"And Gate"(与门) 和"Or Gate"(或门)构成的算术逻辑单元,主要功能是进行二位元的算术运算,如加减乘(不包括整数除法)。 2.PC:负责储存内存地址,该地址指向下一条即将执行的指令,每解释执行完一条指令,pc寄存器的值 就会自动被更新为下一条指令的地址。 3.寄存器(Register)是CPU内部的元件,所以在寄存器之间的数据传送非常快。 用途:1.可将寄存器内的数据执行算术及逻辑运算。 2.存于寄存器内的地址可用来指向内存的某个位置,即寻址。 3.可以用来读写数据到电脑的周边设备。4.Cache:缓存
Maynor
2021-12-27
4090
Kettle教程[2] 程序员小姐姐的第二次邂逅——JOB(作业)开发
前几天帮助程序员小姐姐小花解决了使用Kettle从Excel中抽取数据到MySQL问题,小姐姐特别高兴,请你吃了一顿饭,好一顿魂牵梦绕。小姐姐好几天都没有联系了,今天小姐姐又抱着电脑来找你了。你知道,又有新的问题来了。
Maynor
2021-12-07
3910
ava. lang. NullPointerException com. ajax. connection. ConnectionUtil findProvinces(ConnectionUtil j
记录一个Mysql连接Bug tomcat启动后报错,发现是mysql连接写的不对 "jdbc:mysql:///localhost:3306/mooncollege?useSSL=false
Maynor
2021-12-07
3630
【秋招面试】面试准备(一面准备)
实际上算法这块我还是个菜狗 没办法机会难得,不知道下次能不能这么走运 只能硬着头皮上了……!
Maynor
2021-12-07
3500
一文快速搞懂系列__一文快速搞懂SuperSet[实战案例]
1.1 简介 Superset是一款开源的现代化企业级BI。它是目前开源的数据分析和可视化工具中比较好用的,功能简单但可以满足我们对数据的基本需求,支持多种数据源,图表类型多,易维护,易进行二次开发。 1.2 特点 1)丰富的数据可视化集 2)易于使用的界面,用于浏览和可视化数据 3)创建和共享仪表板 4)可提供身份验证
Maynor
2021-12-07
1.4K0
Note_Spark_Day08:Spark SQL(Dataset是什么、外部数据源、UDF定义和分布式SQL引擎)
​ Spark 框架从最初的数据结构RDD、到SparkSQL中针对结构化数据封装的数据结构DataFrame, 最终使用Dataset数据集进行封装,发展流程如下。
Maynor
2021-12-07
3.9K0
Note_Spark_Day07:Spark SQL(DataFrame是什么和数据分析(案例讲解))
使得Spark SQL得以洞察更多的结构信息,从而对藏于DataFrame背后的数据源以及作用于DataFrame之上的变换进行针对性的优化,最终达到大幅提升运行时效率
Maynor
2021-12-07
2.2K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档