首页
学习
活动
专区
工具
TVP
发布

最新最全的大数据技术体系

专栏作者
717
文章
537236
阅读量
33
订阅数
基于内存的分布式NoSQL数据库Redis(六)AOF设计
Maynor
2023-10-22
1510
基于内存的分布式NoSQL数据库Redis(五)数据存储与RDB设计
原因:如果只有一组策略,面向不同的写的场景,会导致数据丢失 - 针对不同读写速度,设置不同策略,进行交叉保存快照,满足各种情况下数据的保存策略
Maynor
2023-10-22
1140
基于内存的分布式NoSQL数据库Redis(四)Jedis:使用方式
📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正! 📢本文由 Maynor 原创,首发于 CSDN博客🙉 📢不能老盯着手机屏幕,要不时地抬起头,看看老板的位置⭐ 📢专栏持续更新,欢迎订阅:https://blog.csdn.net/xianyu120/category_12394313.html
Maynor
2023-10-22
1350
基于内存的分布式NoSQL数据库Redis(三)常用命令
Maynor
2023-10-17
1110
基于内存的分布式NoSQL数据库Redis(二)数据结构与通用命令
Key:StringValue类型Value值应用场景pv_20200101String10000一般用于存储单个数据指标的结果person001Hashname:laoer age : 20 sex female用于存储整个对象所有属性值uvList{100,200,300,100,600}有序允许重复的集合,每天获取最后一个值uv_20200101Set{userid1,userid2,userid3,userid4……}无序且不重复的集合,直接通过长度得到UVtop10_productZSet【score,element】{10000-牙膏,9999-玩具,9998-电视……}有序不可重复的集合,统计TopNuser_filterBitMap{0101010101010000000011010}将一个字符串构建位,通过0和1来标记每一位product_20200101HypeLogLog{productid1,id2……}类似于Set集合,底层实现原理不一样,数据量大的情况下,性能会更好,结果可能存在一定的误差
Maynor
2023-10-13
1280
基于内存的分布式NoSQL数据库Redis(一)介绍与安装
Windows版本安装及远程工具使用请参考随堂资料《Redis的Windows版安装及远程工具的使用.pdf》
Maynor
2023-10-13
1900
2022年Flink面试题整理
Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。并且 Flink 提供了数据分布、容错机制以及资源管理等核心功能。Flink提供了诸多高抽象层的API以便用户编写分布式任务: DataSet API, 对静态数据进行批处理操作,将静态数据抽象成分布式的数据集,用户可以方便地使用Flink提供的各种操作符对分布式数据集进行处理,支持Java、Scala和Python。 DataStream API,对数据流进行流处理操作,将流式的数据抽象成分布式的数据流,用户可以方便地对分布式数据流进行各种操作,支持Java和Scala。 Table API,对结构化数据进行查询操作,将结构化数据抽象成关系表,并通过类SQL的DSL对关系表进行各种查询操作,支持Java和Scala。 此外,Flink 还针对特定的应用领域提供了领域库,例如: Flink ML,Flink 的机器学习库,提供了机器学习Pipelines API并实现了多种机器学习算法。 Gelly,Flink 的图计算库,提供了图计算的相关API及多种图计算算法实现。
Maynor
2022-03-28
2.5K0
大数据Flink面试考题___Flink高频考点,万字超全整理(建议)
1.下面哪个不是 Dataset的转换算子() A. readTextFile B reduce distinct D rebalance
Maynor
2021-12-30
8990
MyBatis Plus 入门
MyBatis-Plus(简称 MP)是一个 MyBatis 的增强工具,在 MyBatis 的基础上只做增强不做改变,为简化开发、提高效率而生。
Maynor
2021-12-21
4270
对于一般大数据物流项目的面试题(问题+答案)
1、数据采集如何完成 OGG 不要涉及,Oracle DBA完成 Canal数据采集,一定知道高可用HA集群模式 2、数据量大小 Kafka topic 数据存储生命周期(多久) 7天
Maynor
2021-12-07
3010
分布式NoSQL列存储数据库Hbase(一)Hbase的功能与应用场景、基本设计思想
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-j3OUucRa-1627099407310)(20210316_分布式NoSQL列存储数据库Hbase(一).assets/image-20210316180046440.png)]
Maynor
2021-12-07
1.6K0
HarmonyOS入门第一课:初识HarmonyOS
1.1简介 HarmonyOS的定位是一款面向未来、面向全场景的分布式操作系统。 适配多种终端形态的分布式理念,能够支持手机、平板、智能穿戴、智慧屏、车机等多种终端设备。
Maynor
2021-12-07
5510
大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day08】——Hbase2
•Hive是通过构建元数据,映射HDFS文件构建成表,本质还是HDFS,实现离线大数据仓库 •Hbase是通过构建上层分布式内存,底层HDFS,实现大数据实时存储的NoSQL数据库
Maynor
2021-12-07
3110
大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day07】——Hbase1
•功能:Hbase是一个分布式的、基于分布式内存和HDFS的按列存储的NoSQL数据库 •应用:Hbase适合于需要实时的对大量数据进行快速、随机读写访问的场景
Maynor
2021-12-07
2060
分布式实时消息队列Kafka(二)
cord.key(); //获取Value String value = record.value(); System.out.println(topic+"\t"+partition+"\t"+offset+"\t"+key+"\t"+value); } ```
Maynor
2021-12-07
4860
回答粉丝疑问:Spark为什么调优需要降低过多小任务,降低单条记录的资源开销?
filter操作使用不当,很容易引发麻烦。假如一个任务有3个parition,经过filger过滤之后,可能导致部分剩下很少,有些剩余很多,剩余很多的在下一步计算量很大,会拖后腿,其他的作业很快就做完了,而剩余很多的要执行很长时间,整个任务都要延误,而其他很快执行完的作业早就释放资源了 造成资源还的浪费
Maynor
2021-12-07
1160
大数据Flink面试考题___Flink高频考点,万字超全整理(建议收藏)
1.下面哪个不是 Dataset的转换算子() A. readTextFile B reduce distinct D rebalance
Maynor
2021-06-29
1.8K0
分布式实时消息队列Kafka(一)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RaU9EfHR-1617011887969)(20210329_分布式实时消息队列Kafka(一).assets/image-20210328152502315.png)]
Maynor
2021-04-09
1.3K0
分布式NoSQL列存储数据库Hbase_列族的设计(五)
文章目录 分布式NoSQL列存储数据库Hbase_列族的设计(五) 知识点01:课程回顾 知识点02:课程目标 知识点03:Hbase设计:列族的设计 知识点04:聊天系统案例:需求分析 知识点05:聊天系统案例:Hbase表设计 知识点06:聊天系统案例:环境准备 知识点07:聊天系统案例:模拟生成数据 知识点08:聊天系统案例:构建Rowkey 知识点09:聊天系统案例:测试写入代码 知识点10:聊天系统案例:查询需求分析 知识点11:聊天系统案例:测试查询代码 知识点12:聊天系统案例:查询问题 知
Maynor
2021-04-09
1.3K0
分布式NoSQL列存储数据库Hbase Java API(四)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yYfd67AX-1616633798599)(20210319_分布式NoSQL列存储数据库Hbase(四).assets/image-20210317190105892.png)]
Maynor
2021-04-09
1.2K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档