用户1410343

LV1
发表了文章

Flink1.12支持对接Atlas【使用Atlas收集Flink元数据】

问题导读 1.Atlas中实体具体指什么? 2.如何为Flink创建Atlas实体类型定义? 3.如何验证元数据收集? 在Cloudera Streamin...

用户1410343
发表了文章

金三银四拿offer:About云对面试者的答疑解惑

上周末我们VIP成员及创始人和About云会员、粉丝进行了两次面试讨论交流,这里记录了部分内容。如果我们在面试方面有问题的成员,欢迎加入和大家一起交流。

用户1410343
发表了文章

2021年最新鲜的面试题整理:亿信华辰

我们VIP成员很多在2021年春节年前、后,拿到了offer。而且不止一个,有的两个,有的四个,有的六个。这里给我们分享其中一位成员,整理的一家公司的面试题,后...

用户1410343
发表了文章

工作经验分享:Spark调优【优化后性能提升1200%】

问题导读 1.本文遇到了什么问题? 2.遇到问题后,做了哪些分析? 3.本文解决倾斜使用哪些方法? 4.本次数据倾斜那种方法更有效? 5.解决性能优化问题的原...

用户1410343
发表了文章

彻底打通实时数据仓库该如何实现及多种技术架构解析

问题导读 1.实时数据仓库有哪些特点? 2.公司构建实时数据仓库有哪些好处? 3.如何构建实时数据仓库? 4.实时数据仓库本文解析了哪些架构? 越来越多的实...

用户1410343
发表了文章

大数据集群资源预估规划【适用于面试与工作集群规划】

问题导读 1.如何判断数据增量? 2.QPS如何计算? 3.存储空间需要考虑哪些因素? 4.内存估算和哪些因素有关? 我们在实际工作,或者面试中,经常会遇到这...

用户1410343
发表了文章

菜鸟实时数据技术架构的演进

实时架构是我们很多成员比较关心的,在About云社区(www.aboutyun.com)也非常的受欢迎,这里放到公众号,分享给大家。

用户1410343
发表了文章

大数据分析平台总体架构方案

关于金融大数据分析平台,这方面的资料不多,给大家分享下这方面的内容,供大家参考。

用户1410343
发表了文章

Flink实战之网站日志ETL案例【含代码】

问题导读 1.怎样对字段进行大区转换? 2.怎样拆分打平大JSON? 3.怎样把不同类型的日志数据分别进行存储? 应用场景:

用户1410343
发表了文章

ClickHouse实时场景分析及调优

ClickHouse使用越来越多,这里给咱们分享下ClickHouse实时场景分析及调优

用户1410343
发表了文章

Hadoop3.3新版本发布【整合了腾讯云】

问题导读 1.Hadoop3.3支持JDK哪个版本? 2.SCM是什么? 3.YARN应用程序做了哪些改进? 4.整合腾讯云实现了什么文件系统? 1.支持A...

用户1410343
发表了文章

数据中台到底如何落地实现【含架构图及代码】

数据中台已经被很多公司应用,数据中台资料也不少,可是作为程序员更关心的是该如何代码实现。下面是中台相关代码实现及说明。

用户1410343
发表了文章

基于Flink商品实时推荐系统项目【大数据及算法】

介绍: 基于Flink实现的商品实时推荐系统。flink统计商品热度,放入redis缓存,分析日志信息,将画像标签和实时记录放入Hbase。在用户发起推荐请求后...

用户1410343
发表了文章

懂点深度学习:【白话】模型

问题导读 1.什么是机器学习模型? 2.机器学习数学符号是如何认识的? 3.损失函数的作用是什么? 我们可能听说过机器学习、深度学习。可是我们可能觉得非常神...

用户1410343
机器学习神经网络AI 人工智能线性回归编程算法
发表了文章

Shell大全:可以应用于工作及面试

1.Shell该如何学习? 2.Shell和传统编程语言有哪些相同? 3.Shell和传统编程语言有哪些不同? 4.你认为Shell还有哪些便捷的地方?

用户1410343
Shellhttps网络安全UnixPHP
发表了文章

Flink1.9新特性解读:通过Flink SQL查询Pulsar

问题导读 1.Pulsar是什么组件? 2.Pulsar作为Flink Catalog,有哪些好处? 3.Flink是否直接使用Pulsar原始模式? 4.Fl...

用户1410343
大数据BashShellBash 指令https
发表了文章

大数据实用组件Hudi--实现管理大型分析数据集在HDFS上的存储

问题导读 1.什么是Hudi? 2.Hudi对HDFS可以实现哪些操作? 3.Hudi与其它组件对比有哪些特点? 前两天我们About云群大佬公司想了解Hu...

用户1410343
大数据sparkHiveHBase分布式数据库
发表了文章

数据治理:白话打通对Atlas的理解

问题导读 1.Atlas是什么? 2.Atlas能干什么? 3.Atlas血统关系是什么? Atlas现在被企业使用的越来越多,我们可能听说过,但是具体它是...

用户1410343
大数据Hadoophttps网络安全数据库
发表了文章

Logstash收集多数据源数据神器

问题导读 1.Logstash是什么? 2.Logstash工作包含哪些流程? 3.logstash 是以什么方式流转数据的? 4.logstash架构包含哪...

用户1410343
数据处理编程算法
发表了文章

算法系列讲解之:社交网络之共同好友模型讲解

问题导读 1.寻找共同好友,该如何转换为程序逻辑? 2.寻找共同好友的思路是什么? 3.如何通过MapReduce实现寻找共同好友? 我们知道社交网络经常会...

用户1410343
MapReduce

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券