前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据面试问题

大数据面试问题

作者头像
Albert陈凯
发布2018-04-04 14:32:12
6160
发布2018-04-04 14:32:12
举报
文章被收录于专栏:Albert陈凯Albert陈凯

spark工作原理

spark运行原理

Spark Streaming

Storm的ack是干嘛的

kalfka干嘛的

job提交到yarn上的工作流程

10x+5y+z = n,x+y+z的最小值

ArryList、LinkedList、vector的区别

hashMap HashTable的区别

垃圾回收机制

JVM的工作原理

Hbase的垃圾回收工具

for循环LinkedList

遍历HashMap的并且把某一个值删除

线程 进程

Java中Runnable和Thread的区别Callable

Callable与Future的介绍

sleep wait区别

hadoop源码使用了什么JAVA技术

hadoop的通讯接口RPC协议

java的数据类型

mapreduce中的Text类型 LongWriteable 能不能用String 或者用long类型代替

JAVA如何实现序列化

反序列化是什么? 序列化是将(内存中的)结构化的数据数据,序列化成2进制

mapreduce常用的接口

mapreduce的工作流程

MR优化方式

什么样的情况下不能用mapreduce

HDFS的架构

hdfs改那几个文件 分别改什么内容 内容代表什么意思(3次) core是全局的 site是局部的

hdfs优化

mapreduce怎么实现join连接

yarn的ha搭建

zookeeper的工作原理和应用场景

如何解决mapreduce的数据倾斜

mapreduce怎么实现把移动数据到移动计算的

hive 增加数据有几种方式

怎么给hive的表里面增加一个字段

增加的字段里面数据占不占内存

给字段增加值怎么增加

1g的小文件,1g的一个文件 ,为什么小文件占的空间更大

hive建表,什么情况下见内部表

impala 依赖

怎么解决hive数据倾斜问题

hbase rowkey的设计原则 唯一 简明有意义

hbase的应用场景

你们平时PV有多少,数据量有多少

Hive是重点

hadoop工程师

zookeeper在hbase中作用

ZK中存的两张最重要的表

shall 数组的分隔符是什么

linux的copy

权限

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017.04.13 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档