首页
学习
活动
专区
工具
TVP
发布

大数据实战演练

专栏作者
157
文章
539373
阅读量
60
订阅数
Ambari部署及hdp部署的疑难问题解答汇总
以下,都是收集于网友、群友安装 ambari 或部署 hdp 集群时出现的问题,挤时间写了个疑难问题解答汇总,希望能够快速帮小伙伴们定位解决问题。觉得文章靠谱的小伙伴,希望能转发、点赞、在看三连走一波~
create17
2022-11-17
9290
数仓面试高频考点--解决hive小文件过多问题
hive 中的小文件肯定是向 hive 表中导入数据时产生,所以先看下向 hive 中导入数据的几种方式
create17
2021-04-07
6260
Hive MetaStore 在快手遇到的挑战与优化
导读:快手基于Hive构建数据仓库,并把Hive的元数据信息存储在MySql中,随着业务发展和数据增长,一方面对于计算引擎提出了更高的要求,同时也给Hive元数据库的服务稳定性带来了巨大的挑战。本文将主要介绍Hive MetaStore服务在快手的挑战与优化,包括:
create17
2021-04-07
7850
Ambari 2.7.3.0 安装部署 hadoop 3.1.0.0 集群完整版,附带移除 SmartSense 服务
这篇文章之前也写过类似的,已经有很多人在看了,也有很多朋友在这过程中碰到了困难,私聊我。为了提高各自的工作效率,所以我又将文章完善了一版,这应该算是第三版了。
create17
2021-01-28
5.1K6
拜托!这才是分布式系统CAP的正确打开方式!
纠结了很久要不要写这一篇,作为分布式系统的核心理论简单说说容易,聊透却很难,转念一想,如果不写这篇,算什么想通透大数据呢!并且这本身就违背了我写作的初衷;加之正好前几天和同事以ZooKeeper的用户行为反推了CAP理论,回过头来细琢磨了下,还蛮有意思的!闲话少絮,我们进入正题!
create17
2020-09-01
7010
spring boot 项目中自动执行 sql 语句
在 properties 或 yaml 文件里面,添加以下配置(以 yaml 配置文件为例):
create17
2020-08-25
1.9K0
HBase 集成 Phoenix 构建二级索引实践
Phoenix 在 HBase 生态系统中占据了非常重要的地位,本文主要包括以下几方面内容:
create17
2020-02-18
2K1
mybatis-plus/mybatis 自定义 sql 语句、动态 sql
MyBatis-Plus(简称 MP)是一个 MyBatis 的增强工具,在 MyBatis 的基础上只做增强不做改变,为简化开发、提高效率而生。在 Java 项目内,配置如下:
create17
2019-11-01
37.2K0
PostgreSQL与PostGIS的基础入门
PostgreSQL是一个功能强大的对象关系型数据库管理系统(ORDBMS)。用于安全地存储数据,支持最佳做法,并允许在处理请求时检索它们。
create17
2019-04-17
5.4K0
PostgreSQL本地/远程登陆配置
关于PostgreSQL与PostGIS使用,可参看《PostgreSQL与PostGIS的基础入门》。本篇文章主要介绍如何实现本地与远程登陆,并对其认证方式进行总结。
create17
2019-04-17
11.1K0
spring boot使用JDBCTemplate访问Mysql
根据个人喜好选择配置文件的类型,在这里我选择配置application.yml,主要对datasource进行一些配置说明。
create17
2019-03-19
7980
Elasticsearch基本概念及特点
Lucene:简单来说,就是一个jar包,里面包含了封装好的各种建立倒排索引,以及进行搜索的代码,包含各种算法,我们用java开发的时候,引入lucene.jar就可以进行开发了。
create17
2019-03-15
1.3K0
Mysql数据导入SolrCloud
Solr主要是做数据搜索的,那么Solr的数据是从哪里来的呢?总不能一条一条的插入吧。Solr也有这方面的考虑,比如配置Dataimport将mysql数据批量导入Solr中。 环境说明:
create17
2019-03-15
4.3K0
如何在HUE上通过oozie调用Hive SQL工作流
执行Hive SQL脚本查询mytable表数据前10条,field以”\t”分割,并输出到hdfs指定路径。
create17
2019-03-12
9900
如何在HUE上使用Spark Notebook
打开hue.ini文件,找到【yarn_clusters】【default】,修改spark_history_server_url值。
create17
2019-03-12
3.7K0
如何在HUE上通过oozie调用Hive SQL工作流
特别说明:该专栏文章均来源自微信公众号《大数据实战演练》,欢迎关注!
create17
2019-02-20
2.6K0
Sqoop概述及shell操作
基于传统关系型数据库的稳定性,还是有很多企业将数据存储在关系型数据库中;早期由于工具的缺乏,Hadoop与传统数据库之间的数据传输非常困难。基于前两个方面的考虑,需要一个在传统关系型数据库和Hadoop之间进行数据传输的项目,Sqoop应运而生。
create17
2019-02-17
1.3K0
Kylin基本原理及概念
“带你走进Apache Kylin的世界”
create17
2019-01-23
2.7K0
Kerberos实战
前面的文章介绍了《Kerberos原理--经典对话》、《Kerberos基本概念及原理汇总》、《基于ambari的Kerberos安装配置》、《Windows本地安装配置Kerberos客户端》,已经成功安装了Kerberos KDC server,也在Ambari上启用了Kerberos,接下来我们再来研究一下如何使用Kerberos。
create17
2019-01-20
6.4K7
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档