前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >[Apache Doris] Apache Doris 架构及代码目录解读

[Apache Doris] Apache Doris 架构及代码目录解读

作者头像
awwewwbbb
发布2021-11-10 14:17:57
1.3K0
发布2021-11-10 14:17:57
举报
文章被收录于专栏:chaplinthink的专栏

一、系统架构

Doris是一个MPP的OLAP系统,主要整合了Google Mesa(数据模型),Apache Impala(MPP Query Engine)和Apache ORCFile (存储格式,编码和压缩) 的技术。

既可以满足OLAP查询,也可以满足Adhoc查询需求。

image
image

Frontend

Frontend 以 Java 语言为主。主要有如下功能职责:

  • 接收用户连接请求(MySQL 协议层)
  • 元数据存储与管理
  • 查询语句的解析与查询计划的执行
  • 集群管控

Backend Backend 以 C++ 语言为主。主要有如下功能职责:

  • 数据存储与管理
  • 查询计划的执行

二、Apache Doris 代码目录结构说明

代码语言:javascript
复制
├── be                  // BE 代码目录
├── bin                 // FE/BE 的启停脚本
├── build_plugin.sh     // FE 插件编译脚本
├── build.sh            // Doris 编译脚本
├── build-support       // 编译用辅助脚本
├── CODE_OF_CONDUCT.md  // 贡献者代码行为准则
├── conf                // FE/BE 的配置文件
├── contrib             // 第三方贡献代码,如 udf
├── CONTRIBUTING_CN.md  
├── CONTRIBUTING.md
├── DISCLAIMER
├── docker              // Doris 开发镜像的 Dockerfile
├── docs                // 文档目录
├── env.sh
├── extension           // 扩展功能代码,如 flink connector 等
├── fe                  // FE 代码目录
├── fe_plugins          // FE 插件目录
├── fs_brokers          // Broker 代码目录
├── gensrc              // thrift/protobuf 等代码生成目录
├── LICENSE.txt
├── NOTICE.txt
├── README.md
├── run-be-ut.sh        // BE 单元测试运行脚本
├── run-fe-ut.sh        // FE 单元测试运行脚本
├── samples             // 示例代码目录
├── thirdparty          // 第三方依赖库目录
├── tools               // 一些辅助工具
├── tsan_suppressions
├── ui                  // FE 前端代码目录
└── webroot             // 一些静态网页相关代码

主要介绍 fe/ be/ gensrc/ extension/ 四个目录

2.1 FE

代码语言:javascript
复制
├── checkstyle-apache-header.txt
├── checkstyle.xml
├── conf
├── fe-common   // 一些 FE 模块的通用代码
├── fe-core     // FE 模块主代码
├── pom.xml
├── README
└── spark-dpp   // Spark Load 所依赖的 Spark 导入程序代码

fe-core 为 FE 的核心代码模块

代码语言:javascript
复制
├── main            
│   ├── cup         // 语法定义文件
│   ├── java        // 主代码
│   ├── jflex       // 词法定义文件
│   └── resources
└── test            // 单元测试
    ├── java
    └── resources

在 main/java/org/apache/doris/ 下即是 FE 代码的主要部分了:

代码语言:javascript
复制
├── alter       // 表结构变更操作相关的代码。包括表结构变更,物化视图等。
├── analysis    // 包含所有SQL语法的java实例类
├── backup      // 备份恢复操作相关的代码
├── blockrule   // SQL 黑名单相关代码
├── catalog     // 包含元数据操作的主类和各种数据库、表、分区的元数据实例类
├── clone       // 数据副本修复和均衡相关的代码
├── cluster     // 已废弃
├── common      // 一些工具类和通用定义
├── consistency // 数据一致性校验相关的代码
├── deploy      // 部署相关代码
├── external    // Doris on Elasticsearch相关的代码
├── ha          // 元数据高可用相关的代码
├── http        // http v1 代码
├── httpv2      // http v2 代码(逐步替换v1)
├── journal     // 元数据日志相关的代码
├── ldap        // LDAP 认证相关代码
├── load        // 导入作业相关代码
├── master      // FE Master角色相关的操作代码,如元数据Checkpoint,BE任务汇报的处理等。
├── metric      // FE 监控指标相关的代码
├── monitor     // JVM 监控相关代码
├── mysql       // MySQL协议层相关代码
├── PaloFe.java // Main函数入口
├── persist     // 元数据持久化相关的代码
├── planner     // 查询优化器相关的代码
├── plugin      // Frontend端插件管理相关代码
├── qe          // 用于处理各类SQL请求相关的代码。如查询请求的处理类、DDL请求的处理类等
├── resource    // 资源标签相关的代码
├── rewrite     // 查询优化器重写规则相关的代码
├── rpc         // Frontend和Backend之间RPC协议相关的代码
├── service     // Frontend侧各种服务器端代码
├── system      // 集群节点的实例类和集群节点管理相关的代码
├── task        // Frontend发往Backend的各类任务相关的代码
└── transaction // 导入事务相关代码

2.2 BE

代码语言:javascript
复制
├── CMakeLists.txt  // CMake 编译文件
├── src             // 主代码目录
├── test            // 单元测试

主代码目录包含:
├── agent                   // FE 下发的 agent task 相关处理类
├── common                  // 通用类
├── env                     // 文件系统操作类
├── exec                    // 执行算子相关代码
├── exprs                   // 表达式、函数计算相关代码
├── geo                     // 地理位置函数相关代码
├── glibc-compatibility     // GLIBC 兼容代码
├── gutil                   // Google gutil 相关代码
├── http                    // BE 端 http server 相关代码
├── olap                    // 存储层代码
├── plugin                  // BE 插件管理相关代码
├── runtime                 // 查询层运行时相关代码
├── service                 // BE 对外服务接口相关代码
├── testutil                // 单元测试辅助类
├── tools                   // 辅助工具相关代码
├── udf                     // 用户自定义函数相关代码
└── util                    // 一些工具类

2.3 gensrc

代码语言:javascript
复制
├── Makefile
├── proto       // protobuf 定义文件
├── script      // 一些辅助脚本,包括函数定义代码生成模板等
└── thrift      // thrift 定义文件

2.4 extension

代码语言:javascript
复制
├── DataX                   // DataX doriswriter 插件
├── flink-doris-connector   // Flink Doris Connector
├── logstash                // logstash 导入插件
└── spark-doris-connector   // Spark Doris Connector

三、 源码编译部署

使用docker镜像编译

代码语言:javascript
复制
# 挂载maven仓库及源码目录并进入镜像
$ docker run -it -v /data/dev:/root/.m2 -v /root/code/incubator-doris/:/root/incubator-doris/ apache/incubator-doris:build-env-1.3.1

# 编译
sh build.sh

# 编译文件位置
output/

WebUi: http://ip:8030/login 默认登陆账号: admin/

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021-11-06 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、系统架构
  • 二、Apache Doris 代码目录结构说明
    • 2.1 FE
      • 2.2 BE
        • 2.3 gensrc
          • 2.4 extension
          • 三、 源码编译部署
          相关产品与服务
          对象存储
          对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档