【干货】华为九大热门开源项目,你了解多少?

世界 500 强的华为,旗下设有华为开源软件能力中心。是基于华为开源战略新成立的部门。承担开源新技术扫描与规划、开源技术研究、开源开发方法探索、开源社区运营和开源能力构建及管理等相关工作。本期,就为大家整理了华为的开源项目:

1

HBase 二级索引 hindex

https://github.com/Huawei-Hadoop/hindex Stars 435

hindex 是华为公司开发的纯 Java 编写的 HBase 二级索引,兼容 Apache HBase 0.94.8。当前的特性如下:

● 多个表索引

● 多个列索引

● 基于部分列值的索引

● 使用索引扫描等于和范围条件

● 批量加载数据来索引表(索引完成批量加载)

工作原理如下:

2

华为物联网操作系统 LiteOS

https://github.com/Huawei/Huawei_LiteOS_Kernel Stars 372

Huawei LiteOS 是华为面向 IoT 领域,构建的"统一物联网操作系统和中间件软件平台",以轻量级(内核小于 10 k)、低功耗(1 节 5 号电池最多可以工作 5 年),快速启动,互联互通,安全等关键能力,为开发者提供 "一站式" 完整软件平台,有效降低开发门槛、缩短开发周期。

Huawei LiteOS 目前主要应用于智能家居、穿戴式、车联网、智能抄表、工业互联网等 IoT 领域的智能硬件上。

3

流处理平台查询语言 StreamCQL

https://github.com/HuaweiBigData/StreamCQL Stars 320

StreamCQL 作为华为 FusionInsight 产品的重要组件,提供了在分布式流处理平台上的类SQL查询能力,包括窗口计算等高级特性,在开源之前已经在电信、金融等多个行业成功应用,简化开发工作量数倍。

在架构上,除了支持主流的流处理平台 Storm,它支持扩展到多种流处理引擎之上,如Flink。在功能上,StreamCQL 弥补了传统流处理平台上一些基本业务功能的缺失,除了过滤、转换等基本 SQL 能力之外, 还引入基于内存窗口的计算、统计、关联等能力,以及流数据的拆分、合并等功能。后期 StreamCQL 的发展方向包括:模式匹配、CQLServer(CQL远程提交,多语言接口,JDBC接口)、可靠性增强等。

4

Spark Streaming 数据挖掘 streamDM

https://github.com/huawei-noah/streamDM Stars277

streamDM,是由华为诺亚方舟实验室开源的使用 Spark Streaming 挖掘大数据的开源软件。Spark Streaming 是核心 Spark API 的一个扩展,它能让多个源的数据流处理成为可能。Spark 是一个可扩展可编程的框架,用于大规模分布式数据集(也称为弹性分布式数据集(RDD))处理。Spark Streaming 接收输入的数据流后将数据分批,再由 Spark 引擎处理,生成结果。Spark Streaming 数据被编成一个 DStreams 序列,内在地表示成一个 RDD 序列。

5

大数据存储解决方案 CarbonData

https://github.com/HuaweiBigData/carbondata Stars 209

CarbonData 是由华为开源贡献的大数据高效存储格式解决方案。针对当前大数据领域分析场景需求各异而导致的存储冗余问题,CarbonData 提供了一种新的融合数据存储方案,以一份数据同时支持“交互式分析、详单查询、任意维度组合的过滤查询等”多种大数据应用场景,并通过丰富的索引技术、字典编码、列存等特性提升了IO扫描和计算性能,实现百亿数据级秒级响应,与大数据生态 Apache Hadoop、Apache Spark 等无缝集成。

6

HBase 的 Spark SQL Astro

https://github.com/HuaweiBigData/astro Stars 198

华为 2015 年 7 月 20 日在 O'Reilly Open Source Convention (OSCON) 上宣布 Spark SQL on HBase package 正式开源。Spark SQL on HBase package 项目又名 Astro,端到端整合了 Spark,Spark SQL和HBase的能力,有助于推动帮助Spark进入NoSQL的广泛客户群,并提供强大的在线查询和分析以及在垂直企业大规模数据处理能力。当前的 Astro 1.0 依赖于 Spark 1.4.0,HBase 0.98。

7

多功能微服务框架 ServiceComb

https://github.com/ServiceComb/ServiceComb-Java-Chassis Stars 152

ServiceComb 是华为开源的一套包含代码框架生成,服务注册发现,负载均衡,服务可靠性(容错熔断,限流降级,调用链追踪)等功能的微服务框架。ServiceComb 包括应用框架代码生成,服务注册发现、服务配置管理、服务监控、服务调用追踪、多通信协议支持等功能,具有服务化契约增强、响应式编程范式及多语言 SDK 支持等优势特性。ServiceComb 基于开放的架构,不仅可以支持开发者根据自身业务需求定制业务插件,而且还兼容多种业界流行的微服务框架。

8

OpenFlow控制器 POFController

https://github.com/ProtocolObliviousForwarding/POFController

POFController 是由华为公司采用 BSD/ Apache 授权基于 Java 语言实现的 OpenFlow 控制器,提供了一个 GUI 管理界面,用于交换机的控制和配置。POF 主要包含控制器和交换机两个 原型文件,旨在提高OpenFlow的规范及支持无感知转发协议和数据包格式。

9

Cloud Foundry-Mesos

https://github.com/mesos/cloudfoundry-mesos Stars 98

Cloud Foundry-Mesos 框架由华为与 Mesosphere 的工程师合作完成,能够为应用提供安全可靠的、可伸缩、可扩展的云端运行环境,并且应用能够享用 Cloud Foundry 生态圈内各类丰富的服务资源。企业能够通过 Cloud Foundry 开发云应用,并通过 Cloud Foundry-Mesos 将应用部署到 DCOS上,使应用能够与 DCOS 上安装的其他服务及应用框架共享资源,实现资源利用率最大化,能够大幅降低企业数据中心运营成本。DCOS 能够运行在虚拟和物理环境上,能够支持 Linux(以及很快支持 Windows),并可适用于私有云、公有云及混合云环境。

原文发布于微信公众号 - 钱塘大数据(qtbigdata)

原文发表时间:2018-05-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏安全领域

启动物联网项目所需的一切:第 1 章

本文旨在帮助读者围绕物联网或流处理系统的技术问题,建立完整的基础和多方面的理解。

7598
来自专栏王亚昌的专栏

常见互联网业务模型与架构浅析[未完]

    Q3和老大讨论下半年技术学习方向时,老大建议应该多关注常见的互联网业务模型,并尝试分析各种业务的架构模型。确实,一个好的软件开发人员要成为一名优秀的架构...

1361
来自专栏pangguoming

Hadoop概念学习系列之Hadoop、Spark学习路线(很值得推荐)

说在前面的话   此笔,对于仅对于Hadoop和Spark初中学者。高手请忽略! 1 Java基础: 视频方面:           推荐《毕向东JAVA基础...

7027
来自专栏美团技术团队

行进中换轮胎——万字长文解析美团和大众点评两大数据平台是怎么融合的

背景 互联网格局复杂多变,大规模的企业合并重组不时发生。原来完全独立甚至相互竞争的两家公司,有着独立的技术体系、平台和团队,如何整合,技术和管理上的难度都很大。...

39617
来自专栏积累沉淀

storm概述

1.Storm是什么,应用场景有哪些?        2.Storm有什么特点?        3.spout发出的消息后续可能会触发产生成...

2369
来自专栏Golang语言社区

大数据架构下对于业务监控的几点思考

许俊是极光的第一位严格意义上的大数据工程师,目前是大数据平台的负责人,见证了极光大数据平台从0到1,迅速发展到现在规模的历程。他给开发者带来的是大数据架构下对于...

5106
来自专栏Albert陈凯

Kylin正式发布:面向大数据的终极OLAP引擎方案

日前,eBay公司隆重宣布已经正式向开源业界推出分布式分析引擎:Kylin(http://kylin.io)。作为一套旨在对Hadoop环境下分析流程进行加速、...

6774
来自专栏CSDN技术头条

Kylin正式发布:面向大数据的终极OLAP引擎方案

日前,eBay公司隆重宣布已经正式向开源业界推出分布式分析引擎:Kylin(http://kylin.io)。作为一套旨在对Hadoop环境下分析流程进行加速、...

2329
来自专栏Golang语言社区

大数据架构下对于业务监控的几点思考

许俊是极光的第一位严格意义上的大数据工程师,目前是大数据平台的负责人,见证了极光大数据平台从0到1,迅速发展到现在规模的历程。他给开发者带来的是大数据架构下对于...

2954
来自专栏智能计算时代

微软数据湖架构

一个无限制的数据湖为智能行动提供动力: 存储和分析PB级大小的文件和数以万亿计的对象 开发大规模并行程序简单 调试和优化您的大数据程序轻松 企业级安全,审计和支...

4943

扫码关注云+社区

领取腾讯云代金券