首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

基于spark数据采集平台

数据采集平台管理端 https://github.com/zhaoyachao/zdh_web 数据采集平台服务 https://github.com/zhaoyachao/zdh_server web...平台介绍 数据采集,处理,监控,调度,管理一体化平台具体介绍请看github连接中readme 文档 # 数据采集,处理,监控,调度,管理一体化平台 # 提示 zdh 分2部分,前端配置...保持同步 版本会同步兼容 如果zdh_web 选择版本1.0 ,zdh_server 使用1.x 都可兼容 # 特色 开箱即用 支持多数据源 高性能数据采集 单独调度器...,redis,kafka,hbase,es,sftp,hive) + 数据加密 + 数据转换,数据离线同步,实时数据同步 + 质量检测 + 元数据,指标管理 + drools灵活动态数据清洗...# 主要功能 zdh 主要作用 是从hdfs,hive,jdbc,http-json接口 等数据源拉取数据,并转存到hdfs,hive,jdbc等其他数据源 支持集群式部署

67010
您找到你想要的搜索结果了吗?
是的
没有找到

数据平台搭建:基于Hadoop数据分析平台

15.jpg 企业要进行大规模数据分析,基于开源Hadoop及其生态圈来搭建起大数据系统平台,无疑是一种低成本高效率选择。...Hadoop大数据平台 Hadoop在大数据技术生态圈,经过这么多年发展,基础核心架构地位,依然稳固。...Hadoop系统可伸缩性、健壮性、计算性能以及低成本,使得它事实上已成为当前互联网企业主流数据分析平台解决方案。 基于Hadoop,可以根据企业实际业务需求,来进行数据系统规划和设计。...针对不同具体需求,采用不同数据分析架构和框架组件来解决实际问题。 大数据分析平台需求规划 按照数据分析时效性需求,大数据分析可分为实时数据分析和离线数据分析两种。...在这类场景下,Hadoop无疑是就是低成本高效解决方案了。 9.jpg 关于大数据平台搭建,基于Hadoop数据分析平台,以上就是今天分享内容了。

2K1410

腾讯音乐基于 Apache Doris + 模型构建全新智能数据服务平台

平台融入模型后,平台用户输入问题会进入模型进行语义解析,自动转化为 SQL 语句触发 OLAP 引擎开启数据分析与查询。...模型 + OLAP 引擎结合全新数据服务模式,不仅为平台用户提供了个性化、灵活表达、秒级回复服务体验,还大幅降低了企业内部技术与业务学习成本,加速数据分析效率,实现多端入口统一、界面统一平台构建...模型 + OLAP :开启数据服务平台新模式 在模型 + OLAP 架构方案中,目前经典方案如下图所示,模型充当中间层将用户输入自然语言转化为 SQL 执行语句,OLAP 作为底层存储和数据处理引擎...同时模型整体按照 Token 收费,使用量增加时也会导致平台成本升高。 私域知识无法识别: 虽然模型已经开展许多公开数据语言转换训练,但面对企业内部大量专业术语仍无法很好地理解转化。...平台基于模型 + OLAP 模式加速业务分析效率,减少技术开发成本,向智能化、个性化、实时化全新业务服务模式更近一步。

54820

JuiceFS 在搜车数据平台实践

搜车已经搭建起比较完整汽车产业互联网协同生态。...在这一生态中,不仅涵盖了搜车已经数字化全国 90% 中大型二手车商、9000+ 家 4S 店和 70000+ 家新车二网,还包括搜车旗下车易拍、车行168、运车管家、布雷克索等具备较强产业链服务能力公司..., 与搜车在新零售解决方案上达成深度战略合作长城汽车、长安汽车、英菲尼迪等主机厂商,以及与中石油昆仑好客等产业链上下游合作伙伴。...基于这样生态布局,搜车数字化了汽车流通链条上每个环节,进而为整个行业赋能。 说到大数据,对于每个公司都不陌生。...大数据集群现状 搜车目前大数据集群分为离线计算集群和实时计算集群,离线计算基于 Hive 和 Spark,实时计算基于 Flink,这两类集群分别基于 HDP 和 CDH 两套管理方式。

1.7K50

基于Ambari构建自己数据平台产品

我们公司最初是使用CDH环境,近日领导找到我让我基于Ambari做一个公司自己数据平台产品。...后来想想如果公司如果有自己数据平台产品后续在客户面前也能证明自己技术实力且我个人也能从源码级别更深入学习了解大数据生态圈各个组件。   个人在公司数据平台从无到有的这个过程。...认为建设一个自己数据平台应该包含三个部分。包括基础设施建设、大数据平台建设、业务系统数据接口三部分组成。...批处理针对于数据仓库,通过采集程序、对接业务系统或收集业务系统日志等数据数据存储底层使用分布式文件系统HDFS,基于多种业务需求构建数据仓库用于多维度数据分析。...对于对接业务系统数据如果有操作型数据可以构建ODS系统。用于数据分析数据(含采集数据和对接业务数据)在Hadoop上构建数据仓库。 2.2. 数据仓库模块   基于Hadoop之上构建数据仓库。

1.4K30

数据分析:基于Hadoop数据分析平台

互联网发展,带来了各种数据爆发式增长,所以接入互联网相关操作行为,都化为虚拟数据被记录了下来。...大数据时代带来,一个明显变化就是全样本数据分析,面对TB/PB级及以上数据规模,Hadoop始终占据优势。今天数据学习分享,我们来聊聊基于Hadoop数据分析平台。...Hadoop系统可伸缩性、健壮性、计算性能以及低成本,使得它事实上已成为当前互联网企业主流数据分析平台基于Hadoop平台,可以根据实际业务需求,来进行数据系统规划和设计。...针对不同具体需求,采用不同数据分析架构来解决实际问题。 按照数据分析实时性,分为实时数据分析和离线数据分析两种。...对于大多数反馈时间要求不是那么严苛应用,比如离线统计分析、机器学习、搜索引擎反向索引计算、推荐引擎计算等,应采用离线分析方式,通过数据采集工具将日志数据导入专用分析平台

1.8K20

Amas:基于数据平台技术开发统一监控平台

EaconTang 基于数据平台技术开发统一监控平台Amas开源项目核心开发者。...GitHub ID:EaconTang https://github.com/amas-eye/amas Amas是什么 Amas是基于数据平台技术开发统一监控平台,其特点包括: 全维度监控指标,覆盖从操作系统...、中间件、大数据平台(Hadoop/Spark/HBase/Kakfa等)到代码级别 可扩展、自定义采集框架,支持不同语言(Python/Perl/Shell/...)开发采集器 基于OpenTSDB...可分组聚合告警信息,避免海量数据监控场景下告警风暴 基于Jagger分布式链路追踪数据提取和展示,历史事件可追溯 可对接基于机器学习异常检测服务,落地AIOps智能运维 微服务架构,支持docker...ToDoList 告警引擎,支持DSL语言定义规则 集成开源Zabbix、Nagios等监控数据 基于AspectJJava字节码注入监控 基于pyrasitepython字节码注入监控 更多AIOps

2.8K30

当 Apache Doris 遇上模型:探秘腾讯音乐如何基于模型 + OLAP 构建智能数据服务平台

平台融入模型后,平台用户输入问题会进入模型进行语义解析,自动转化为 SQL 语句触发 OLAP 引擎开启数据分析与查询。...模型 + OLAP 引擎结合全新数据服务模式,不仅为平台用户提供了个性化、灵活表达、秒级回复服务体验,还大幅降低了企业内部技术与业务学习成本,加速数据分析效率,实现多端入口统一、界面统一平台构建...模型 + OLAP :开启数据服务平台新模式* * *在模型 + OLAP 架构方案中,目前经典方案如下图所示,模型充当中间层将用户输入自然语言转化为 SQL 执行语句,OLAP 作为底层存储和数据处理引擎...超音数平台框架构思* * *根据上述模型 + OLAP 解决方案进行了方案整合,以此进行框架设计并将其命名为超音数平台。...平台基于模型 + OLAP 模式加速业务分析效率,减少技术开发成本,向智能化、个性化、实时化全新业务服务模式更近一步。

43530

当 Apache Doris 遇上模型:探秘腾讯音乐如何基于模型 + OLAP 构建智能数据服务平台

平台融入模型后,平台用户输入问题会进入模型进行语义解析,自动转化为 SQL 语句触发 OLAP 引擎开启数据分析与查询。...模型 + OLAP 引擎结合全新数据服务模式,不仅为平台用户提供了个性化、灵活表达、秒级回复服务体验,还大幅降低了企业内部技术与业务学习成本,加速数据分析效率,实现多端入口统一、界面统一平台构建...模型 + OLAP :开启数据服务平台新模式 在模型 + OLAP 架构方案中,目前经典方案如下图所示,模型充当中间层将用户输入自然语言转化为 SQL 执行语句,OLAP 作为底层存储和数据处理引擎...超音数平台框架构思 根据上述模型 + OLAP 解决方案进行了方案整合,以此进行框架设计并将其命名为超音数平台。...平台基于模型 + OLAP 模式加速业务分析效率,减少技术开发成本,向智能化、个性化、实时化全新业务服务模式更近一步。

34530

英伟达发布基于Xavier处理器AI平台

Nvidia还宣布了其DRIVE AI平台三种新变体,这三种变体都基于Xavier SoC(系统级芯片)。...DRIVE AR为开发者提供了一种SDK,可以让开发人员利用计算机视觉、图形和人工智能开发新驾驶功能,比如覆盖有关路况信息、兴趣点以及使用交互式车载显示其他真实世界位置。...英伟达在Xavier基础上推出三个新平台另一个——DRIVE IX,将进一步简化车内人工智能助手构建和部署,同时具备内部和外部传感器数据功能,不仅可以与司机互动,还可以与路上乘客互动。...所有的汽车制造商最终都有可能拥有自己汽车专用AI助手,而Nvidia可能将借助DRIVE IX成为其中巨大推动力。 最后一个平台实际上是对其现有自主出租车大脑——Pegasus修改。...新Pegasus改进了之前版本,将两个Xavier SoC和两个英伟达GPU封装成一个包,这个包大小相当于一个汽车牌照大小。

83160

007.基于CentOS7.8安装Ambari2.7+HDP3.1数据平台

Ambari-Server、Ambari-Agent、Apache、MySQL hdp02 数据节点 Ambari-Agent hdp03 数据节点 Ambari-Agent hdp04 数据节点 Ambari-Agent.../data目录,/data目录磁盘是独立挂载容量磁盘 datadir=/data/mysql character_set_server=utf8mb4 character-set-client-handshake...Anywhere [7] - BDB ============================================================================== # 在选择数据环节...Ambari+HDP大数据平台部署 4.1 部署Ambari集群和HDFS集群 ? ? ? 接着要把滚动条往下拉,把无用其他操作系统仓库删掉: ?...剩余组件安装都是一样,有需要的话直接在页面操作安装即可,要注意就是需要修改日志目录和数据目录。 至此,Ambari2.7+HDP3.1数据平台就安装部署完成了!

2.1K32

JSW - 基于WEBMSSQL数据库查询平台

一般做法都是: 通过数据库账号限制查询人员、限制查询表和字段。但不好统计开发人员都查询了什么数据 使用跳板机,所有查询都要在跳板机上进行。进出跳板机数据文件要过审查机制。...第三级基本都是基于WEB系统,查询语句入库限制查询结果,并记录用户查询SQL。 我们想使用第三级,但能支持数据库只有MySql没有发现能支持微软SqlServer。...使用druid数据库连接池 数据库记录每次SQL执行脚本,并限制返回结果数量 支持查询结果csv格式导出 脚本输入框语法高亮,智能提醒 存储过程查看,表数据大小快速查看 项目部署 环境安装 本项目使用...首选我们看如何增加待管理数据库服务器,选择服务器管理=>增加服务器。在弹层中添加你服务器相关信息。 我们顺便给平台在增加一个用户。点击账号管理=>增加用户,在弹层内输入新用户账号和密码即可。...后台日志:经过几次试用可以去往后台查询日志。可以看到用户数据执行情况。

2.4K10

基于AI技术数据安全审计平台研究

系统解决大数据安全,必须建设一套符合大数据平台自身特点事后安全审计体系,以统筹解决安全威胁,并进行系统性安全威胁消除。...通过借鉴国内外大数据平台安全体系建设经验,参考业界前沿安全技术手段和经验,我们提出了数据安全审计层进建设体系。该体系以组织架构为基础,通过组织架构信息需求,建立大数据安全审计框架。...该安全审计框架自底向上依次建设“内容计算层、要点审计层、目标分析层”,并在建设过程中引入AI技术,构建基于AI技术数据安全审计平台。...通过利用两种算法特性,所取到结果数据有一定差异,在K-Means贴合行为分类基础上,DBSCAN噪点数据更加符合风险用户特性,因此采用两者结果集,使用取二者交集方法获得复合需要结果数据。...基于聚类算法与故障树算法相结合,依据ISO/IEC 27002 标准层次结构建立故障树,过程如下。

2.8K230

基于CDH(Cloudera Distribution Hadoop)数据平台搭建

“Apache Hadoop存在版本管理混乱、部署过程繁琐、升级过程复杂、兼容性差、安全性低等问题,CDH是Hadoop商业发行版之一,本文介绍基于Cloudera ManagerCloudera...Hadoop 6.1.0数据平台搭建,简单易上手 ” 基础环境准备 1、CM和CDH包 准备cmrpm包,cdhparcel包,第1个链接内需要完全下载,第2个链接内根据linux版本(centos6...192.168.242.134/cm-6.1.0,能够访问则成功; ② 制作本地yum源 #下载yum源工具包 yum -y install yum-utils createrepo # 在cm-6.1.0目录下生成rpm元数据...安装CDH 1、安装Cloudera-manager 这里使用默认pgsql作为元数据库,可以自己安装mysql库,并将其作为元数据库; # ① 安装必要rpm包 cd /var/www/html...2、配置cdh中数据相关组件 按照指引进行,记住数据登录名和密码; ? 初始化组件安装时容易出现主机资源不足,前期应该给cm节点足够存储空间; ?

89030

开源基于.NET8管理平台,支持智慧

软件介绍 RuYiAdmin是一款强大企业级WEB RBAC统一安全管理平台解决方案,具有前后端分离、代码自动生成、基于.NET 8平台和跨平台等特点。...此外,它还集成了VForm表单设计器,支持PC、Pad、手机H5页面表单设计与预览。 强大后端框架:RuYiAdmin采用.NET 7平台作为后端框架,并支持跨平台和Linux Docker。...它还支持锁屏、水印,以及按钮和视图可见性控制。RuYiAdmin还提供了按钮和视图级别的颗粒授权,支持权限下放。另外,软件支持视图层业务多语、敏感数据通信加密和智慧大屏幕等功能。...数据库和中间件支持:软件支持多种关系数据库,包括MySQL、SQL Server、Oracle、PostgreSQL和OpenGauss等。...此外,它还支持非关系型数据库,如Redis、MongoDB、Elasticsearch和Meilisearch等。RuYiAdmin还内置了可视化ER关系模型、数据库初始化脚本和自动构建数据库功能。

30710

快DKH大数据基础数据平台监控参数说明

2018年国内大数据公司50强榜单排名已经公布了出来,快以黑马之姿闯入50强,并摘得多项桂冠。Hanlp自然语言处理技术也荣膺了“2018中国数据星技术”奖。对这份榜单感兴趣可以找一下看看。...本篇承接上一篇《DKM平台监控参数说明》,继续就数据一体化处理架构中平台监控参数进行介绍和说明。 DKhadoop大数据处理平台架构安装相关文章已经分享过,详细内容可以找一下看看。...今天就把剩下一些监控参数一起介绍完,关于快大数据处理平台监控参数介绍就完整了。...1、Yarn监控界面 (1) 执行失败应用程序 图片1.png 监控 yarn资源管理中总执行失败应用程序数量 纵轴表示应用程序数量,单位个 横轴表示时间,单位分钟 (2)已提交应用程序 图片...资源管理中被杀死应用程序数量 纵轴表示应用程序数量,单位个 横轴表示时间,单位分钟 2、Spark监控界面 注意:(spark 运行任务后才有监控数据) (1) 最大可使用内存 图片7.png 监控

1.2K20

美国大数据智能理财平台5模式

不过,世易时移,近年来美国出现了智能投资市场,涌现出很多基于数据分析智能理财平台,大大降低了财富管理门槛,让原先处于“服务真空区”中产阶级也能享受同等财富管理服务。 ?...智能理财平台为什么会成功? 现在看来,有两因素促成了这些智能理财平台成功。 首先,ETF基金出现大大降低了投资成本。...第1种:基于数据分析给出投资建议 这种类型平台根据客户在其他理财交易平台行为数据,全面了解客户财务状况和投资现状,帮助客户对过去投资决策做出回顾。...第2种:基于数据分析购买投资组合 这种类型平台基于客户财务状况和风险承受能力,为客户推荐或购买相应交易型指数基金。 ETF成为这类型平台首选基金,因为它周转率低,降低了交易成本。...更长远一点说,我们看好这个行业发展,相信随着这些模式不断摸索和成熟,大数据智能理财肯定会掀起下一轮“大众理财”热潮。 (文章来源:苏宁美国硅谷研究院战略部)

1.8K60

勿谈,且看Bloomberg数据处理平台

时至今日,高核心数、SSD以及海量内存已并不稀奇,但是当下数据平台(通过搭建商用服务器集群)却并不能完全利用这些硬件优势,存在挑战也不可谓不大。...因此,即使在命中率为99.9%高效缓存中,仍然存在大量缓存未命中情况。这样一来,如果底层系统使用磁盘介质的话,这个操作往往会造成成千上万磁盘寻道。同时,基于用户数量,系统中存在着大量请求。...但是这里仍然存在一个非常缺点,在任何给定时间,到给定region读写操作只被一个region服务器控制。如果这个region挂掉,故障将会被发现,故障转移会自动进行。...同时,更快机器也有利于缩短响应时间。通过使用开源平台,我们认真思索来自多个提供商意见,在中型数据处理上,我们可以看到很大发展空间。...使用HBase,用户可以在Portfolio文件上做拆分,并且分配到集群中多个主机上进行处理。

3.1K60
领券