首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

直播 | 数据服务全生命周期落地难,如何巧用数据集成框架解决困境?

进入数字经济时代,无论企业还是工程师都深刻地意识到,数据在生产过程中的地位愈发重要。被称为数字时代「石油」的大数据,蕴藏着巨大的价值和可能性,等待我们挖掘和利用。 众所周知,数据的生命周期分为采集、存储、整合、呈现与使用、分析与应用、归档和销毁等阶段。而数据集成则是数据全生命周期中至关重要的一环,关系着企业是否能够以最小的成本从数据中心获取最大的价值。 当数据资源成为生产发展乃至于生存过程中必不可少的要素,企业该如何通过数据集成帮助企业数据服务全生命周期落地呢?5 月 14 日,一站式数据集成平台  Apa

04

小米doris

apache doris在小米演进架构中的应用,原来的方式是来自各平台的数据,都要有一个数据汇总的平台,但是由于数据量巨大,如果还用传统的mysql来做数据筛选,mysql的查询语句会变得越来越复杂,而且每天产生的都是pb级别的数据量,这种级别的数据,不搭建hadoop大数据平台的话,根本没有这样海量数据的处理能力。但是要维护一个大数据处理平台,运维成本是相当高的。而且每进行一次数据的汇总运算的话,可能服务集群的所有资源都要让度出来供该次运算得出结果,对整体集群的上其他一些服务的影响也特别大,所以引入了apache doris平台。支持了本地数据的上传,支持insert into select from的查询语句,也支持routing keys直接订阅kafka的broker(这好像是rabbitmq中的概念呀),这些数据导入之后,就可以在apache doris进行汇总了。现在apache doris已经在天星数科、新零食、用户画像、BI广告投放等业务上广泛被使用,大大提高的服务的运算性能。服务的演进过程也是宽查询,就是建立相应的表

01

腾讯云大数据技术介绍-云 HDFS

大数据虽然是一个比较宽泛的词,但对于我们来说其实可以简单理解为“海量数据的存储与处理”。之所以人们专门大数据这个课题,是因为海量数据的处理和较小量级数据的处理是不一样的,例如我们对一个mysql表中的数据进行查询,如果是100条数据,那对于mysql来说毫无压力,但如果是从十亿条数据里面定位到一条呢?情况就变得复杂了,换个角度想,十亿条数据是否适合存在mysql里也是尚待讨论的。实时上从功能角度的出发,我们完全可以使用以往的一些技术栈去处理这些问题,只不过高并发高可用高实时性这些都别想了。接下来要介绍的这些腾讯大数据组件就是在这一个问题背景下一个个诞生的。

012

华汇数据带你了解下大数据服务能力

大数据服务能力其实是一个相对于大数据产品能力的概念。从企业实际建设大数据项目的角度来说,多数情况下简单地购买一些大数据产品并不能满足实际需求,往往需要供应商提供一定的服务来完成项目的建设。具体来说,大数据项目前期的规划、咨询、设计,实施阶段大数据平台等产品的部署以及定制化开发,进一步对已有数据的迁移、集成、整合以及在此基础上进行的数据治理,接下来的持续运维运营和迭代优化,结合业务进行的一些应用开发等,这些围绕数据开展的一系列工作都属于大数据服务的范畴。供应商向客户提供这些服务的水平就是我们提到的大数据服务能力。

04

又到一年金三银四,还敢不重视 MySQL 原理吗?

过了年,2022年的金三银四黄金招聘季也就近在眼前了。卧薪尝胆也罢、踌躇满志也好,作为一名技术人,想要进阶大厂或者升级加薪,首先必须要拥有能够通关打怪的实力加持,这样才可能在千军万马中脱颖而出成为优胜者。每到这个时候各路面经也往往铺面而来,以我往年参加的大咖闭门分享会的经验而言:选对方向好过自我感动式的盲目努力。在数智化时代,围绕数据存储、处理和分析的技能都是必须要掌握的,而MySQL作为数据库里使用最广的开源软件,是技术人怎么都绕不开的全方位支撑技能。而大厂面试重基础早已闻名业界,只不过偶尔表述的套路不同

02

如何做好大型遗留系统的数据迁移

历史悠久的大型企业,都会存在遗留系统。这些系统运转着重要的业务,但使用到的技术已经跟不上时代潮流。因此有着维护成本高、难以扩展、用户体验差等缺陷。最终,企业一定会下决心开发一套全新的系统来替代遗留系统。除了完成新系统的开发,还有一项重要的工作,是将老系统中存留的数据迁移进新系统,也就是我们常说的数据迁移。如果你没有数据迁移的经验,很容易低估其难度。数据迁移看起来只是把数据从一个 DB 转移到另外一个 DB,select + insert + 转换逻辑就可以轻松搞定。如果带着这个想法开始数据迁移项目,你的团队很快就会坠入深渊,举步维艰。数据迁移是一项看似简单,实而复杂且繁琐的工作,想要做好并不容易。

01

招商信诺人寿基于 Apache Doris 统一 OLAP 技术栈实践

当前,大数据、人工智能、云计算等技术应用正在推动保险科技发展,加速保险行业数字化进程。在这一背景下,招商信诺不断探索如何将多元数据融合扩充,以赋能代理人掌握更加详实的用户线索,并将智能分析贯穿业务全链路,实现对用户、产品、场景策略的全面洞察与闭环迭代。本文将详细介绍招商信诺在大数据基础建设方面的探索之旅,从最初为线报表、Ad-hoc 分析提供服务的 OLAP 引擎,逐步发展至基于 Apache Doris构建的统一实时数据仓库,通过一套架构实现各业务领域的多元数据实时分析与融合统一管理,最终实现保险一线业务降本增收的目标。

04
领券