在今年的Oracle Cloud World,Oracle宣布将发布一款数据库湖仓产品——MySQL HeatWave Lakehouse用以解决存储在数据库之外的文件数据等非结构化数据的查询和处理。
上一篇文章《面试必备:如何将一个长URL转换为一个短URL?》中谈到如何将长地址URL转换为短地址URL,其中谈到了一个比较理想的解决方案就是使用发号器生成一个唯一的整数ID,然后转换为62进制,作为短地址URL。
顶级云计算数据仓库展示了近年来云计算数据仓库市场发展的特性,因为很多企业更多地采用云计算,并减少了自己的物理数据中心足迹。
根据 DB-Engines 网站的数据,Snowflake 荣获2021年度数据库。
出品 | OSC开源社区(ID:oschina2013) DB-Engines 宣布 Snowflake 成功卫冕,获得了 “2022 年度数据库” 称号。 DB-Engines 是全球知名的数据库流行度排行榜网站,其评选年度数据库的标准为:计算数据库当前最新流行度分数(2023 年 1 月)的同比增长量,分数增长最多的即为年度数据库。 年度 DBMS:Snowflake Snowflake 是一个基于云的数据平台,因其可扩展性、灵活性和性能而广受欢迎。它使用自定义 SQL 引擎和列式数据存储,并提供广泛
DB-Engines 根据其网站的数据,宣布 Snowflake 荣获“2021 年度数据库”称号。
表命名的规则分为3个层级,层级之间通过_分割,例如b_r_identity、d_l_identity。规约为:
本文最初发表于 OtterTune 网站,经原作者 Andy Pavlo 授权,InfoQ 中文站翻译并分享。
如何将一个物理DG转换为一个快照DG呢?如果备库正处于Redo Apply过程,那么需要先取消日志应用,并且关闭数据库所有节点到MOUNT阶段:
好奇心是我们学习过程中最好的老师,对于Oracle的研究和学习也是如此,在遇到未知的问题时要善于提出为什么。本文将从问题出发,和大家一起解密Oracle rdba结构。
DB-Engines新的年度流行度排行榜出炉,2021年1月度排行榜上前三甲分别为 Oracle、MySQL 和 Microsoft SQL Server,这三者的名次已经稳定长达10年之久。在可以预见的5年之内,前三强的位置仍然不会改变。
在前面提到的精确去重方案都是会保存全量的数据,但是这种方式是以牺牲存储为代价的,而hyperloglog方式虽然减少了存储但是损失了精度,那么如何能够做到精确去重又能不消耗太多的存储呢,这篇主要讲解如何使用bitmap做精确去重。
关于sql解析的一些概述: 因为最近在研究如何将oracle的sql语句迁移到hive上去,前期是准备写一些udf函数去弥补hive缺失oracle函数的遗憾, 其次会使用python开始开发一套轮子去实现转换。目前是实现了DDL建表语句的迁移,之后会慢慢不上DML的迁移。 目前的整体架构和一般的sql解析引擎无异,有如下几个部分: Catalog:这部分相当于字典表,使用了pyhs2去检查hive是否存在这张表,后续的话,应该也会利用pyhs2直接建表。 DDL_parser:现在只是实现了建表语句的互换 sql_parser:打算是正常的select语句,不支持insert语句。解析关键字,生成一棵树。主要是对oracle语句和hive语句的join做出处理,变成一个逻辑执行计划。 analyzer:将逻辑执行计划,重新组装成hive sql语句。 具体细节如下: 逻辑执行计划主要是树的数据结构,分为三种节点: 一元节点:主要是存放Project,Sort,Limit,Filter这四种操作。一个子节点 二元节点:主要是Except(也就是类似于not in),Intersect(也就是join,这里目测实现难度会最大),两个子节点 parser的设计: 对于传入的语句将\r\n\t这些都替换为空格,设为空格标识符。 对sql语句进行拆分,会使用stack的结构,处理子查询。 DDL的解析:对create和table进行匹配,create table设为DDL标识符。表名就是identifier,再就是匹配括号,将括号里面的语句进行处理转换成hive的语句。 其中特别提到的是数据类型的转换,通常来讲是会全部转成string类型,number会转成decimal类型。 sql_parser:会对里面的函数进行匹配,使用字典的形式去匹配,赋值相应的标识符。将相应的字段名,处理到keyword的执行计划中,放入树中。会处理oracle的一些特殊表示连接 的方式 analyzer:目前再将sql_parser的数再拼接回来,将oracle简写的sql语句变成hive的。
近些年,很多数据库公司上岸,MongoDB市值 216亿美金,Cloudera 市值 45亿美金。而其中最耀眼的,非 Snowflake莫属,849亿美金。
当我们在生成式 AI 的背景下讨论数据库时,总是首先想到的问题之一是:“我不能告诉数据库我需要什么,而不必制作一个复杂(通常是多页)的 SQL 查询吗?
DB-Engines 最近发布了 2021 年 9 月份的数据库排名。该网站根据数据库管理系统的受欢迎程度对其进行排名,实时统计了 378 种数据库的排名指数。前 30 名的排行情况详见下图:
DB-Engines 最近发布了 2021 年 9 月份的数据库排名。该网站根据数据库管理系统的受欢迎程度对其进行排名,实时统计了 378 种数据库的排名指数。前 30 名的排行情况详见下图,前10大数据库 用线段做了分割。同时在文末,会免费赠送给大家一些数据库书籍!
之前我写了文章简单的讲了一下最近非常热闹的由Databricks发起的和Snowflake的撕逼文章们:
在RAC环境中,只有在集群正常启动的情况下才能创建和启动单实例的数据库,否则报错:
数据库中间件承担应用与数据库之间的粘合与润滑,数据库中间件设计的合理应用跑起来就丝滑,否则会拉胯。本文就常见数据库组件相关的功能设计点做个归纳整理:
snowflake 成为年度数据库 根据 DB-engine 统计的流行度,2021 年 snowflake 成为年度数据库。年度数据库的标准很简单,就是新增流行度最多的数据库,DB-Engine 对 2021 年度数据库解读是: Snowflake is the database management system that gained more popularity in our DB-Engines 1Ranking within the last year than any of the oth
SNP Glue是SNP的集成技术,适用于任何云平台。它最初是围绕SAP和Hadoop构建的,现在已经发展为一个集成平台,虽然它仍然非常专注SAP,但可以将几乎任何数据源与任何数据目标集成。
经常思考一个问题,为什么我们需要分布式?很大程度或许是不得已而为之。如果摩尔定律不会失效,如果通过低成本的硬件就能解决互联网日益增长的计算存储需求,是不是我们也就不需要分布式了。
其实很简单 Driver选择 Microsoft SQL Server(jTds) 即可。
数栈是云原生—站式数据中台PaaS,我们在github和gitee上有一个有趣的开源项目:FlinkX,FlinkX是一个基于Flink的批流统一的数据同步工具,既可以采集静态的数据,也可以采集实时变化的数据,是全域、异构、批流一体的数据同步引擎。大家喜欢的话请给我们点个star!star!star!
分布式系统专家,架构师,开源软件作者。PingCAP 联合创始人兼 CTO,知名开源项目 Codis / TiDB / TiKV 主要作者,曾就职于微软亚洲研究院,网易有道及豌豆荚。2015 年创业,成立 PingCAP,致力于下一代开源分布式数据库的研发工作,擅长分布式存储系统设计与实现,高并发后端架构设计。
回顾数据仓库的发展历程,大致可以将其分为几个阶段:萌芽探索到全企业集成时代、企业数据集成时代、混乱时代--"数据仓库之父"间的论战、理论模型确认时代以及数据仓库产品百家争鸣时代。查看原文
客观地说,如果一定要用uuid生成订单号这类东西也能凑合用,但是它有着罄竹难书的“罪行”:肉眼可见,它是无序的;长度是64位数字字母随机组合的字符串,占用空间巨大;完全不具备业务属性,也就是说使用uuid你完全无法推算出它到底是干嘛的;因为无序,所以趋势递增就更不用指望了;所以用uuid生成订单号就是自杀行为,适合它的是类似生成token令牌的场景。
【Flink】第四篇:【迷思】对update语义拆解D-、I+后造成update原子性丢失
它仅基于 7 个基本命令: Migrate、 Clean、 Info、 Validate、 Undo、 Baseline和 Repair。
丨导语丨 本文分享的主题是腾讯灯塔融合引擎的设计与实践,主要围绕以下四个方面进行介绍: 1. 背景介绍 2. 挑战与融合分析引擎的解法 3. 实践总结 4. 未来演进方向 分享作者|冯国敬 腾讯 后台开发工程师 一 背景介绍 腾讯灯塔是一款端到端的全链路数据产品套件,旨在帮助产品、研发、运营和数据科学团队 30 分钟内做出更可信及时的决策,促进用户增长和留存。 2020 年后数据量仍然呈爆炸性增长的趋势,且业务变化更加迅速、分析需求更加复杂,传统的模式无法投入更多的时间来规划数据模型。我们面临一个海量、
DB-Engines最近发布了2020年10月份的数据库排名。该网站根据数据库管理系统的受欢迎程度对其进行排名,实时统计了359种数据库的排名指数。前10名的排行情况详见下图:
前一段时间学习Oracle 时做的学习笔记,整理了一下,下面是分享的Oracle常用函数的部分笔记,以后还会分享其他部分的笔记,请大家批评指正。 1.Oracle 数据库中的to_date()函数的使用: 往emp表中插入一条记录: SQL> insert into emp values(1234,'LIZELU','BOSS',1234,'1980-12-06',10000.0,0,30); insert into emp values(1234,'LIZELU','BOSS',1234,
众所周知,数据库很容易成为应用系统的瓶颈。单机数据库的资源和处理能力有限,在高并发的分布式系统中,可采用分库分表突破单机局限。
H2是一个采用java语言编写的嵌入式数据库引擎,只是一个类库(即只有一个 jar 文件),可以直接嵌入到应用项目中,不受平台的限制
Oracle 23c 提出的理念是 App Simple,亚马逊在 re:invent 2022 大会提出的一个理念是 ZERO ETL,其实都是在简化。
本文只整理MySQL的自增字段方案,Oracle和SQL Server的自增长方案就不介绍了。
这是2023年纽约NYC MongoDB大会的第二期,这期的主题是在企业级别从RDBMS 迁移到 NoSQL.
DB-Engines 12 月份数据库流行度排行榜已发布更新,下面让我们一起来看看这份榜单,了解数据库技术的发展趋势。
这是《ShardingSphere 进阶》专栏的第一篇文章,介绍一下Sharding-JDBC实现分库分表的详细配置。
作为全球最具权威的IT研究与顾问咨询公司,Gartner报告非常值得从业者研究学习。从中我们可以了解到更多行业、产品、技术发展趋势。近日,数据库领域的重磅报告《Magic Quadrant for Cloud Database Management Systems》悄然出炉。作为数据库领域的重要组成部分,云数据库近些年来发展迅速。2020年,Gartner将魔力象限从Operational Database更名为Cloud Database。从2020年的数据来看,云数据库已占据整体数据库市场份额的40%,且贡献了增长市场的9成以上份额。据Gartner预测,到2022年云数据库营收数据将占据数据库整体市场的半数以上。可以说,云数据库代表着数据库行业的未来。本文将尝试从多角度加以分析,窥视云数据库2021发展变化。文中仅代表个人观点,如有偏颇,欢迎指正。
众所周知,数据库很容易成为应用系统的瓶颈。单机数据库的资源和处理能力有限,在高并发的分布式系统中,可采用分库分表突破单机局限。本文总结了分库分表的相关概念、全局ID的生成策略、分片策略、平滑扩容方案、以及流行的方案。
服务化、分布式已成为当下系统开发的首选,高并发操作在数据存储时,需要一套id生成器服务,来保证分布式情况下全局唯一性,以确保系统的订单创建、交易支付等场景下数据的唯一性,否则将造成不可估量的损失。
来源 :ToBeSaaS 作者:戴珂 ---- 几天前,圈里有朋友请我分析一下SaaS界的新贵Snowflake。 文章写完好几天了也没发布,因为看到铺天盖地关于Snowflake的文章。大都谈论它迅速造富的事儿;连八杆子都打不着SaaS的巴老,也投资了Snowflake,并立刻获得翻倍的回报。 总之,SaaS又火了一把。 在整个SaaS界都沉浸在Snowflake致富神话中,我写这些跟钱没啥关系的文章,估计也没什么人有心思读下去。 所以我就摘出四个方面的内容分享一下,至于其它内容读者可以自行去
Tableau是一款优秀的数据可视化分析软件,这几天安装之后,感觉它不仅可以实现对各种数据的可视化绘制操作,并支持多个视图按照故事进行组织,同时具有强大的数据连接操作。支持各种数据源。当然最强大的肯定还是它的server版,可以实现与desktop版的无缝对接。
导语 | 分析型数据仓库经历了共享存储、无共享MPP、SQL-on-Hadoop几代架构的演进,随着云计算的普及,传统的数据仓库架构在资源弹性,成本等方面已经很难适应云原生的要求。本文由偶数科技 CEO,腾讯云TVP 常雷在 Techo TVP开发者峰会「数据的冰与火之歌——从在线数据库技术,到海量数据分析技术」 的《新一代云原生数据仓库的应用》演讲分享整理而成,为大家详细剖析新一代云原生数据仓库的架构、原理和实现技术,以及如何充分应用云原生数据仓库的特点来实现云上大数据应用。 点击可观看精彩演讲视频
名称 TO_NUMBER 和 TONUMBER 可以互换。它们支持 Oracle 兼容性。
编辑说明:《Oracle性能优化与诊断案例精选》出版以来,收到很多读者的来信和评论,我们会通过连载的形式将书中内容公布出来,希望书中内容能够帮助到更多的读者朋友们。 在今天的技术领域,DevOps已经成为最热门的话题之一,DevOps是开发和运维一体化的实践趋势,也是运维掌握一定的开发能力,推动和协助开发进行适应高效运维的渐进变革。 在我的技术生涯中,对Oracle数据库的接触最多,感受也最深。如果说要将最值得推荐的技能展示给大家,那么我想推荐的就是Oracle跟踪方法。事实上,通过跟踪能够实现的也正是不
企业可以利用Hadoop以及所有与它相关的技术设计大数据环境,以满足其特定的需求。但把所有的技术集成在一起并不是一件容易的事。 IT团队寻求构建大数据架构时有大量的技术可供选择,他们可以混合搭配各种技
领取专属 10元无门槛券
手把手带您无忧上云