首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

银行核心海量数据无损迁移:TDSQL数据库多源异构迁移方案

本文将带来直播回顾第五篇《银行核心海量数据无损迁移:TDSQL数据库多源异构迁移方案》。...事实上,作为国产自研的成熟的分布式数据库产品,TDSQL对内稳定支撑腾讯海量计费业务,对外开放5年来也通过云服务为微众银行等超过600家金融政企机构提供高性能、高可用、高可靠、强一致的分布式数据库服务。...image.png 结合我们刚刚说的需求,基于数据同步的跨城活架构,也是腾讯内部现在在使用的架构。...基于数据同步的跨城活架构是这样的形式: 首先左边和右边代表不同的城市,这里举例左边是深圳,右边是上海。...举个例子,我们按[5,6,7,8,9]这样的顺序向消息队列生产一部分消息(写),届时收到的消息回调序号也应该是[5,6,7,8,9];当接收完9号这条消息回调的时候,下一条如果收到的回调序号是12、或者11

2.4K31

海量数据迁移之外部表并行抽取(99天)

对于大型项目中海量数据使用sqlloader是一种全新的方式,不过很明显,sqlloader的可扩展性更强,但是基于oracle平台的数据迁移来说,外部表的性能也不错。...对于数据迁移来说也是一个很好的方案。...使用外部表来做数据迁移,可以“动态”加载数据,能够很方便的从数据库中加载数据,对于数据校验来说就显得很有优势了,而对于sqlloader来说,可能得等到数据加载的时候才知道是不是有问题,如果对于数据的准确性要求极高...,可以使用外部表动态加载数据到备库,和现有的数据做比对,减少在升级过程中带来的灾难。...1 ora11g dba 30531584 Jun 10 01:43 T_TEMP_1.dmp 在比较同样的数据量的情况下,sqlloader可能需要大约120G的容量,而对于外部表来说,大概只需要

1.5K50

数据揭秘“11”成长史

1111日,本来也就是文艺单身狗们发点牢骚,抒抒情的日子,可如今却变成了电商最惨烈的战场,这场起源于2009年的“品牌商的5折活动”,现如今已经成了一个“疯狂吸金”的强大商标,这一部11的成长史,每一年都给我们一组新的惊人数字...,博古才能通今,通观这些历年的双十一大数据,看看我们除了总结过去之外,还能不能预测一下未来。...2013年,11“光棍节”支付宝交易额达350.19亿元。2014年达到571.12亿元。 ?...淘宝和天猫各自销售额 年份 淘宝(亿元) 天猫(亿元) 2011 18.4 33.6 2012 59 132 2013 未公布 未公布 2014 未公布 未公布 2009年到2011年这三年基本是阿里11...小结: 以上就是历年11的一些大数据,这些数据其实不仅仅是阿里的一个成长,也代表着其他一些变化,比如说:天猫的销售额占总体销售额越来越高,移动端收入占比越来越高,单店销售收入冠军从生活服饰类变成了手机

4K10

海量数据迁移,小程序云开发数据库这样做

在优化的过程中,就涉及到了迁移的问题。 一般来说,业界针对升级和迁移,会提供热迁移和冷迁移两种方案: 冷迁移:冷迁移需要对数据库先进行停机,等迁移完成后,再重启数据库。...热迁移:热迁移无需对数据库进行停机,整个迁移过程中,数据库可以持续对外提供服务。用户对于热迁移无感知。...云开发作为基础服务提供商,是无法进行冷迁移的,因此,对于云开发来说,思考如何在现有的架构基础之上做好热迁移势在必行。 想要对云开发的数据库进行热迁移,首先,需要理解云开发数据库的底层架构。...热迁移的基础是数据库底层的迁移能力,而数据库底层的迁移分为三个状态: 数据同步:对快照和数据库的 oplog 进行拷贝和追踪; 数据割接:在 oplog 几乎追上时,进行数据割接; 目标集群可用:完成割接后...生产环境下目前迁移用户请求如图所示: ? 以上便是基于小程序云开发自身的数据库架构设计的数据库底层热迁移实现方案概述。 如果你对上文有任何疑问,欢迎在下方评论区留言。

1.7K20

海量数据迁移之冲突数据筛查(r2 第1天)

对于数据迁移来说,无论准备工作准备的多么充分,在测试和正式生产环境中,心里还是会对冲突的数据有一些疑虑,心里感觉没底,因为生产的数据也是在不断变化的,要迁移数据也在做相应的改动,在这样的环境中,其实数据抽取的工作还是顾虑比较少的...可能会有一些紧急的数据更改任务,数据的稽核等等。。 对于主键相关的数据排查,如果在数据迁移前能够发现,是最好的了,这样可以极大的减少dba的工作量。...个人就是在这种窘境中这样设想了一个方法,首先通过查询主键信息,得到主键索引相关的列,然后通过Intersect来查询那些主键字段的数据在生产和迁移库上有冲突,这个过程可以创建一个临时的用户来加载外部表,...所以省去了创建额外的数据空间,而且可以考虑在备库上执行。...基本思路就是通过如下的sql语句来找到冗余的数据

1.5K50

数据告诉你:面对11,线下商机何在

芝麻科技授权转载 微信:Smart_Business 每年的11都呈愈演愈烈之势,今年11,天猫成交额更是达到了前所未有的912亿。 线上的购物狂欢对实体商业究竟有什么影响?...实体商业在11的大背景下,还有没有可以挖掘的商机? 11为实体商业带来了大量的销售机会。...研究数据涉及北京、武汉、深圳重点商圈的男装、女装、化妆品店在“11”前一个周末(11月7日、11月8日)的客流及客群画像与“11”前三周的对比。由芝麻科技的客流分析系统有数提供研究所需数据。...11前,女装店吸引了大量老顾客,她们对品牌熟悉,更愿意在门店里长久停留选购(从平均5.3分钟提升至8.5分钟),或是为即将到来的线上抢购做准备,品牌如果能满足老客们已有的购买意愿,将有可能促成她们的线下购买...11不是实体商业的黑色周,相反,无论是客流数据,还是客群画像,都证明了旺盛的购物意愿会为实体商业带来大量销售机会。

6.8K60

2018天猫11各项数据发布

数据11当天,小米新零售全渠道支付金额创下52.51亿元新纪录。   11已有10年时间,每年的冠军商家是谁?主力消费者、惊喜品类和创新业务是……?看下图~点击看大图 ?...张勇分享11体会:顺着马老师昨天在视频里表达的,作为11十年的经历者,我也想对大家表达一声感谢。...张勇:11是24小时的shopping day,不仅是购物,还是分享快乐和购物的乐趣,这是11所做到的。...张勇:今天的11,不仅是消费力量的体现,也是大的商业力量的体现。通过大数据,云计算平台,赋能商家,这也是我们“让天下没有难做的生意”愿景。 张勇:11期间,国际品牌成交量超40%。...蚂蚁金服“11”期间数据:生物技术让数亿人的支付时长缩短至1秒,今年11生物支付占比达到60.3%。

2.9K10

首次揭秘1112背后的云数据库技术!| Q推荐

是什么样的数据库撑起了 2021 年的 11 12 的稳定进行?...《数据 Cool 谈》第三期,阿里巴巴大淘宝技术部 12 队长朱成、阿里巴巴业务平台 11 队长徐培德、阿里巴巴数据 11 队长陈锦赋与 InfoQ 主编王一鹏,一同揭秘了 11 12 背后的数据库技术...在 11 12,这种方式的弊端会被进一步放大。数据显示,在 11 秒杀系统中,秒杀峰值交易数据每秒超过 50 万笔,是一个非常典型的电商秒杀场景。...在 2021 年 11 12 中,有一种无所不在的技术力保证了整体系统的稳定,如 PolarDB 具备的极致弹性、海量存储和高并发 HTAP 访问的产品特性。...在 2021 年的 11 12 中,ADB 3.0 真正实现了无论是否在峰值场景,都能让历史订单实时检索。 具体而言,ADB 3.0 解决了三方面的问题: 全量数据迁移与实时同步。

31.6K50

海量数据迁移数据加载流程(r4笔记第88天)

在之前的博文中分享了关于数据抽取流程的一些思路,整体来说,数据的抽取是辅助,数据的加载是关键。加载的过程中每一步需要格外关注,稍有偏差就可能造成数据的损坏或者丢失。...把一些潜在的数据冲突问题提前发现,提前修复,如果在大半夜的数据加载中发现了问题,再去修复似乎就晚了很多,而且带着疲惫去尝试修复数据真实苦不堪言。 右边的图是数据加载的一个流程图。...通过比较只读用户(即目标数据)和外部表用户中的外部表数据(源数据),可以灵活的匹配主键列,非唯一性约束列可以很有效的进行数据的冗余比较。...有了这种方式,在多次的数据迁移中,都可以在数据加载前提前进行数据检查。着实让人放心不少,对于提升自信心是很有帮助的。一旦发现了数据问题,就可以及时发现,提前发现,让专门的团队及时修复数据。...至于最关键的数据加载,就是外部表用户和目标数据用户之间的数据关联了。可以通过insert append的方式进行数据的导入。可以根据数据情况进行切分粒度的控制。

1.6K30

海量数据迁移数据抽取流程 (r4笔记第72天)

采用外部表抽取数据的流程图如下: 大体标注了一下抽取的基本结构,我们会尽量保证不去碰原本的数据源,会创建两个临时的用户,一个是只读用户,这个用户上只有同义词,只具有数据源中的select权限。...这就对应上面红色标注的1,而另外一个用户是外部表用户,所有通过创建外部表都会在这个用户下进行,生成了dump文件之后,我们可以随时删除外部表,这个时候为了保证相关的drop操作不会牵扯到数据源,外部表用户会继承只读用户中的...当开始抽取数据的时候,会去查找是否有权限读取数据,会找到只读用户,最终能够读取数据源的数据,这就对应红色标注的3,4 当满足了基本的条件,就开始生成外部表的dump,可以为一个表生成多个dump,而且这个过程是并行的

1.4K40

海量数据迁移之分区并行切分(r2笔记60天)

海量数据迁移中,如果某个表特别大,可以考虑对表中的分区进行切分,比如某个表有100g,还有100个分区,那么可以考虑针对这100个分区,那么可以考虑把这100个分区看成100个表进行并行抽取,如果某个分区数据比较多...目前生成了如下的数据报告,我们需要基于这个报告来对如下的表/分区进行切分。 REEMENT这个表不是分区表,所以在分区信息的地方填写了默认值'x',在数据加载的时候会进行过滤。...在数据加载的时候就可以先加载21号dump,然后22号dump,23号dump MEMO partition(P0_A1000_E3) 3 21..23 MEMO partition(P0_A1000...move INVOICE partition(A11_B6) to par6_ move INVOICE partition(A11_B4) to par1_ move INVOICE partition...(A11_B2) to par2_ move INVOICE partition(A11_B10) to par3_ move INVOICE partition(A10_B8) to par4

1.3K40

海量数据迁移之分区并行抽取(r2笔记53天)

在之前的章节中分享过一些数据迁移中并行抽取的细节,比如一个表T 很大,有500G的数据,如果开启并行抽取,默认数据库中并行的最大值为64,那么生成的dump文件最50多为64个,每个dump文件就是7.8G...,还是不小,况且在做数据抽取的时候,资源被极大的消耗,如果资源消耗紧张,可能可用的并行资源还不到64个。...分区表的数据基本都是分散在各个分区的,考虑数据的不均匀分布,那么每个分区的数据可能在5~10G吧。...参照这个思想,假设开启并行,比如200M为一个基准点来切分分区表,比如分区表的某个分区含有5G的数据,那么需要开启25个并行即可,文件就会被切分为200M的很多细粒度的dump文件。...36 SUBSCRIBER_HISTORY x 11

99080

海量数据迁移之外部表切分(r2笔记52天)

在前几篇中讨论过海量数据的并行加载,基本思路就是针对每一个物理表都会有一个对应的外部表,在做数据迁移的时候,如果表有上百G的时候,一个物理表对应一个外部表性能上会没有任何提升。...如果需要做数据插入的时候,对undo是极大的挑战,从某种程度上而言,性能应该要比datapump要差。这个时候可以考虑一个物理表对应多个外部表,比如一个表有100G。...可以考虑生成100个external dump 文件,然后加载生成100个外部表,每个dump文件对应一个外部表,这样做数据的插入的时候就相对容易控制了。...每一个外部表的数据加载到目标库之后,commit一次,就能及时的释放Undo资源,提高性能。

91770

天猫11数据过于完美?我们用python来看看

11结束了,大家已经无手可剁 。 天猫官方公布了今年的11成交额为2684亿元,成功刷新了自己创下的商业纪录。按理说大家已经习惯了逐年增长,没想到 由于过于完美,引发网友提出质疑。...一些人提出了相反意见:如大V@阑夕表示天猫11数据是精确地控制了交易额,从而形成了理想的曲线。 而天猫相关负责人回应称,符合趋势就假?造谣要负法律责任。...先将天猫2009年-2018年的双十一历年销售额历史数据导入到一张表里。 ? 点击插入一张散点图。 ? ? 左键点击一下任意一个散点数据,出现散点数据选择状态。...利用三次多项式预测的数据与公布的结果确实很相近。 我们继续搞事情。 将今年2019年的2684亿导入,预测一下后面三年: ? 按照网上的阴谋论,后面几年的数据应该如此。...只写一些其中跟我们相关的数据知识就够了。 网络大众对此事的看法到底如何? 不妨看下腾讯科技发起的一个投票。 ? 大众的看法就像这个投票。

1.6K10

天猫11数据过于完美?我们用python来看看

11结束了,大家已经无手可剁 。 天猫官方公布了今年的11成交额为2684亿元,成功刷新了自己创下的商业纪录。按理说大家已经习惯了逐年增长,没想到 由于过于完美,引发网友提出质疑。 ▼ ?...一些人提出了相反意见:如大V@阑夕表示天猫11数据是精确地控制了交易额,从而形成了理想的曲线。 而天猫相关负责人回应称,符合趋势就假?造谣要负法律责任。...先将天猫2009年-2018年的双十一历年销售额历史数据导入到一张表里。 ? 点击插入一张散点图。 ? ? 左键点击一下任意一个散点数据,出现散点数据选择状态。...利用三次多项式预测的数据与公布的结果确实很相近。 我们继续搞事情。 将今年2019年的2684亿导入,预测一下后面三年: ? 按照网上的阴谋论,后面几年的数据应该如此。...热衷于Python爬虫,数据分析,可视化,个人公众号《凹凸玩数据》,有趣的不像个技术号~

1.5K20

10 年稳定支撑 11 ,国产数据库之光 OceanBase

这场阿里专为开发者打造的数据库交流学习的机会,怎么能少了我呢?于是西红柿也趁周末时间去”补课“了,一到现场可谓满满都是”压迫感“!没想到大家周末都这么有激情呀(见图一,千人会场座无虚席)。...OceanBase CTO 杨传辉在大会现场说,“OceanBase 将持续降低开发者使用门槛,全面提升 OceanBase 的易用性,打造真正对开发者友好的数据库,建设开放的技术生态,让国产数据库走向田间地头...简单来说,就是牛,非常牛, 11 知道吧?...OceanBase 已连续 10 年稳定支撑 11,创新推出“三地五中心”城市级容灾新标准,在被誉为“数据库世界杯”的 TPC-C 和 TPC-H 测试上都刷新了世界纪录。

3.2K50

程序员如何快速将海量本地数据迁移至腾讯云对象存储COS

“ 在大数据时代面对海量的本地文件时,随着云存储的普及,越来越多的用户需要把海量数据从传统的本地存储迁移到新的分布式云基础设施上,这就需要快速高效安全的迁移方法。”...原文发布于微信公众号:腾讯云存储(关注有惊喜) 操作场景 对于拥有本地 IDC 的用户,对象存储 COS 在不同迁移类型上支持以下迁移方式,帮助用户将本地 IDC 的海量数据快速迁移至对象存储 COS。...下图展示的是使用线上迁移时预估的时间消耗,可以看出,若此次迁移周期超过10天或者迁移数据量超过50TB,我们建议您选择线下迁移,否则,请选择线上迁移。...用户可以考虑使用多台机器安装 COS Migration 并分别执行不同源数据迁移任务。 二、云数据迁移CDM 线下迁移 迁移操作步骤: 1.前往云数据迁移 CDM 控制台提交申请。...3.收到设备后,按照迁移设备手册把数据拷贝至设备。 4.完成数据拷贝后,在控制台提交回寄申请并等待腾讯云把数据迁往对象存储 COS。 详情请参见云数据迁移 CDM产品文档。

1.8K00
领券