首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

对于大表的写入和统计查询该如何权衡,我有四个解决思路

所以从我的理解中,月数据量在一千万,其实量级不大,按照几年的饿一个维度来存储,这个量级其实也可以接受。...我有几种迭代方案: 1.单独建一个归档库,把这些年的订单放在一起,即可以统一访问入口,比如order表,数据按照业务ID分片(如果没有,自增ID也行,不做业务逻辑接入),底层可以使用mycat分片,唯一性索引需要在订单号上面...2.使用mysql列式存储引擎infobright,社区版足够,60亿的统计大概10秒左右出数据,需要离线文件load,不支持DML ,其中的方案特点就是针对列式存储的方式来大大提高效率,当然是用HBase...3.考虑TiDB的方案,大数据量效果也不错,建议直接写入TiDB,次之业务写,如果TiDB做sync源,复杂度高,而且难以追溯,性能可以做下权衡 。其中如下图,可以在TiKV层面做横向扩展。 ?...今天读到的一段文字,让我有一种莫名的感同身受,尽管经历不同:我希望你们不要和我一样,耽误了十二年,快被业内淘汰的时候才把早该弄明白的问题搞清楚。

79220

腾讯云深度归档让数据从磁带走向云端

典型的数据归档业务场景包括: 金融交易:交易日志、票据影像、录视频; 视频监控:安防监控、交通监控、个人视频监控; 生命科学:医疗影像数据、电子病例、基因测序数据; 广告营销:电子商务日志、广告营销日志...备份服务器直接访问对象存储COS,支持类型包括标准存储、低频存储归档存储和深度归档存储。...离线数据搬迁上云 如果本地数据中心还没有拉通专线,或者存量归档数据规模比较大,可以通过云数据迁移服务CDM专用设备,进行大规模离线迁移数据上云,从而获得深度归档带来的好处。...提供安全可靠的离线迁移专用设备,解决本地数据中心通过网络传输时间长、成本高的问题。...随着腾讯云COS深度归档的发布,结合商业备份软件、云存储网关、离线迁移工具,腾讯云为企业的核心数据资产提供了高性价比的归档解决方案,助力企业数字化转型。

3.3K40
您找到你想要的搜索结果了吗?
是的
没有找到

有赞搜索中台的探索与实践

离线离线写这块主要有一点就是注意版本覆盖问题,避免版本乱序。 初始数据刷入一次场景,这种离线选择 create 操作即可,如果增量有数据则被过滤掉。...通用DSL语言 这个不用赘述,由于不同存储的 sql 语法是不同的,如果让业务前置感知就侵入太大了,而且同一存储的不同版本有时候变动也较大,业务方兼容不实际。...搜索中台通过监听自建索引双机房同步的消息中,做了一层配置化路由写,来做到索引无感知重建。...再比如数据归档搜索,当数据量级大到一定程度,势必要进行归档归档方案的选型,随着各个业务量级和对归档数据搜索的诉求,痛点,集成后,中台产出通用解决方案,做到无感知数据归档,搜索集成,配置化路由到对应索引中...关键抓手牢牢抓住,一口吃不了一个胖子,能解决大部分能力复用,服务核心业务方就很不错了 不过度设计,贴着业务需求做能力搭建,方便快速落地。

1.1K30

年均节省千万元的大数据成本管控体系,是如何构建的?| ArchSummit

大家,我是王海华,货拉拉基础架构负责人,我将从以下几方面展开分享。首先是背景与挑战;其次是大数据成本管理体系;接着是存储成本优化和计算成本优化技术细节;最后是总结与展望。...第一,数据采集有实时采集和定时离线采集,这里会存在采集任务的数据资产信息;第二,实时的数据存储和计算会涉及实时数仓、实时计算以及实时在线存储,最后可能会直接推送到线上服务使用,这里会涉及到像 HBase...这些冷数据可能是可以删除的,删除不了也不应该跟热数据占用一样的存储价格。例如云存储提供了数据归档能力是比较适合冷存储的。...货拉拉进行冷热分层的依据是云存储数据归档收益曲线,我们将最近 90 天被访问次数的数据进行分类,通过上图可以看到,最近 90 天被访问零次的归档收益为 50.87%,这类数据占比较高,存储归档收益相对较高...另外,冷数据也可以利用公有云的低频存储归档能力甚至是深度归档能力,实现更精细化的管理。 今天的分享就到这里,谢谢大家。

1K20

计算机系统结构变革在即?

FPGA的逻辑是通过向内部静态存储单元加载编程数据来实现的,存储存储器单元中的值决定了逻辑单元的逻辑功能以及各模块之间或模块与I/O间的联接方式,并最终决定了FPGA所能实现的功能,FPGA允许无限次的编程...人工智能的应用场景,包括云(数据中心)和端(智能设备)两部分;其中,云端又包括离线训和在线服务。离线训练是指利用海量数据,选择合适的训练方法,训练出一个模型。...当时Intel并没有提到他们合作用的FPGA芯片来自哪家公司,现在可以公布了,这家公司就是被Intel收购的Altera公司,如今变成子公司了,各种合作也更方便了。...前面说到这种处理器将采用芯片封装,Intel对这种封装其实也很熟悉了,还记得Intel推出的第一代Pentium D核处理器吗?...Intel当时为了尽快拿出产品,Presler架构的PD核并不是原生的,而是两个单核处理器封装在一个芯片内,被玩家戏称为胶水核,未来的处理器大体上也会是这种结构。

2.6K70

一个线上IM系统必要的组件

四、消息去重系统 这个系统会对网络上的消息包进行检测重复,这些重复可能是网络上tcp的一些不可靠因素或者重试发送带来的,检测重复的机制是保存历史的消息,同时为了减轻存储压力,一般会对这种存储做个有效期自然消亡...五、消息存储系统 消息服务端存储一个主要动机是对方可能是离线状态,或者是对方上线,但是可能拉取不成功,需要重复拉取。...所以这个消息存储有个队列,至少要等接收放完全拉取时,并回复ACK,才能从消息队列中删除消息。 对于不丢失高可靠的要求,消息存储可能还需要做写。...十、离线push系统 在线消息通过接入系统发给用户,但是离线消息只能通过push通道传输,比如说apns,gpm/fpm,华为小米OV魅族的第三方push通道。...十二、用户读消息偏移指针的记录模块 需要记录用户当前已读的seq,以便后面发送相应的未读消息给用户。

1.6K10

搜狐智能媒体基于腾讯云大数据 EMR 的降本增效之路

,需在数据迁移完后使用腾讯云提供的COS-Distcp工具进行校验; 5)文件时间问题,通过-pt 参数将云下 HDFS上文件时间属性一并迁移到对象存储中,后续可以根据文件时间属性进行归档操作。...3、Raw Log 迁移 将云下存储在 HDFS 中的 Raw Log 数据迁移到 COS 中,结合业务对数据的使用场景,一月前基本不使用的数据存储到深度归档中,一周前的 Raw Log 数据使用频次低...,采用低频存储借助 COS 的深度归档和低频功能进一步降低存储成本。.../月;而使用 OFS 的标准存储,成本约12.37万/月,还可以使用归档功能进一步降低成本,两者成本相差5倍以上。...1、降本方面: 1)开启 OFS 归档和深度归档,及开发配套的回热功能,降低持续增长的数据存储成本; 2)尝试 EMR 容器版,计算资源需求按照负载伸缩,实现完全弹性; 3)尝试使用托管的 PAAS/SAAS

37850

架构思考-业务快速增长时的容量问题

背景 之前做过一个项目,数据库存储采用的是mysql。当时面临着业务指数级的增长,存储容量不足。...采用的是数据库写的方式,采用异步确保性的补偿型事务,发送实时和延迟两个MQ,通过开关来控制以老数据为准还是新数据库为准。...拆分成实时和离线,将实时性要求不高的查询走ES。ES的数据可以通过同步binlog变更获得。 另外一个思路是将数据库按照历史数据来拆分。就是数据库里只保存一定时间内的实时数据。...超过指定时间则进行数据归档。将数据归档到HBase等,一般对于历史的查询实时性要求也不是很高。...过渡可以采用上面说的写方式,观察运行情况进行切换。切换过程中也可以不关闭流量。 麻烦的是数据归档。因为数据归档后删除数据库的数据,变更生效时,针对innodb来说,意味着数据结构重建,频繁IO。

65220

大数据实战【千亿级数仓】阶段一

最近开始上手一个大数据离线数仓项目。本篇博客先为大家进行一个总体的介绍,包括各个阶段的任务以及项目的简介,环境,需求等等… 码字不易,先赞后看 ! ?...2012年十一 ? 2019年十一 ? ? ? ? ?...千亿级数仓模仿阿里巴巴双十一的大屏显示功能实现的互联网电商指标的离线,同时也模仿了阿里巴巴大数据平台上面数据仓库的设计思想和理念。...每日交易额:700W 商家数:5W 商品数:45W PV:500W UV:50W 数据在hdfs中平均每天 40G左右的速度增长,存储...CPU资源:24核 内存:128G 硬盘:4T 两种解决方式: 1:增加磁盘,对磁盘扩容, 2:把之前的历史数据导出,hadoop归档技术

2K20

架构思考-业务快速增长时的容量问题

背景 之前做过一个项目,数据库存储采用的是mysql。当时面临着业务指数级的增长,存储容量不足。...采用的是数据库写的方式,采用异步确保性的补偿型事务,发送实时和延迟两个MQ,通过开关来控制以老数据为准还是新数据库为准。...拆分成实时和离线,将实时性要求不高的查询走ES。ES的数据可以通过同步binlog变更获得。 另外一个思路是将数据库按照历史数据来拆分。就是数据库里只保存一定时间内的实时数据。...超过指定时间则进行数据归档。将数据归档到HBase等,一般对于历史的查询实时性要求也不是很高。...过渡可以采用上面说的写方式,观察运行情况进行切换。切换过程中也可以不关闭流量。 麻烦的是数据归档。因为数据归档后删除数据库的数据,变更生效时,针对innodb来说,意味着数据结构重建,频繁IO。

79720

热卖云产品3折起

用户量级缓存服务 2G容量 适用于8000用户量级缓存服务 4G容量 适用于16000用户量级缓存服务 8G容量 适用于32000用户量级缓存服务 MongoDB 提供备份,恢复,监控,权限管理等产品功能 三副本存储...支持自定义告警 4G内存100G硬盘 适用于1万用户量级的数据规模 4G内存200G硬盘 适用于4万用户量级的数据规模 8G内存300G硬盘 适用于10万用户量级的数据规模 COS低至9.4元 COS标准存储包...具有高扩展性、低成本、可靠和安全等特点,为您提供专业的文件存储服务 适合UGC社交媒体存储场景 适合无需进行存储资源运维管理的中小创企业 支持用户海量存储,超大文件存储;特别适合大规模数据存储的场景...COS归档存储包 满足管控要求需要更长时间保存,低成本离线存储 归档属于离线存储,适用于低频率访问的场景,特别适合文件归档备份 成本极低,适用于海量数据的长期存储 更多云优惠信息请关注:云优惠

1.1K50

一切坚固的东西都将烟消云散,唯有数据不朽

事实上,在与华为围绕AR技术开发旅游产品之前,华为已经通过为敦煌研究院提供云、大数据、人工智能、数据存储、数据保护等先进的产品及解决方案,与敦煌研究院已经建立起长期、深入的合作关系。...华为公司副总裁、数据存储与机器视觉产品线总裁周跃峰博士在此次发布会中指出:“在数字经济时代,数据已经成为重要的生产资料。...;备份场景实现各类应用场景关键数据不丢失,可恢复到指定时间点,通过高效、经济、可靠的备份帮助企业积累“数据资产”,提升核心竞争力;归档场景实现海量业务数据长期归档留存。...其中,方案通过部署SAN/NAS一体化活以及全场景3DC组网,可以支撑结构化和非结构化的数据保护;由于业务灾备可平滑升级,满足7个9数据可靠性,该方案真正实现了全场景容灾。...围绕温归档需求,方案支持蓝光分级归档,实现温数据快速读取,冷数据离线保存,可满足50年超长留存的需求。

31420

如何正确选择多云架构?

亦或者企业有海量对象存储归档的需求,而另一家云在存储架构上有优势,如提供更具性价比的深度归档存储能力,或直接提供更具竞争力的价格。...基于这些存储,企业还可能在备份云上开一些衍生的离线的计算,用来进行二次加工等。 在主备架构下,上述优势的表现如下,使用 3 分制进行评定。...特定访问,1 分,企业逐步开始使用另一家云供应商差异化的对象存储服务,如更深度的归档能力、更丰富的图片处理能力等等。...为了确保有突发流量时第二家云可以稳定承接,所以常态下就要承接一定流量,保证服务是活的。当流量增加时,弹性云进行快速扩容,通过 DNS 或者网关将主云上无法承载的流量转移到弹性云上。...当然还有就是在线业务用一家云,离线业务用一家云等等。 这种模式下各维度的打分如下: 灾难备份、故障转移,0 分。两家云上的服务和存储加起来才是完整的,所以灾难恢复、故障转移都无法实现。

56430

生产力工具综合评测:轻量级笔记软件、Markdown 编辑器、云 Office、离线笔记、云笔记、开源笔记软件、大纲编辑器、协同办公笔记软件、知识库管理工具

在《那些强大、好用的离线笔记/云笔记软件综合评测》这篇文章中,我先分析了离线笔记和云笔记软件各自的优点和缺点,并且分享了常见的离线笔记软件,以及如何同时使用云笔记软件和云笔记软件。...对于中度需求,优先推荐使用 备忘录或者 Typora.那些强大、好用的离线笔记/云笔记软件综合评测云笔记 1.0离线笔记之外,有没有好用、强大、容易上手的云笔记?...印象笔记 Verse、Notion、FlowUs、Wolai在线协作产品哪家强?...Roam 之后,诞生了一批链笔记软件。...如果你对链笔记软件感兴趣,可以阅读下面这些文章:链笔记软件综合评测:Roam Research、 Obsidian、Logseq 、思源笔记 、Roam Edit 、RemNote、葫芦笔记、TiddlyWiki

4.4K20

存储知识:数据一致性、分级存储、分层存储与信息生命周期管理

HSM:Hierarchical Storage Management,分级存储管理。起源于1978年,首先使用于IBM的大型机系统。是一种将离线存储与在线存储融合起来的技术。...Tiered Storage:分层存储,指的是基于性能、业务连续性、安全、保护、数据保留、法规遵从以及成本的考虑,将数据分层存放,如主盘,备份盘,归档盘,磁带归档,光盘归档等。...这就为我们不同的应用追求最佳性价比提供了条件,因为这些不同的存储媒介可应用于不同的存储方式中。这不同的存储形式包括在线存储、近线存储离线存储。...2、离线存储     离线存储(NearStore),主要是用于对在线存储的数据进行备份,以防范可能发生的数据灾难,因此又称备份级的存储离线海量存储的典型产品就是磁带或磁带库,价格相对低廉。...离线存储介质上的数据在读写时是顺序进行的。当需要读取数据时,需要把带子卷到头,再进行定位。当需要对已写入的数据进行修改时,所有的数据都需要全部进行改写。因此,离线海量存储的访问是慢速度、低效率的。

2.5K30

大数据运维三十六计

第二个特点是分层 大数据平台实质上是提供大数据的PaaS服务,基于大数据平台会有很多的大数据应用,包括各类离线报表、机器学习、OLAP、实时分析等。...第十一计:大数据存储瓶颈除了容量,文件数也是一个大问题。 第十二计:离线作业要有基线关键路径产出时间预测系统,提前预警,否则没有足够时间重跑。...第十六计:实时计算重要业务要通过链路灾备保证业务稳定性。 第十七计:大规模计算平台至少要能容忍单机故障,否则别让它上线。...第三十一计:要储备计算换存储或者存储换计算应急方案,解决临时资源缺口。 第三十二计:规模大、压力大,要时刻关注硬件和网络发展,尽快拿到科技红利。...启发 从上面这个故事中我们可以学到三个注意点: 做变更时要评估变更的影响,例如保留时间从3天延长至5天,可能引起的存储增加要有定量评估,不能随意拍脑袋决定。

2.7K40

NAS 从入门到放弃

搭建家庭 NAS 服务器有什么方案? NAS(Network Attached Storage:网络附属存储)按字面简单说就是连接在网络上,具备资料存储功能的装置,因此也称为“网络存储器”。...朋友和家人便能在单一个存储中心找到所有的数字文件,使用不同的平台和设备存取,也包括最方便的移动设备。 免费的离线下载 搭建私有离线下载服务,添加任务至下载列表,自动全天下载。...在预算不紧张的前提下,RAID 1 是最适合盘位 NAS 的存储方案,不仅安全性有一定保证,升级大容量硬盘也很方便,每次替换一块硬盘后重建 RAID 就可以了。...另外,盘位 NAS 的硬盘在升级更多盘位的 NAS 时可以保留数据无缝沿用,因此对普通消费级用户来说盘位 NAS 可谓入门首选。...如今改变了对数据的想法,自然也就不再囤积数据,而是随用随取,根据不同的特性去加密、存储归档、同步数据。 拥抱互联网云时代,扔掉无用的硬盘吧!

12.3K10

干货 | 万字长文详解携程酒店订单缓存 & 存储系统升级实践

图1.1  存储系统架构图 二、应用场景 2.1  新单秒级各端同步 从订单的提交到各端可见的速度为存储服务的核心指标之一,我们对数据链的主要环节进行了优化,覆盖了新单同步、消息实时推送、查询索引构建以及数据平台离线归档等主要环节...BI等各类离线业务使用; 图2.1 数据链 2.2  自动发单与工作台 对客、商、员工工作台三端的支持是订单存储系统的基本角色,图2.1数据链在新单提交后为自动发单与工作台起到的衔接作用功不可没。...数仓衔接设计则侧重于解决数据平台百亿级离线数据与库在线期间的同步问题,以及解决全量接入MySQL期间产生的数据问题。 以下将分三个部分分享我们在这一过程中学到的经验。...DB,通过同步Job实时比对、修复和记录两侧DB差异,再通过离线T+1校验写中出现的最终不一致,如此往复直到写一致; 写一致之后,就开始逐步将读SQLServer切换到读MySQL,通过ES监控和...离线数据校验和预警:订单库迁移涉及到几百张表,离线数据比较多,一年的订单相关数据就有上百亿了,对于离线数据校验比较有挑战。

1.9K20

块编辑器和链笔记如何选择Notion vs Roam Research?FlowUs vs Obsidian

比如,在国内,FlowUs 对标 Notion,新增了文件夹页面、原生开发等特性,Logseq 则对标 Roam Research, 提供了 离线、加密、主题市场、插件市场等功能。...链笔记目前多数只支持简单的分享,葫芦笔记已经支持了初步的多人协作。。当然,从长远来看,多人在线协作也是链笔记发展的方向。...此外,链笔记和 Notion/FlowUs 代表了两种思维:《冰与火之歌》的作者马丁大爷说:“我认为存在两种作家:建筑师和园丁。建筑师提前计划一切。...链笔记软件学习资源关于链笔记的深度评测,见我的相关文章:链笔记软件综合评测:Roam Research、 Obsidian、Logseq 、思源笔记 、Roam Edit 、RemNote、葫芦笔记...印象笔记 Verse、Notion、FlowUs数字花园:在线协作产品哪家强?

4.6K50
领券