首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

让 JuiceFS 帮你做好「异地备份」

大意是 Google 平台上一个区计算实例和存储盘存在单一数据中心风险,无法避免数据中心级别的灾难。提醒客户做好自己异地备份,以保证最佳数据安全。...存在 HDFS 数据计算很方便,但是在数据恢复就复杂了,要先把对应数据通过 HDFS CLI 拷贝到本地才行,这对运维工程师来说来说是个噩梦。...另外数据安全要依赖 RAID 方案,一旦 RAID 卡损坏,数据就有丢失风险。...缺点:存取都需要通过专用 SDK 或 API,没有真正目录结构,不支持改名。很多系统不支持直接存取对象存储,数据恢复需要先下载到本地,数据量很大时会耽误紧急数据恢复时间。...方案 3 中,无论使用公有 NFS 存储还是基于硬盘自建 NFS,因为协议不支持传输加密,跨公网直接挂载很不安全,需要再搭配 V** 或者其他网关来解决。

1.2K30

静默错误:为什么看了那么多灾难,还是过不好备份这一关?

事件回放 腾讯披露整个事件基本情况如下: 8月6日 消息:近日,腾讯用户“前沿数控”平台一块操作系统盘,因受所在物理硬盘固件版本Bug导致静默错误,文件系统元数据损坏。...在某些情况下,写入硬盘,应该写入一个位置数据实际上最终写入另一个位置。 因为某些故障,磁盘不会将此识别为错误,并将返回成功代码。...结果,RAID系统未检测到“错误写入”,因为它仅在硬盘发出错误信号才采取措施。 因此,不仅发生了未检测到错误,而且还存在数据丢失。...该文提供了一组数据: ...一项针对NetApp数据库中150万个硬盘驱动器学术研究在32个月内发现,8.5%SATA磁盘会产生静默损坏。...但是,Google 工程师经常喜欢深究问题,也引以为豪,于是他就继续在系统中查找可能存在问题,发现数据完整性损坏真正原因时,他却差点吓出心脏病:这段数据是被某个保护隐私目的数据删除流水线所删掉

1.1K40
您找到你想要的搜索结果了吗?
是的
没有找到

静默错误:为什么看了那么多灾难,还是过不好备份这一关?

事件回放 腾讯披露整个事件基本情况如下: 8月6日 消息:近日,腾讯用户“前沿数控”平台一块操作系统盘,因受所在物理硬盘固件版本Bug导致静默错误,文件系统元数据损坏。...这些错误很难检测和诊断,更糟糕是 它们实际上在没有扩展数据完整性检测功能系统中相当普遍。 在某些情况下,写入硬盘,应该写入一个位置数据实际上最终写入另一个位置。...因为某些故障,磁盘不会将此识别为错误,并将返回成功代码。 结果,RAID系统未检测到“错误写入”,因为它仅在硬盘发出错误信号才采取措施。 因此,不仅发生了未检测到错误,而且还存在数据丢失。...该文提供了一组数据: ...一项针对NetApp数据库中150万个硬盘驱动器学术研究在32个月内发现,8.5%SATA磁盘会产生静默损坏。...但是,Google 工程师经常喜欢深究问题,也引以为豪,于是他就继续在系统中查找可能存在问题,发现数据完整性损坏真正原因时,他却差点吓出心脏病:这段数据是被某个保护隐私目的数据删除流水线所删掉

1.9K10

YouTube 数据库如何保存巨量视频文件?

使用Zookeeper来管理集群,并使其保持最新状态。 5部署到云中 Vitess 是原生,很适合云中部署,因为就像模式一样,容量是逐步添加到数据库。...Google Cloud Platform 是一套计算服务,它基础设施与谷歌内部终端用户产品(如谷歌搜索和 YouTube)所用基础设施是相同。...每个大规模在线服务都有一个多样化(polyglot)持久性架构,因为某一种数据模型,无论是关系型还是 NoSQL,都无法处理服务所有使用场景。...在为本文展开研究中,我无法找到 YouTube 所使用具体谷歌数据库清单,但我非常肯定它会使用 GCP 特有产品,如 Google Cloud Spanner、Cloud SQL、Cloud...旋转硬盘驱动器是主要存储介质,因为其成本低,可靠性高。 SSD 固态硬盘比旋转磁盘具有更高性能,因为它们是基于半导体,但大规模使用固态硬盘并不划算。

1.6K40

YouTube 数据库如何保存巨量视频文件?

使用Zookeeper来管理集群,并使其保持最新状态。 5 部署到云中 Vitess 是原生,很适合云中部署,因为就像模式一样,容量是逐步添加到数据库。...Google Cloud Platform 是一套计算服务,它基础设施与谷歌内部终端用户产品(如谷歌搜索和 YouTube)所用基础设施是相同。...每个大规模在线服务都有一个多样化(polyglot)持久性架构,因为某一种数据模型,无论是关系型还是 NoSQL,都无法处理服务所有使用场景。...在为本文展开研究中,我无法找到 YouTube 所使用具体谷歌数据库清单,但我非常肯定它会使用 GCP 特有产品,如 Google Cloud Spanner、Cloud SQL、Cloud...旋转硬盘驱动器是主要存储介质,因为其成本低,可靠性高。 SSD 固态硬盘比旋转磁盘具有更高性能,因为它们是基于半导体,但大规模使用固态硬盘并不划算。

1.5K10

精通Java事务编程(1)-深入理解事务

写入过程中,通常涉及预写日志,以便在磁盘数据损坏可进行恢复。支持复制DB中,持久性意味着数据已成功复制到多个节点。为实现持久性保证,DB必须等到这些写入或复制完成后,才能报告事务成功提交。...完美的持久性是不存在:若所有硬盘和所有备份同时被(人为)销毁,那DB也无能为力。 复制与持久性 历史上,持久性最早意味着写入磁带存档,后来演变为写入磁盘、SSD。...硬盘固件和软件一样可能有 bug 存储引擎和文件系统之间微妙关系,可能包含难以追踪bug,并最终导致磁盘文件在系统崩溃后也损坏 磁盘数据可能会在没有检测到情况下逐渐损坏。...磁盘坏道率较低,但整盘失效概率更高 若SSD断电,可能会在几周内开始丢失数据,具体取决于温度 没有技术能提供绝对持久性保证。只有各种降低风险技术,包括写盘,复制到远程机器和备份。...1.2.3 处理错误和中止 事务一大关键特性,若出错,中止所有操作,之后安全重试。ACID DB基于此理念:若DB存在违反原子性、隔离性或持久性风险,则完全放弃事务,而非部分放弃。

92230

NAS 从入门到放弃

而且个人觉得 NAS,包括个人移动硬盘,注定是要被淘汰东西,未来是计算存储时代。当然,还是会有一小部分人会有实体机、私有需求。显然,目前我不属于那一部分人。...JBOD (Just a Bunch of Disks)是把多块硬盘容量合并成一个整体来使用磁盘组合方式,和 RAID 0 不同是数据按顺序存储在多块硬盘上,一块硬盘损坏不会影响到其他盘——但如果存储分区表第一块硬盘损坏则所有硬盘数据都无法挽回...JBOD 和 RAID 0 显然严重不推荐,而在动辄单盘 3TB、4TB 现在,RAID 5 因为重建风险也已经不再推荐使用,需要一块大盘的话 RAID 6 或者更简单 RAID 10 是相对合适选择...但NAS整合”备份+分享”功能正正就是NAS最大安全隐患,大部分人只看到了其便利之处,而忽视了其可能存在数据泄漏风险。 如果你单纯用磁盘做备份,每天1小备份时间差不多了吧?...个人硬盘有硬件损坏风险,需要多盘位冗余存储; 个人硬盘有丢失被盗风险,还需要异地冗余存储; 个人硬盘想要方便随机存取,就得有网络访问功能,自然也就有被黑数据风险,还需要可靠加密存储; 既然如此,为什么不直接加密隐私数据

12.2K10

面向容器技术资源调度关键技术对比

讨论Kubernetes时候,自然想到Mesos冲击力,并随着Docker容器技术兴起、计算发展,人们开始忘记Omega,似乎只有Mesos和Kubernetes,以及共同祖先Borg。...3.1 分配抢占 分配抢占,例如在不同优先级别任务共同部署在一个集群时候,出现更高优先级任务实例需要资源时候,空闲资源又不足以应付,此时,低优先级任务实例将被Kill,释放资源。...分配抢占往往是约定规则下执行。为了最小化应用之间影响,抢占尽量不集中在一个点或者一个应用或者一个业务层面,风险分散式折中。...在线Service内存、磁盘空间大小往往不是瓶颈,磁盘IO、网络带宽使用,可以进行软降级。 对于被系统中断等使用CPU核,尽量不要使用这些计算资源服务应用。毕竟和系统中断抢资源,非常不明智。...从这些历史数据中,多维度对应用、应用实例层面分别给出面向不同时间片大小预测值,其实是非常具有挑战事情。

1.8K70

企业云端数据可能面临这些安全威胁

数据与别的人,组织或企业共享,不要在它未加密发送是很重要,因为某个恶意攻击者可以在它传送过程中读取并修改它。...文件同步:同步常常用来备份在硬盘文件,预防硬盘损坏或如果用户想要在任何有网络连接地方访问文件。...最常用同步服务包括Google Drive,Dropbox,SugarSync和Amazon 盘。取决于你所使用服务,同步到云端文件在存储不见得是加密。...保护在线和离线数据存储 存储到各种设备和在服务中使用时,数据必须要适当加密,而存储在云端,就更需要这样做,因为这些数据可以在任何地方访问。...SQL数据库:对于云端数据库安全存储,组织可以使用ClearDB、ZeroDB之类产品。 手机:安卓手机在出厂已经支持磁盘加密了,可以在设置中启用。

1.5K110

【GPU陷入价格战】谷歌抢占GPU降价40%,P100每小时不到3块钱

今年早些时候,谷歌平台宣布,可以将你GPU连接到谷歌计引擎(Google Compute Engine)和Google Kubernetes Engine上抢占虚拟机(Preemptible...连接到抢占虚拟机GPU跟按需GPU基本相同,但有两点重要不同:因为是抢占计算引擎可能会停止服务,停止服务前30秒会提前给你发送警告;你最多可以使用它们24小。...任何连接到抢占虚拟机实例GPU都将被视为是抢占,并将以较低价格进行计费。 现在,谷歌平台提供3种GPU,可以根据你需要选择使用。...如何使用云端抢占GPU 结合自定义机器类型,具有抢占GPU抢占式虚拟机,让你可以根据自己需要资源构建计算堆栈,而不再需要其他资源。...谷歌Kubernetes引擎和计算引擎受管实例组(managed instance groups)让你能为大型计算作业创建动态扩展带GPU抢占虚拟机群集。

2.1K30

AOF文件同步频率对Redis性能影响和数据丢失情况

低同步频率:数据写入不会立即同步到硬盘,而是在一段时间内进行批量同步。虽然性能会有所提高,但存在数据丢失风险,因为在同步之前Redis发生了故障,会丢失最近一段时间内数据。...例如,Redis在执行AOF重写过程中,如果发生严重错误(如磁盘空间不足),可能会导致AOF文件损坏或者丢失一部分数据。...数据丢失发生,Redis会根据AOF文件完整性和数据先到先得原则来处理:如果AOF文件中数据丢失不严重,即AOF文件完整性没有受到破坏,Redis会尽可能多地恢复数据。...Redis会尝试修复AOF文件,剔除损坏命令,然后加载剩余命令来恢复数据。但是,丢失数据是无法恢复。如果AOF文件完全丢失,Redis会尝试使用快照(RDB文件)进行数据恢复。...Redis会检查是否存在RDB文件,并且文件是否是最近一次创建。如果满足条件,Redis会加载RDB文件来恢复数据。然后,Redis会重新执行AOF文件中命令来保证数据一致性。

34861

给你几个硬盘,你能提供什么样高可靠性存储解决方案?

“给你几个硬盘,你能提供什么样高可靠性存储解决方案?” 我们这些计算领域工程师在面试,常被问题这个问题。 这是一个很有意思问题,十个人有十个答案。...) = 162.2 IOPS 至于各类RAID配置容量、读、写IO计算Google一下有很有资料,我就不阐述了。...另外,在计算最终用户最大可用容量,我们还需要考虑减去如下三类开销: (1)、文件系统本身metadata开销。 (2)、文件系统性能销。...例如,某些文件系统中磁盘容量利用率超过一定比率(比如,95%),则I/O性能将快速下降。 (3)、预留给文件系统快照数据空间。...(4)、数据损坏,包括触发Split Brain并观察是否存在数据损坏问题并找出数据服务恢复解决方案,触发RAID损坏并观察是否存在数据损坏问题并找出数据服务恢复方案。

57420

原生下离在线混部实践系列】深入浅出 Google Borg

作者徐蓓,腾讯专家工程师,长期从事计算 IaaS、PaaS 架构和研发工作,现负责腾讯 TKE 资源调度、离在线混部、大数据云原生化等领域。...Alloc set 类似 Job,是一堆 Alloc 集合。一个 Alloc set 被创建,一个或多个 Job 就可以运行在上面了。...资源紧张,集群会优先 Preempt Batch Job,将资源提供给 Routine Job 使用。这时 Preempted Batch Job 会回到调度队列等待重新调度。...Job 在提交需要指定 resource limit,它能确保内部 Task 有足够资源可以运行。 有些用户会为 Task 申请过大资源,以应对可能请求或计算突增。...不可压缩资源,包括内存、磁盘空间等,在资源紧张,任务会被按照优先级从低到高杀死,直到紧张情况缓解。 在内核层面,Google Borg 同样有策略保证资源隔离与复用。

1.7K21

【可用性设计】 GCP 面向规模和高可用性设计

故障域是可以独立发生故障资源池,例如 VM 实例、专区或区域。您跨故障域进行复制,您可以获得比单个实例更高聚合级别的可用性。有关更多信息,请参阅区域和可用区。...在区域出现故障使用跨区域数据复制和自动故障转移。一些 Google Cloud 服务具有多区域变体,例如 BigQuery 和 Cloud Spanner。...为了应对区域故障,请尽可能在您设计中使用这些多区域服务。有关区域和服务可用性更多信息,请参阅 Google Cloud 位置。 确保不存在跨区域依赖关系,以便区域级故障影响范围仅限于该区域。...这些问题可能是软件错误、错误输入或配置、计划外实例中断或人为错误。您服务流程有助于确定您是否应该过度宽容或过于简单化,而不是过度限制。...但是,控制对用户数据访问权限服务器组件最好关闭失败并阻止所有访问。配置损坏,此行为会导致服务中断,但可以避免在打开失败泄露机密用户数据风险

1.2K20

和无序说再见

时至今日,“”已经开始变得像自来水一样慢慢走进了大众生活,诸如电子邮件、电子日历、文件备份、资料共享、盘之类服务都属于计算范畴。...这意味着你可以在任何一台联网计算机或者其他设备(比如装有浏览器手机、PAD)上访问和使用自己信息。...你信息存放在一个地方而你可以通过很多种方式获取它,这样的话,即便你电脑磁盘损坏或者手机中毒导致文件不可用,你也不用担心自己数据会丢失。 只要能联网,你就可以使用绝大多数服务。...在这些海量服务中,我个人比较喜欢Google免费Gmail、Google Drive(有15G空间)、Google Doc、Google Photo(可以上传无限张压缩无损照片)。...(这也会减少磁盘空间浪费你只需要128GMac和16Giphone就行了甚至移动存储设备都可以被抛弃另外也可以把森林砍伐风险降到最小) 欢迎关注我

31120

数据中心年年升级,废弃“垃圾”让谷歌头大

SSD硬盘就算被物理销毁,数据仍然可以被找到 如果企业决定采用物理销毁磁盘,那么SSD硬盘销毁则会造成更多麻烦。...虽然像Microsoft Azure和谷歌这样超大规模计算供应商使用碎纸机处理驱动器(谷歌使用机器人自动化销毁),但这在传统企业数据中心中很少见,费用也相当昂贵。...另外,有一些担心安全性企业试图使用具有强磁性消磁器来擦除数据,而并不是物理损坏硬盘驱动器,但当今硬盘外壳将会阻挡磁性,SSD硬盘数据并不会受到消磁器影响。...但是只有在70%到80%情况下,旧硬盘驱动器可以被删除到一个审核水平,这意味着部分数据仍然可以通过正确工具从中恢复。...报告指出,尽管当前计算技术可以提高设备使用效率,比如一台设备就可以提供比以往更多服务,但计算需求不断增加意味着人们需要更多数据中心,由此也产生更多电子垃圾。

49110

如何提升计算数据保护状态

在存储受保护数据集,这些供应商通常以专有格式存储数据,这会降低访问性和重用性。为了提高云计算数据保护状态,计算供应商需要专注于为工作负载恢复和其他用例重用性提供即时访问。...对象存储问题 对象存储是一种非常经济有效存储数据方法。它具有内置扩展和持久性功能,使其成为长期数据保留理想选择。然而,对象存储通常不适合作为生产应用程序存储。...Actifio 10c还解决了将数据从计算对象存储移动到基于云块存储基础设施问题。它通过在对象存储和基于块存储之间启动SSD硬盘缓存来实现。...Actifio编排工具还将自动实例化更多SKY设备,以确保快速执行大规模恢复工作。 组织还可以使用灾难恢复编排进行迁移。该功能可以在测试期间连续为沙箱播种,然后在准备就绪执行最终切换。...客户可以利用Actifio 10c不仅将工作负载迁移到平台,还可以在工作负载存在对其进行保护。

91910

COS CFS CBS产品对比

文件存储(Cloud File Storage,CFS)提供了扩展共享文件存储服务,与腾讯 CVM 、容器、批量计算等服务搭配使用。...硬盘(Cloud Block Storage,CBS)是一种高可用、高可靠、低成本、定制化块存储设备,可以作为服务器独立扩展硬盘使用,为服务器实例提供高效可靠 存储设备。...硬盘提供数据块级别的持久性存储,通常用作需要频繁更新、细粒度更新数据(如文件系统、数据库等)主存储设备,具有高可用、高可靠和高性能特点。...业务爆发、用户产生内容(UGC)突增,对象存储将根据请求和流量需求自动扩展,从容应对业务突发访问状况。...数据库:业务核心数据库需要支持应用高峰期密集访问,要求磁盘具有持续稳定高性能和低延,腾讯增强型 SSD 硬盘采用新一代自研存储引擎搭配 NVMe 标准 SSD,实现了基于全 SSD 存储介质和分布式架构

6.3K184

RAID磁盘阵列原理分析总结

SNIA 对 RAID 定义 一种磁盘阵列,部分物理存储空间用来记录保存在剩余空间上用户数据冗余信息。其中某一个磁盘或访问路径发生故障,冗余信息可用来重建用户数据。...数据条带具有更高并发粒度,访问数据,可以同时对位于不同磁盘上数据进行读写操作, 从而获得非常可观 I/O 性能提升。...,这N+1个硬盘其中一个硬盘出现故障,从其它N个硬盘数据也可以恢复原始数据,这样仅使用这N个硬盘也可以带伤继续工作(如采集和回放素材),更换一个新硬盘后,系统可以重新恢复完整校验容错信息...数据块和对应校验信息存保存在不同磁盘上,一个数据盘损坏,系统可以根据同一条带其他数据块和对应校验数据来重建损坏数据,与其他 RAID 等级一样,重建数据 RAID5 性能会受到较大影响...,因而系统性能随硬盘IO带宽增加得以有效提升; 自愈合:出现硬盘预警,无需热备盘,无需立即更换故障盘,系统快速重构,实现自愈合。

2.3K20

圆周率计算到小数点后 31.4 万亿位

Iwao 表示,这次记录是利用计算完成,这也是第一次使用打破吉尼斯世界纪录,证明了谷歌基础设施能够可靠地完成长时间、高计算任务。...此外,随着计算进行,在潜在硬件中断或故障中生存下来会变得越来越困难。 我们决定使用计算 π。使用 Compute Engine,谷歌高性能基础设施,比使用专用物理机器有许多好处。...在计算出现之前,分发如此大数据集唯一可行方法是运送物理硬盘。 此外,在环境中运行还有很多好处:可以选择多种硬件,包括支持 AVX-512 最新英特尔 Skylake 处理器。...你可以根据需要对实例进行放大或缩小,并在使用实例后将其删除,只需要为使用实例付费即可。...方便你在自己工作中使用这些数字,我们将计算 π 数字作为快照在谷歌平台上提供。每个快照都包含一个带有十进制数字文本文件,你可以根据这些图像创建一个新永久磁盘

2.4K20
领券