产品介绍

最近更新时间:2019-05-08 14:26:15

归档存储简介

归档存储(Cloud Archive Storage,CAS)是面向企业和个人开发者提供的高可靠、低成本的云端离线存储服务。您可以将任意数量和任何形式的非结构化数据放入 CAS,实现数据的容灾和备份。归档存储采用分布式云端存储,您可以在任何有网络的地方通过 RESTful API 对数据进行管理。

归档存储主要是针对海量、重要且访问频率极低的非结构化数据进行长期的归档保存和备份管理。在数据安全层面,归档存储提供数据锁定机制,防止数据被修改和删除,保障数据安全。用户可以以低廉的存储费用,享受存放海量数据,极大降低存储成本。

技术架构

图片描述

性能指标

腾讯云归档存储拥有高 QPS、大带宽和数据取回三个性能指标。

QPS(每秒请求数)

每个用户在每个地域默认800。如用户在北京和上海地域使用归档存储,分别有800QPS的频控配额。当用户有较高的 QPS 要求时,可以通过工单或客服联系腾讯云存储进行扩展。

大带宽

为了服务广大用户,腾讯云归档存储每个地域准备了较大的带宽,用户可复用这些公共带宽。一般情况下,腾讯云归档存储提供的带宽是大于单个用户的带宽的,当用户带宽上有特殊需求时,可以通过 提交工单 报备,我们会进行特殊支持。

数据取回

数据取回分为三档,其中加急取回的对象需要小于256MB,当大于256MB时,需要使用标准取回或批量取回方式。
加急取回一般在1 - 5分钟内可以完成;标准取回一般在3 - 5小时完成;批量取回一般在5 - 12小时完成。

与对象存储的差异

归档存储 CAS 是一项离线存储服务,不同于在线的对象存储 COS,在使用过程中差异点如下:

差异一:不保存文件索引

差异描述

对象存储 COS 是一项在线存储服务,主要由两个部分组成:文件数据和文件索引(包括文件元信息)。用户可以凭借一串指定的资源地址(即 URI )来访问数据,用户也可实时获取所有的资源地址(即 URI )。

作为离线存储的 CAS,为了降低成本,去掉了文件索引的部分,转而用档案 ID,档案 ID 中记录了该文件的归属者、存储地址等信息,但是该 ID 对使用者不可解读,只有 CAS 系统可以识别和解译其中的信息。

  • 档案 ID 使用方式一

    • 用户上传档案时,系统返回档案 ID,用户记录档案 ID。
    • 用户凭借记录的档案 ID 来发起数据取回任务。
  • 档案 ID 使用方式二

    • 用户上传档案时,系统返回档案 ID,但是用户没有记录档案 ID。
    • 用户发起『检索档案列表』的数据取回任务。
    • 任务返回一张表或者 JSON 字符串,其中每条记录档案 ID,该档案的备注,上传时间等其他信息,该过程约耗时3 - 5小时。
    • 用户使用档案 ID 来发起档案取回类型的任务。

使用效果

  • 节约成本:由于不保存文件索引,因而归档存储的价格要远低于对象存储。
  • 无法实时获取目前文件库下所有的档案列表,需要发起『检索档案列表』的数据取回任务,该任务约耗时3 - 5小时。
  • 无法使用 URI 直接获取文件,需要记录档案 ID,通过档案 ID 发起数据取回请求。
  • 无法实时获取目前文件库下档案个数和总大小,该数据每日更新一次。

差异二:数据取回需要时间等待

差异描述

归档存储是一项离线存储服务,存储集群在归档存储内部分为『临时缓存集群』和『持久化冷数据集群』。数据上传时,先进入『临时缓存集群』,后沉降至『持久化冷数据集群』。数据取回时,先从『持久化冷数据集群』进入『临时缓存集群』,后返回给用户。

保存在『持久化冷数据集群』的数据会做磁盘休眠,同时在『持久化冷数据集群』和『临时缓存集群』之间存在数据调度,因而数据取回的时候存在等待时间用以唤醒磁盘和调度数据。

使用效果

  • 节约成本:由于磁盘休眠,节约机房电力成本,因而归档存储的价格要远低于对象存储。
  • 用户需要发起一个任务请求,一段时间之后,再发起 Get Job Output 的请求获取缓存池中的数据,此处的缓存池即『临时缓存集群』的外部表现。缓存池中的数据保留24小时。
  • 用户发起一个档案取回或者档案导入 COS 的任务,存在三种模式,三个模式时间不同,收费不同。返回时间越短,在系统调度数据中优先级更高,价格越昂贵。