"鹅厂网事"由深圳市腾讯计算机系统有限公司技术工程事业群网络平台部运营,我们希望与业界各位志同道合的伙伴交流切磋最新的网络、服务器行业动态信息,同时分享腾讯在网络与服务器领域,规划、运营、研发、服务等层面的实战干货,期待与您的共同成长。 网络平台部以构建敏捷、弹性、低成本的业界领先海量互联网云计算服务平台,为支撑腾讯公司业务持续发展,为业务建立竞争优势、构建行业健康生态而持续贡献价值! 随着互联网的快速发展,网络化已经深入到人们的方方面面,随之而来的是各类涉密敏感数据几何倍的增长。而近年来信息安全事件频频发
前段时间整理了DSMM的一系列内容,已经介绍和分享了三个部分,分别为DSMM开篇的总结与交流、数据采集安全、数据传输安全。
哈佛商学院教授Clayton Christensen在《创新者的窘境》一书中认为,技术分为颠覆性和延续性,而颠覆性技术往往会改变整个行业的格局,因为它以一种全新的方式或为一个全新的群体解决了急迫的问题。
数据中心约超过一半的成本是电费,数据存储系统作为数据中心三大件之一,能耗也约占三分之一,面对非结构化数据量的快速增长挑战,以及国家对数据中心绿色节能要求的提高,分布式存储的绿色节能愈来愈加重要。
对于运维来说,数据读取、安全与存储,也是至关重要的一点,数据存储的技术点也是相当的多,面比较广,今天,民工哥来给各位小伙伴聊一聊有关于数据存储的“那些事儿”
本篇来自Stanfordcompression workshop2019论坛系列讲座,演讲者是来自斯坦福的Hanlee Ji。
据IDC发布的《数据时代2025》报告显示,全球每年产生的数据将从2018年的33ZB增长到2025年的175ZB,平均每天约产生491EB数据。随着数据量的不断增长,数据存储成本成为企业IT预算的重要组成部分。例如1PB数据存储一年,全部放在高性能存储介质和全部放在低成本存储介质两者成本差距在一个量级以上。由于关键业务需高性能访问,因此不能简单的把所有数据存放在低速设备,企业需根据数据的访问频度,使用不同种类的存储介质获得最小化成本和最大化效率。因此,把数据存储在不同层级,并能够自动在层级间迁移数据的分层存储技术成为企业海量数据存储的首选。
非易失存储器(Non-Volatile Memory,NVM)是一种能够在断电后保持存储数据的计算机存储器。
Dynamo风格数据库来源于亚马逊的Dynamo: Amazon’s Highly Available Key-value Store 论文,在该论文中论述了一种无主复制的数据库,受此启发,携程酒店开发了多存储介质预定库Hare和高可用性高性能的动态信息存储服务InfoKeeper。本文将介绍Dynamo风格的无主复制数据库,及其在携程酒店的实践。
数据库模式分为三个层次:外模式、概念模式和内模式。这三个层次分别对应不同的抽象级别,帮助数据库管理员和用户以不同的视角理解数据库结构。
前言 云计算已逐步进入了成熟和规模化应用的阶段,越来越多的用户将自己的业务和私密数据部署在云端。与此同时,国内外政府和监管机构对云服务的安全也提出了严格的规范和标准,如国内的《等保》《个人信息安全规范》,国际通用的《ISO27001》、《PCI》等。腾讯是如何捍卫数据中心物理安全的?前文《互联网业务安如磐石之根基——IDC物理安全》有说明。对于数据存储介质销毁的规划,鹅厂网事的《数据存储介质销毁:护航数据安全的最后一公里》也有说明,此不赘述。那传闻中神秘的“数据销毁工厂”、“IDC销毁中心”现场情况是怎样的
当我们进行集中数据备份和归档时,重复的数据块会导致存储费用快速上升,同时也会占用数据传输带宽,这时就需要去重技术(重复数据删除技术)。
Shopee ClickHouse 是一款基于开源数据库 ClickHouse 做二次开发、架构演进的高可用分布式分析型数据库。本文将主要介绍 Shopee ClickHouse 的冷热分离存储架构和支持公司业务的实践。
Web或者移动应用的重心,由后台往前台挪动的两个标志是:客户端存储,客户端模型维护。在可见的未来,我们将会见证后端将不存储数据、由前端负责存储数据的应用。 写过一个又一个的应用,我仍然没有遇到一个业务逻辑复杂的应用。即,我需要在前台处理一系列复杂的业务逻辑,我需要不断的转换前端的数据模型,才能追得上业务的变化。 普通的 Web 应用里, 前台只需要负责显示即可,而后台相对应的提供数据。后台每次都为前端提供相应的数据,处理后显示即可。多数时候,提交的数据也是一次提交,不需要经过复杂的转换。 而复杂的 Web
在Web应用程序中,缓存是一种常见的优化技术,它可以将频繁访问的数据或结果存储在内存或其他高速存储介质中,以便以后更快地访问。通过缓存,Web应用程序可以减少对数据库或其他慢速存储介质的访问,提高响应速度和性能。
1990年,EMC Symmetrix 4200问世,标志着高端存储时代正式开启。
将视频存进细胞中?听起来很像黑科技,但早在五年前就有团队成功在DNA中存储文字和图片。DNA记录以其存储密度大、保存时间长等优点,成为一项热门技术,但目前也存在合成成本高,且不能随时存取的缺点。 但此
术语“云存储”和“云计算”通常可以互换使用。也许有人会相信它们具有相同的含义,但这与事实相去甚远。尽管云计算和云存储有很多共同点,并且它们源自同一资源,但它们实际上是不同的概念。我们将在本文中研究这些概念之间的差异。
今天为大家介绍的是来自Stephen Mann, Chunhai Fan和Tom F. A. de Greef团队的一篇综述论文。DNA计算和DNA数据存储是新兴领域,它们为信息技术和诊断学解锁了新的可能性。这些方法利用DNA分子作为计算基质或存储介质,提供了纳米级的紧凑性,并能在非传统介质(包括水溶液、水包油微乳液和自组装的膜化隔室)中操作,这些都是超越传统基于硅的计算系统的应用。为了构建一个能够处理和存储分子信息的功能性DNA计算机,需要持续发展计算和数据存储的策略,并且桥接这两个领域之间的差距。
信息是人类认知外界的方式,最初的信息都会对应到现实世界的一个客体或者相关描述。人类是通过不断增加、完善信息来接触、认知并改变世界的。
ClickHouse 是一款开源的列存 OLAP(在线分析查询)型数据库,实现了向量化执行引擎,具有优秀的 AP 查询性能。Shopee ClickHouse 则是基于 ClickHouse 持续做二次迭代开发和产品架构演进的分析型数据库。
其本质是一个文件系统,数据库按照特定的格式将数据存储到文件中,使用者可以对数据库中的数据进行增加,修改,删除及查询操作。
服务器备份存储是一种关键的数据管理和恢复策略,以确保数据的安全性和可用性。以下是了解服务器备份存储的一般方式:
在Java开发中,持久化是一种将数据存储到持久存储介质(如磁盘)上,并能够在需要时重新加载数据的机制。持久化允许应用程序将数据持久保存,以便在应用程序重新启动或在其他场景下使用。本文将详细介绍Java中的持久化概念、持久化技术的种类和使用方法,并提供一些示例代码。
近几年,新兴存储架构逐渐布满了市场,给由传统SAN架构占据的市场带来了大量的烟火气。不妨列举一下名词:分布式存储,ServerSAN,云存储,对象存储,超融合,一体机。实际上,这堆名词里,除了对象存储描述的是前端访问协议之外,其它的基本上都是基于分布式存储构建的。
近日获悉,腾讯云对象存储COS正式通过Veeam备份软件标准化测试,携手为用户提供云上数据存储服务。
缓存的使用,是一个逐渐演进的过程。问一下你自己,最直接的使用缓存的原因是什么?无它,唯快而已!
最近,来自中科院、美国纽约州立大学石溪分校和德州大学奥斯汀分校的联合课题组,首次实现了基于蚕丝蛋白的高容量、可重写的生物存储技术。
本文档为数据存储与操作思维导图与知识点整理。共分为6个部分,由于页面显示原因,部分层级未能全部展开。结构如下图所示。
Hadoop分布式文件系统(HDFS)是Hadoop生态系统的重要组成部分之一,它是一个高度可靠、高度可扩展的分布式文件系统,专门为海量数据存储而设计。
在大规模数据采集和处理任务中,使用分布式架构可以提高效率和可扩展性。本文将介绍Python爬虫分布式架构中常用的消息队列工具Redis和RabbitMQ的工作流程,帮助你理解分布式爬虫的原理和应用。
随着计算力的不断提升和智能算法的快速演进,以及云计算、物联网和人工智能与传统产业更加密集的渗透,如今的世界正在加速进入一个全新的数据时代。
近日,在全球分布式云大会上,昆腾中国资深解决方案架构师赵丙涛深入地分析了企业数据存储的痛点,并给出解决之道。
科学是一种泛指的领域,包括数据科学、计算机科学、社会科学、经济科学、语言科学、生物科学等都是小、窄而深的认知领域,这些领域的科学有各自的体系、规范及认知特性。科学,不管是某个领域的科学,还是泛指的科学认知体系,都有最基本的要求——精确性和体系性。
Druid 是一个专为大型数据集上的高性能切片和 OLAP 分析而设计的数据存储系统。
现有的存储系统经过长期发展,种类及其繁多,架构也各不相同,按照从底层到上层的思路,大致可以分为:物理层、协议层、架构层、连接层四个层次。接下来我们由下往上详细分析。
二级存储旨在通过更经济、更安全的存储介质长期保留相对不关键和不活跃的数据,这些数据不需要像主存储中的数据那样频繁访问。
随着越来越多的信息进入云计算,未来我们将越来越依赖大规模的数据存储。 近日,英国曼彻斯特大学的研究团队在分子数据存储领域取得了重要进展,他们实现了将大量数据有效存储在单个分子中。 目前,数据的存储介质主要是磁盘,通常,我们使用10至20纳米尺寸的磁性颗粒来编码单位数据,其中磁性颗粒的两极分别表示1和0,而之所以可以利用磁性物质实现存储,是因为磁性颗粒存在磁滞现象。 磁滞现象,即当外加磁场施加于磁性物质时,其原子的偶极子按照外加场自行排列,即使当外加场被撤离,部分排列仍保持的现象。 一直以来,科学家在开发更小
近期,浪潮发布了采用英特尔双端口傲腾SSD的全闪存存储新品——AS5000G5-F,成为全球范围内较早采用傲腾双端口固态盘的存储厂商之一。这一创新看得出浪潮在存储新技术上的开放态度,与此同时,浪潮在全球市场表现在提醒着我们,这是一家TOP级存储厂商分内的事儿。
现有的存储系统经过长期发展,种类及其繁多,架构也各不相同,仅靠一文不可能讲得完全详尽。笔者试图在各个存储系统中,按照从底层到上层的思路,抽象出某些共性,也就是:物理层、协议层、架构层、连接层四个层次。这种层次划分不一定对所有存储系统通用,但可以帮助初学者对市面上主流的存储技术架构建立一个大体的认识,接下来我们由下往上详细分析。
“ Apache Flink的Table API提供了对数据注册为Table的方式, 实现把数据通过SQL的方式进行计算。Table API与SQL API实现了Apache Flink的批流统一的实现方式。Table API与SQL API的核心概念就是TableEnviroment。TableEnviroment对象提供方法注册数据源与数据表信息。那么数据源与数据表的信息则存储在CataLog中。所以,CataLog是TableEnviroment的重要组成部分。”
Laravel框架的缓存服务提供了多种缓存驱动程序,可以满足不同的需求。我们可以在config/cache.php配置文件中配置使用哪种缓存驱动程序。
数据量的增长其实一直是随着互联网的发展呈现爆发式增长的,因为各种各样的数据都在不断的被原样或者是经过少量的更改和增补后拷贝到互联网的各个角落。为了适应互联网数据的海量增长,在后端和架构意义上而言,数据库的发展也大致经历了「单库单表 -> 主从读写分离 -> 分表分库 -> NoSQL -> NewSQL」这样的过程。
这大约等同于12万张DVD存储量,放256GB的SD存储卡上,能装满2320张。该数字一举刷新了磁带存储密度的世界纪录,且相关研究已发表于《IEEE磁学汇刊》。
时光如白驹过隙,坐在时代的列车里,我们一路向前;近三十年来,无数事物在车窗前掠影而过,一度流行,又一度黯淡。磁带,就是一个时代的符号。彼时,磁带因其低廉、可靠及易用等特性,一度成为音乐最主流的载体,将流行音乐传遍大街小巷。后来,随着 CD 和 MP3走进大众视野,磁带逐步退出历史舞台。如今,磁带作为音乐载体早被时代淘汰.....但磁带作为存储载体,近几十年却从未过时:在冷数据场景,磁带存储凭借其极低的成本和极长的寿命,在企业存储市场始终占有一席之地。今天的故事就此展开,来聊聊腾讯的深度归档存储与磁带的那些事。欢迎阅读~
英特尔的战略非常清晰:同为新一代存储介质,Optane(傲腾)针对的是热数据,提供其所需要的存储性能;3D NAND(闪存)针对容量型数据存储市场,二者相得益彰。
最近几年存储介质得到了快速发展,单位存储介质的性能越来越高,原来 HDD 机械硬盘读写速度不足 100 IOPS,如今 NVMe SSD 可以达上百万 IOPS,时延从毫秒压缩到微秒,系统的性能瓶颈也由存储硬件本身逐渐转移到网络及处理器上,传统文件系统、调度器等方法无法充分发挥新存储介质的性能,成为存储系统的新瓶颈。尤其对于大型互联网后端系统,这些瓶颈不仅会对业务系统带来低效率,而且会影响到系统可靠性。
ASCII(American Standard Code for Information Interchange,美国信息互换标准代码)是一套基于拉丁字母的字符编码,共收录了 128 个字符,用一个字节就可以存储,它等同于国际标准 ISO/IEC 646。
在数据世界里,时间同样是恒定的。人们希望更快的数据流动和更智能的数据策略来提升数据利用价值。
领取专属 10元无门槛券
手把手带您无忧上云