对象存储select_select存储_对象存储对象存储 - 腾讯云开发者社区

对象存储不是什么新技术了，但是从来都没有被替代掉。为什么？在这个大数据发展迅速地时代，数据已经不单单是简单的文本数据了，每天有大量的图片，视频数据产生，在短视频火爆的今天，这个数量还在增加。有数据表明，当今世界产生的数据，有80%是非关系型的。那么，对于图片，视频等数据的分析可以说是大数据与人工智能的未来发展方向之一。

对象存储COS成本优化方案

随着上云企业越来越多，企业对用云成本问题也越发重视。业务的发展会产生海量存储需求，在云端存储数据时，如何进行成本优化，减轻业务负担呢？

您找到你想要的搜索结果了吗？

是的

没有找到

GooseFS透明加速能力，助力加速 CosN 访问 COS 的性能

TiDB 7.5.0 LTS 高性能数据批处理方案

过去，TiDB 由于不支持存储过程、大事务的使用也存在一些限制，使得在 TiDB 上进行一些复杂的数据批量处理变得比较复杂。

联想凌拓“开门红”，揭示中国用户最大“痛点”

马云说过：企业价值大小决定于解决“痛点”的能力，解决的问题越重要，企业的价值越大。不要去争当“首富”，而是要争当“首负”，必须对用户、对社会负责。一句话，企业的业绩营收和解决用户问题的能力相辅相成。

读书笔记-APUE第三版-(8)进程控制

看来有的人还是对schema的真正含义不太理解，如今我再次整理了一下，希望对大家有所帮助。

基于对象存储数仓 Databend vs Clickhouse 性能对比 | 猜猜谁能赢

导读：全文阅读需要将近 30 分钟，关心结果的可以直接跳到尾部，内含压测办法及脚本。

如何使用开源 Byzer 和 JuiceFS 做实时Nginx日志分析

运维领域常见的方案是使用 ELK 全家桶，通过 Logstash 收集，直接写入 ElasticSearch, 配合web插件 Kibana 完成交互分析部分。

分布式文件系统MinIO

我们的系统离不开文件存储系统，因为系统会存储各种文件，所以选择一个好的文件存储系统是十分有必要的，我们选择文件系统一般需要看其使用是否简单，是否可靠，对各种环境是否适配，社区是否活跃，分布式等，随着云的普及，现在很多云厂商提供了文件存储服务，我们成为OSS，我们的文件由云厂商进行托管，我们只需要按时按量付费，这就是SAAS模式，使用OSS，那么自然得付费，加上文件是存储在别人家，对于很多行业来说，文件得存储在自己的网络，所以OSS自然不行，所以我们得搭建自己的文件服务器，常见的分布式文件服务器有HDFS，FastDFS等，不过对于HDFS，FastDFS，他们的学习成本有点高，加上随着云原生的普及，可能就不太适合我们现在使用，所以我们就说到了MinIO。

Hive3连接RDBMS和使用函数

使用JdbcStorageHandler，可以将Hive连接到MySQL，PostgreSQL，Oracle，DB2或Derby数据源。然后，您可以创建一个表示数据的外部表，并查询该表。

EMR数据导入Snova云数仓

在数据仓库的建设中，通常我们使用Hive处理原始数据（PB级别），进行耗时较长的ETL工作，再将结果数据（TB级别）交由准实时的计算引擎（如Snova）对接BI工具，保证报表的准实时展现。

Snova基础篇（一）：生产环境搭建及运行测试数据

本节主要从snova基础环境构建入手，为snova用户提供直观操作感受。目录：腾讯云平台snova集群创建控制台使用指南 snova数据库访问方式内表-外表创建，cos对象存储数据交互 ---- 基本概念：名词释义集群集群是Snova 的基本使用单位，一个集群通常由 2 个 master 节点和多个计算节点组成。每个用户根据业务需求可在多地建立多个集群。计算节点集群的基本存储和计算单元，每个集群计算节点个数不少于 2 个，随着计算节点增加，可线性提升集群容量和性能。节点规格计算节点

使用 Velero 备份还原 Kubernetes 集群资源

作者：仇明，中国移动云能力中心软件研发工程师，专注于云原生、微服务、算力网络等领域。简介 Velero前身是Heptio Ark ，是由GO语言编写的一款用于灾难恢复和迁移工具，可以安全地备份、恢复和迁移Kubernetes集群资源和持久卷。 Velero主要提供以下能力 • 备份Kubernetes 集群资源，并在资源丢失情况下进行还原 • 将集群资源迁移到其他集群 • 将生产集群复制到开发和测试集群 Velero 主要组件 • Velero 组件主要包括服务器端和客户端两部分 • 服务端：运行在你Ku

大型分布式存储方案MinIO介绍，看完你就懂了！

官方解释：MinIO 是一个基于Apache License v2.0开源协议的对象存储服务。它兼容亚马逊S3云存储服务接口，非常适合于存储大容量非结构化的数据，例如图片、视频、日志文件、备份数据和容器/虚拟机镜像等，而一个对象文件可以是任意大小，从几kb到最大5T不等。

图片处理及上传命令行工具 —— PICTL

自从博客从 WordPress 转到静态博客（先 Hexo 后 Jekyll）之后，文章的图片处理、图片上传就成了一个不大顺畅的事情。最先是使用了 vgy.me 提供的免费图床，支持直接从剪切板上传，操作上相对比较简单，也不需要任何本地存储。不过后来 vgy.me 进行了升级改版，原先的剪切板上传功能也不再支持了，偶尔还出现图片像素被降低、丢失的问题。同时，考虑到 WebP 格式可能会适合博客使用，而 vgy.me 还不支持该格式。于是开始切换到 “对象存储 + CDN” 的方案。本地准备好的 PNG 格式图片，先通过 cwebp 命令行转成 WebP 格式图片，再通过 uPic 工具修改文件名后上传到对象存储。由于此前采用的是腾讯云的 COS 对象存储和 CDN，经常面临着 SSL 证书更新等琐碎的事情。这样一来，整体的效率实际上并不高，只能说勉强接受。

oracle之表空间(tablespace)、方案(schema)、段(segment)、区(extent)、块(block)

数据文件和日志文件是数据库中最关键的文件。它们是数据存储的地方。每一个数据库至少有一个与之相关的数据文件，通常情况下不仅仅一个，有非常多。数据在数据文件里是怎样组织的？要了解这些内容我们首先必须理解什么是表空间（tablespace）、段（segment）、区（extent）、块（block），这些都是oracle数据库在数据文件里组织数据的基本单元。如今我们来理解这些概念。块是数据存储的物理单位，也是数据文件里最基础的单位，数据直接存储在块上。是oracle空间分配的最小单位。oracle中的块大小常见的有三种，2KB、4KB、8KB。块的大小在数据库创建时就已经固定下来，数据库中每一个块的大小都是同样的，并且全部的块都有同样的格式，由“块头＋表文件夹＋行文件夹＋空暇空间＋数据空间”组成。块头包括着块类型（比方是表块、还是索引块）的信息、磁盘上块的位置等信息。表文件夹（table directory），假设有的话，包括着此块中存储各行的表的信息（假设一个块中存有多个表中的数据）。行文件夹（row directory）包括着数据行的描写叙述信息，它是一个指针数组，指示了每一行在数据块中的物理位置。块头、表文件夹、行文件夹统称为块开销（block overhead），是oracle原来统计、管理块本身的。剩下的两部分非常easy，已经存有数据的就是数据空间，临时没存的就是空暇空间。区又叫盘区，是数据文件里一个连续的分配空间，它比块要大，由块组成。有些对象分配空间时可能至少须要两个盘区，比方回滚段，而这两个盘区不一定要求相连。区的大小从一个块到2GB不等段是oracle数据库中的分配单位，对象如表、索引等都是以段为单位进行分配。当创建一个表时将创建一个表段，创建一个索引时就创建一个索引段。每个消耗存储空间的对象终于被存储到一个单一的段中。有回滚段、暂时段、聚簇段、索引段等。表空间是一个逻辑容器，它和数据文件关联起来，一个表空间至少有一个数据文件与之关联。一个表空间能够有多个段，一个段仅仅能属于一个表空间。方案（schema）又叫模式，是比表空间小一级的逻辑概念，它也是一个逻辑容器。多个用户可能共用一个表空间，那怎样区分开每个用户？那么在表空间中对每个用户都有一个相应的方案，用于保存单个用户的信息。 oracle中存储的层次结构总结例如以下：一、数据库由一个或多个表空间组成二、表空间由一个或多个数据文件组成，一个表空间包括多个段三、段由一个或多个区组成四、区是数据文件里一个连续的分配空间，由一个或多个块组成五、块是数据库中最小、最主要的单位，是数据库使用的最小的I/O单元六、每一个用户都有一个相应的方案

架构师的AI/ML数据湖参考架构指南

在企业人工智能中，有两种主要类型的模型：判别式和生成式。判别式模型用于对数据进行分类或预测，而生成式模型用于创建新数据。尽管生成式 AI 近来占据新闻头条，但企业仍在追求这两种类型的 AI。

GenAI技术栈架构指南—10 个工具

我之前写过关于现代数据湖参考架构，解决了每个企业面临的挑战 — 更多数据、老化的 Hadoop 工具（特别是 HDFS）以及对 RESTful API（S3）和性能的更大需求 — 但我想填补一些空白。

Docker搭建MinIO对象存储【简单易学、功能强大】

MinIO 是一款高性能、分布式的对象存储系统. 它是一款软件产品, 可以100%的运行在标准硬件。即X86等低成本机器也能够很好的运行MinIO。

装在笔记本里的私有云环境：网络存储篇（上）

本篇是系列中的第三篇内容，我们继续聊聊如何把一个简化过的私有云环境部署在笔记本里，以满足低成本、低功耗、低延时的实验环境。

php sql filestream,FileStream应用

FileStream:文件流,为了解决大对象BLOB(Binary Large Objects)的存储问题.对于大对象存储,并且不受2GB的限制. 以往有两种方式: (1)存储在数据库里面,这种方式一般使用image字段,或者varbinary(max)来做,好处是可以统一备份,但实际效率较低; (2)存储在文件系

【存储服务】基于MinIO和Thumbor搭建图像服务

nohup ./minio server /home/minio > /home/minio/minio.log 2>&1 &

JuiceFS 新手必知 24 问

JuiceFS 是一个创新性的软件产品，很多初次尝试的小伙伴对产品和用法感到很多疑惑，所以为了帮助大家快速理解并上手 JuiceFS，我们整理了24个关于 JuiceFS 经典的问题答案，相信经过这 24 问，大家对 JuiceFS 会有更清晰的认识，使用上也会更加得心应手。

嫌 OSS 查询太慢？看我们如何将速度提升 10 倍

HDFS 是 Hadoop 生态的默认存储系统，很多数据分析和管理工具都是基于它的 API 设计和实现的。但 HDFS 是为传统机房设计的，在云上维护 HDFS 一点也不轻松，需要投入不少人力进行监控、调优、扩容、故障恢复等一系列事情，而且还费用高昂，成本可能是对象存储是十倍以上。

探索未来：对象存储的演进与应用

在当今数字化时代，数据量不断增长，对于存储系统提出了更高的要求。传统的存储方式已经难以满足大规模数据的存储和管理需求，因此，对象存储（Object Storage）应运而生。对象存储是一种面向海量数据的存储架构，以其高扩展性、弹性存储、高性能和简单管理等特点，成为了云计算、大数据分析和企业数据管理中的重要组成部分。

对象存储入门

10.5.3 对象接口对象存储系统（Object-BasedStorage System）是综合了NAS和SAN的优点，同时具有SAN的高速直接访问和NAS的数据共享等优势，提供了高可用性、跨平台性及安全性的数据共享的存储体系结构。 Object是对象存储的基本单元。每个Object都是数据和数据属性集的综合体。数据属性可以根据应用的需求进行设置，包括数据分布、服务质量等。在传统的存储中，块设备要记录每个存储数据块在设备上的位置。Object维护自己的属性，从而简化了存储系统的管理任务，增加了灵活性。O

基于Apache Hudi + MinIO 构建流式数据湖

Apache Hudi 是一个流式数据湖平台，将核心仓库和数据库功能直接引入数据湖。Hudi 不满足于将自己称为 Delta 或 Apache Iceberg 之类的开放文件格式，它提供表、事务、更新/删除、高级索引、流式摄取服务、数据聚簇/压缩优化和并发性。Hudi 于 2016 年推出，牢牢扎根于 Hadoop 生态系统，解释了名称背后的含义：Hadoop Upserts Deletes and Incrementals。它是为管理 HDFS 上大型分析数据集的存储而开发的。Hudi 的主要目的是减少流数据摄取过程中的延迟。

[译] Oracle Database 21c 中的数据泵（expdp、impdp）增强功能

以下示例，通过 expdp 实用程序导出 T1 表，需要注意的是，T1 表需要包含使用新 JSON 数据类型定义的列。

聊一聊分布式对象存储解决方案

OSS（Object Storage Service）俗称对象存储，主要提供图片、文档、音频、视频等二进制文件的海量存储功能。目前除了公有云提供对象存储服务外，一般私有云比较关心一些开源的分布式对象存储解决方案，本文列举了一些常见的技术方案供参考。

基于Apache Hudi + MinIO 构建流式数据湖

云存储定价：顶级供应商的价格比较

大多数供应商提供各种不同的云存储服务，并且每种服务的价格可能会受到许多不同因素的影响。例如，数据中心规模、弹性级别、存储数据量、免费资格、数据访问频率、数据传输费用、数据访问费用，以及支持订阅等都可能影响云存储的定价。对于企业来说，估测云存储的定价可能非常复杂。并且，对行业领先的云计算供应商提供的价格进行比较，以确定价格最低的云存储更为复杂。大多数供应商提供各种不同的云存储服务，并且每种服务的价格可能会受到许多不同因素的影响。例如，数据中心规模、弹性级别、存储数据量、免费资格、数据访问频率、数据传输费用

听说你想把对象存储当 HDFS 用，我们这里有个方案...

传统的大数据集群往往采用本地中心化的计算和存储集群。比如在谷歌早期的【三驾马车】中，使用 GFS 进行海量网页数据存储，用 BigTable 作为数据库并为上层提供各种数据发现的能力，同时用 MapReduce 进行大规模数据处理。但随着互联网业务的发展，本地中心化的架构开始受到以下两个方面的挑战：数据增长越来越快，并且数据格式更加丰富多样，非结构化数据越来越多。传统的分布式存储引擎难以大规模存储和处理文本、音视频等非结构化数据。计算和存储强耦合在本地应用上，缺少弹性。强耦合的模式增加了企业

非结构化数据怎么存？——开源对象存储方案介绍

过去的相当长的一段时间里，商用对象存储占据了市场上的大量的份额。国外的Amazon S3，国内的阿里云OSS都成为了大多数公司的选择。但是构建一个企业级的数据湖（包括结构化和非结构化数据）已经成为了越来越多公司的目标。那么Hadoop还能满足我们的要求吗？还是我们需要更多的选择？

PostgreSQL里面的一些命令小结

近两天总结了下PostgreSQL的基本操作命令，对PostgreSQL也有了一个基本的认识。 PostgreSQL的功能还是很丰富的，有序列，支持db link，基本Oracle里有的概念它这里也有，目前来看不支持package。风格和Oracle也类似，没有MySQL中快捷方便的show create table 这样的语句。从我的使用习惯来说，我基本关注以下的一些方面。查看数据库的配置查看用户信息查看会话连接信息 show tables的类似方法用户的权限查看建表语句表空间信息对象

对象存储，为什么那么火？

上期文章，小枣君给大家详细介绍了数据存储技术的基本知识，其中重点对DAS、SAN和NAS技术进行了对比分析。

012

基础| 实现网页瞬开，indexedDB的这几个基本操作你必须懂

前端爱好者的知识盛宴嗨这里是IMWEB 一个想为更多的前端人享知识助发展觅福利有情怀有情调的公众号欢迎关注转发让更多的前端技友一起学习发展~ 引语 indexedDB 简介: indexedDB 是一种使用浏览器存储大量数据的方法。它创造的数据可以被查询，并且可以离线使用。 indexedDB 有以下特点: 1.indexedDB 是 WebSQL 数据库的取代品 2.indexedDB遵循同源协议(只能访问同域中存储的数据，而不能访问其他域的) 3.API包含异步API和同步API

集群NAS和对象存储的区别

010

官方推荐 | 《2分钟带你认识腾讯云对象存储产品》

关注腾讯云大学，了解最新行业技术动态戳【阅读原文】查看55个腾讯云产品全集一、课程概述对象存储（Cloud Object Storage, COS）是腾讯云提供的一种存储海量文件的分布式存储服务，类似于网盘，可以存储任何类型的数据。腾讯云提供多种存储产品，如标准存储、低频存储和归档存储，适用于不同的存储场景。本视频将带你在2分钟内快速了解腾讯云对象存储服务，并对对象存储的产品以及他们的应用场景进行简单的介绍。【课程目标】了解腾讯云对象存储服务了解标准存储、低频存储和归档存储以及他们的应用场景

听说你想把对象存储当 HDFS 用，我们这里有个方案...

传统的大数据集群往往采用本地中心化的计算和存储集群。比如在谷歌早期的【三驾马车】中，使用 GFS 进行海量网页数据存储，用 BigTable 作为数据库并为上层提供各种数据发现的能力，同时用 MapReduce 进行大规模数据处理。

mybaties 的一些点

本文讨论MyBatis-Plus如何通过自定义通用Mapper和通用Service实现基于多数据源的增删改查。首先，介绍了MyBatis-Plus的架构和核心功能，然后通过一个具体实例展示了如何定义通用Mapper和通用Service，以及如何使用多数据源完成增删改查操作。最后，介绍了在SpringBoot中集成MyBatis-Plus的方法和注意事项。

非结构化数据怎么存？——开源对象存储方案介绍

存储市场发展趋势依旧美好，对象存储将成企业存储新标准丨科技云·视角

继网络接入存储、块存储、文件存储之后，对象存储掀起了新一轮的发展浪潮。如今，传统企业存储比如NAS或者SAN等显然无法应对如此海量的非结构化数据存储需求。国外IBM、Red Hat、HDS、EMC等巨头、国内华为云、青云、杉岩数据等企业纷纷在企业级对象存储领域展开了积极布局。

Shopee x JuiceFS：ClickHouse 冷热数据分离存储架构与实践

Shopee ClickHouse 是一款基于开源数据库 ClickHouse 做二次开发、架构演进的高可用分布式分析型数据库。本文将主要介绍 Shopee ClickHouse 的冷热分离存储架构和支持公司业务的实践。

对象存储基础概念

对象存储诞生之初谈到为什么要有对象存储，必须聊聊对象存储诞生之前的两大存储模型：块存储和文件存储。块存储主要是将存储介质的空间整个映射给主机使用的，主机如果需要对这些空间进行读写IO操作，需要先进行分区和格式化处理，形成可以被操作系统识别的逻辑命名空间，之后主机才能通过操作系统对这些存储介质进行读写操作。常见的块存储有磁盘，SSD，NAS、SAN等，这些物理设备都或多或少存在物理上的极限，比如存储空间、性能等都存在物理极限。文件存储立足于物理存储介质之上，是操作系统对数据管理操作的抽象，这些抽象最终汇

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐