开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Python使用游程编码查找最小长度压缩字符串，我们可以删除n个连续字符以获得最小长度

Python使用游程编码查找最小长度压缩字符串的方法是通过遍历字符串，统计连续字符的个数，并将连续字符的个数和字符本身进行编码。然后根据编码后的字符串长度，找到最小长度的压缩字符串。

具体步骤如下：

初始化一个空字符串compressed，用于存储压缩后的字符串。
遍历原始字符串，使用一个计数器count记录当前连续字符的个数。
当遇到不同的字符或者遍历到字符串末尾时，将当前字符和计数器count进行编码，并将编码后的字符串添加到compressed中。
如果编码后的字符串长度大于原始字符串长度，则不进行压缩，直接将原始字符添加到compressed中。
继续遍历原始字符串，重复步骤2-4，直到遍历完整个字符串。
返回compressed作为最小长度压缩后的字符串。

下面是一个示例代码：

def run_length_encoding(s):
    compressed = ""
    count = 1

    for i in range(1, len(s)):
        if s[i] == s[i-1]:
            count += 1
        else:
            compressed += s[i-1] + str(count)
            count = 1

    compressed += s[-1] + str(count)

    if len(compressed) >= len(s):
        return s
    else:
        return compressed

# 测试示例
s = "aaabbbcccdd"
compressed_string = run_length_encoding(s)
print(compressed_string)

输出结果为：a3b3c3d2

在这个例子中，原始字符串为"aaabbbcccdd"，经过游程编码压缩后得到最小长度的压缩字符串"a3b3c3d2"。

推荐的腾讯云相关产品和产品介绍链接地址：

腾讯云对象存储（COS）：https://cloud.tencent.com/product/cos
腾讯云云服务器（CVM）：https://cloud.tencent.com/product/cvm
腾讯云云原生容器服务（TKE）：https://cloud.tencent.com/product/tke
腾讯云人工智能（AI）：https://cloud.tencent.com/product/ai
腾讯云物联网（IoT）：https://cloud.tencent.com/product/iot
腾讯云移动开发（移动推送、移动分析、移动测试等）：https://cloud.tencent.com/product/mobile
腾讯云数据库（MySQL、Redis、MongoDB等）：https://cloud.tencent.com/product/db
腾讯云区块链（BCS）：https://cloud.tencent.com/product/bcs
腾讯云元宇宙（Tencent XR）：https://cloud.tencent.com/product/xr

请注意，以上链接仅供参考，具体产品选择应根据实际需求和情况进行评估。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

ZIP压缩算法详细分析及解压实例解释（下）

来源：esingchan - 博客园链接：www.cnblogs.com/esingchan/p/3958962.html（点击尾部阅读原文前往） 7、ZIP中对CL进行再次压缩的方法这里仍然沿用Huffman的想法，因为CL也是一堆整数，那么当然可以再次应用Huffman编码。不过在这之前，PK对CL序列进行了一点处理。这个处理也是很精巧的。 CL序列表示一系列整数对应的码字长度，对于literal/length来说，总共有0-285这么多符号，所以这个序列长度为286，每个符号都有一个码字长度，当然

06

VBA解压缩ZIP文件02——压缩过程

要实现解压缩肯定得了解压缩的过程，解压缩相比压缩来说是简单很多，简单说一下压缩的过程。

02

算法科普：有趣的游程编码

在这个大数据时代，我们保存的数据量有时候往往是非常庞大的，存储它将会耗费非常多的内存，读取速度也相对减慢了。

02

数据压缩----游程编码

比特流中最简单的冗余形式是一串重复的比特，利用这种冗余来压缩数据的经典方法是游程编码。例如有一串比特流：0000000000000001111111000000011111111111，该比特流中有15个0，然后是7个1，然后是7个0，然后是11个1。因为0和1总是交替出现的，我们只要表示出游程长度即可。上面的比特流可用游程编码压缩为：1111011101111011（15=1111，7=0111，7=0111，11=1011）。为了有效地实现该压缩方法，需要回答下面三个问题：应该用多少比特记录游程长

00

干货 | 携程百亿级缓存系统探索之路——本地缓存结构选型与内存压缩

作者简介一十，携程资深后端开发工程师；振青，携程高级后端开发专家。一、前言携程酒店查询服务是酒店BU后端的核心服务，主要负责提供所有酒店动态数据计算的统一接口。在处理请求的过程中，需要使用到酒店基础属性信息、价格信息等多维度的数据信息。为了保证服务的响应性能，酒店查询服务对所有在请求过程中需要使用到的相关数据进行了缓存。随着携程酒店业务的发展，查询服务目前在保证数据最终一致性以及增量秒级更新延迟的情况下，在包括服务器本地内存以及Redis等多种介质上缓存了百亿级的数据。本文将主要讨论酒店查询服务

02

干货 | 携程百亿级缓存系统探索之路——本地缓存结构选型与内存压缩

携程酒店查询服务是酒店BU后端的核心服务，主要负责提供所有酒店动态数据计算的统一接口。在处理请求的过程中，需要使用到酒店基础属性信息、价格信息等多维度的数据信息。为了保证服务的响应性能，酒店查询服务对所有在请求过程中需要使用到的相关数据进行了缓存。随着携程酒店业务的发展，查询服务目前在保证数据最终一致性以及增量秒级更新延迟的情况下，在包括服务器本地内存以及Redis等多种介质上缓存了百亿级的数据。

03

jpeg编码学习笔记

jpeg编码学习笔记各种图片格式目的是在网络传输和存储的时候使用更少的字节，即起到压缩的作用。在图片格式解码后，无论图片的格式，图片数据都是像素数组。本文将尝试通过JPEG这种图片编码格式的学习，了解图片编码的秘密。 ---- JPEG简介一张100X100大小的普通图片，如果未经压缩，大概在100*100*4*8bits=0.3MB左右,这也是图片在内存中占用的内存大小。通常JPEG文件相对于原始图像,能够得到1/8的压缩比，如此高的压缩率是如何做到的呢？ JPEG能够获得如此高的压缩比是

06

香农编码的matlab仿真实现实验报告_香农编码例题

实验目的: 通过该实验，掌握通过计算机实验可变长信源编码方法，进一步熟悉香农编码，费诺编码以及霍夫曼编码方法。

03

我从来不理解 “压缩算法”，直到有人这样向我解释它

除了上面这些压缩格式，像.jpg，.mp3，.avi这些，也都是有着压缩的作用，只不过跟上面.zip这些相比，它们执行的是有损压缩

02

15.计算机科学导论之数据压缩学习笔记

此部分包含第15、16、17和18章，包含了计算机中传输的数据压缩(有损与无损)、网络数据在传输过程中如何保证其数据安全, 讨论计算理论，即哪些是可计算的，哪些是不可计算的，最后介绍当前热门的人工智能(AI)的观点，加深我们对计算机数据处理的的认识，为后续学习扩展基础认识。

02

JPEG编码和解码

JPEG（Joint Photographic Experts Group）是联合图像专家小组的英文缩写。它由国际电话与电报咨询委员会CCITT（The International Telegraph and Telephone Consultative Committee）与国际标准化组织ISO于1986年联合成立的一个小组，负责制定静态数字图像的编码标准。

02

JPEG 编码过程：为 GPU 处理开路

该文介绍了JPEG图片压缩算法的基本原理、过程、以及GPU并行化考量。

01

LeetCode 900. RLE 迭代器（模拟/二分查找）

迭代器由 RLEIterator(int[] A) 初始化，其中 A 是某个序列的游程编码。更具体地，对于所有偶数 i，A[i] 告诉我们在序列中重复非负整数值 A[i + 1] 的次数。

01

一文读懂Hive底层数据存储格式（好文收藏）

本文讲解 Hive 的数据存储，是 Hive 操作数据的基础。选择一个合适的底层数据存储文件格式，即使在不改变当前 Hive SQL 的情况下，性能也能得到数量级的提升。这种优化方式对学过 MySQL 等关系型数据库的小伙伴并不陌生，选择不同的数据存储引擎，代表着不同的数据组织方式，对于数据库的表现会有不同的影响。

05

WEB前端压缩看这里就够了

0写在前面 web前端在越来越多的Hmtl5游戏 web App的复杂的web运用中需要更多有针对的压缩方案。本文抛砖引玉，聊一下基于前端javascript以及Html5线上有损图像压缩，无损数据压缩方案等运用。 web项目需求中有很多资源压缩优化有很多不错的方案比如针对文本js的compress 以及服务器gzip，比如sprite雪碧图+png压图。在越来越多的Hmtl5游戏 webApp的复杂的web运用中需要更多有针对的压缩方案。本文抛砖引玉，聊一下基于前端javascript以及H

01

深度学习助力数据压缩，一文读懂相关理论

本文对数据压缩的「前世今生」进行简要的回顾，重点分析基于深度学习的有损压缩、无损压缩方法，对基于深度学习的数据压缩进行了探讨和展望。

03

视频压缩编码和音频压缩编码的基本原理

本文介绍一下视频压缩编码和音频压缩编码的基本原理。其实有关视频和音频编码的原理的资料非常的多，但是自己一直也没有去归纳和总结一下，在这里简单总结一下，以作备忘。

02

【连载】如何掌握openGauss数据库核心技术？秘诀三：拿捏存储技术（5）

列存储引擎在Btree索引的支持角度，与传统的行存储引擎无本质差别。对于一般用于应对大数据批量分析性负载的列存储引擎来说，Btree索引有助于帮助列存储大大提升自身的点查效率，更好的适应混合负载。

05

Apache CarbonData 简介

Apache CarbonData 是一种索引列式数据格式，专为快速分析和实时洞察至关重要的大数据场景而开发。这个强大的数据存储解决方案是 Apache 软件基金会内的顶级项目，提供了一种更结构化、更高效、更快速的方法来处理和分析大型数据集

02

LeetCode 700题题解答案集合 Python

====================================================

01

BMP格式

BMP 格式是 Windows 下最简单的图像存储格式，它支持图像以每像素 1,4,8,16,24,32比特表示。BMP 格式也支持 4,8比特每像素的游程算法压缩图像。

01

JPEG/Exif/TIFF格式解读(1):JEPG图片压缩与存储原理分析

JPEG的全称是JointPhotographicExpertsGroup（联合图像专家小组），它是一种常用的图像存储格式， jpg/jpeg是24位的图像文件格式，也是一种高效率的压缩格式，文件格式是JPEG（联合图像专家组）标准的产物，该图像压缩标准是国际电信联盟（International Telecommunication Union，ITU）、国际标准化组织（International Organization for Standardization，ISO）和国际电工委员会（International Electrotechnical Commission，IEC）共同制定。JPEG标准正式地称为ISO/IEC IS（国际标准）10918-1：连续色调静态图像数字压缩和编码（Digital Compression and Coding of Continuous-tone Still Images）和ITU-T建议T.81。

01

JPEG/Exif/TIFF格式解读(1):JEPG图片压缩与存储原理分析

JPEG的全称是JointPhotographicExpertsGroup（联合图像专家小组），它是一种常用的图像存储格式， jpg/jpeg是24位的图像文件格式，也是一种高效率的压缩格式，文件格式是JPEG（联合图像专家组）标准的产物，该图像压缩标准是国际电信联盟（International Telecommunication Union，ITU）、国际标准化组织（International Organization for Standardization，ISO）和国际电工委员会（International Electrotechnical Commission，IEC）共同制定。JPEG标准正式地称为ISO/IEC IS（国际标准）10918-1：连续色调静态图像数字压缩和编码（Digital Compression and Coding of Continuous-tone Still Images）和ITU-T建议T.81。

01

NodeJS模块研究 - zlib

nodejs 的 zlib 模块提供了资源压缩功能。例如在 http 传输过程中常用的 gzip，能大幅度减少网络传输流量，提高速度。本文将从下面几个方面介绍 zlib 模块和相关知识点：

03

Redis源码阅读（二）底层数据结构

Redis对于底层数据结构的极致封装，是Redis高效运行的原因之一。我们结合Redis源码对其进行分析。

02

服务器开发设计之算法宝典

作者：lynhlzou，腾讯 IEG 后台开发工程师孙子云：“上兵伐谋，其次伐交，其次伐兵，其下攻城”，最上乘行军打仗的方式是运用谋略，下乘的方式才是与敌人进行惨烈的厮杀。同样的，在程序设计中，解决问题的办法有很多种，陷入到与逻辑进行贴身肉搏的境况实属下下之策，而能运用优秀合理的算法才是”伐谋”的上上之策。算法的思想精髓是值得深入研究和细细品味的，本宝典总结了服务器开发设计过程中涉及到的一些常用算法，试图尽量以简洁的文字和图表来解释和说明其中的思想原理，希望能给大家带来一些思考和启示。思维导图

04

普林斯顿算法讲义（三）

一个有向图（或有向图）是一组顶点和一组有向边，每条边连接一个有序对的顶点。我们说一条有向边从该对中的第一个顶点指向该对中的第二个顶点。对于 V 个顶点的图，我们使用名称 0 到 V-1 来表示顶点。

01

敲黑板！鹅厂程序员面试也考了这些算法知识

开发者在程序设计时，擅于运用优秀合理的算法相较于被动陷入逻辑之沼潭，是更被推荐的上上之策。算法的思想精髓是值得每个开发者深入研究和细细品味。本文总结腾讯游戏、微信红包等腾讯王牌的后台开发在设计过程中涉及到的一些常用算法，试图尽量以简洁的文字和图表来解释和说明其中的思想原理，希望能给大家带来一些思考和启示。

07

Redis 内部编码与优化方式

redis 为每种数据类型都提供了多种内部编码方式，以散列类型为例，通过散列表实现散列类型，此时查找和赋值操作时间复杂度为 O(1)，但是当键中元素很少时，O(1)的性能并不会比 O(n)有明显的性能提高。所以此时 redis 会使用一种比较紧凑但是性能稍差的内部编码方式，内部编码方式对于开发者来说是透明的，当键中元素变多时，redis 就会自动调整内部编码方式，转换为散列表。

01

LeetCode 第 199 场周赛（757/5231，前14.5%）

全国排名： 757 / 5231，14.5%；全球排名： 0 / 1，00.0%

01

Redis数据结构与底层实现揭秘

Redis支持五种主要数据结构：字符串（Strings）、列表（Lists）、哈希表（Hashes）、集合（Sets）和有序集合（Sorted Sets）。这些数据结构为开发者提供了灵活的数据操作方式，满足了不同场景下的数据存储需求。

01

JPEG编码原理与快速编解码

NVIDIA在2018年6月发布了基于GPU加速的用于解码JPEG的nvJPEG。实际上早在1998年，libjpeg/SIMD就开始使用SIMD指令集对JPEG编解码进行加速。我们可能会问：为什么JPEG编解码过程可以被SIMD或GPU加速？为什么我们又尚未看见类似的对PNG进行加速的项目？本文将从JPEG编解码原理出发，简单讲解SIMD加速的原理，并简要说明PNG不能被加速的原因。

02

Redis数据结构和内存分配

OBJ_ENCODING_INT：表示成数字。最多标识long的最大值，超过转为OBJ_ENCODING_RAW。 OBJ_ENCODING_RAW： string原生表示方式。 OBJ_ENCODING_EMBSTR：功能同RAW，只是数据是存储在一块连续的内存中，embstr创建和释放字符串操作内存的次数比RAW的2次降低为1次，修改将重新分配内存。 OBJ_ENCODING_HT：类似hashtable，表示成dict。 OBJ_ENCODING_ZIPMAP：是个旧的表示方式，已不再用。 OBJ_ENCODING_LINKEDLIST：双向列表，3.2以下版本使用 OBJ_ENCODING_ZIPLIST：表示成ziplist。 OBJ_ENCODING_INTSET：表示成整数数组。用于set数据类型。 OBJ_ENCODING_SKIPLIST：表示成skiplist跳跃表。用于zset数据结构。 OBJ_ENCODING_QUICKLIST：表示成quicklist。用于list数据类型。

02

基于游程法的二值图像Blob 分析算法

1. 概述按照处理对象的不同，目前典型的连通性分析算法包括基于像素的方法和基于游程的方法。后者是对像素法的一种改进，它充分利用了区域各部分之间的连通关系，搜索空间得到压缩，整体效率高于前者，因此近年来得到了更多的关注。在具体实现上，这两类方法都可采用递归法或序贯算法。递归法实现起来简单，但运行时需要消耗大量堆栈，除了效率低，在实际应用中还容易因堆栈资源耗尽而造成算法不稳定。序贯法在扫描过程中会出现标记冲突现象，为此，常规的做法是对图像( 或子图像) 进行二次或多次扫描，并利用冲突等价表等辅助措施来

06

FTP协议的数据传输模型和相关命令说明

上文说过，一旦FTP数据发送双方建立控制命令通道和数据传输通道后，双方就可以发送数据。在数据传输中，FTP协议又规定了三种模式，分别是流模式，块模式和压缩模式。

01

文心一言 VS 讯飞星火 VS chatgpt （227）-- 算法导论16.3 9题

确实，对于一个由随机生成的8位字符组成的文件，我们不能期望通过任何压缩方法将其压缩，哪怕只是压缩一位。这里的原因涉及到信息论的基本概念，特别是与数据编码和压缩相关的概念。

02

Redis原理篇之数据结构

redis中保存的Key是字符串，value大多也是字符串或字符串集合，因此字符串是Redis中最常使用的一种数据结构。

02

DDIA 读书分享第三章（下）：TP AP 和列存

术语事务（ transaction ）由来有一些历史原因。早期的数据库使用方多为商业交易（commercial ），比如买卖、发工资等等。但是随着数据库应用不断扩大，交易\事务作为名词保留了下来。

03

Python 3 学习笔记：序列

序列是一块用于放置多个值得连续存储空间，并且按特定顺序排列，每个值（称为元素）都分配一个整数（由左至右则从 0 开始；由右至左则从 -1 开始），称为索引（index）或位置，如下所示：

01

Parquet存储的数据模型以及文件格式

Aapche Parquet是一种能有效存储嵌套数据的列式存储格式，在Spark中应用较多。

01

一文读懂 Redis 常见对象类型的底层数据结构

Redis 是一个基于内存中的数据结构存储系统，可以用作数据库、缓存和消息中间件。Redis 支持五种常见对象类型：字符串（String）、哈希（Hash）、列表（List）、集合（Set）以及有序集合（Zset），我们在日常工作中也会经常使用它们。知其然，更要知其所以然，本文将会带你读懂这五种常见对象类型的底层数据结构。

01

【愚公系列】软考中级-软件设计师 018-数据结构（二叉树的分类）

在线索二叉树中，除了左右孩子指针，还添加了两个额外的指针：前驱指针和后继指针。这两个指针分别指向当前节点的前驱节点和后继节点。

02

一文理解Redis底层数据结构

Redis的5种常见数据结构：字符串(String)、列表(List)、散列(Hash)、集合(Set)、有序集合(Sorted Set)。这些都是Redis对外暴露的数据结构，本文将介绍这些数据结构的底层数据结构的实现。

01

细品Redis高性能数据结构之hash对象

上一节讲Redis的高性能字符串结构SDS，今天我们来看一下redis的hash对象。

01

数据库压缩技术简介

最近接触到一些海量数据存储的需求，为了解决这样的需求，一个想法是对数据进行一定程度的聚合。在应用层的聚合方式，这里不展开。但是让我联想到的是以前学习 prometheus tsdb的时候接触到的压缩技术。即使本质上来讲，应用层的数据聚合，就是一种数据压缩技术。而 tsdb 使用的 gorilla 技术令人印象深刻。有兴趣的可以详细看一下 prometheus 作者的这篇博客, 以及其使用的技术 gorilla 的 paper. 简而言之 prometheus 的 tsdb 简洁强大，受益于其高效的压缩【gorilla 平均能压缩 16 byte samples to an average of 1.37 bytes】和查询效率，其单机的设计并没有影响他在众多场景中的广泛使用。

Redis专题(2)：Redis数据结构底层探秘

上篇文章 Redis闲谈（1）：构建知识图谱介绍了redis的基本概念、优缺点以及它的内存淘汰机制，相信大家对redis有了初步的认识。互联网的很多应用场景都有着Redis的身影，它能做的事情远远超出了我们的想像。Redis的底层数据结构到底是什么样的呢，为什么它能做这么多的事情？本文将探秘Redis的底层数据结构以及常用的命令。

05

Python 最常见的 120 道面试题解析

Python 今年还是很火，不仅是编程语言排行榜前二，更成为互联网公司最火热的招聘职位之一。伴随而来的则是面试题目越来越全面和深入化。有的时候不是你不会，而是触及到你的工作边缘，并没有更多的使用，可是面试却需要了解。

02

Redis数据结构为什么既省内存又高效？

「Redis所有的数据结构都是在内存占用和执行效率之间找一个比较好的均衡点，不一味的节省内存，也不一味的提高执行效率」

06

哈夫曼树、哈夫曼编码和字典树

哈夫曼树（Huffman Tree）是一种带权路径长度最短的二叉树。哈夫曼树常常用于数据压缩，其压缩效率比较高。

01

Redis的五种数据结构的底层实现原理

redis的性能高的原因之一是它每种数据结构都是经过专门设计的，并都有一种或多种数据结构来支持，依赖这些灵活的数据结构，来提升读取和写入的性能。如果要了解redis的数据结构，可以从两个不同的层面来讨论它：

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭