前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >算法-对一百亿个正整数进行排序并去重

算法-对一百亿个正整数进行排序并去重

作者头像
devi
发布2021-08-18 15:27:54
7470
发布2021-08-18 15:27:54
举报
文章被收录于专栏:搬砖记录

本题思路源自Bitmap算法,实际操作可能有一定的限制或难点,仅用于算法思想学习与参考,如有疑问或建议,欢迎留言交流。

前置知识

  • 一位二进制0/1表示两种世界上任意的两种状态,
  • 二位二进制可以表示世界上的任意4种状态,00,01,10,11
  • 依此类推,一串二进制数可以表示世界上的任意状态。

题目

定义一个数有2种状态,“不存在这个数”,“存在这个数”,你只有1G出头的运行内存,给出算法设计,对一百亿个数字(数字x∈[0,1010])进行排序并去重,最后给出所需内存大小(注,直接读取一百亿个数字大概需要37.26G的运行内存)

运存计算所需公式: 1byte=8bit(1字节等于8位) 1024byte=1kb 1024kb=1Mb

分析

在前置知识中,已经提示使用二进制位来表示数的状态,则: 设:“存在这个数”,用1表示,“不存在这个数”,用0表示。

由于一百亿个数字的直接存储已经远远超过普通计算机的运存,不可能放在内存当中,因此只能通过文件读取的形式获得。

数字范围在[0,1010],构造一百亿bit的空间,每一bit都用于存放数的状态。

构造一百亿bit,需要内存为: 10000000000/8=1250000000 byte 1250000000/1024=1220703.125 kb 1220703.125/1024=1192.09289550781 mb 1192.09289550781/1024=1.16415321826935 gb

只需要1.165G内存即可存放一百亿个数字,符合要求。

题解

  1. 构造一百亿bit的空间,每个bit设为0。
  2. 挨个从文件中读取数字,给对应的bit设为1。
  3. 通过bit的状态,对应输出数据。

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

读入某个数,就改变该数的对应状态。 若读入的数已存在,则continue



在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

总结

涉及到的思想:

  • 利用bit(位)的思想,通过0/1存储数据的状态,不仅仅节省了空间,而且算法非常高效。
    • 假设需要“判断一个数字是否出现多次”,可以通过以下设计来实现:
      • 00:数字不存在
      • 01:数字仅有一个
      • 10:数字出现多次
    • 二进制本身就是组成多姿多彩计算机世界的基础,理论上,直接操纵二进制就可以进行任意运算。
  • 利用数组本身的性质“下标”,来实现数据的“间接存储”(实际上并没有保存这个数字,但是却能够操作这个数字)
    • 凡是需要对一定范围内的正整数进行排序去重,都可以使用这个办法(空间换时间)。
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/12/20 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前置知识
  • 题目
  • 分析
  • 题解
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档