首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Linux文件随机抽取N行

有时候需要从大文件中随机抽取N行出来进行模拟,但是用python或者别的语言感觉不太方便,linux下直接分割感觉会更快捷。...一般可以考虑以下的方法: 1. shuf shuf -n100 filename # 从文件中随机选取100行 2. sort sort -R filename | head -n100 -R参数是将文件随机顺序...3. awk awk是一个处理文件神器,可以像下面这么写(别的写法也可实现): awk 'BEGIN{srand()} {print rand()"\t"$0}' filename | sort -nk...,必须写在BEGIN中才能正常运行;rand()是产生0到1之间的随机数。...第一列是产生的随机数。sort -nk 1是根据第一列排序,运行后输出: ? 因为种子不一样,所以结果与上图不同。 最后选取想要的行数,然后输出除了第一列的内容就可以了。

8.2K20
您找到你想要的搜索结果了吗?
是的
没有找到

Java实现随机人名抽取

- 使用数组、方法、循环等实现人名的随机抽取 ## 前言:         我们今天来写一个随机抽取用户名字的一个小程序,     首先我们思考这个需求他需要的条件,要抽取用户的名     字,...就要先有一个容器,来储存用户名字的数据,其次     要有随机的功能实现,因为要随机,所以还要有一个寻     找的功能,挨个寻找的功能需要循环来实现,再想一下     有寻找,找到了还继续往后找嘛...###### 4.if、else与length         一个if与else的嵌套,确定随机生成的数字是否大于     1,若小于1则直接终止程序,length函数,表示数组的长     度...###### 5.使用循环语句         使用while函数,直接对生成的数字进行判断。...break;          }          num = (int) (Math.random() * 3);       } //将数组下标设置成随机数,就可以实现人名的随机抽取

1.2K10

算法(二)蓄水池抽样算法快速随机抽取reads

fastq文件往往都很大,出于测试目的,我们经常要从fastq文件中随机抽取reads,生成一个小一点的fastq文件,以加快测试效率。...假设我们要从一个包含大约100M reads的fastq文件中随机抽取1M reads,该怎么办呢?...我们将问题简单化:假设我们要从一个txt文件中(不知道总共多少行)随机抽取M行(fastq文件的处理与之类似,只不过fastq文件是压缩过的,且其一条记录由4行组成),比较容易想到的是如下办法(伪代码)...但是,当文件很大时,该方法消耗的内存就太大了(想像一下把一个8G的txt文件整个加载到内存时的糟糕情况)。所以,不光要减少读取文件的次数,还要消耗较少的内存才好!...蓄水池抽样算法适用于大数据随机抽样,其关键在于证明其抽样的步骤是等概率的。其实证明方法也不难,只需运用归纳法即可,具体证明过程可参照wiki。

1.3K10

ASP.NET (Web) + C#算法 | 生成随机数字序列(随机数字+每个数字随机不重复的位置和颜色)

关于今天的一个关于ASP的课后作业,是要求在ASP上实现随机生成数字序列: 具体要求: 随机位置:每个数字的位置相对随机随机颜色:每个数字的颜色随机且不重复; 随机数字:从0到9随机取出四个数;...GetRandom(int minValue, int maxValue, int count) { int[] intList = new int[maxValue];//创建一个以...Random(); for (int i = 0; i < count; i++) { int index = rand.Next(0, n);//随机一个...//不断用最后面的值来覆盖选中到的值,再把最后面的值去掉(通过n--实现,抽象意义上“截短”提供数字的intList),由此实现不重复序列 详细解析见以上的代码截图。...sbft1, new PointF(0, 300)); int[] rdlist = common.GetRandom(0,cr.Length,textString.Length);//产生一个随机的不重复的

2.4K10

python–随机生成汉字、数字「建议收藏」

第二种方法:GBK2312 gbk2312对字符的编码采用两个字节相组合,第一个字节的范围是0xB0-0xF7, 第二个字节的范围是0xA1-0xFE...., "光", "超", "军", "达"] name = random.choice(first_name) + random.choice(second_name) print(name) 二、随机生成数字...#随机整数 print(random.randrange(1,20))#随机产生一个range print(random.choice('x23serw4'))#随机一个元素 print(random.sample...('hello',2))#从序列中随机取几个元素 print(random.uniform(1,9))#随机取浮点数,可以指定范围 x = [1,2,3,4,6,7] random.shuffle(x)...#洗牌,打乱顺序,会改变原list的值 print(x) print(string.digits)#所有的数字 print(string.ascii_letters)#所有的字母 print(string.punctuation

2.7K20

如何批量生成个位随机数字

今天小编给大家介绍如何随机生成个位数字。   打开条码软件,新建一个标签并设置标签的尺寸,标签的尺寸要和打印的标签纸的尺寸保持一致。...点击软件左侧的单行文字按钮,在画布上输入文本框,在弹出的界面中选择来自随机产生的数字。 01.jpg   接下来编辑数据,在随机数长度处选择1,因为我们要生成个位数字,所以选择1。...您也可以根据自己的需要进行选择,比如选择2,就是两位数字。也可以选择是否添加前缀或者后缀。在数据预览处可以预览效果。 02.jpg   随机数字生成后,在软件右侧可以设置数字的字体、字号等。...在预览处可以看到生成的随机数字。 04.jpg   综上所述就是在条码标签软件中批量生成个位随机数字的操作方法了,有需要的小伙伴可以自己试着做一做。

1.2K10

零基础VB教程054期:随机抽取不重复的值

随机抽取不重复 1、假设有个数组n(9) 有十个数,分别存放在n(0)至n(9)中 2、要从n数组中随机抽取一个数,存放到数组m中 3、从n中每次随机抽取一个,重复抽取10次,抽完 4、每次抽取到的值,...都是不同的 5、存储在n数组中的值都是不同的,需要保证每次随机抽取到的值都是不同的 需要考虑如何才能从n中每次随机抽取到不同的值????...1、从n数组中抽取不同的值的时候,只要保证每次抽取到不同的索引值即可 2、如何保证每次抽取到不同的索引?...其实只要考虑每次抽取一个数组索引的时候,每抽取一个,只要将这个值删除,是的数组缩短一个 重申一个关键词 Redim 重新声明,只用这个关键词声明,意味着要清空原来数组 Redim preserve来重新声明后...,就不要清空原来的值 需要注意,在第一次声明数组时,必须不能定义数组长度,也就是说必须是一个动态数组!!!!

1.3K20

Linux随机那些事儿

Linux中,常用的随机相关的命令有 md5、shuf、$RANDOM、openssl等,当然如果你会写Python或者PHP,那么也是可以的,同样的像JavaScript也是可以的。...当然了,博主这里主要讲的是Linux的使用方法。 ---- 随机数字 // Linux随机变量 $RANDOM,需要时直接调用即可 [email protected]/* <!..., -hex 后面的数字就是字符串长度 // 利用这个特性,可以随机生成虚拟 MAC 地址 [email protected]/* <!...// 随机生成 1-9 的数字(其实也就是打乱顺序) [email protected]/* <!...当然了,上述方法也不能 100% 保证唯一性,最稳妥的办法就是写一个 function 进行查重,又或者先把结果存储到一个数组中,新元素进行查重后再写入数组,最后打印数组; 如果你和我一样都是新手,那么我有必要说下随机字符串的简单应用场景

30220

原生JS | 随机抽取不重复的数组元素 —— 有没有更好的方法?

HTML5学堂-码匠:从数组中随机抽取不重复的元素,构成新数组,拥有多种方法,来看看你用的方法性能如何? 效果的功能需求 从一个数组当中,随机抽取数个元素,构成新数组,要求这些元素不能重复。...方法1:较为“传统”的实现方法 基本实现思路 从第二次随机抽取的元素开始,需要将抽取的元素与当前新数组的已抽取元素相比较,如果相同,则重新抽取,并再次执行比较的操作。...方法2:标记法 / 自定义属性法 基本实现思路 当获取新元素时,为该元素添加一个属性标记,再抽取一个元素之后,先判断是否有属性标记,如果已被标记,则说明该元素已被抽取,此时重新抽取。...基本实现思路 该方法的基本原理是,在抽取一个元素之后,将该元素与数组末端的最后一个元素交换,然后将数组最后一个元素扔掉。...第二,每次随机数的范围越来越小,数组长度越来越短。 也就是说,我们只要保证当前元素被末尾元素替代,并不断减小随机数范围,“数组长度”和“数组末尾的元素值”是可以忽略的。

8.8K50
领券