首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Linux文件随机抽取N

有时候需要从大文件中随机抽取N出来进行模拟,但是用python或者别的语言感觉不太方便,linux下直接分割感觉会更快捷。...一般可以考虑以下的方法: 1. shuf shuf -n100 filename # 从文件中随机选取100 2. sort sort -R filename | head -n100 -R参数是将文件随机顺序...'\t' '{print $2}' # 假如输出的内容只有一列 awk 'BEGIN{srand()} {print rand()"\t"$0}' filename 这一句话,strand()是设定随机数种子...,必须写在BEGIN中才能正常运行;rand()是产生0到1之间的随机数。...第一列是产生的随机数。sort -nk 1是根据第一列排序,运行后输出: ? 因为种子不一样,所以结果与上图不同。 最后选取想要的行数,然后输出除了第一列的内容就可以了。

8.5K20
您找到你想要的搜索结果了吗?
是的
没有找到

java按字节、字符、随机读取文件,并设置字符编码格式

,转成字节流,字节流读取不存在编码问题 FileReader:读取文件中的字符,转成字符流,字符读取需要注意编码问题 BufferedInputStream:字节读取,减少磁盘开销,不带缓存没读取一个字节就要写入一个字节...BufferedReader:字符读取,减少磁盘开销,可以使用readline()方法整行读取。...);//读取文件中所有字节的方法 System.out.println("----------字节以每次读取512个字节,循环读取文件内容-------------"); readFileRoundBy512...(fileName);//以每次读取512个字节,循环读取文件内容 System.out.println("----------字节创建缓冲流读取读取文件内容-------------"); readFileBufferByte...=-1){ System.out.print(new String(buf,0,tempByte)); //不能使用println,否则会出现错的现象 } fis.close();

1.3K30

pandas读取excel某一_python读取csv数据指定行列

pandas中查找excel或csv表中指定信息的数据(超详细) 关键!!!!使用loc函数来查找。...话不多说,直接演示: 有以下名为try.xlsx表: 1.根据index查询 条件:首先导入的数据必须的有index 或者自己添加吧,方法简单,读取excel文件时直接加index_col...不能是index的名称 #如果要打印index的话就data.index data.columns #与上面的一样 以上全过程用到的库: pandas,xlrd , openpyxl 5.找出指定的和指定的列...主要使用的就是函数iloc data.iloc[:,:2] #即全部,前两列的数据 逗号前是,逗号后是列的范围,很容易理解 6.在规定范围内找出符合条件的数据 data.iloc[:10,:][...data.工资>6000] 这样即可找出前11里工资大于6000的所有人的信息了 版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。

3.1K20
领券