几个与文本处理相关的Linux命令总结

版权声明:本文为耕耘实录原创文章,各大自媒体平台同步更新。欢迎转载,转载请注明出处,谢谢

1.当前目录下有若干文件,找出扩展名为TextGrid的所有文件,并复制到…/file_set。

find . -name "*.TextGrid" \-exec cp {} ../file_set/ \;

2.当前目录下有若干文件,找出扩展名为“TextGrid”且非UTF-8(UTF-8 Unicode Text,with CRLF line terminators)编码的文件,并将其移动到…/trash。该类型的文件命名规则为16位随机数字。

for s_file in `for t_file in $(ls *.TextGrid);do file $t_file|grep -v "UTF-8 Unicode Text,with CRLF line terminators"|grep -o -E [0-9]{16}\.TextGrid;done` do mv $s_file ../trash ;done

3.产生一个含有大写字母和数字长度为8的随机字符串。

echo $RANDOM|md5sum|tr -t [a-z] [A-Z]|cut -b 1-8

4.批量删除文本中以某指定字符串匹配的行。

sed -i '/^sid/d' test.txt

5.查看系统中所有人可读写执行的不安全文件。

find / -perm 777 -a \! -type s -a \! -type l -a \! \( -type d -a -perm 1777 \)

6.当前目录中有300个文件,现需要从该批文件中随机选取100个并移动到上层目录to_dir中。

for $files in `ls|sort --random-sort|head -n 100`;do mv $files ../to_dir/ ; done

7.当前目录有若干UTF-8带BOM的文件,需删除这些文件中的BOM。

for files in `ls`;do sed -i 's/\xEF\xBB\xBF//g' $files ;done

8.当前目录下有若干UTF-8文件,使用file命令查看,显示“UTF-8 Unicode (with BOM) text”,找出非该类文件,并查看他们的内容。

file *|grep -v "UTF-8 Unicode (with BOM) text"|awk -F ":" '{print $1}'|xargs cat

9.当前目录下有一批UTF16BE的文件,需转换成UTF-8,转换完成后需将新文件保存到上层目录to_dir中。

for files in `ls`; do iconv -f UTF16BE -t UTF-8  -o ../to_dir/$files $files;done

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏C/C++基础

Makefile教程

Makefile定义了软件开发过程中,项目工程编译链、链接的方法和规则。 由IDE自动生成或者开发者手动书写。 Unix(MAC OS、Solaris)和Lin...

45120
来自专栏芋道源码1024

消息队列中间件 RocketMQ 源码分析 —— Message 存储

1、概述 2、CommitLog 结构 3、CommitLog 存储消息 MappedFile#落盘 FlushRealTimeService CommitR...

451130
来自专栏机器学习从入门到成神

关于hibernate中对象的三种状态分析

一、首先Hibernate中对象的状态有三种:瞬态、游离态和持久态,三种状态转化的方法都是通过session来调用,瞬态到持久态的方法有save()、saveO...

26110
来自专栏温安适的blog

剖析1条JMS消息

41370
来自专栏林欣哲

区块链开发之Go语言—文件系统

处理的文件名 path库 filepath库 查看文件的元信息 os.Stat os.Lstat 操作临时文件区域 os.TempDir os — 平台无关的操...

39880
来自专栏破晓之歌

Django 2.0 新特性 转

2017年12月2日,Django官方发布了2.0版本,成为多年来的第一次大版本提升,那么2.0对广大Django使用者有哪些变化和需要注意的地方呢?

11220
来自专栏北京马哥教育

Ansible 详细用法说明(二)

例:获取某台主机的变量 ansible 10.1.6.68 -m setup ===================================== sc...

40050
来自专栏大内老A

WCF技术剖析之二十五: 元数据(Metadata)架构体系全景展现[WS标准篇]

元数据实际上是服务终结点的描述,终结点由地址(Address)、绑定(Binding)和契约(Contract)经典的ABC三要素组成。认真阅读过《WCF技术剖...

41490
来自专栏Java3y

Servlet第四篇【request对象常用方法、应用】

什么是HttpServletRequest HttpServletRequest对象代表客户端的请求,当客户端通过HTTP协议访问服务器时,HTTP请求头中的所...

46050
来自专栏安恒网络空间安全讲武堂

writeup | 强网杯—Simple check

Simplecheck 下载之后使用winhex打开文件 ? 发现是属于android的逆向题目 修改后缀为.apk 先使用模拟器安装打开该apk ? 猜测题目...

39450

扫码关注云+社区

领取腾讯云代金券