前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >我被跨系统的换行符折磨疯了~~~

我被跨系统的换行符折磨疯了~~~

作者头像
生信宝典
发布2022-04-19 12:30:22
2.2K0
发布2022-04-19 12:30:22
举报
文章被收录于专栏:生信宝典生信宝典

不同的操作系统使用的换行符不同,如 Windows 使用的换行符是\r\n (回车+换行), Unix/Linux使用的换行符是\n (换行),Mac 使用的换行符是\r (回车)。

这么使用是有其历史渊源的,来源于打字机时代:

电传打字机每秒钟可以打10个字符。但是它有一个问题,就是打完一行换行的时候要用掉0.2秒,正好可以打两个字符。 如果在这0.2秒里面,又有新的字符传过来,那么这个字符将会丢失。 于是科学家想了个办法解决这个问题,就是在每行后面加两个表示结束的字符,回车和换行: 回车,符号 \r;是告诉打字机把打印头定位在左边界; 换行,符号 \n;是告诉打字机把纸张向下方移动一行; https://blog.csdn.net/lijing742180/article/details/85018164

电脑发明后,这一习惯就沿用了下来。但为了节省存储的空间,Unix 和 Mac 做了修改。

  • 在Unix/Linux系统中,行尾只使用换行符 \n,系统会自动加上\r实现 回车+换行 的操作;
  • 在 Mac 系统中,行尾只使用回车符 \r,系统会自动加上 \n实现 回车+换行 的操作;

这对我们通常也没什么影响,键盘上的Enter键自己会处理这个事情。

但如果我们跨系统传输和使用文件时,问题就出来了。

Winddows 的程序传到 Linux不能运行

比如下面这个脚本metaphlan_to_stamp.pl,可能在 windows 下做了修改,保存时自动加了\r,而\r在 Unlix/Linux 上显示为^M,运行时弹出如下错误提示:

代码语言:javascript
复制
metaphlan_to_stamp.pl: /usr/bin/perl^M 解释器错误:没有那个文件和目录

找不到名字为perl^M的解释器,实际应该是用perl做解释器,因为这个是perl脚本。其它语言脚本也会有类似问题,如bash^M, python^M等。

怎么修改呢? 找到这个程序,把\r去掉即可。用下面的命令。

代码语言:javascript
复制
sed -i 's/\r//' metaphlan_to_stamp.pl

代码语言:javascript
复制
# 这是看到什么替换什么
# 但需要注意^M 不是^加 M,而是一个字符
# ^M的输入方式是 先按快捷键ctrl+v,再按快捷键ctrl+m,稍微麻烦一些
sed -i 's/^M//' metaphlan_to_stamp.pl

有时不如果知道程序在什么地方,可以用which返回脚本的路径,直接替换

代码语言:javascript
复制
sed -i 's/\r//' `which metaphlan_to_stamp.pl`

Winddows 的数据传到 Linux不能匹配

我们在做数据提取时,尤其是用awk时,也会遇到这样诡异的问题,代码没问题,测试数据也没问题,换上真实数据就是匹配不出来。

这时别着急,用cat -A filename查看下文件里面有没有特殊字符。也许是因为文件夸了系统捣的鬼。

像下面这个数据最后一列切出来的字符是Cancer^M而不是Cancer;如果用Cancerkey去匹配信息,是匹配不到的。

代码语言:javascript
复制
SampleID^IGroup^M$
C1^ICancer^M$
C2^ICancer^M$

Linux 的数据传到 Windows 打开不换行

Linux 生成的文件,传到 windows,如果用记事本打开,会出现都在一行的情况。尽量不要用记事本,装一个文本查看器,UltraEdit、Notepad 之类的。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-04-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信宝典 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Winddows 的程序传到 Linux不能运行
  • Winddows 的数据传到 Linux不能匹配
  • Linux 的数据传到 Windows 打开不换行
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档