我有一个有3列的标签分隔的文本文件。
在某些列中,我要删除单个或多个空格。但我希望保持每一列与换行符之间的制表符分隔。
我试过了
perl -lape 's/\s+//sg
但这删除了所有空白空间,也删除了制表符空间。
我的档案看上去像这样
col1 col2 col3
1 test test
2 test test
3 test test
我想要
col1 col2 col3
1 test test
2 test test
3 test test
所以我只想保留不同列之间的表空间,而不是单个
嗨,我试图粘贴多个文件(每个文件都有一个列,但行数不同)。
paste file1.txt file2.txt paste3.txt ... paste100 > out.txt
输入文件1:
A
B
C
输入文件2:
D
E
输入文件3:
F
G
H
I
J
产出:
A D F
B E G
C H
I
J
当我从-f2文件中删除第2列(裁剪out.txt )时,它给列2提供了3行空行(可能是因为列有5行,所以为了与第3列匹配,它创建了额外的2行空行)。第1列(较少的out.txt _ -f1)也是如此,它提供了2个空行。知道它
我有一个像这样的文本文件:
A one two three
B four five six
每个都用制表符分隔。
我希望每个选项卡都有一个换行符,但保留第一列,例如:
A one
A two
A three
B four
B five
B six
插入像我知道的新行(awk '{$1=$1} 1‘FS="\t“OFS="\n")不会保留我的第一列
有人能帮我改一下我的档案吗?
我有两个文件,一个比is文件(有249430行),其他的比第一个(500行)小。
第一个文件有这五列和其他列(前五列在第二个文件中相同),例如
#CHROM POS ID REF ALT QUAL INFO
chr2 32424454 rs4576493 T G pass ......
chr8 35578788 rs3686678 C A pass .........
chr8 3557
我有一个文本文件,我想分隔每一列。但整个文本被pandas视为一列: 6/1/2018 12:01:11.490 AM HEP.U02.OIL.GOV.P2_RUN <Unit #2>No.2 oil pump
runing On
6/1/2018 12:01:19.383 AM HEP.COM.WAT.DRN.P1_CRTL Control No.1 drainage
pump On
6/1/2018 12:01:19.384 AM HEP.COM.WAT.DRN.P1_RUN No.1 drainage pum
我有一个带制表符分隔符的文本文件,我正在尝试将第一列打印为id,并将剩余的字符串数组打印为第二列名称。
下面是要加载的文件:
cat file.txt;
1 A B
2 C D E F
3 G
4 H I J K L M
在上面的文件中,第一列是id,其余是名称。
我应该得到如下输出:
id names
1 A,B
2 C,D,E,F
3 G
4 H,I,J,K,L,M
如果名称使用分隔符,拆分,那么我将使用以下命令获得输出:
test
我有一个带有一些列的选项卡分隔的文本文件。对于某些行,特定列的值(即字符串)的末尾有一个反斜杠,这会导致问题,而我希望将这些数据导入到PostgreSQL数据库。我希望将该反斜杠从该列的字符串值的末尾移除,该反斜杠用于所有拥有反斜杠的行。我该怎么做?
例如,在这一行中,如您所见,在第二列末尾有一个反斜杠。
862B25B3 Making Large-Scale Nystr{\ making large scale nystr 2010 2010 international conference on machine learning icml
我正在尝试加载一个包含两列的文本文件:第一列被标记为"date“,它是一个字符串值(即'12/31/19‘、'1/1/20’等)。第二列是与日期对应的值(整型)。 当我尝试使用np.loadtxt时,我得到错误:ValueError: could not convert string to float: '12/31/19' 因此,我尝试使用Pandas和read_csv打开该文件。但我最终得到了一张像this这样的桌子。我尝试将这两列彼此分开,并将每列的值放入两个单独的数组中。有没有另一种简单的方法来打开txt文件,该文件包含字符串格式的值并将其放入
我试图将索引列添加到csv文件中。我不能使用熊猫,因为我的文件太大了,它不能读取整个数据。
我试过这样做;
with open('test.csv') as infile, open('sample_.csv', 'w') as outfile:
for idx, line in enumerate(infile):
outfile.write(f'{idx} {line}')
这确实给了我一个列,但是,索引列将与已经存在的第一列合并。
with open("data3.txt") as f:
data = f.read()
data = data.split('\n')
x = [row.split(' ')[0] for row in data]
y = [row.split(' ')[1] for row in data]
我需要读取数据文件(这是一个文本文件,列由制表符分隔),但我无法使用上面的代码读取它,在上面的代码中,我复制了.txt文件中的‘制表符’间距,并将其直接粘贴到代码中。这种情况没有发生的原因是什么?
我已将分隔的制表符导入到excel中。我从Oracle数据库转储了一个数据类型为VARCHAR2(255)的列。
列中格式化的数据具有如下数据:(冒号分隔值)
info 1: info 2: info 3
在将文件导入到excel worksheet后,我有一些记录的格式有问题。基本上就是冒号之间的空格,导致了制表符的问题。
不好的记录应该是这样的。记录导入,但数据在电子表格中未对齐。
info<...whitespace here...>1: info 2: info 3
在Oracle语法和sql中,有没有一种方法可以让我以某种方式选择该列并删除嵌入的空格,这样它就不会破坏我的