我准备用Pandas的read_fwf导入固定宽度的文本文件,我的数据是以下格式(文件名:test.txt):
111 222 333 线性代数 12345698778998
232 444 234 概率论 12345698778998
我的代码:
import pandas as pd
w = [4,4,4,30,14]
df = pd.read_fwf(r'G:\test.txt',widths=w,encoding='ansi',header=None)
导入后的结果,有中文的字段出现错位:
本来一个汉字是2个字节,加上后面的空格刚好30个字节,但感觉read_fwf是把汉字当做1个占位符,因此出现以上错位的情况,不知怎么才能解决这个问题?
相似问题