我试图将它们与Python pandas连接起来,但当调用pd.read_csv时,这些文件的各种编码都会导致问题,我不确定将它们转换为一致编码的最佳方法是什么,例如utf-8。这些编码包括Little-endian UTF-16Unicode English text, with CRLF lineterminators
Little-endian UTF-16Unicode text, with CR
我知道这个问题有相当多的解决方案,但我的解决方案很特殊,因为我可能会得到截断的utf16数据,但必须尽最大努力处理使用UnicodeDecodeError解码和编码将失败的转换。所以用python写出了下面的代码。请让我知道你的意见,我可以如何改善他们,以加快处理。print("Little-Endian format, UTF-16")
leAscii = "".join([(unicode[i]) for i in range(return leA