decode byte 0xe7 in position 63897: invalid continuation byte
Log的意思是,UTF-8的解码器无法处理字符0xe7
最后的解决方案是使用latin...ASCII编码
学编程的时候,ASCII是最早介绍的字符编码.
标准ASCII使用7位二进制数,因为一个字节占8位,所以在第一位补0形成8位....0x是16进制,用二进制表示就是1110 0111,十进制是231.
对照ASCII码,7位一共128个字符,231明显超过了128,所以对于ASCII编码来说,它并不认识0xe7....1110 0111,占2字节,对比UTF-8的2字节,第三位就不一样,所以0xe7不属于UTF-8的格式,因此无法解码....Latin-1属于单字节编码,最多能表示0-255的范围,即$2^8$,所以0xe7就在它的表示范围内,因此可以解码.