今天在处理工作时,需要将结果从hive读出,并保存为csv格式,然后下载。可以下载后用excel打开发现出现乱码,非我想要的。
参考了https://blog.csdn.net/zhuzuwei/article/details/80890007的博文,在此表示感谢。
我们看下pandas官网对参数encoding 的解释,默认为utf-8,就是说 在我们不给指定时,就已经默认选择了utf-8编码格式。
这里我使用的是代码格式为utf_8_sig
df.to_csv("data.csv",encoding="utf_8_sig")
此处待完善和进一步理解。