在使用过程中会用到一些基本的参数,如上代码:
1) dtype='str':以字符串的形式读取文件;
2) nrows=5:读取多少行数据;
3) sep=',:以逗号分隔的方式读取数据;
4) header...3.1、导出到csv/excel中:
df.to_csv('tses.csv', sep=',',columns=['a','b','c'],
na_rep='', header...1) sep=',':输出的数据以逗号分隔;
2) columns=['a','b','c']:制定输出哪些列;
3) na_rep='':缺失值用什么内容填充;
4) header=True:是导出表头...可以导出为csv、text和导出到hive库中,可以添加format格式和追加模式:append 为追加;overwrite为覆盖。...如上即为数据的导入导出方法,笔者在分析过程中,将常用的一些方法整理出来,可能不是最全的,但却是高频使用的,如果有新的方法思路,欢迎大家沟通。