有没有可能在不转换csv的情况下,在parquet中转换xlsx excel文件?问题是,我有许多excel文件,每许多张,我不想转换每张在csv,然后在拼花,所以我想知道有没有一种方法可以直接转换excel到拼花?或者,有没有办法用nifi做到这一点?我想使用python脚本这样做。
def csv_from_excel():
wb = xlrd.open_workbook('your_workbook.xls')
sh = wb.sheet_names()
for i in sh:
sh = wb.sheet_by_name(i)
your_csv_file = open('your_csv_file.csv', 'wb')
wr = csv.writer(your_csv_file, quoting=csv.QUOTE_ALL)
for rownum in xrange(sh.nrows):
wr.writerow(sh.row_values(rownum))
your_csv_file.close()
`
发布于 2018-12-20 08:15:11
从Nifi的角度来看,这里有两个有趣的问题:
在利用XLSX processor时,这应该不会太困难,但是如果您的情况稍微复杂一点,this elaborate HCC article可能会有所帮助。
这部分很简单,有了PutParquet processor,Nifi就可以直接写拼花了。
https://stackoverflow.com/questions/45368526
复制相似问题