首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >将xlsx转换为parquet

将xlsx转换为parquet
EN

Stack Overflow用户
提问于 2017-07-28 16:27:43
回答 1查看 3.3K关注 0票数 4

有没有可能在不转换csv的情况下,在parquet中转换xlsx excel文件?问题是,我有许多excel文件,每许多张,我不想转换每张在csv,然后在拼花,所以我想知道有没有一种方法可以直接转换excel到拼花?或者,有没有办法用nifi做到这一点?我想使用python脚本这样做。

代码语言:javascript
复制
def csv_from_excel():

wb = xlrd.open_workbook('your_workbook.xls')
sh = wb.sheet_names()
for i in sh:
    sh = wb.sheet_by_name(i)
    your_csv_file = open('your_csv_file.csv', 'wb')
    wr = csv.writer(your_csv_file, quoting=csv.QUOTE_ALL)

    for rownum in xrange(sh.nrows):
        wr.writerow(sh.row_values(rownum))

    your_csv_file.close()
`
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-12-20 08:15:11

从Nifi的角度来看,这里有两个有趣的问题:

  1. 是否可以提取此Excel?

在利用XLSX processor时,这应该不会太困难,但是如果您的情况稍微复杂一点,this elaborate HCC article可能会有所帮助。

  1. 可以写入拼花吗?

这部分很简单,有了PutParquet processor,Nifi就可以直接写拼花了。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45368526

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档