我有100个pdf,但每个pdf有40页,即它没有被处理。实际上,我们正在尝试使用猪Udf??我们可以使用Pig Udf拆分PDF文件吗??
发布于 2016-05-04 19:26:36
不是的。虽然我对Pig不是很熟悉,但它似乎并不了解PDF文件格式,它的目的是存储和分析数据,而不是操作文件。
您可以将Pig与另一个理解PDF的库组合,以便拆分PDF,Pig不是必需的,尽管拆分PDF不是必需的,但这完全取决于使用Pig的工作流/目的。
https://stackoverflow.com/questions/36998435
复制