首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >XmlInputFormat的拆分是否总是包含元素的开始标记和结束标记?

XmlInputFormat的拆分是否总是包含元素的开始标记和结束标记?
EN

Stack Overflow用户
提问于 2014-11-15 16:09:12
回答 1查看 134关注 0票数 0

我想知道如何处理包含多个拆分的Xml文件。谁负责将Xml元素的开始标记和结束标记放在同一个拆分中?是XmlInputFormat的责任还是在HDFS上创建Xml文件的程序的责任?

最好的,泡菜

EN

回答 1

Stack Overflow用户

发布于 2014-11-16 06:58:26

XMLInputFormat要求您分别使用xmlinput.startxmlinput.end指定开始标记和结束标记。一旦为XMLInputForamt指定了开始和结束标记,XMLInputForamt的RecordReader就能够确定记录边界。

作为参考,请看一下XMLInputFormat的代码。

因此,在HDFS中创建XML文件的程序不必执行任何操作。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/26943914

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档