首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >如何在spark应用中验证orc矢量化是否有效?

如何在spark应用中验证orc矢量化是否有效?
EN

Stack Overflow用户
提问于 2018-05-23 13:09:48
回答 1查看 1.4K关注 0票数 1

我已经在我的spark streaming应用程序中启用了以下列出的配置,但我无法推断设置这些参数后的性能优势,如果你们中的任何一个知道任何方法来验证矢量化是否按预期/正确启用!

注意:我正在使用Spark 2.3,并将我的应用程序中的所有数据转换为原生orc格式1.4版本。

代码语言:javascript
复制
sparkSqlCtx.setConf("spark.sql.orc.filterPushdown", "true") 
sparkSqlCtx.setConf("spark.sql.orc.enabled", "true") 
sparkSqlCtx.setConf("spark.sql.hive.convertMetastoreOrc", "true") 
sparkSqlCtx.setConf("spark.sql.orc.char.enabled", "true") 
sparkSqlCtx.setConf("spark.sql.orc.impl","native") 
sparkSqlCtx.setConf("spark.sql.orc.enableVectorizedReader","true") 
EN

回答 1

Stack Overflow用户

发布于 2018-08-18 02:47:38

您需要进行如下设置

代码语言:javascript
复制
spark.sql("set spark.sql.orc.impl=native")

您可以使用以下命令进行确认

代码语言:javascript
复制
spark.sql("set spark.sql.orc.impl").show
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50480236

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档