前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >spark redis 中碰到java.net.SocketTimeoutException: Read timed out问题的解决

spark redis 中碰到java.net.SocketTimeoutException: Read timed out问题的解决

作者头像
sparkexpert
发布2018-01-09 11:51:07
5.8K0
发布2018-01-09 11:51:07
举报
文章被收录于专栏:大数据智能实战

最近在写入redis的时候,程序跑着跑着会发现碰到这样的问题。

代码语言:javascript
复制
redis.clients.jedis.exceptions.JedisConnectionException: java.net.SocketTimeoutException: Read timed out
    at redis.clients.util.RedisInputStream.ensureFill(RedisInputStream.java:202)
    at redis.clients.util.RedisInputStream.readByte(RedisInputStream.java:40)
    at redis.clients.jedis.Protocol.process(Protocol.java:151)
    at redis.clients.jedis.Protocol.read(Protocol.java:215)
    at redis.clients.jedis.Connection.readProtocolWithCheckingBroken(Connection.java:340)
    at redis.clients.jedis.Connection.getBinaryMultiBulkReply(Connection.java:276)
    at redis.clients.jedis.Connection.getMultiBulkReply(Connection.java:269)
    at redis.clients.jedis.Jedis.lrange(Jedis.java:935)
    at com.redislabs.provider.redis.rdd.RedisListRDD$$anonfun$getLIST$1$$anonfun$3.apply(RedisRDD.scala:98)
    at com.redislabs.provider.redis.rdd.RedisListRDD$$anonfun$getLIST$1$$anonfun$3.apply(RedisRDD.scala:98)
    at scala.collection.TraversableLike$$anonfun$flatMap$1.apply(TraversableLike.scala:241)
    at scala.collection.TraversableLike$$anonfun$flatMap$1.apply(TraversableLike.scala:241)
    at scala.collection.IndexedSeqOptimized$class.foreach(IndexedSeqOptimized.scala:33)
    at scala.collection.mutable.ArrayOps$ofRef.foreach(ArrayOps.scala:186)
    at scala.collection.TraversableLike$class.flatMap(TraversableLike.scala:241)
    at scala.collection.mutable.ArrayOps$ofRef.flatMap(ArrayOps.scala:186)

由于spark采用的是jedis来连接的,因此也就说明是jedis的问题。

针对这一问题,之前直接都是利用

val client = new Jedis(ip, port)的方法,嵌套在dataframe.foreach()中的方式。

由于之前部署是流式的数据处理,所以每次处理间隔都非常短,因此没有任何问题。但是这回为了查看一个数据想缓存到spark的时候,发现了这个BUG。也才具体发现以前程序设置的不合理的地方。

还好,Jedis提供了这种解决方法。

  • public JedisPool(final GenericObjectPoolConfig poolConfig, final String host, final int port, final int timeout)
  • public JedisPool(final GenericObjectPoolConfig poolConfig, final String host, int port, int timeout, final String password, final int database)
  • public JedisPool(final GenericObjectPoolConfig poolConfig, final String host, int port, int timeout, final String password, final int database, final String clientName)

采用这种池化的概念,可以来设置里面的timeout参数,默认是2000。

根据大概程序写入redis的数据量和时长来设置即可。

由于本来写入的数据量大概有7亿多条记录,为了方便,拆分了400个小片断分开写入,再用上述默认设置,也能够通过。

代码片断可以如下:

代码语言:javascript
复制
Jediscommands jediscommands;
JedisPool jedisPool;
JedisPoolConfig config = new JedisPoolConfig()

String ip = "***"
int port = 6379
long timeOut = 2000
代码语言:javascript
复制
String auth = "***"
JedisPool jedisPool = new JedisPool(config,ip,port,timeOut,auth)

Jedis jedis = jedisPool.getResource();

当前,也只可以对JedisPoolConfig进行设置。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017年10月26日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云数据库 Redis
腾讯云数据库 Redis(TencentDB for Redis)是腾讯云打造的兼容 Redis 协议的缓存和存储服务。丰富的数据结构能帮助您完成不同类型的业务场景开发。支持主从热备,提供自动容灾切换、数据备份、故障迁移、实例监控、在线扩容、数据回档等全套的数据库服务。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档