开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >作为火花配对中的关键因素--恩纳姆--引发问题

问作为火花配对中的关键因素--恩纳姆--引发问题
EN

Stack Overflow用户

提问于 2017-05-02 12:56:00

回答 1查看 1.1K关注 0票数 2

当RDD的键是或包含枚举时，PairRDD上的一些操作不能正常工作。

例如，以下星图代码将花费两周的工作日时间，并按工作日计算：

import java.time.DayOfWeek
val weekdays: Seq[(DayOfWeek, Int)] = DayOfWeek.values().map(dow => (dow, 1))
val numPartitions = 2 * weekdays.size
val result = sc
  .parallelize(weekdays ++ weekdays, numPartitions)
  .reduceByKey(_ + _)
  .collect
  .toSeq
println(result)

在输出中，我希望每个工作日(例如，MONDAY)都有计数2，但是在我的集群中，我得到：

WrappedArray(
  (THURSDAY,1), (SATURDAY,1), (WEDNESDAY,2), (SATURDAY,1),
  (MONDAY,2), (TUESDAY,2), (THURSDAY,1), (FRIDAY,2), (SUNDAY,2)
)

如果您在具有单个节点(或将numPartitions设置为1)的集群上运行此操作，则结果是正确的(即所有计数为2)。

校园云服务器 2H2G30元起

云+校园是针对学生用户推出的扶持计划，2核2G云服务器30元起，1核1G云数据库4元起，并享受免费体验6个月云开发

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-05-02 12:56:00

Spark PairRDD的操作(如aggregateByKey()、reduceByKey()、combineByKey() )使用一个可选参数来指定Spark要使用的Partitioner。如果不显式地指定分区，则使用Spark的HashPartitioner，它调用一行的键的hashCode()方法，并使用它将行分配给分区。然而，如果枚举的hashCode()在相同的Java版本上运行，则不能保证在不同JVM进程- even上的hashCode()相同。因此，Spark xyzByKey()操作不能正常工作。

在上面的示例中，输入中有两对(THURSDAY, 1)，每对都在不同的执行器上处理。该示例使用具有14个(= numPartitions)分区的numPartitions。因为(THURSDAY, 1).hashCode() % 14对这两个执行器产生不同的结果，所以这两行被发送到不同的执行器以减少，从而导致不正确的结果。

Bottomline:不对哈希码在不同的JVM进程上不一致的对象使用HashPartitioner。特别是，以下对象不能保证在不同JVM进程上生成相同的哈希代码：

爪哇enum
Scala sealed trait-based enum的：

sealed trait TraitEnum
object TEA extends TraitEnum
object TEB extends TraitEnum

Scala abstract class-based enum的：

sealed abstract class AbstractClassEnum
object ACA extends AbstractClassEnum
object ACB extends AbstractClassEnum

包含上述类型之一的嵌套对象的任何键(并且没有自定义的hashCode()实现)。

但是，Scala case class-based enum具有一致的哈希代码，因此可以安全地使用：

sealed case class CaseClassEnum(…) # “…" must be a non-empty list of parameters
object CCA extends CaseClassEnum(…)
object CCB extends CaseClassEnum(…)

附加信息：

票数 6

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/43747083

复制

相关文章

未识别的网络的原因未识别网络的解决方法

相信会有很多的网友遇到过一个问题，就是明明已经连接了路由器，却显示出一个黄色的小感叹号，互联网就无法正常使用了。再点击开关于网络连接的页面之后会显示未识别的网络。那么在大家遇到这种情况的时候，会如何解决呢？下面就来为大家带来一些实用的解决方法。

用户8739990

2021/07/23

7.3K0

未识别的网络的原因未识别网络的解决方法

JWT-JSON Web令牌的深入介绍

json 网站编程算法存储 https

从桌面应用程序到Web应用程序或移动应用程序，身份验证是几乎所有应用程序中最重要的部分之一。本教程是JWT（JSON Web令牌）的深入介绍，可帮助您了解：

ccf19881030

2020/06/29

2.4K0

JWT-JSON Web令牌的深入介绍

Linux 修改密码出现“鉴定令牌操作错误”

cat ps root shadow 权限

第二种：lsattr /etc/shadow 得到----i--------e- /etc/shadow（文件的隐藏属性，具体不扩展），这里需要将i去掉，用chattr -i /etc/shadow

用户5760343

2022/05/24

8.1K0

JSON Web 令牌（JWT）是如何保护 API 的

json api jwt token web

你可以已经听说过 JSON Web Token (JWT) 是目前用于保护 API 的最新技术。

用户4283147

2022/10/27

2.1K0

不为别的，聊聊react源码的设计理念

渲染 react 网站

以前在看一些开源项目的源码时，比如cornerstone（一种为医学影像服务的web框架），折服于其优秀的设计模式，灵活的工具扩展，丰富的数据结构，在当时阅读和学习这些源码时，都是出于公司业务考虑，只是看懂了个大概，而如今随着编码技能的提高和经验的积累，我发现，源码的背后其实是在阐述一种设计理念，自顶而下，设计思想抽象逐渐落地，落实到每一行代码，同时我也有了进一步的体会，软件架构在某种程度上是为了服务它的设计理念，它的技术平衡点。

用户3986961

2022/03/15

6430

不为别的，聊聊react源码的设计理念

golang--ratelimit令牌桶原理分析

限流对某一时间窗口内高于系统承载的请求进行限制，通过限速来保护系统，一旦达到限制速率则可拒绝服务，等待。常见调用平台及服务，比如微信发消费券服务每秒500qps，万一我们超过请求频次，就会发生意想不到的业务问题，踩过坑的小伙伴深有体会

小许code

2023/02/21

7340

golang--ratelimit令牌桶原理分析

3种常见的Class级别的错误

ClassNotFoundException 很明显，这个错误是找不到类异常，即在当前classpath路径下找不到这个类。 ClassNotFoundException继承了Exception，是必须捕获的异常，所以这个异常一般发生在显示加载类的时候，如下面两种方式显示来加载类并要捕获异常。 public static void main(String[] args) { try { Class.forName("com.User"); } catch (ClassN

Java技术栈

2018/03/30

2.9K0

3种常见的Class级别的错误

如何使用jwtXploiter测试JSON Web令牌的安全性

json web 测试工具渗透测试

关于jwtXploiter jwtXploiter是一款功能强大的安全测试工具，可以帮助广大研究测试JSON Web令牌的安全性，并且能够识别所有针对JSON Web令牌的已知CVE漏洞。 jwtXploiter支持的功能如下：篡改令牌Payload：修改声明和值；利用已知的易受攻击的Header声明（kid、jku、x5u）；验证令牌有效性；获取目标SSL连接的公钥，并尝试在仅使用一个选项的密钥混淆攻击中使用它；支持所有的JWA；生成JWK并将其插入令牌Header中

FB客服

2023/03/30

1.1K0

如何使用jwtXploiter测试JSON Web令牌的安全性

React 错误边界指南

虽然在错误到达生产环境之前捕获错误是理想的，但是其中一些错误（例如网络错误）可能会通过测试而影响用户。如果你的 React 组件没有正确地捕捉到第三方库或 React Hooks 抛出的错误，这样的错误要么导致 React 生命周期崩溃，要么到达主执行线程的顶层，导致“白屏”场景：

用户8921923

2022/10/24

2.5K0

PHP解析json、xml错误

json xml php 编程算法

解析json php内置函数json_decode() 可以解析json字符串但是有的时候看起来正确的json，解析却一直返回null。你知道吗，json是可能解析失败的，此时PHP不会产生提示。我们需要手动通过json_last_error()函数获取 function json_decode_siam($string, $mark = false){ $data = json_decode($string, $mark); switch (json_last_error()) {

宣言言言

2019/12/15

2.5K0

大数据分析：闻香识佳人

　　大数据还是大忽悠？作为科技领域最时髦的词汇之一，大数据(Big Data)带来的机遇究竟有没有被过分炒作？在2013年夏季达沃斯论坛上，这个议题以一场辩论会的形式展开。最终胜出的观点：反方认为，作为热概念，“大数据”正在影响着传统制造业、零售业、金融业、汽车业、物流业，也令研究机构和政府部门大开眼界。　　可视化的大数据才是酷的，好比双目失明的退休中校斯莱德能够闻香识佳人。 “我们不关心你的数据到底有多大，而关心怎么来处理数据，数据开发的结果哪些是软件解决不了的，也就是从大数据中获得一种‘可视化’的意

CDA数据分析师

2018/02/05

5330

给在本机运行的 React 程序配置 HTTPS

https 网络安全 npm react javascript

如果用 create-react-app 构建一个程序，并且在本地运行，默认情况下会用 HTTP 协议为该程序提供服务。而在生产环境中运行的程序都用 HTTPS 进行服务。

疯狂的技术宅

2020/11/03

2.9K0

给在本机运行的 React 程序配置 HTTPS

动态令牌_创建安全令牌

数据加密服务编程算法 html python https

HMAC-based One-Time Password 简写，表示基于 HMAC 算法加密的一次性密码。是事件同步，通过某一特定的事件次序及相同的种子值作为输入，通过 HASH 算法运算出一致的密码。

全栈程序员站长

2022/11/17

1.5K0

本机未装Oracle数据库时Navicat for Oracle 报错：Cannot create oci environment 原因分析及解决方案

因为要更新数据库加个表，远程桌面又无法连接。。。所以就远程到另外一台电脑，然后用navicat通过内网修改目标数据库。

木子墨

2018/09/13

2.9K0

本机未装Oracle数据库时Navicat for Oracle 报错：Cannot create oci environment 原因分析及解决方案

Rest API: Json参数格式错误时显示Json原文

json 编程算法 http

一开始想寻找其他方式，当抛出异常的时候，就从HttpServletRequest读取body内容。但是做不到，因为在做Json读取的时候，InputStream已经被读取了，无法再次获取到body内容。所以只能通过自定义MessageConverter的方式。

十毛

2019/03/27

1.9K0

编程算法 python windows

在入侵过程中，令牌盗窃和用户冒充可以提供很大帮助，节省我们大量时间并帮助我们尽可能保持隐秘，仅使用 Microsoft Windows 操作系统本身提供的功能和工具。

Khan安全团队

2022/01/18

1.3K0

【React 错误处理】 ---- Error: Minified React error #185；

render setstate 生命周期

1. 报错信息 Error: Minified React error #185; visit https://reactjs.org/docs/error-decoder.html?invarian

Rattenking

2022/01/06

3.2K0

【React 错误处理】 ---- Error: Minified React error #185；

React 17 要来了，非常特别的一版

api react javascript

React 最近发布了v17.0.0-rc.0，距上一个大版本v16.0（发布于 2017/9/27）已经过去近 3 年了

ayqy贾杰

2020/08/25

1.6K0

React 17 要来了，非常特别的一版

【深度知识】JSON Web令牌(JWT)的原理，流程和数据结构

json 编程算法 html php 网站

JSON Web Token（缩写 JWT）是目前最流行的跨域认证解决方案，本文介绍它的原理，用法和详细的数据结构。

辉哥

2019/07/10

29K0

【深度知识】JSON Web令牌(JWT)的原理，流程和数据结构

点击加载更多

相似问题

JSON分析错误: react本机中未识别的令牌“<”

12

响应本机JSON分析错误:无法识别的令牌'<‘

11

JSON分析错误:角中未识别的令牌“<”

24

如何解决警告"JSON分析错误:未识别的令牌'<'"？

12

JSON解析错误:未识别的令牌<

23

活动推荐

提供高质量视频生成与处理服务，效果专业

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例