开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >spark:对RDDs进行加扰并压缩

问spark:对RDDs进行加扰并压缩
EN

Stack Overflow用户

提问于 2016-12-02 20:34:19

回答 2查看 129关注 0票数 0

我有两个相同长度的RDD，我想随机地将它们压缩在一起(例如，第一个RDD是(A，B，C，D)，第二个是(W，X，Y，Z)，我想要一个随机的zip，比如(AX，BZ，CW，DY)。使用pySpark实现这一点的快速方法是什么？

EN

回答 2

Stack Overflow用户

发布于 2016-12-02 21:07:23

这是你需要的吗？

x = sc.parallelize(['A','B','C','D'])
y = sc.parallelize(['W','X','Y','Z'])
x = x.takeSample(False, 4)
y = y.takeSample(False, 4)
combine = zip(x,y)
combine
>> [('D', 'Z'), ('B', 'X'), ('A', 'W'), ('C', 'Y')]

票数 0

EN

Stack Overflow用户

发布于 2016-12-04 19:53:08

您可以：

from pyspark.sql.functions import rand

s = lambda x: (x[1], x[0])

def shuffle(rdd):
    return rdd.map(lambda x: (x, )) \
              .toDF(["data"]).withColumn("rand", rand()) \
              .orderBy("rand") \
              .rdd.map(lambda x: x.data)

shuffle(rdd1).zipWithIndex().map(s).join(rdd2.zipWithIndex().map(s)).values()

票数 0

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/40940407

复制

相关文章

使用OpenCV加载TensorFlow2模型

opencv tensorflow github git 开源

Suaro希望使用OpenCV来实现模型加载与推演，但是没有成功，因此开了issue寻求我的帮助。

小白学视觉

2020/12/07

1.8K0

使用OpenCV加载TensorFlow2模型

干货 | tensorflow模型导出与OpenCV DNN中使用

opencv tensorflow 迁移学习 api python

Deep Neural Network - DNN 是OpenCV中的深度神经网络模块，支持基于深度学习模块前馈网络运行、实现图像与视频场景中的

OpenCV学堂

2019/04/29

5K0

干货 | tensorflow模型导出与OpenCV DNN中使用

【tensorflow速成】Tensorflow图像分类从模型自定义到测试

tensorflow kernel bash bash 指令

TensorFlow 是 Google brain 推出的开源机器学习库，与 Caffe 一样，主要用作深度学习相关的任务。

用户1508658

2019/07/25

7230

【tensorflow速成】Tensorflow图像分类从模型自定义到测试

TensorFlow 2.0 - 自定义模型、训练过程

tensorflow pytorch 模型

文章目录 1. 自定义模型 2. 学习流程学习于：简单粗暴 TensorFlow 2 1. 自定义模型重载 call() 方法，pytorch 是重载 forward() 方法 import tensorflow as tf X = tf.constant([[1.0, 2.0, 3.0],[4.0, 5.0, 6.0]]) y = tf.constant([[10.0],[20.0]]) class Linear(tf.keras.Model): def __init__(self):

Michael阿明

2021/02/19

9570

在tensorflow2.2中使用Keras自定义模型的指标度量

keras tensorflow api 神经网络

使用Keras和tensorflow2.2可以无缝地为深度神经网络训练添加复杂的指标

deephub

2020/07/07

2.6K0

在tensorflow2.2中使用Keras自定义模型的指标度量

TensorFlow中滑动平均模型介绍

其中a的取值范围[0,1]，具体就是：本次滤波结果=(1-a)*本次采样值+a*上次滤波结果，采用此算法的目的是：

老潘

2018/06/21

1.6K0

TensorFlow中滑动平均模型介绍

TensorFlow 目标检测模型转换为 OpenCV DNN 可调用格式

tensorflow 图像识别存储 opencv api

在 OpenCV4.X 版本(OpenCV3.4.1之后版本) 可以采用 cv2.dnn.readNetFromTensorflow(pbmodel, pbtxt) 函数直接调用 TensorFlow 训练的目标检测模型.

AIHGF

2019/05/13

2.5K0

TensorFlow 目标检测模型转换为 OpenCV DNN 可调用格式

opencv3.3+TensorFlow

anaconda numpy python 腾讯云测试服务

2、下载opencv_python3.3.0cp35cp35mwin_amd64.whl或...win32.whl，

py3study

2020/01/08

3990

微信小程序|调用tensorflow自定义模型

html5 tensorflow javascript python ide

在成功调用官网打包好的tensorflowjs模型后，怎么调用自己的模型呢？又需要做哪些处理呢？

算法与编程之美

2020/06/17

2.7K0

[Tensorflow] Tensorflow中模型保存与回收的简单总结

今天要聊得是怎么利用TensorFlow来保存我们的模型文件，以及模型文件的回收（读取）。刚开始接触TensorFlow的时候，没在意模型文件的使用，只要能顺利跑通代码不出bug就万事大吉，但是随着接触的数据量的增加以及训练时间的增长，万一中间由于各种原因（比如显卡线断了，电源线断了，手残点了X。。。，恩，没错都是我遇到的问题… ./摊手.sh）意外中断，而没有保存模型文件，那一刻想屎的心都有了。那么问题来了，我们需要重头开始训练模型吗，答案肯定是不用的，当然前提是保存了模型文件。首先说一下这个模型文

用户1622570

2018/04/11

1.2K0

[Tensorflow] Tensorflow中模型保存与回收的简单总结

Tensorflow + OpenCV4 安全帽检测模型训练与推理

tensorflow api opencv https github

如何安装tensorflow object detection API框架，看这里：

OpenCV学堂

2020/09/08

2.5K0

Tensorflow + OpenCV4 安全帽检测模型训练与推理

在已经配置了Tensorflow的虚拟环境中配置Opencv

opencv tensorflow

在开发环境里面已经安装了tensorflw，但是有时候需要进行底层图像处理，需要配置opencv，下面介绍在虚拟环境中配置opencv的方法。

狼啸风云

2019/01/18

8550

使用TensorFlow物体检测模型、Python和OpenCV的社交距离检测器

tensorflow https opencv http 网络安全

疫情期间，我们在GitHub上搜索TensorFlow预训练模型，发现了一个包含25个物体检测预训练模型的库，并且这些预训练模型中包含其性能和速度指标。结合一定的计算机视觉知识，使用其中的模型来构建社交距离程序会很有趣。

小白学视觉

2020/07/22

1.4K0

使用TensorFlow物体检测模型、Python和OpenCV的社交距离检测器

使用OpenCV+Tensorflow跟踪排球的轨迹

https 网络安全深度学习人工智能神经网络

我是个排球迷，所以让我们来看看最后一个网站，这是一个奥地利研究所的网站，他分析了当地业余联赛的比赛数据。

小白学视觉

2020/09/22

1.6K0

使用OpenCV+Tensorflow跟踪排球的轨迹

2.1 TensorFlow模型的理解

tensorflow 编程算法数据结构

版权声明：本文为博主原创文章，未经博主允许不得转载。python版本为python3，实例都是经过实际验证。 https://blog.csdn.net/jinxiaonian11/article/details/82984443

锦小年

2019/05/26

9860

tensorflow版的bvlc模型

研究相关的图片分类，偶然看到bvlc模型，但是没有tensorflow版本的，所以将caffe版本的改成了tensorflow的: 关于模型这个图：下面贴出通用模板： 1 from _

Gxjun

2018/03/27

6960

tensorflow版的bvlc模型

tensorflow的模型持久化

tensorflow 编程算法 html 数据结构 javascript

tensorflow提供了一个非常简单的API来保存和还原一个神经网络模型。这个API就是tf.train.Saver类。以下代码给出了保存tensorflow计算图的方法。

狼啸风云

2019/03/06

1.9K0

干货 | TensorFlow 2.0 模型：Keras 训练流程及自定义组件

keras 小程序 api https 网络安全

在上一篇文章中，我们介绍了循环神经网络的建立方式。本来接下来应该介绍 TensorFlow 中的深度强化学习的，奈何笔者有点咕，到现在还没写完，所以就让我们先来了解一下 Keras 内置的模型训练 API 和自定义组件的方法吧！本文介绍以下内容：

AI研习社

2019/10/22

3.3K0

【tensorflow】模型加载

.load() 只能加载.npy文件，.restore() 只能加载 ckpt（checkpoint）文件。

JNingWei

2020/04/25

1.3K0

Django 模型中自定义Manager和模型方法

django 数据库 sql

在语句Book.objects.all()中,objects是一个特殊的属性,通过它来查询数据库,它就是模型的一个Manager. 每个Django模型至少有一个manager,你可以创建自定义manager以定制数据库的访问. 这里有两个方法创建自定义manager:添加额外的manager;修改manager返回的初始Queryset.

菲宇

2019/06/13

2.8K0

相似问题

OpenCV - Tensorflow模型导入错误

22

不能在OpenCV中应用tensorflow模型

11

加载自定义模型时，Tensorflow keras模型对opencv错误的影响(C++)

17

如何使用opencv dnn模型加载tensorflow的预训练模型

10

使用Opencv对tensorflow模型进行评估失败

12

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例