如何在python pyspark中使用pivot进行变换

文章/答案/技术大牛

发布

1回答

、

我在excel中有如下数据0 cisc am-01 RSR 11.00 99.72 99.75 99.75 99.83 99.822 cisc am-01 DBRSR 13.00 99.97 99.95 99.95 99.9

浏览 20提问于2020-03-04得票数 0

回答已采纳

1回答

python中基于小波变换的图像融合

、、

如何使用小波变换融合两幅图像。有几种方法可用，如主成分分析，高通滤波，IHS等。我想知道如何使用小波变换进行融合。我知道背后的理论，并想知道如何在Python中实现它。这是一个基于小波变换的图像融合链接

浏览 42提问于2017-03-05得票数 0

1回答

在使用PySpark时，如何在Spark中实现Python数据结构？

、、、

我目前正在自学Spark programming，并试图用PySpark重新编写一个现有的Python应用程序。然而，我仍然对如何在PySpark中使用常规Python对象感到困惑。我了解Spark中的分布式数据结构，如RDD、DataFrame、Datasets、vector等。Spark有自己的转换操作和动作操作，如.map()、.reduceByKey()来操作这些对象。但是，如果我在PySpark中<

浏览 34提问于2017-03-01得票数 1

回答已采纳

1回答

是否将pyspak sql数据写入磁盘并再次读取将加快进一步的处理？

、

Scenario1使用coaelesce将此数据存储在磁盘上，并读取数据again.Improves，这大大提高了进一步转换的性能。问题为什么会出现这种性能改进？

浏览 2提问于2021-07-12得票数 1

回答已采纳

2回答

无法在Apache Spark中使用Pivot

、、、、

我正在尝试在Apache Spark中使用pivot。|User_2|我想要在用户列上进行透视。/hdp/current/spark2-client/python/pyspark/sql/dataframe.py", line 1020, in __getattr__ "'%s' object__name__, name)

浏览 2提问于2018-05-22得票数 0

1回答

如何使用yml文件创建conda环境而没有此错误？

、、、

我遵循教程在AWS上执行PySpark。到目前为止，一切都像本教程一样工作。<<<<<<<<<<<<< File "/Users/macbookair13/anaconda3/lib/python3.71043, in __call__ return func(*args,

浏览 1提问于2019-08-06得票数 0

回答已采纳

2回答

pyspark流媒体是否适合机器学习/科学计算？

、、、

我是spark的新手，不得不写一个流媒体应用程序，它必须执行一些任务，比如快速傅立叶变换和一些机器学习的东西，比如使用svms进行分类/回归等。我想在pyspark中做到这一点，因为python有各种各样的模块，比如numpy，scikit-learn等等。我的问题是，在流媒体应用程序中可以做这样的事情吗？据我所知，spark使用dstream。这些流是否可以转换为numpy数组之类的内容，或者可以作为python函数的输入

浏览 0提问于2017-09-25得票数 0

1回答

我是否需要使用普通的python，除了pyspark，或者pyspark拥有我所需要的所有东西？

、、、

我的公司正转向使用Hadoop & learning进行机器学习。我知道python在库中是非常全面的，但是当我们切换到pyspark时，如果我们需要的东西还没有在pyspark中可用呢？而且，继续使用python可能更容易一些，因为我已经知道了python.So：我可以运行我的普通python代码的火花，但仍然得到所有的好处，如速度？人们是只使用火

浏览 4提问于2017-08-30得票数 0

1回答

如何将索引转换为PySpark* DataFrame？*

、、、

我有一个PySpark DataFrame，类似：------------|201 |efgh ||133 |mnop|mylist = ['abcd', 'ijkl', 'efgh', 'efgh', 'abcd', 'ijkl', 'ijkl'] 我希望使用<

浏览 2提问于2019-08-20得票数 1

回答已采纳

2回答

如何将数据从Google PubSub主题流到PySpark* ( Google上)*

、、、

我可以看到使用简单Python代码的数据：def callback(message): message.ack() future.result() 上面的python代码从Google PubSub主题(使用订阅服务器subscriber_name)接收数据，

浏览 1提问于2018-09-17得票数 1

2回答

Pyspark :在透视表中保留仅为空值的条目

、、、

我正在尝试在PySpark上创建一个枢轴表，它不会删除空值。我的输入表有以下结构：我在Python2下运行体验云中的所有内容，使用Spark2.1。=False) 在PySpark SQL中，我目前正在使用以下命令： ratings_pivot = spark_df.groupBy('monthyear','userId').pivot('movieId

浏览 0提问于2018-01-27得票数 2

回答已采纳

1回答

在3.6之前不支持python* 2和3*

、、

我的代码编译成功，并通过了所有测试用例，但由于推荐错误而陷入困境：我现在该怎么做？

浏览 4提问于2021-12-25得票数 -1

3回答

Spark worker中的python版本与Spark驱动程序不匹配

、、、

例外: worker中的Python2.7版与驱动程序3.5中的版本不同，PySpark无法在不同的次要versions.Please检查环境变量PYSPARK_PYTHON和PYSPARK_DRIVER_PYTHON如何在worker中更改python版本？(我在独立模式下使用Spark )

浏览 62提问于2019-01-10得票数 1

1回答

C#_Using NAudio将实现STFT

、、

:) 最后，利用DTW算法对两种STFT float[]进行了比较我不知道NAudio使用的是什么窗口。这些东西困扰了我很长一

浏览 0提问于2018-04-17得票数 0

回答已采纳

3回答

为什么当我使用IPython运行Pyspark时总是得到错误env: ipython:没有这样的文件或目录

、

我想用IPython运行Pyspark终端。我已经在正确的目录中运行了该命令，如但我最终得到的是env: ipython: No such file or directory 我已经使用brew cask ins

浏览 6提问于2016-01-28得票数 2

回答已采纳

6回答

Spark和/或星火DataFrames中的整形/旋转数据

、、、、

我有以下格式的数据( RDD或)：sqlContext = SQLContext(sc) categories = ['US', 'UK', 'CA']我

浏览 4提问于2015-05-15得票数 25

回答已采纳

1回答

Pyspark 2.4中的GroupedData对象

、

.| 48| Male| No| 我可以通过以下代码在python中对较小的数据集执行此操作- df.groupby(['respID','Serial']).apply(lambdax:x.pivot(columns='VariableName', values='Response')).reset_index().groupby(['respID','Serial']).first() 但是

浏览 24提问于2019-05-02得票数 1

2回答

如何与PySpark、SparkSQL和Cassandra合作？

、、、

我有点困惑于不同的演员在这个故事: PySpark，SparkSQL，卡桑德拉和火星雨-卡桑德拉连接器。在Scala中使用spark-shell，我可以做的很简单val dataframe = cc.sql("SELECT count(*) FROM mytable group by beamstamp") 我需要使用pyspark还是可以自己使用</

浏览 7提问于2016-02-28得票数 1

2回答

PYSPARK_PYTHON适用于部署模式的客户端，而不是部署模式的集群。

、、、、

我试图使用自定义python运行python脚本，并在Enterprise4.2集群上部署--deploy-mode cluster。=/home/biadmin/anaconda2/bin/python2.7 export PYSPARK_DRIVER_PYTHON=/home/biadmin/anaconda2/bin/python2.7PYSPARK</e

浏览 11提问于2016-12-22得票数 3

1回答

如何删除python中Json dict中的节点

、、、

我在python中创建了一个josn，如： "ses_group": { "grp_b": "batric",grp_b": "batric", "grp_ca": "x", "grp_cb&

浏览 10提问于2022-07-19得票数 -2

点击加载更多