腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
用
map
并行
化
for
循环
,
用
pyspark
并行
化
reduce
python
、
apache-spark
、
pyspark
现在,我正在使用一个for
循环
。但我有一种感觉,使用
pyspark
中的
map
和
reduce
函数可以更有效地完成这项工作。下面是我的代码:from
pyspark
.sql import SQLContext, GroupedDatarid of date_string = datetime.strftime(dt, '%Y-%m-%d'
浏览 0
提问于2016-08-24
得票数 3
1
回答
Spark实现Scala的
并行
交叉验证
scala
、
apache-spark
、
cross-validation
、
apache-spark-ml
Pyspark
提供了一个很大的可能性,可以通过将模型的交叉验证
并行
化
,简单地
用
我如何才能实现类似的功能,斯派克的ScalaCrossValidator,即
并行
化
每一个折叠?
浏览 1
提问于2017-01-05
得票数 3
回答已采纳
1
回答
Spark:如何将pairRdd的值转换为Rdd?
apache-spark
、
pyspark
1,2,3]},{'f':[1,2]}])
reduce
_rdd= pair_rdd.reduceByKey(lambda x,y: x+y) 输出结果: [('f', [1, 2, 3, 1, 2])] 因为
reduce
_rdd的值可能非常大,所以我想
并行
reduce
_rdd
reduce
_rdd.
浏览 14
提问于2020-07-02
得票数 1
回答已采纳
1
回答
TensorFlow中张量运算的
并行
化
python
、
tensorflow
、
gpu
我正在尝试
并行
不同的张量操作。我知道tf.vectorized_
map
和/或tf.
map
_fn可以相对于第一个轴
并行
输入张量,但这不是我想要的。我正在寻找一种方法来
并行
化
一组可能具有不同形状的张量上的for
循环
。for t in list_of_tensors:有没有可能在GPU上
用
TensorFlow
并行
浏览 3
提问于2021-07-07
得票数 1
1
回答
用
PySpark
实现程序
并行
化
python
、
apache-spark
、
parallel-processing
、
pyspark
我对
PySpark
还是个新手,我正在寻找如何用
PySpark
并行
化
一个简单的程序。我没有找到一个Spark转换,可以正确地进行这种处理。 我想要做的处理方法是过滤一个非常大的有序向量/列表的一些数值。该程序在“经典”Python中实现非常简单,但需要使用Spark
并行
化
非常快速地获得结果。
浏览 1
提问于2018-01-20
得票数 0
6
回答
"MapReduce“中"
Reduce
”的
并行
化
multithreading
、
optimization
、
map
、
multicore
、
reduce
我理解
Map
是如何很容易
并行
化
的--每台计算机/CPU只能在阵列的一小部分上运行。
Reduce
/foldl是可
并行
的吗?似乎每个计算都依赖于前一个计算。它只对某些类型的函数可
并行
化
吗?
浏览 1
提问于2008-11-30
得票数 10
回答已采纳
1
回答
如何
并行
化
python/
pyspark
中的for
循环
(潜在地跨Amazon服务器上的多个节点运行)?
python
、
amazon-web-services
、
parallel-processing
、
pyspark
、
mapreduce
我有一些计算密集型的代码,可
并行
化
得令人尴尬。伪代码如下所示。因此,我希望通过将计算分散到亚马逊上运行的500个独立节点来
并行
运行n=500迭代,将内部
循环
的运行时间缩短到大约30秒。我该怎么做呢?我假设
PySpark
是标准的框架,Amazon EMR是相关的服务,可以让我在多个节点上
并行
运行。所以我的问题是:我应该如何增强上面的代码,以便使用
PySpark
框架在亚马逊服务器上的500个
并行
节点上运行?或者,有没有不同的框架和/或Amazon
浏览 52
提问于2019-06-02
得票数 1
1
回答
用
Pyspark
并行
化
HTTP请求
python
、
apache-spark
、
pyspark
我正在使用
pyspark
进行一些数据转换:如下所示: .option("dbtable"driver", "org.apache.phoenix.jdbc.PhoenixDriver") \objRDD = df_systems_tree_users.rdd.
map
我的问题是如何优化代码以高效地
并行
化
我的ht
浏览 0
提问于2017-08-31
得票数 3
1
回答
如何使用
PySpark
并行
化
我的文件处理程序
apache-spark
、
for-loop
、
pyspark
、
parallel-processing
对于在这个For
循环
中遍历的每个文件,我都调用了一个函数parse_file(...)它解析该文件并调用一系列处理该文件的其他函数。整个项目运行起来需要几分钟时间,这很慢,而且驱动程序还没有使用太多的
PySpark
。问题是每个parse_file(...)在文件级,for
循环
是按顺序执行。是否可以使用
PySpark
并行
化
文件级for
循环
来运行parse_file(...)对所有这些文件
并行
执行函数,以减少程序执行时间并提高效率?如果是这样的话,由于程序
浏览 2
提问于2020-06-04
得票数 1
1
回答
优化LBFGS OWLQN实现
apache-spark
、
apache-spark-mllib
、
apache-spark-ml
我正在寻找有关在Spark1.6ML库中实现
并行
LBFGS和OWLQN算法的文档。我为1.6:找到了这个页面,但没有任何关于
并行
化
的内容最后,我阅读了代码link1。该方法似乎使用Breeze优化模型,但我找不到火花函数的调用位置(
map
、flatMap、
reduce
、.)。在代码link2中,
map</
浏览 2
提问于2016-08-01
得票数 2
回答已采纳
1
回答
用
OpenMP实现嵌套
循环
的
并行
化
c++
、
parallel-processing
、
nested
、
openmp
我试图
用
OpenMP在我的代码中
并行
化
以下
循环
pot2body=0.0; CEnergymulti::calculatePot(vector<CMolecule*> m_mols) ...schedule(dynamic)
浏览 3
提问于2013-04-09
得票数 1
回答已采纳
1
回答
Spark文档:添加列表元素的简单示例
python
、
apache-spark
、
lambda
、
mapreduce
我正在学习Spark,偶然发现了文档中关于
并行
化
集合的部分。我
用
python复制了文档中的以下代码,以执行
Reduce
步骤:datapar = sc.parallelize(data) result = datapar.
reduce</e
浏览 9
提问于2016-07-15
得票数 0
回答已采纳
0
回答
将
pyspark
2.2.0数据帧分区写入S3
并行
化
dataframe
、
amazon-s3
、
parallel-processing
、
pyspark
开始使用
pyspark
,遇到了我
用
代码创建的瓶颈:问题是,
循环
使处理成为串行的显然,
浏览 4
提问于2017-12-10
得票数 0
2
回答
R-
并行
化
多模型学习(使用dplyr和purrr)
r
、
parallel-processing
、
dplyr
、
purrr
用
例是,我对每个主题都有多个观察,我想为每个主题训练一个模型。关于如何做到这一点,请参阅Hadley的。purrr:library(dplyr)dt %>%
map
$observation, "norm")) 因此,由于建模是一个令人尴尬的
并行
任务,我想知道dplyr、purrr是否有一种很容易使用的
并行
化
机制(比如
并行
浏览 2
提问于2016-07-07
得票数 16
回答已采纳
2
回答
对串行算法进行
并行
化
algorithm
、
mapreduce
、
parallel-processing
、
distributed-computing
、
text-mining
嘿,朋友们,Queue<Element>; 有没有办法让像这样的串行算法
并行
化
?我正在尝试想一种反馈机制,能够提供自己的输入,但是如何将其
并行
化
呢? 感谢您的帮助/意见
浏览 0
提问于2012-05-02
得票数 3
1
回答
如何使用prefect“How”
并行
化
嵌套
循环
prefect
我正在尝试弄清楚如何使用prefect
并行
化
嵌套
循环
,这需要在外部扇出/输入内进行内部扇出/输入。如果我在外部
循环
上使用
map
(),然后将也使用
map
()的外部
循环
计算的一些结果传递给unmapped()中的内部
循环
,这是否会创建内部扇出?那么我如何做一个"partial
reduce
“来在外部
循环
中使用内部
循环
的结果呢? 一个指针或例子将是非常感谢的。
浏览 9
提问于2020-06-15
得票数 2
回答已采纳
3
回答
混合Boost FOREACH宏和OpenMP
并行
化
c++
、
boost
、
foreach
、
openmp
我目前有一段代码(
用
C语言编写),它的外部
循环
是OpenMP
并行
化
的(它在本地对共享内存列表进行操作)。我
用
C++重写了它,并且我发现BOOST_FOREACH宏是一种非常好的语法,作为
循环
构造,用于迭代列表、数组等。 我的问题是:有没有办法既可以使用这种语法,又可以像OpenMP那样
并行
化
循环
?
浏览 3
提问于2010-11-22
得票数 6
回答已采纳
3
回答
布尔值的流,是否为真?
java
、
lambda
、
parallel-processing
、
java-8
、
java-stream
我想要
并行
化
以下使用parallelStream截取的代码: for (Element e : setOfE) { } return false;以下操作是否适用于
并行
流,并使用常规短路评估?setOfE.parallelStream().
map
(e -> eval(e)).
reduce
(false, (a,b) -> a || b))
浏览 0
提问于2014-10-11
得票数 57
回答已采纳
1
回答
映射化简以计算奇异值分解( SVD )
hadoop
、
mapreduce
是否可以
并行
化
SVD计算,例如使用Hadoop的
MAP
REDUCE
?你能提供一个简单的例子吗?
浏览 4
提问于2011-02-20
得票数 2
回答已采纳
1
回答
Intel TBB禁用嵌套
并行
c++
、
parallel-processing
、
openmp
、
tbb
考虑以下场景:我正在编写一个函数,其中有一个计算密集型
循环
。我
用
TBB的parallel_for
并行
化了它。现在,问题是这个函数可以单独使用,并且可以从
并行
化
中获益。或者它可能在另一个
循环
中使用。在后一种情况下,外部
循环
也可以
并行
化
。而且,通常情况下,最好只
并行
化外部
循环
。 通常,在TBB
并行
化
中,外部和内部
循环
都不是问题,因为与OpenMP不同
浏览 8
提问于2015-06-02
得票数 3
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
即时通信 IM
活动推荐
运营活动
广告
关闭
领券