spark云计算_云 Spark_计算Spark DataFrame中的公式 - 腾讯云开发者社区

云数据库 SQL Server

想购买云服务做大数据计算和分析，如何选择满足个人日常学习的配置？我是小白，从未用过云服务，现在需要用到Hadoop、Hbase、Mysql、Hive、Spark、zookeeper等，只是学习使用

浏览 137提问于2018-06-21

1回答

说好的流式数据处理呢？没有storm和flink的开发指南吗？

官方文档

没看到storm和flink的开发指南？EMR支持storm和flink吗？ [附加信息]

浏览 562提问于2018-09-10

1回答

R& Spark-Scala Dataframes处理时间

r、apache-spark、spark-dataframe、apache-spark-mllib

在准备这个数据集时，我观察到了在为R& Spark之间的数据分析准备数据时，性能上的巨大差异。本质上，Spark比R更快，这里有一篇文章是在互联网上发现的，而且一般都是众所周知的。= dat3_.withColumn(c.name, when(col(c.name).isNull, 0).otherwise(col(c.name)))这在我看来还不清楚，为什么在Spark

浏览 2提问于2018-04-04得票数 0

1回答

Hadoop，火花和云

machine-learning、data-mining、apache-spark、apache-hadoop、cloud

看起来Hadoop、Spark和不同版本的Clouds提供了存储和分析大数据的工具。有一些文章比较Hadoop和Spark (例如，这篇文章)。还有一些文章讨论了AWS上用于使用Hadoop/spark的服务，例如这篇文章。我的问题是，如果我使用的是提供存储和分析服务的云计算，我还需要hadoop/spark吗？

浏览 0提问于2023-04-16得票数 0

2回答

如何在Cloud Dataproc上安装Apache Spark的自定义版本

apache-spark、google-cloud-platform、google-cloud-dataproc

如何在安装自定义版本的Spark的同时保持与Cloud Dataproc工具的兼容性？

浏览 3提问于2018-04-12得票数 3

1回答

Apache梁在关键云铸造上的星火运行程序部署

apache-spark、cloud-foundry、apache-beam

我需要使用Spark引擎部署Apache应用程序。我的问题是，我是否可以在关键的云创建环境上部署星火应用程序。如果有的话，你能提供例子吗？谢谢

浏览 3提问于2017-09-12得票数 0

回答已采纳

2回答

随着Dataproc img版本2.0.39-ubuntu18 18的增加，GCP云日志记录成本增加

google-cloud-platform、google-cloud-dataproc、google-cloud-logging

我有一个带有映像版本- 2.0.39-ubuntu18 18的Dataproc集群，它似乎将所有日志都放入了云日志记录中，这大大增加了我们的成本。=gs://dataproc-spark-logs/joblogs 若要停止使用云日志记录，请执行以下操作。日志也被重新定向到云日志记录。(映像版本1.4.37-ubuntu18 18，类似于映像版本2.0-ubuntu18 18)，它具有类似的配置，但似乎没有那么多地使用云日志记录。我需要更改什么来确保Dataproc作业(吡火花

浏览 16提问于2022-05-30得票数 1

回答已采纳

1回答

星星之火创建的数据库到哪里去了？

azure-ml

此外，还有一个问题 Question: Which of the following are good applications for Apache Spark?Apache Spark uses SQL to read and performs analysis on large files, but it is not a Database.如果我们可以使用spark创建一个数据库，那么为什么我们也不能更改它的记录呢？

浏览 0提问于2019-12-29得票数 2

1回答

GCP dataproc在哪里存储笔记本实例？

google-cloud-platform、jupyter-notebook、bucket、dataproc

我使用Dataproc创建了一个星火库集群，并将Jupyter Notebook附加到其中。然后，我删除了集群，我以为笔记本已经不见了。但是，在创建了另一个集群(连接到同一个Bucket)之后，我可以看到我的旧笔记本。这是否意味着笔记本(或他们的检查点)存储在我的桶里？或者它们存储在哪里，以及如何确保它们被删除？

浏览 4提问于2022-02-09得票数 0

回答已采纳

1回答

无法从ssh到的主节点，但可以通过ssh计算引擎VM

ssh、google-cloud-platform、google-compute-engine、gcloud、google-cloud-dataproc

我在进入Google计算引擎VM时没有遇到任何问题，但我无法将ssh放入Google集群的主节点中。计算引擎VM和Dataproc集群位于同一个项目中。我从错误消息中了解到，它与ssh键有关，但我不知道如何修复它--我通过云控制台检查了项目中的ssh键，它是正确的，并尝试了通常的gcloud auth login来重置gcloud项目的登录细节。编辑:我正在尝试从我的机器中获取ssh，而不是云控制台--这是一个很好的点，我会尝试这样做，看看这是否可能。但最后，我想用这个连接到本地计算机上的木星笔记本，这样

浏览 2提问于2020-09-04得票数 0

回答已采纳

2回答

我的集群在Google云平台上的碳足迹计算

google-cloud-platform、google-cloud-dataproc

是否可以计算我的集群在Google云平台上的碳排放量？我正在使用google dataproc的spark集群。到目前为止，我的技术讨论主要取决于成本，我希望将碳排放作为另一个参数。

浏览 2提问于2016-04-21得票数 1

2回答

CodeIgniter网站可以部署到云托管吗？

cloud-hosting、cloud、codeigniter

目前，我正在考虑用CodeIgniter创建一个网站，并计划将其部署到云托管中，但我不知道这是否可行。

浏览 0提问于2019-10-15得票数 2

回答已采纳

1回答

谷歌云星火ElasticSearch TransportClient连接异常

elasticsearch、apache-spark、google-cloud-dataproc

我正在使用Google上的Spark，我有下面的代码连接到Elasticsearch数据库当我在本地运行它时，即spark-submit代码是使用使用sbt组件创建的fat jar上传到google云的，所以所有使用的库都是常见的，除了本地jav

浏览 7提问于2016-05-01得票数 0

回答已采纳

3回答

如何从电子病历连接到GCS

scala、apache-spark、google-cloud-platform、amazon-emr

我们有一个在EMR集群上运行的火花流应用程序，我们需要将流数据存储到中。

浏览 2提问于2019-02-28得票数 0

1回答

读取csv文件时中绝对URI中的相对路径

python、pandas、pyspark、databricks

我试图使用以下语法从本地计算机读取csv文件： df = spark.read.format("csv").option("header", True).load("C:\\Users\\***\\Desktop

浏览 13提问于2021-07-06得票数 1

回答已采纳

1回答

使用spark将拼图数据从谷歌云存储加载到BigQuery

apache-spark、google-bigquery、google-cloud-storage

如何从谷歌云存储加载拼图数据到spark，并将其保存到BigQuery？

浏览 13提问于2019-12-04得票数 0

2回答

用于NRT数据应用的Google

apache-spark、apache-kafka、google-cloud-platform、google-cloud-dataflow、bigdata

客户端根据数据包(Kafka)发布不同主题的数据，并将其传递给流式分析管道(Spark)。Kafka、Spark和HDFS可以通过亚马逊EC2 (或Google使用连接器)进行可选部署。我读到了谷歌云DataFlow，云存储，BigQuery和Pub。此外，它还将利用DataFlow管道进行分析和云存储，并使用cloudera火花连接器进行数据流分析，并使用spark for ML (预测API有点限制性)。可以在Google云上部署Kafka/Sp

浏览 2提问于2016-02-16得票数 0

6回答

Google Cloud Dataflow和Google Cloud Dataproc之间的区别是什么？

google-cloud-platform、google-cloud-dataflow、google-cloud-dataproc

看看谷歌的云服务，DataProc似乎也可以做同样的事情。而且看起来DataProc比DataFlow便宜一点。

浏览 1提问于2017-09-27得票数 66

4回答

Google Dataproc支持Apache Impala吗？

google-cloud-platform、impala、google-cloud-dataproc

我刚开始使用云服务，在谷歌的云平台上导航是非常可怕的。当涉及到Google Dataproc时，他们确实在宣传Hadoop、Spark和Hive。我的问题是，Impala到底有没有？我想做一些基准项目使用所有这四个工具，我需要Apache Impala以及Spark/Hive。

浏览 1提问于2019-05-31得票数 2

2回答

我怎样才能逃避地形上的真假？

terraform、hcl

" { spark_driver_port = "${var.spark_driver_port}"

浏览 1提问于2019-01-04得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

想购买云服务做大数据计算及数据分析，如何选择满足个人日常学习的配置？

说好的流式数据处理呢？没有storm和flink的开发指南吗？

R& Spark-Scala Dataframes处理时间

Hadoop，火花和云

如何在Cloud Dataproc上安装Apache Spark的自定义版本

Apache梁在关键云铸造上的星火运行程序部署

随着Dataproc img版本2.0.39-ubuntu18 18的增加，GCP云日志记录成本增加

星星之火创建的数据库到哪里去了？

GCP dataproc在哪里存储笔记本实例？

无法从ssh到的主节点，但可以通过ssh计算引擎VM

我的集群在Google云平台上的碳足迹计算

CodeIgniter网站可以部署到云托管吗？

谷歌云星火ElasticSearch TransportClient连接异常

如何从电子病历连接到GCS

读取csv文件时中绝对URI中的相对路径

使用spark将拼图数据从谷歌云存储加载到BigQuery

用于NRT数据应用的Google

Google Cloud Dataflow和Google Cloud Dataproc之间的区别是什么？

Google Dataproc支持Apache Impala吗？

我怎样才能逃避地形上的真假？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐