腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(848)
视频
沙龙
1
回答
从
运
行在
Dataproc
集群
上
的
Rstudio
连
接到
BigQuery
、
、
、
、
我创建了一个
Dataproc
集群
,并使用以下说明成功启动了
RStudio
服务器:https://cloud.google.com/solutions/running-
rstudio
-server-on-a-cloud-
dataproc
-clustersc <- spark_connect(master = "local") 但是,我想知道如何连
接到
BigQuery
。有一个sparkbq库,但是我不确定如何
浏览 15
提问于2020-11-28
得票数 1
回答已采纳
1
回答
如何使用
dataproc
从
与我
的
dataproc
集群
不在同一项目中
的
bigquery
中提取数据?
我所在
的
组织需要使用Spark
从
客户
的
bigquery
数据集中提取数据,考虑到客户和我们都使用GCP,使用
Dataproc
来实现这一点是有意义
的
。我读过,它看起来非常有用,但是它似乎假设
dataproc
集群
、
bigquery
数据集和临时
BigQuery
导出
的
存储桶都在同一个GCP项目中-对我来说并非如此。我有一个服务帐户密钥文件,它允许我连
接到
存储在
bigquery</em
浏览 2
提问于2018-11-02
得票数 0
2
回答
用星火
BigQuery
连接器旋转
Dataproc
集群
、
、
阅读这个repo:下
的
说明,我按照下面的初始化操作创建一个新
的
Dataproc
集群
,并安装了特定版本
的
Google和
BigQuery
连接器:--max-age=5h \--labels=<owner>=christos,<team>=group \ --tags=allow-internal-
dataproc
-
浏览 4
提问于2019-10-02
得票数 3
回答已采纳
2
回答
如何将防火墙规则/网络标记设置为google数据流管道
、
我试图连接
从
谷歌数据流应用卡桑德拉。我们的卡桑德拉环也在谷歌云
上
。当我们必须在
dataproc
上
通过星星之火连
接到
cassandra时,我们通过传递“-标记cassandra”来创建
集群
,这允许运
行在
dataproc
上
的
应用程序连
接到
Cassandra。
浏览 1
提问于2017-03-24
得票数 0
回答已采纳
1
回答
Zepplin
BigQuery
连接性对
Dataproc
错误
的
影响
、
、
、
我已经设置了一个节点
Dataproc
集群
,并使用初始化操作在其
上
安装。当我试图使用简单
的
BigQuery
查询访问示例select sql表时,它将引发来自Zeppelin
的
错误:SELECT * FROM `GCPPJ-238506.ML_DATASET.test请注意,我已经为服务帐户设置了凭据访问权限,并在齐柏林飞艇
上
的
BigQuery
解释器中设置了以下值: zeppelin.<em
浏览 0
提问于2019-04-26
得票数 1
1
回答
如何在本地木星笔记本
的
Dataproc
中使用考拉
、
、
、
、
通过查看Google文档,我能够向
Dataproc
集群
提交Spark作业,并在
集群
中安装JupyterLab,以便在笔记本
上
运行迭代操作。但是,我无法找到使用
DataProc
集群
资源
从
本地木星笔记本(在我
的
计算机上)运行迭代命令
的
正确配置。我特别感兴趣
的
是
从
本地JupyterLab创建
集群
,然后使用pySpark (考拉)对托管在
BigQuery
和GCS
上
浏览 3
提问于2022-01-11
得票数 2
3
回答
为什么不推荐持久性
Dataproc
集群
?
我正在考虑运行一个持久化GCP
Dataproc
集群
,该
集群
承载一个Hive服务器,它将提供一个HiveQL接口,用于查询和更新存储在Google中
的
长期数据,通过访问。我正在阅读以下文档: 如果没有持久
集群
无法完成您
的
工作,则可以创建一个
集群
。如果有一种方法可以在短暂
的
集群
上
完成您
的
工作,那么这个选项可能很昂贵,
浏览 3
提问于2022-01-11
得票数 2
1
回答
从
PySpark代码中获取
Dataproc
集群
名称
、
从
运
行在
dataproc
集群
上
的
pyspark代码中,可以获得它正在运行
的
dataproc
集群
名称吗?
浏览 4
提问于2022-10-01
得票数 2
1
回答
Datalake环境下
Dataproc
元数据存储
的
功能
、
、
、
我正在看,在这段17:33左右
的
视频中,主持人说: 为了使数据可访问,需要做
的
另一件事是GCS中存在
的
所有数据,
BigQuery
上
也是如此。所以最近推出了
Dataproc
Metastore,所以这是一个高兼容
的
Metastore。它是基于高Metastore。我理解这个引号
的
方式是,如果我有一个名为
BigQuery
的
my_
bigquery
_table表,我应该能够运行以下
的
Hi
浏览 15
提问于2022-05-10
得票数 4
1
回答
有什么方法可以在
Dataproc
中使用
BigQuery
吗?
、
我将
Dataproc
与(MySQL)
上
的
数据连
接到
具有IPv4地址
的
GCSQL中。是否有
从
Dataproc
到
BigQuery
的
连接,以便我可以在
BigQuery
上
使用数据?
浏览 1
提问于2016-03-24
得票数 1
回答已采纳
1
回答
如何
从
Sparklyr连接Google
Dataproc
集群
?
、
、
我是Spark和GCP
的
新手。我试着和它联系起来但它显然不能工作(例如,没有身份验证)。 我该怎么做呢?是否可以
从
Google Cloud外部连
接到
它?
浏览 3
提问于2016-09-29
得票数 5
1
回答
Google
Dataproc
Presto:如何使用Python运行查询
、
、
、
、
通过执行此中
的
步骤,我已经设置了一个运行Presto
的
Google
Dataproc
集群
。 它工作得很好,我可以通过gcloud命令行工具运行查询,如链接所示。有没有办法通过我
的
Python应用程序在
Dataproc
集群
上
运行查询?我知道有适用于Presto
的
Python客户端,但我找不到有关如何将其与运
行在
Dataproc
集群
上
的
Presto连
浏览 13
提问于2021-03-14
得票数 3
2
回答
谷歌云数据流程中用于Google JDBC驱动程序
的
ClassNotFoundException
、
、
、
、
我正在尝试从一个运
行在
google cloud
dataproc
上
的
作业连
接到
google cloud sql。我没有授权外网访问云sql实例。因为我
的
dataproc
集群
与云sql在同一个项目中,所以我希望它允许连接。 我已经按照文档连
接到
了云sql ()。但本文档是GAE接入云sql
的
文档。尽管如此,我还是尝试了这些步骤。但是看起来com.mysql.jdbc.GoogleDriver在数据处理环境中是不可用<e
浏览 0
提问于2017-09-27
得票数 1
1
回答
如何在PySpark应用程序中读写Google Cloud Bigtable中
的
数据?
、
、
、
我在Google Cloud
Dataproc
集群
上
使用Spark,我想在PySpark作业中访问Bigtable。我们有没有像谷歌
BigQuery
连接器那样
的
Spark
的
Bigtable连接器?如何
从
PySpark应用程序访问Bigtable?
浏览 4
提问于2016-11-02
得票数 5
1
回答
是否可以通过将在
dataproc
上
运行
的
.hql文件访问
bigquery
表
、
我正在尝试
从
我
的
.hql文件访问
BigQuery
表,我将在
Dataproc
集群
上
运行该文件。table_name; 然后,我编写了一个查询,将输出插入到
BigQuery
中
的
表中。Insert into ${destination_table_name} select count(*) from ${so
浏览 0
提问于2020-02-12
得票数 0
1
回答
在Visual Studio Code
上
编辑和运行Google Cloud Platform中
的
Jupyter笔记本
、
、
、
、
我有一个运
行在
GCP
上
的
Dataproc
集群
,安装了Jupyter组件,它将笔记本存储到GCS上
集群
的
临时存储桶中,并直接通过
Dataproc
的
Jupyter web界面进行编辑。有没有办法使用VSCode直接
从
GCS编辑和运行(使用jupyter扩展)我机器
上
的
笔记本,这样我仍然可以使用
集群
的
计算资源和GCP中
的
在线数据?
浏览 41
提问于2021-08-17
得票数 2
1
回答
将
BigQuery
与Spark集成
、
、
我怎样才能将“星火”连
接到
谷歌
的
BigQuery
?但是我发现唯一
的
JDBC驱动程序是旧
的
。如果答案涉及JDBC,那么url参数应该是什么样子
的
?
浏览 3
提问于2015-10-03
得票数 1
1
回答
在GCP
上
连接b/w R studio server pro和hive
、
、
、
、
这不是一个与编程相关
的
问题,请耐心等待。有人能在这方面给我指点一下吗?(我看过关于
rstudio
桌面-> hive连接和
从
spark
集群
中运行
rstudio
-ser
浏览 1
提问于2018-05-14
得票数 1
2
回答
从
PySpark数据处理作业连
接到
托管在Kubernetes engine
集群
中
的
DB
、
、
、
、
我是
Dataproc
的
新用户,我正在尝试运行一个PySpark作业,该作业应该使用MongoDB连接器
从
托管在Googke Kubernetes引擎
集群
中
的
MongoDB副本集中检索数据。有没有办法实现这一点,因为我
的
副本集不应该在不使用端口转发或其他方式
的
情况下
从
外部访问?
浏览 43
提问于2018-07-26
得票数 0
1
回答
使用用于数据处理
的
组件网关显示色调
有没有可能用
Dataproc
的
组件网关来暴露色调?我看了一遍文档,没有找到任何添加服务
的
选项。我正在使用下面的命令创建
Dataproc
集群
。gcloud beta
dataproc
clusters create hive-cluster \ --image-versioninit-scripts/hue.sh \ --properties hive:hive.metastor
浏览 2
提问于2020-11-02
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
自学14天后,我毁掉了自己的数据工程师面试
RCourse002 R包安装与数据读写
如何用Prometheus和Grafana监控多云Kubernetes
183个国家,10000名程序员,我们惊喜地发现原来敏捷专家薪资居然这么高!
Using the RStudio Terminal
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券