腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
在
云
数据
融合
中
加载
多个
表
失败
,并
出现
DAG
错误
我有一个包含大约1000个
表
的MS SQL Server
数据
源,我需要将其放入BigQuery
中
。我希望使用
数据
融合
将它们全部
加载
到BigQuery
中
的临时
表
中
,然后对它们执行转换。然而,一旦我创建了一个带有两个“岛”的管道,它就会给出一个
DAG
错误
。这是一个特性还是仅仅是我做错了什么?我
在
文档里找不到任何东西。我的管道看起来像这样: ? 当我尝试部署时,我得到的
错误
浏览 10
提问于2019-06-28
得票数 2
回答已采纳
1
回答
Google Cloud Data Fusion,如何在一个管道中将
多个
表
加载
到bigquery
、
我想使用
云
数据
融合
加载
aws rds mysql服务器
中
的许多表。每个
表
的存储大小约为1 1gb。我还找到了一个名为“多
数据
库
表
”的插件来
加载
多表。但我
失败
了。而且,基本上当我使用
数据
库源时,我可以检查我的
表
的模式。然而,
在
多个
数据
库
表
中
,我找不到如何检查表模式。我如何使用此插件?或者在<em
浏览 7
提问于2021-07-13
得票数 0
2
回答
GCP
中
合成器(气流)
DAG
RunID冲突
、
、
、
、
我们有一个
云
功能,它是基于
云
存储的。一旦文件
加载
到桶
中
,此
云
函数将触发。当文件
加载
时,该函数将调用/触发气流
DAG
。这个
DAG
将处理该文件。问题是,当
多个
文件
在
一秒钟内同一时间放置时,函数调用
失败
,
出现
以下
错误
, b‘{“
错误
”:“运行id pl_imaoc_trigger_
dag
_2020-07-31T17:48:
浏览 4
提问于2020-08-01
得票数 0
1
回答
通过
云
数据
融合
从Mysql到Bigquery的
数据
(使用
多个
联接的查询)
、
、
我要在MySQL
中
运行一个具有
多个
表
联接的复杂查询,并将输出
数据
导入BigQuery
表
。 我想为此使用
云
数据
融合
。我是GCP的新手,不知道如何实现这一目标。我知道可以使用
数据
融合
将MySQL
表
引入到BigQuery
表
中
,但这是一种直接的拉动。如果我想要运行一个具有
多个
表
联接的查询,
并
使用
云
<e
浏览 10
提问于2022-10-11
得票数 0
1
回答
是否可以使用
云
数据
融合
FTP -> GCS GCS -> BQ
、
我是全新的GCP和
云
数据
融合
。我看到您可以使用此服务将跨
数据
源的
数据
集成到
数据
池中。最终,我希望这些
数据
可以
在
BQ
中
获得。sftp站点将有
多个
文件表示
多个
表
。/r
浏览 1
提问于2020-10-28
得票数 0
回答已采纳
1
回答
当从单个python源代码生成数百个
DAG
时,气流会减慢。
、
、
在
我们的大
数据
项目中,有3000个
表
需要
加载
,所有这些
表
都应该由气流
中
的一个单独的
DAG
来处理。
在
我们的解决方案
中
,单个python文件生成每种类型的
表
加载
器,因此它们可以通过基于事件的REST通过
云
函数单独触发。因此,我们使用以下方法生成我们的
DAG
: 用于
DAG
生成器逻辑scd2的气流变量生成
表
类型的
表
名列
浏览 3
提问于2021-11-06
得票数 1
回答已采纳
2
回答
如何在
云
函数
中
实现文件的串行处理?
、
、
、
我写了一个基于
云
函数的
云
存储触发器。我有10-15个文件
在
云
存储桶
中
以5秒的间隔登陆,它将
数据
加载
到bigquery
表
中
(截断
并
加载
)。当存储桶中有10个文件时,我希望
云
函数以顺序的方式处理它们,即一次处理一个文件,因为所有文件都访问相同的
表
进行操作。目前
云
函数一次触发
多个
文件,BIgquery操作
失败
,因为<
浏览 1
提问于2020-07-15
得票数 0
1
回答
如何从具有动态参数的气流
中
触发
云
数据
融合
、
、
、
、
我试图
在
气流2+
中
创建一个
DAG
,它将使用CloudDqtaFusionStartPipeline操作符触发
多个
数据
融合
管道,它们将并行运行。我正在尝试的流程如下所示。开始- read_bq - df_1,.df_n 这里,read_bq是一个BigQuery任务,它将从BigQuery
表
中
读取值作为列表
浏览 8
提问于2022-10-16
得票数 0
2
回答
无法从
数据
融合
连接Cloud / postgreSQL实例
、
、
、
目标是使用
云
数据
融合
连接Cloud或postgreSQL实例。用MySQL和postgreSQL创建Cloud实例
在
添加连接中使用jd
浏览 2
提问于2019-08-01
得票数 0
1
回答
bigquery
表
加载
后触发的自动调度
、
、
、
它将在bigquery
表
加载
后自动触发。我不想使用每周调度查询,这是手动任务,我希望这使它在将
表
加载
到Bigquery
表
时自动触发调度。
浏览 10
提问于2022-11-12
得票数 0
1
回答
BigQuery执行
失败
,
在
云
数据
融合
方面没有有意义的
错误
、
我正在尝试使用
云
数据
融合
( BigQuery )
中
的执行函数。该组件验证良好,SQL签出,但每次执行时都会得到这个没有意义的
错误
:02/11所讨论的SQL是dataset.table
中
的简单删除,其中ds = CURRENT_DATE()这是管道 "name": "
浏览 15
提问于2022-02-11
得票数 0
回答已采纳
1
回答
无法使用Google
数据
融合
连接到
我正在尝试使用
云
数据
融合
来测试连接到。我们的GCP项目不使用默认网络,而是使用自定义VPC。我使用角色
云
数据
融合
API服务代理复制
并
添加了生成的
数据
融合
服务帐户
浏览 0
提问于2019-09-27
得票数 2
2
回答
Data Fusion管道使用来自
云
NAT的外部IP,而不是将外部IP分配给Dataproc群集节点
我正在尝试从限制外部IP访问的客户端提取
数据
。我已经使用允许的IP配置
并
测试了
云
NAT。我不想分配这些IP,这样节点就可以使用
云
NAt上定义的IP。 我尝试过通过Data Fusion运行时参数将--no-address传递给Dataproc,但这不是正确的方式。此外,我还查找了一些
在
我的Data Fusion实例上配置计算配置文件的方法,这在基础版或企业版中都找不到。我希望获得一个
云
数据
融合
管道,使用我的
云
NAT外部IP连接到我的客
浏览 0
提问于2019-06-13
得票数 1
2
回答
如果
表
中
已存在内容,则避免
在
Bigquery
中
重新
加载
数据
、
、
我需要编写
dag
,这样它就可以将csv文件的内容
加载
到Bigquery
表
中
,但是如果
表
中
已经存在该内容,它就会丢弃该文件。我知道我们可以
在
正常的编程中计算文件的哈希,但不知道如何处理Airflow和Bigquery。有人知道怎么做吗?
浏览 0
提问于2021-09-13
得票数 0
2
回答
Google
数据
融合
无法访问来自另一个项目的
数据
,即使授予了访问权限
、
、
、
我已经启用了
云
数据
融合
API,并在BigQuery
中
的项目A
中
创建了一个实例。项目A将包含我们的
数据
仓库,并从BigQuery上的其他项目中
加载
和转换
数据
。当我试图从
表
B.X上的项目B创建一个具有源BigQuery的管道时,我会得到关于BigQuery
表
的详细信息:访问被拒绝:
表
B.X。
在
表
B.X上拒绝的权限bigquery.tables.get (或者它可能不存
浏览 5
提问于2021-10-06
得票数 0
回答已采纳
1
回答
如何使用两个Google
融合
表
中
的
数据
?
、
我试图
在
美国和加拿大创建一个“服务区域”的谷歌地图,无意中发现了这种
融合
表层的东西&认为它会产生很好的效果,但我有问题。我不能创建一个
融合
表
&
在
不向google付费的情况下将其公之于众,没有办法,我将使用现有的公共
表
。我需要将样式应用到
融合
表层,但我正在
加载
2个
融合
表
(层)& API只允许将样式添加到一个层。}], suppressInfo
浏览 0
提问于2018-04-06
得票数 0
回答已采纳
2
回答
Google Data Fusion从存储桶
中
的
多个
子文件夹
中
读取文件,并需要将其放入侧子文件夹
中
的另一个文件夹
中
/student/land/压缩文件sameer/student/pro/未压缩文件在上面的例子
中
,我需要从存在于不同子目录
中
的所有LAND文件夹
中
读取文件,并需要处理它们,并将它们放在与其相同的子文件夹
中
的PRO文件夹
中
。
在
GCS源代码
中
,我提供了
浏览 2
提问于2020-11-05
得票数 0
1
回答
无法确定GCP Composer (气流)
DAG
任务
失败
的问题
、
、
、
我的守护进程的一些操作符有一个
失败
的状态。我正在努力理解
错误
的根源。 filename="/home/airflow/gcs/d
浏览 4
提问于2020-04-07
得票数 1
1
回答
事件驱动DAGs的气流可选算子模式
、
我知道,
在
dag
_a的末尾,我可以添加一个触发器来启动
dag
_b。然而,从抽象的角度来看,这种哲学上是
错误
的:
dag
_a不需要理解或知道
dag
_b的存在,但是这种模式将强制执行在
dag
_a上调用
dag
_b的责任。更具体地说,我设想了一个用例,其中
多个
DAG
每天运行(因此它们共享相同的运行日期),并且每个
DAG
的输出都是某个
表
中
的一个日期分区。现在,我在下游dags
浏览 7
提问于2022-03-31
得票数 1
1
回答
气流
DAG
-如何首先检查BQ (必要时删除),然后运行
数据
流作业?
、
、
、
、
我有一个
云
函数,它在文件到达时触发进程,
云
函数将文件名/位置传递给
DAG
。
在
我的
DAG
中
,我有两个任务: 1)使用DataflowPythonOperator运行
数据
流作业,该作业读取GCS
中
的文本
中
的
数据
,并将其转换为BQ,2)根据作业
失败
或成功与否将文件移动到
失败
/成功桶我查看了其他气流操作符,但在运行
数据
流作业之前,我希望
在</e
浏览 0
提问于2019-01-09
得票数 3
回答已采纳
点击加载更多
相关
资讯
大规模运行Apache Airflow的经验和教训
如何高效构建多线程POST信息批量发布系统?
数据湖和SQL并不矛盾
教你数分钟内创建并运行一个 DolphinScheduler Workflow
Hive相关的简介
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券