腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(2190)
视频
沙龙
1
回答
在
数据流
工作流
时间
戳
上
执行
BigQuery
to
Postgre
失败
、
、
、
我能得到关于
时间
转换格式的帮助吗?Causes: S01:QueryTableStdSQL+Writing to DB/ParDo(_WriteToRelationalDBFn) failed.,
BigQuery
executionxxxxxxxx` \source_config = relational_db.SourceConfiguration(
bigquery
浏览 14
提问于2020-12-05
得票数 0
2
回答
PubSub水印不前进
、
、
,
bigquery
.CREATE_NEVER) 我使用事件
时间
戳
作为我的
时间
戳
属性,它是PubsubMessage中属性键ts的值。这与我
在
.timestampBy中使用的
时间
戳
完全相同,在对我的数据进行窗口化之前。我期望的是,一旦水印超过sessionGap (默认30分钟),输出触发器就会触发。使用
数据流
运行器和DirectRunner,触发器永远不会触发,即使我模拟
时间
戳
间隔超过30分钟的数
浏览 3
提问于2018-06-05
得票数 2
2
回答
增量地将数据从GCP数据存储转移到
BigQuery
的最佳实践
、
我们希望
在
预定义的
时间
间隔内将新插入/更新/删除的数据存储实体加载到
BigQuery
中进行分析。
在
执行
操作时发布所有新的/更新/删除的实体,并使
数据流
订阅和TL到
BigQuery
。
在<
浏览 0
提问于2018-07-30
得票数 0
1
回答
BigQueryIO.write()使用SQL函数
、
、
、
、
我有一个
数据流
的工作。我正在使用BigqueryIO.write库
在
BigQuery
表中插入行。BQ表中有一列,它应该存储行创建
时间
戳
。我不能使用java的任何库(比如Instant.now())来获取当前的
时间
戳
。因为这将在作业
执行
期间派生该值。我正在使用一个
BigQuery
加载作业,它的触发频率是10分钟。因此,如果我使用任何java库来派生
时间
戳
,那么它将不会返回预期的输出。 我
在</
浏览 21
提问于2021-08-10
得票数 0
1
回答
DataFlow管道:项目配额不足
、
我正在按照这个来创建一个
数据流
管道https://codelabs.developers.google.com/codelabs/modern-data-pipeline-firestore-
bigquery
-dataflow-templates/index.html#9,但是我的
数据流
由于我的配额而
失败
。我收到此错误消息:“
工作流
失败
。原因: Project XXXX配额不足,无法
在
区域us-Causes 1中使用1个
浏览 21
提问于2020-09-28
得票数 1
1
回答
bgiquery - zeppelin
时间
戳
未呈现为日期
、
我正在使用
Bigquery
解释器
在
zeppelin
上
运行
Bigquery
查询,查询是
在
一个表
上
运行的,该表的字段类型为
时间
戳
。行为: 1.
在
google控制台上
执行
查询时,
时间
戳
字段被视为日期,这是有效的默认行为,因为它是可读的。对于任何SQL数据库也是如此。2.当使用
bigquery
解释器
在
zeppelin
上
执行</e
浏览 1
提问于2017-12-14
得票数 0
1
回答
用Dataflow API
执行
Dataprep模板包含流配方中包含的
时间
戳
。
、
、
、
该菜谱基本上清理了一些JSON对象,将它们转换为CSV格式,并添加了一个
时间
戳
列来获取
BigQuery
数据库中的所有内容。其主要思想是对我们平台的某些信息进行快照。我成功地从dataflow API运行了作业,数据正确地插入到
bigquery
表中,但是
在
时间
戳
字段中,
时间
戳
的值总是相同的,它对应于我从其中获取模板的作业的
执行
时间
(DataPrep模板)。当我从dataprep接口运行作业时,这个<e
浏览 1
提问于2018-06-05
得票数 2
1
回答
从
数据流
插入到
BigQuery
之前验证行
、
根据,在从
数据流
将数据加载到
BigQuery
时,目前无法设置maxBadRecords配置。建议
在
将
数据流
作业中的行插入
BigQuery
之前验证它们。这些对象包含了许多在
BigQuery
中不需要的信息,还包含一些甚至不可能在模式中描述的部分(基本
上
是自由的JSON有效负载)。像
时间
戳
这样的东西也需要格式化,以便与
BigQuery
一起工作。我或多或少只是循环处理一个属性名称列表,从源对象中提取值,查看一个配置,看看是否
浏览 3
提问于2016-02-03
得票数 10
回答已采纳
1
回答
如何作为流从
BigQuery
读取
、
、
我正在为Java2.0.1-快照使用Java + Apache 还是可以设置 BatchLoads ,以便不时插入大量数据?
浏览 5
提问于2017-07-20
得票数 1
3
回答
解析时,
BigQuery
不识别时区。
、
、
、
、
摘自 然后,通过ApacheBeam Python作业,将该条目写入
BigQuery
并生成以下错误: There w
浏览 0
提问于2021-09-15
得票数 2
回答已采纳
1
回答
基于
时间
戳
的
数据流
有界数据过滤
、
在
我的
数据流
管道中,我将从PCollections<TableRow>表中读取两个
BigQuery
。我计划将这两个PCollections合并成一个带有的PCollection。因为
BigQuery
仅仅是附加的,所以目标是用一个新的PCollection
在
BigQuery
中编写第二个表。 我已经阅读了文档,这是我困惑的中间步骤。使用我的新PCollection,计划使用Comparator DoFn查看最大的
上
一次更新日期并返回给定的行。--我不确定是否应该
浏览 9
提问于2016-06-11
得票数 0
回答已采纳
1
回答
当多个PubSub主题使用DataFlow从多个主题流到
BigQuery
时,消息卡在GBP中?
、
、
、
、
在
发送几十条测试消息之后,我让它运行了几个小时,但是没有任何东西写入
BigQuery
。我发现了以下三种工作(每一种工作与其他工作不同) 这些消息不是故意加盖
时间
戳
的--只使用
BigQuery
时间
戳</e
浏览 0
提问于2018-08-23
得票数 1
回答已采纳
1
回答
调试复杂NiFi
数据流
的理想方法
、
、
据我所知,
在
使用NiFi构建了一些DB摄取PoCs之后,整个
数据流
作为流文件运行。并且在任何特定
时间
,
执行
控制可以同时
在
一个或多个处理器
上
。因此,我真的很困惑如何调试一个复杂的
数据流
,以防止任何故障。当我们使用生产用例时,它可能会变得比这复杂得多。所以我有几个问题要问。 如何了解
数据流
的状态。假设10个分叉的流文件中有4个因为数据库池错误而在GenerateTableFetch
上</e
浏览 80
提问于2018-09-13
得票数 2
3
回答
如何从oracle数据库中提取数据并保存到Google云平台
、
需要从oracle数据库中提取数据并存储
在
Google云平台中。数据大小约为10 TB。有没有可能通过Spark?数据必须每月传输一次。
在
GCP中存储和处理的数据如下: Oracle数据库到云存储(不必做CSV导出),然后它将是干净的,并准备
在
Dataprep中,这将通过
数据流
进一步处理,最后它将被存储
在
Big Query下(从大查询数据科学家将使用数据来创建他们的模型我正在考虑从spark中提取数据(通过将DataProc用于spark作业),并将其存储
在
GCP (任何一个云存储或大表
浏览 2
提问于2019-11-17
得票数 0
1
回答
在
GCP
数据流
作业中使用或REPLACE模型
、
因此,我试图
在
BigQuery
表
上
使用GCP模型,并且需要定期更新该模型,并针对新的数据集运行它。我使用Dataflow对数据进行预处理,并想知道是否也可以使用它来创建模型。当我尝试使用在
BigQuery
中测试的Create时,会弹出以下错误: 我是做错了什么,还是模型创建不支持Dataflow?
浏览 12
提问于2022-01-12
得票数 1
回答已采纳
1
回答
气流DAG -如何首先检查BQ (必要时删除),然后运行
数据流
作业?
、
、
、
、
在
我的DAG中,我有两个任务: 如果文件ID已经出现在
bigq
浏览 0
提问于2019-01-09
得票数 3
回答已采纳
2
回答
BigQuery
中不同文件格式加载的比较
、
我们目前通过csv或直接通过流式API将大部分数据加载到
BigQuery
中。然而,我想知道是否有可用的基准(或者Google工程师可以
在
答案中告诉我)加载不同格式的效率如何比较。例如,如果我们有相同的100行数据,
BigQuery
是否显示与加载它有任何性能差异: 我相信其中一个答案将是“为什么你不测试它”,但我们希望,
在
架构转换器或重写我们的应用程序之前,工程师可以与我们分享(如果有的话)上述格式中,什么将是最具表现力的数据从一个平面文件加载到烧烤。注意:上述所
浏览 1
提问于2018-03-14
得票数 1
回答已采纳
2
回答
我能否实时地将数据从CloudSQL加载到
BigQuery
?
、
、
、
这些数据呈指数增长,我需要一种高效的方法来
执行
查询。数据库以~3GB/天的速度增长,我希望将数据保存至少3个月。因此,我把我的CloudSQL连接到
BigQuery
..。下面是我
在
BigQuery
上
运行的一个查询示例,但我对此表示怀疑。不确定查询是
在
Postgres还是
BigQuery
中
执行
的。date_trunc('day', created_at) d, variable1, AVG(variable2) FROM
浏览 1
提问于2020-06-03
得票数 1
回答已采纳
1
回答
DataFlow工作者
BigQuery
权限错误
、
我一直试图
在
我的项目中
执行
Dataflow管道(Python),其中我的GCP帐户分配了"Owner“角色。
BigQuery
执行</
浏览 1
提问于2021-08-20
得票数 0
1
回答
数据流
作业
失败
,“无法培养足够的工人”,配额没有问题,更改机器类型和区域不会改变任何事情。
、
、
我们开发了一个基于Google平台的应用程序,它使用Cloud将数据写入
BigQuery
。我现在试图
在
另一个组织的新GCP项目
上
设置这个应用程序。我正在体验这个 作业是从创建
浏览 0
提问于2019-08-12
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用Kafka,如何成功迁移SQL数据库中超过20亿条记录?
从Lambda到无Lambda,领英吸取到的教训
弃用 Lambda,Twitter 启用 Kafka 和数据流新架构
BigQuery提供脚本存储程序,可在单一请求执行多个陈述式
如何在Azkaban中处理作业之间的依赖关系?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券