腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如
何在
Dataprep
中
参数
化
BigQuery
表
?
我习惯于使用
Dataprep
从云存储
中
创建json和csv文件,但今天我尝试从
BigQuery
中
获取一个
表
,但无法
参数
化
。 这样做有可能吗?
浏览 7
提问于2021-07-27
得票数 1
3
回答
将数据追加到
BigQuery
表
中
、
、
我使用GCP的数据代表连接几个具有相同列结构的csv文件,处理一些数据,然后写入
BigQuery
数据库。 我必须将这些数据记录在
BigQuery
中
。我是否可以将这些数据包含在数据代表
中
,并将它们附加到
BigQuery
表
中
?
浏览 7
提问于2020-08-12
得票数 0
回答已采纳
2
回答
云数据流和
Dataprep
之间的区别是什么
、
Dataprep
和Dataflow都可以用于ETL任务。事实上,
Dataprep
似乎使用数据流作业。这是
Dataprep
提供的工具与用户界面编写数据流作业的唯一区别吗?
浏览 31
提问于2019-05-28
得票数 1
1
回答
将宽而深的
BigQuery
表
导入
、
当使用
Dataprep
中
的导入功能导入具有多列和数百万行的
BigQuery
(BQ)
表
时,是否有任何简化数据集的选项?理想情况下,我希望在运行使用此
表
的任何菜谱的输出并避免“select*”步骤时,尽量减少数据流工作流的成本。 如有任何建议,将不胜感激。
浏览 0
提问于2019-09-28
得票数 0
回答已采纳
2
回答
BigQuery
中
存储的数据的预处理
、
、
特别是,我正在尝试将Google Analytics
中
的数据导入
BigQuery
。是否可以对存储在
BigQuery
中
的数据使用
Dataprep
?我见过的几乎每个示例都使用
Dataprep
来可视
化
存储在Google Storage
中
的数据,但没有任何示例涉及到
BigQuery
。 任何帮助都将不胜感激。
浏览 2
提问于2018-03-14
得票数 0
3
回答
获取从GCS到BQ的大量csv文件
、
、
、
、
虽然BQ确实有一个CSV加载器,但我拥有的CSV文件是非常非标准的,如果不对其进行格式
化
,最终无法正确加载到BQ。有没有什么教程可以将GCS
中
的"X“格式的文件导入BQ?任何教程指针或示例脚本都可以做到这一点。
浏览 123
提问于2019-01-09
得票数 1
回答已采纳
1
回答
使用
Dataprep
将日期分区
表
中
的日期分区写入
、
、
我使用一个
BigQuery
视图从一个
BigQuery
表
中
获取昨天的数据,然后尝试使用
Dataprep
将数据写入一个日期分区
表
。但是,在使用
Dataprep
和设置输出
BigQuery
表
时,只有3种选项用于:Append、Truncate或Drop现有
表
。如果对表进行了日期分区,并且使用了Truncate,它将删除所有现有数据,而不仅仅是该分区
中
的数据。 还有别的方法可以让我用吗?我的替代方法是使用<e
浏览 0
提问于2018-08-23
得票数 2
1
回答
导出的数据流模板
参数
未知
、
中
,流通过通配符从Google Cloud Storage拉入文本文件,转换数据,并将其附加到现有的
BigQuery
表
中
。找到)并不适用,因为它使用了自定义函数,而且还以批处理模式运行,覆盖了任何现有的
BigQuery
表
,而不是追加。检查来自
Dataprep
的原始Dataflow作业详细信息显示了许多
参数
(在元数据文件中找到),但我无法使这些
参数
在我的代码
中
工作。我知道我需要指定GCS位置、模板位置和
BigQ
浏览 12
提问于2019-02-11
得票数 0
2
回答
BigQuery
表
的架构与配方不匹配
、
、
我目前正在开发一个从
bigquery
到Tableau的BI堆栈。我正在尝试使用
Dataprep
删除不必要的列,并连接
bigquery
中
的
表
,以创建一个“主”
表
,然后将其提供给Tableau。
bigquery
中
的
表
大约每8小时更新一次,我正尝试在
dataprep
中
为主表创建一个类似的计划。 运行作业或甚至尝试从连接的
表
中
获取样本都会产生此错误。java.lang.I
浏览 25
提问于2018-12-27
得票数 0
2
回答
BigQuery
无法从
DataPrep
导入数据
、
我在
BigQuery
中
创建了一个
表
,它的类型为date,分区方式为Date。
DataPrep
也具有相同数据类型的相同列。当我试图将数据从
dataprep
加载到
bigquery
表
时,我得到了类似于“数据集中的列数据类型必须与目标列数据类型匹配”的错误。截图也附在附件
中
,请仔细查看并给我一个解决方案。
浏览 2
提问于2018-09-17
得票数 1
2
回答
将数据集
参数
添加到列
中
,以便稍后在
BigQuery
中
与
DataPrep
一起使用
、
、
我正在通过Google
DataPrep
从(GCS)导入几个文件,并将结果存储在的
表
中
。/datasets/{month}/2017-02-28-file.csv我们可以创建一个
参数
为的数据集但是,在这个
BigQuery
表
(输出)
中
,我无法仅提取带有
参数<
浏览 0
提问于2019-02-19
得票数 3
回答已采纳
2
回答
将成千上万的JSON文件加载到
BigQuery
中
、
、
我有大约10,000个JSON文件,我想将它们加载到
BigQuery
中
。由于BQ只接受ndJSON,我花了几个小时寻找解决方案,但我找不到一种简单而干净的方法来将所有文件转换为ndJSON。
浏览 19
提问于2019-12-05
得票数 0
1
回答
Bigquery
:查找在数组
中
首次找到指定元素的索引
、
、
我正在使用
Bigquery
,并且我有一个包含数组的数据集,我想在其中提取第一次找到指定元素的索引。我在
Bigquery
中
找不到一个函数来实现我想要的功能。
Dataprep
有arrayindexof函数可以做到这一点,但是在写这篇文章的时候,
Bigquery
中
还没有这个函数。https://cloud.google.com/
dataprep
/docs/html/ARRAYINDEXOF-Function_1361
浏览 16
提问于2020-10-27
得票数 1
回答已采纳
1
回答
按最新日期筛选
BigQuery
行的最有效方法
、
、
我目前正在开发一个ETL管道,该管道使用
BigQuery
来存储暂存数据,然后使用
Dataprep
来转换数据并将其存储在新的
BigQuery
表
中
以供生产。我们已经遇到了一些问题,需要找到最具成本效益的方法将这些转换应用于少量的数据选择上,通常情况下,从暂存数据
表
中
的当前最大日期到最后X天。接下来我们尝试的是过滤
BigQuery
视图中的数据,然后将数据视图用作
Dataprep
流的初始数据集(在
Dataprep
应用任何转换
浏览 2
提问于2018-08-10
得票数 2
1
回答
将字符串转换为GoogleDataprep
中
的数组
、
、
、
我试图在
Dataprep
中
对数据进行反美化,以便在
BigQuery
中使用它。更具体地说,我希望将account_profile
表
中
的条目与带有外键'account_id‘的帐户表链接到我的帐户
表
中
的数组
中
。(Account_profile存储联系方法.坏名声,我知道。)问题是,当我试图在
BigQuery
中
取消该列,或者在
BigQuery
中
执行任何类似数组的操作时,我会得到
浏览 2
提问于2020-05-18
得票数 0
回答已采纳
1
回答
在云数据准备中使用带
参数
的数据集进行
BigQuery
?
、
我有几个具有每天创建的
表
的
BigQuery
数据集,
如
是否有一种方法可以使用此设置每天动态地拉出正确的
表
,还是需要继续另一条路径,
浏览 1
提问于2019-04-10
得票数 0
1
回答
当输出为
BigQuery
时,
Dataprep
-数据流失败
、
、
作为POC的一部分,我试图通过
Dataprep
设置一些数据质量检查。有一个
BigQuery
表
作为源,它应该运行一个输出到另一个
BigQuery
的作业。at org.apache.beam.sdk.io.gcp.
bigquery
.BigQueryHelpers$PendingJob.runJob(BigQueryHelpers.java:196)at org.apache.beam.sdk.io.gcp.
bigquery
.BigQueryHelpers$PendingJobManager.
浏览 1
提问于2019-08-21
得票数 1
1
回答
BigQuery
中
时间分区
表
的自动模式
、
我正在尝试将数据追加到时间分区
表
中
。我们可以创建一个时间分区的
表
,如下所示:# client =
bigquery
.Client() table.table_id, table.time_partitioning.field)) 然而,我想知道如
何在
没有预定义模式的情况下执行以下操
浏览 1
提问于2019-02-18
得票数 0
2
回答
如何自动运行谷歌数据代表作业?
、
源数据集每天都在变化,结果必须附加到Google
BigQuery
表
中
。有办法使这个过程自动
化
吗?源文件是.xls文件。我可以将它们上传到云存储
中
,并编写一个云功能,它将上传到数据代表需要的任何地方。问题是,似乎不可能在
Dataprep
中
替换源数据集。如果是的话,那么计划运行和新的作业运行API有什么意义呢?
浏览 5
提问于2020-02-18
得票数 3
回答已采纳
1
回答
谷歌
DataPrep
中
的动态
BigQuery
数据源--能做到吗?
、
我不能使用
Dataprep
定义动态数据源,这真的是对的吗?据我所知,我只能指向
BigQuery
表
。我需要指向一个
表
中
的某个部分。分区的命名始终包含日期。喜欢。"ga_20171113“。
浏览 0
提问于2017-11-13
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
谷歌正式发布数据可视化工具,提供超500个数据源,主要还免费!
谷歌正式发布数据可视化工具,提供超500个数据源
谷歌正式发布数据可视化工具Data Studio
轻松教你如何在C+中,使用参数化构造函数来初始化对象数组
如何在Spark中处理结构化流式数据,如日志文件或传感器数据?
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券