腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1349)
视频
沙龙
1
回答
在
Google
Cloud
data
Fusion
Pipeline
中
转换
外
键
的
数据类型
以
使用
Joiner
、
现在
的
问题是,当我在数据库插件中
使用
Get Schema时,用于连接table_a和table_b
的
外
键
具有不同
的
数据类型
。
在
Joiner
中
,我加入了table_a.customer_id = table_b.customer_id上
的
表格。table_a.customer_id
的
数据类型
是LONG,但table_b.customer_id是DOUBLE。
浏览 21
提问于2020-03-02
得票数 0
1
回答
预览
中
的
net.jpountz.lz4.LZ4BlockInputStream.<init>(Ljava/io/InputStream;Z)V :java.lang.NoSuchMethodError
我正在试验
Google
Cloud
Data
Fusion
。我正在
使用
joiner
+写回BigQuery来加入2个BigQuery表。
在
预览
中
,我得到这个错误: net.jpountz.lz4.LZ4BlockInputStream.最大
的
表有大约600万条没有任何嵌套字段
的
记录。较小
的
表有66条记录。调试/解决此问题
的
推荐方法是什么?增加工作进
浏览 0
提问于2019-05-10
得票数 2
1
回答
Google
Cloud
Pub/Sub从API端点获取数据并发布为消息
、
、
、
我一直
在
尝试
在
Google
Cloud
Data
Fusion
中
构建一个管道,其中
的
数据源是一个第三方API端点。我曾经是,但有人建议我
使用
发布/订阅来获取数据。我一直
在
尝试以为起点,但这并不能帮助我完成这个过程
的
第一步:从API端点获取数据。谁能提供
使用
发布/订阅--或任何其他可行
的
方法--从API端点摄取数据并将数据发送到
data<
浏览 18
提问于2020-02-10
得票数 1
1
回答
Apache梁在数据流大侧输入
中
的
应用
、
、
、
输入
的
每一条消息都需要通过来自
Google
BigQuery
的
非常大
的
数据集流,并在写入数据库之前将所有相关值(基于
键
)附加到该数据集中。2)键值对映射 在这个策略
中
,我
在
管道
的
第一部分读取了BigQuery数据和Pubsub数据,然后通过ParDo
转换
运行每个数据,这些
转换
将PCollections
中
的
每个值更改为KeyValue对然后,运行Merge.Flatten
浏览 4
提问于2017-11-27
得票数 12
1
回答
将数据从配置单元迁移到BigQuery
、
最初
的
计划是将ORC文件从Hive加载到云存储,然后加载到BigQuery表。通过自动化或任何其他GCP服务实现这一点
的
更好方法是什么?
浏览 17
提问于2021-04-23
得票数 0
1
回答
只有
在
文件存在时才运行数据融合管道
、
、
、
我已经有了一个数据融合
的
工作管道,它可以完成所有的ETL过程,但是只有当它发现一个名为SUCCESS.txt
的
文件位于云存储桶
中
时,我才需要运行它。提前谢谢!
浏览 8
提问于2021-12-22
得票数 4
回答已采纳
1
回答
连接到
Cloud
我们希望测试
使用
云数据融合将
Cloud
(mySQL)连接到BigQuery。连接到CloudSQL
的
正确方法是什么,因为此时似乎并不是“内置”。推荐什么样
的
驱动程序,是否有可用
的
说明?
浏览 0
提问于2019-04-25
得票数 4
1
回答
从GCS向您
的
模型提供图像数据(tfrecords)
的
最佳方法是什么?
、
、
、
我为自己设定了一个目标,仅
使用
Google
解决MNIST皮肤癌数据集。我见过很多示例,它们如何将csv文件提供给它们
的
模型,但没有
使用
图像数据
的
示例。应该把所有的to记录复制到,这样我才能像这样将数据提供给我
的
模型吗?或者有什么更好
的
方法吗? 提前谢谢。
浏览 0
提问于2019-01-11
得票数 1
回答已采纳
2
回答
jsonb和主/
外
键
:哪个
在
PostgreSQL中性能更好?
、
、
、
我相信PostgreSQL
的
jsonb非常适合这个项目,因为它将为我提供JSON对象,而无需在后端进行
转换
。但是,我已经了解到,随着
键
的
添加,jsonb
数据类型
会减慢,我
的
模式将需要
使用
主键和
外
键
引用。我想知道
在
自己
的
列
中
(
以
标准
的
关系数据库方式)
中
是否有主键/
外
键
,然后为其余<em
浏览 10
提问于2014-12-30
得票数 8
回答已采纳
2
回答
在
Google
App Engine
中
,如何配置bulkloader.yaml来处理模型上
的
可选
外
键
?
、
、
、
我
在
App Engine中有一个模型,正在
以
CSV格式导出,然后
使用
appcfg.py和bulkloader.yaml导入到我
的
本地开发环境
中
。我可以导入和导出大多数模型,但我
的
模型有一个
外
键
并不总是存在
的
问题。当我
的
csv文件
中
的
每一行都有
外
键
时,我可以
使用
下面的lambda import将
外
键</e
浏览 0
提问于2012-01-23
得票数 2
回答已采纳
2
回答
Apache :如何同时创建多个经过相同PCollections
的
PTransform?
、
、
+发行: 我可以从一个文件
中
读取,执行一个PTransform
浏览 0
提问于2018-05-22
得票数 2
1
回答
使用
Google
/sub更新单例HashMap
、
、
、
、
此PCollection是提供IoT设备记录
的
数据
的
数据流。来自IoT设备
的
数据流
使用
Apache管道,该管道作为
Google
运行,
使用
Google
/sub。HashMap,
在
该类
中
,我订阅了对数据
的
更新(这些消息提供给我与HashMap
中
已经存储
的
实体相关
的
新数据)。;
Pipeline
pipeLine
= <
浏览 0
提问于2018-11-21
得票数 16
2
回答
如何从PubSub主题中读取数据并将其解析到束流管道
中
并打印出来
、
、
、
、
我有一个
在
pubSub
中
创建主题并将消息发布到该主题
的
程序。我还有一个自动
的
数据流作业(
使用
模板),它将这些消息保存到我
的
BigQuery表
中
。现在我打算用python管道替换基于模板
的
作业,我
的
需求是从PubSub读取数据,应用
转换
,并将数据保存到BigQuery/发布到另一个PubSub主题。-253103/topics/test-
pipeline
-topic&qu
浏览 3
提问于2019-09-16
得票数 0
1
回答
SQL:可以是字符串或数字
的
分析事件值
、
、
我正在
使用
一个PostgreSQL数据库,我想创建一个与analytics_type表有多对一关系
的
分析表,其中analytics_type_id是
外
键
。该表还与
以
user_id作为
外
键
的
用户表具有多对一
的
关系。分析表
的
结构如下所示:值可以是字符串或数字,但
数据类型
将是varchar。到目前为止,这听起来不错,但是我
浏览 0
提问于2021-11-13
得票数 2
回答已采纳
1
回答
python
中
的
Apache光束数据流作业未运行
、
、
、
、
我正在创建一个数据管道,
使用
Apache beam从
google
存储桶(GCS)
中
获取XML文件作为输入,并将其
转换
为JSON文件。我尝试
使用
python
的
'xmltodict‘库首先将XML
转换
为python dict,然后
使用
python json.dumps()函数将其
转换
为json格式。我已经为光束管道
的
每个步骤创建了单独
的
beam.DoFn类。 我
在
一个小文件(
浏览 8
提问于2019-10-25
得票数 0
2
回答
数据流Flex模板验证失败,没有给出任何原因
、
、
我一直在编写一个数据流管道,并且正在
使用
flex模板。 我
的
代码从avro读取并处理它没有问题。但是当涉及到WriteToAvro或WriteToText时,数据流作业会失败,而且看起来像是
在
模板验证时失败。我完全没有理由这样做。 我试过很多方法。删除输出文件
的
参数并将其硬编码到
中
。这是最后一个刚刚中断
的
写入步骤。 编辑
以
添加需求文件。apache-beam==2.29.0
googl
浏览 9
提问于2021-06-27
得票数 0
1
回答
嵌套表查询
我找到了Oracle
的
以下代码:from movies m; 是否与Server等效?
浏览 4
提问于2014-04-03
得票数 0
回答已采纳
1
回答
使用
add_value_provider_argument时数据流作业挂起
、
、
我现在不得不对模板进行一些更改,我似乎在生成工作模板时遇到了问题,即使是
在
使用
与以前相同
的
代码/版本
的
beam时。我
的
工作就是无限期地挂起--我试着离开一个工作,一个小时左右就超时了。当然有一个问题,因为即使是我
的
第一步,仅仅是创建一个空
的
PCollection也不会成功,它只是说运行。 我已经从函数
中
抽象出了地狱,
以
找出问题可能是什么,因为日志
中
没有错误或奇怪之处。
在
非常精简
的<
浏览 19
提问于2020-09-18
得票数 0
2
回答
如何
使用
BigQuery处理数据流管道
中
的
插入错误?
、
、
、
、
我正在尝试用Dataflow创建一个流管道,它从PubSub主题中读取消息,最终将它们写入BigQuery表
中
。我不想
使用
任何数据流模板。目前,我只想在从
Google
实例执行
的
Python3脚本
中
创建一个管道,
以
执行来自Pubsub
的
每条消息
的
加载和
转换
过程(解析其中包含
的
记录并添加一个新字段),最终将结果写入BigQuery表。/usr/bin/env python from apac
浏览 0
提问于2019-11-14
得票数 3
回答已采纳
2
回答
CoGroupByKey没有给出预期
的
结果Apache (Python)
、
、
、
我一直
在
测试如何
使用
自创建
的
数据连接pub/sub数据。下面是主要
的
管道方法。"Window into" >> GroupMessagesByFixedWindows(window_size, num_shards) #creating sample
data
p2 =
pipeline
| "creating a sample
data
" >> Create([('Hel
浏览 0
提问于2021-07-16
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
为什么强烈推荐Java程序员使用Google Guava编程
22个免费的数据可视化和分析工具推荐!
谷歌正式发布数据可视化工具,提供超500个数据源
谷歌正式发布数据可视化工具,提供超500个数据源,主要还免费!
谷歌正式发布数据可视化工具Data Studio
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券