如何使用apache beam将列表对象写入JSON文件？_无法使用apache beam python将json写入Pubsub主题_使用Apache Beam Python SDK将文件写入Parquet中的动态目标 - 腾讯云开发者社区

、、、

我有一个字典元素列表，如下所示。apache beam管道将上述列表写入到JSON文件中。| 'Write Output' >> beam.io.WriteToText(json_file_path, shard_name_template='') p.run() 当我执行上面的代码时，我最终在output.json文件<

浏览 9提问于2021-08-05得票数 1

回答已采纳

1回答

使用Apache光束`GroupByKey`，构造一个新的列-- Python

、、、、

，我知道了如何使用pandas对多列进行分组并构造一个新的唯一id，但是如果我想在Python中使用Apache beam来实现该问题中描述的相同功能，我如何实现它，然后将新数据写入换行符分隔的JSON格式文件(每行都是一个unique_id，其中包含属于该unique_id的对象数组)？假设数据集存储在csv文件中。我是Apache beam的

浏览 14提问于2021-08-15得票数 0

回答已采纳

1回答

谷歌数据流作业在writeToBiqquery步骤失败：'list‘对象和'str’对象没有属性‘’items‘

、、、、

早些时候，我使用beam管道将换行符分隔的JSON写入GCS bucket，并从该文件创建一个BQ表，而无需对其进行任何更改(使用bigquery控制台)。现在我已经修改了管道，以便将输出的JSON行直接写入BQ表。我正在使用apache的beam.io.WriteToBigQuery函数。集合是json对象，其中每一行都包含B

浏览 6提问于2019-11-13得票数 3

回答已采纳

2回答

在Apache* Beam中读取整个文件*

、

是否可以读取整个文件(而不是逐行读取)？例如，我想读取多行JSON，我的想法是逐个文件读取，从每个文件中提取数据并从列表中创建PCollection。这是一个好主意，还是将源JSON预处理为一个JSON文件更好，每行都是单独的JSON？谢谢你的预支。

浏览 17提问于2019-10-18得票数 1

回答已采纳

1回答

将JSON对象写入循环中的文件

、、、

我正在尝试制作一个python脚本，将给定数量的JSON对象写入文本文件。每个对象都需要在自己的线上。 json</e

浏览 0提问于2019-07-17得票数 0

2回答

用dict属性编写JSON到

、、

使用Apache (Python2.7SDK)，我试图将JSON文件作为实体写入。": "Shipping", "streetAddress": "Street 6", "city": "Stockholm", "postalCode": "YYT IKO"}} <

浏览 0提问于2018-11-09得票数 3

1回答

如何使用读取txt文件并转换为数据帧？

、、、

我的txt文件包含没有任何分隔符的股票市场数据。因此，我必须将其转换为结构化列，并使用管道将其转换为数据框架。任何帮助都将不胜感激。

浏览 7提问于2022-01-17得票数 1

3回答

在google cloud上训练神经网络时出现"Unable to get Filesystem for path“错误

、、、、

我正在使用Google Cloud在云上训练神经网络，如以下示例所示： PROJECT_ID=$(gcloud config list project --format"value(core.project)")然后，我使用以下命令将我的训练和评估数据上传到谷歌云存储：然后，我验证了这两个csv文件是否在我的Google

浏览 2提问于2017-05-23得票数 9

1回答

Bigquery加载JSON错误“无法将值转换为字符串”

、、

我正在尝试将JSON事件数据从加载到BigQuery，并且希望以字符串的形式加载所有数据，然后再进行转换，因为对于某些消息，它们看起来如下所示：{"id":234}我不想用--max_bad_records，跳过

浏览 2提问于2020-11-24得票数 3

2回答

如何用Python中的Apache* beam读取和操作Json文件*

、、、

我有一个具有JSON格式的.txt文件。我想读取、操作和重构文件(更改字段名.)我如何用Apache在Python中做到这一点呢？

浏览 0提问于2019-06-04得票数 1

回答已采纳

2回答

Pubsub to Bigquery

、、

在Docs 中的示例中，它们向托管在AppEngine中的工作人员提供pubsub推送，该工作人员随后处理数据(在我的示例中是写入适当的BigQuery表)。

浏览 3提问于2016-11-10得票数 0

回答已采纳

1回答

Apache :将具有对象列表的对象转换为多个TableRows以写入BigQuery

、、、

我正在处理一个beam管道，以处理json并将其写入bigquery。JSON是这样的。其要求是根据消息对象的数量创建多个TableRows。我在JSON和publishDate中还有一些属性，这些属性将添加到tableRow和每个消息属性中。所以表如下所示。但是，不确定它将如何根据消息列表输出多个行。:301) at org.apache.beam.runners.direct.DirectRun

浏览 3提问于2017-10-26得票数 3

回答已采纳

1回答

将数据从csv写入BigQuery时出错

、

我已经编写了一个Python数据流作业，用于从csv文件读取数据并使用该数据填充BigQuery表。但是，每当我运行此作业时，都会弹出一个错误。如果我删除write to Big Query部分，改为写入文件，则代码执行正常，并且表以dict格式写入输出文件。ReadFromTextfrom apache_beam.metrics imp

浏览 0提问于2017-08-30得票数 0

2回答

如何使用带有自定义格式的Apache以JSON格式将BigQuery结果写入GCS？

、、、、

我正在尝试使用python中的Apache将BigQuery表记录作为JSON文件写入GCS桶中。我有一张像这样的BigQuery表-- my_project.my_dataset.my_table我希望将表记录/条目写入GCS桶位置中的JSON文件中- "gs://my_core_ bucketapache管道，我看到创建的JSON</e

浏览 12提问于2021-07-12得票数 1

回答已采纳

1回答

如何同时使用destination_prefix_naming和default_file_naming在Apache中？

我有一个Apache管道，它通过以下方式写入文件： my_pipeline = ( | "WriteSomeFiles" >> beam.io.fileio.WriteToFiles(/to/direc

浏览 5提问于2022-02-10得票数 0

回答已采纳

1回答

数据流GCS到BQ问题

、、、

这里是：我在GCS中有一组文件被压缩，并且有一个.gz文件扩展名(即000000_0-5.gz)，我正试图将这些文件导入到一个BQ表中。压缩的GCS文件中的数据是一个复杂的JSON结构，经常更改模式，因此最简单的方法是将整个文件作为一个TSV，只包含一个名为record的列，然后在BQ中使用JSON_EXTRACT函数解析所需的值。apache_beam as beam</

浏览 0提问于2017-12-14得票数 1

回答已采纳

1回答

json数据的Apache波束流处理

、

我正在分析Apache光束流的数据处理。我从事过Apache流处理(生产者、消费者等)的工作。我想把它和比姆比较一下。我想以编程的方式使用Apache (Java)来流简单的json数据。

浏览 0提问于2018-05-14得票数 2

回答已采纳

1回答

Apache波束文件写入压缩文件

、、、、

我想知道是否可以使用Apache，Python中的fileio模块编写压缩文件。目前，我正在使用该模块将文件写入GCP桶： | 'Convertto JSON' >> beam.ParDo(ConvertToJ

浏览 10提问于2022-07-07得票数 0

回答已采纳

1回答

DataFlow管道中Google Storage SDK中的Socket closed错误

、、

我在我的DataFlow管道(2.29.0)中使用google-cloud-storage (1.54.0)将文件写入Google Storage。我随机地看到了下面的错误。:108) org.apache.beam.runners.dataflow.worker.repackaged.org.apache.beam.runners.core.ReduceFnRunner.lambda$onTrigger$1(ReduceFnRunner.java:1

浏览 56提问于2021-10-05得票数 0

1回答

Apache写入

、、

无法使用Apache Beam JavaSDK写入PubSub。我正在尝试使用beam从PubSub中读取数据，进行处理，然后将数据写入PubSub主题，但我无法找到如何写入PubSub的工作示例。是否有人可以帮助适当的转换，以写入PubSub主题。<java.lang.String,org.apache.beam.sdk.io.gcp.pubsub.Pu

浏览 0提问于2017-11-14得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云