开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >在apache_beam中反序列化to记录的方法是什么？

问在apache_beam中反序列化to记录的方法是什么？
EN

Stack Overflow用户

提问于 2017-09-19 10:31:28

回答 1查看 1.3K关注 0票数 2

我在apache_beam中找到了专门用于tfrecords的io函数，这可以实现：

from apache_beam.io.tfrecordio import ReadFromTFRecord
class VerifyOutput(beam.DoFn):
    def process(self, pcollection):
        try:
            pcollection = pcollection.element
        except AttributeError:
            pass
        logging.info(pcollection.subject_id)


(pipeline |  ReadFromTFRecord(opt.input_path, compression_type='auto', validate=True) 
          | beam.ParDo(VerifyOutput()) )

这将打印出tfrecord的字节串。如何在束流管道中解析这一点？这样才能把个别元素拿回来？

我确实找到了tensorflow成语用于阅读tfrecords 这里，但这对我没有用，我想是因为beam并不是“线程安全的”(挂起永远挂起)。

另外，在没有实际运行管道的情况下运行ReadFromTFRecord (用于调试/学习/测试)是否可能？比如在一个衣冠楚楚的笔记本里？

google-cloud-dataflow

校园云服务器 2H2G30元起

云+校园是针对学生用户推出的扶持计划，2核2G云服务器30元起，1核1G云数据库4元起，并享受免费体验6个月云开发

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-06-06 23:19:09

您需要指定编码器来解码这些特性。像这样的事情应该能做好：

import tensorflow as tf
import tensorflow_transform as tft
from apache_beam.io.tfrecordio import ReadFromTFRecord
from tensorflow_transform.beam import impl as beam_impl
from tensorflow_transform.beam import tft_beam_io 
from tensorflow_transform.tf_metadata import dataset_metadata
from tensorflow_transform.tf_metadata import dataset_schema

...

# for each feature, adapt accordingly:
column_schemas['FEATURE_NAME']= dataset_schema.ColumnSchema(tf.int64, [], dataset_schema.FixedColumnRepresentation())

raw_data_metadata = dataset_metadata.DatasetMetadata(dataset_schema.Schema(column_schemas))
data_coder = tft.coders.ExampleProtoCoder(raw_data_metadata.schema)

_ = (pipeline | ReadFromTFRecord(opt.input_path, coder=data_coder, compression_type='auto', validate=True) 
              | beam.ParDo(VerifyOutput()) )

有关更详细的示例，请参见这里。

但是，考虑到也有(较新的)替代方案来处理TF记录文件和数据集(例如，请参见这里和这里)。

票数 1

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/46307498

复制

相关文章

【SEO优化】在SEO优化中，反链是什么意思？

搜索引擎网站 seo 算法优化

在做网站SEO优化的时候，有些SEO人员怎么优化网站都排不到搜索引擎的首页，文章每天都有发，而且都被收录了，外链也正常发，就是排名没有变化，这是为什么呢？其实，就是SEO人员都忽略了反链的作用。接下来就一起了解一下反链吧！

鸣奔博客

2023/03/23

2K0

【SEO优化】在SEO优化中，反链是什么意思？

反卷积是什么？反卷积的作用

神经网络深度学习 tensorflow

反卷积与卷积反卷积，顾名思义是卷积操作的逆向操作。为了方便理解，假设卷积前为图片，卷积后为图片的特征。卷积，输入图片，输出图片的特征，理论依据是统计不变性中的平移不变性（translation

机器人网

2018/04/24

4.8K0

反爬虫的方法

反爬虫的方法 robots.txt配置 ——反爬等级 ★ User-Agent检测 ——反爬等级 ★ 账户进行访问控制 ——反爬等级 ★★ 有限数据访问 ——反爬等级 ★★★ 访问频率限制 ——反爬等级 ★★★ cookie/token等有效时间 ——反爬等级 ★★★ ip黑名单 ——反爬等级 ★★★ ID连续性问题——反爬等级 ★★★★ JS动态加载 ——反爬等级 ★★★★ 信息图片化 ——反爬等级 ★★★★ 接口加密 ——反爬等级 ★★★★ 接口加密 ——反爬等级 ★★★★★ 验证码 ——反爬等级 ★★

友儿

2022/09/11

2680

Json序列化在golang中的应用

腾讯云开发者社区 go json

golang对json序列化和反序列化的操作实在是难受，所以说用习惯了高级语言特性，再转到这些偏原生的写法上就会很难受。

happlyfox

2021/03/25

2.2K0

记录GOPATH在GOLAND中的坑

这里的GOPATH已经出错了，所以编译找不到，我检查了go env也是正确的GOPATH....

超蛋lhy

2018/08/31

1.8K0

记录GOPATH在GOLAND中的坑

[cloc]在Windows中配置cloc的记录

html php windows

https://github.com/AlDanial/cloc/releases

逝水经年

2022/03/14

2.9K0

反大数据反算法，“反”的究竟是什么？丨科技云·视角

大数据编程算法

企业都想借大数据技术浪潮，反大数据和算法的公司、社交平台却掀起一阵小波澜，是大数据出了问题吗？

科技云报道

2022/04/14

5550

PHPDOM中的children方法是什么

在PHP开发中，PHPDOM是一个非常常用的类库，该类库是基于DOM模型的PHP扩展，主要用于处理XML和HTML文档。而其中的children方法是一种非常重要的函数，用于获取某个元素的所有子元素。

用户10354340

2023/07/26

1480

在.Net Core中记录日志

一个完善的系统，必然会有非常完善的日志记录，用户的操作、系统的运行状况等信息被完整的记录下来，方便我们对系统进行维护和改进。.net core 也为日志记录提供了内置的支持。

拓荒者IT

2019/09/23

1.3K0

UITableView在Flutter中是什么？

网站 javascript ios listview android

前面我们学习了文本、图片和按钮这些基本元素，这些基本元素需要进行排列组合，才能构成我们看到的UI视图。那么，当这些基本元素的排列布局超过屏幕显示尺寸（即超过一屏）时，我们就需要引入列表控件来展示视图的完整内容，并根据元素的多少进行自适应滚动展示。

拉维

2019/08/12

5.6K0

UITableView在Flutter中是什么？

java 中的序列化是什么意思?有什么好处?

简单说就是为了保存在内存中的各种对象的状态，并且可以把保存的对象状态再读出来。虽然你可以用你自己的各种各样的方法来保存Object States，但是Java给你提供一种应该比你自己好的保存对象状态的机制,那就是序列化。

lyb-geek

2018/07/26

5930

DateTime在ExtJs中无法正确序列化的问题

这几天在学习ExtJs + Wcf的过程中，发现一个问题，如果Class中有成员的类型为DateTime，即使我们正常标识了[DataMember]，序列化成JSON时，会生成一种特有的格式: ..."AddTime":"\/Date(1213718400000+0800)\/"}... 这种格式ExtJs并不识别，导致最终的组件，比如Grid上无法正常显示，解决办法有二个: 1.将Class的成员，手动改成String类型，不过个人不推荐这种方式，毕竟将数据类型都改了，相应的服务端很多地方都可能会做相

菩提树下的杨过

2018/01/22

2.7K0

Java对象的序列化和反序列化是什么？

java 变量对象网络序列化

Java对象的序列化和反序列化是Java中常用的一种数据持久化方式。简单地说，序列化是将一个Java对象转换为字节流的过程，而反序列化则是将字节流转换回Java对象的过程。 Java对象序列化的主要目的是将对象转换为字节流，以便在网络上传输或将对象持久化到本地磁盘上。当一个Java对象被序列化后，它的所有属性和成员变量的值都被转换成字节流，并可以通过网络或者存储到本地磁盘上。由于Java对象序列化后可以被传输和存储，因此它在分布式系统和网络编程中扮演着非常重要的角色。

用户1289394

2023/08/22

2300

Java对象的序列化和反序列化是什么？

在Pyppeteer中实现反爬虫策略和数据保护

python爬虫动态代理 python

爬虫是我们获取互联网数据的神奇工具，但是面对越来越严格的反爬虫措施，我们需要一些我们获取数据的利器来克服这些障碍。本文将带您一起探索如何使用Pyppeteer库来应对这些挑战。

小白学大数据

2023/09/26

3680

在MySQL中查找重复记录

数据库云数据库 SQL Server sql

I want to pull out duplicate records in a MySQL Database. 我想在MySQL数据库中提取重复记录。 This can be done with: 这可以通过以下方式完成：

kirin

2021/04/30

3.8K0

MySQL 在查询结果中记录行号

编程算法云数据库 SQL Server 其他数据库 sql

在其他的关系型数据库中，都有rownum这类型的内置函数来提供查询结果的行号，但是MySQL没有，阿福也一直觉得奇怪。

用户2353021

2020/05/09

6.6K0

在JavaScript中，“=” 、“==”和“===”的区别是什么

javascript console var 编程变量

上述代码中，5 和 "5" 在使用 == 进行比较时会被转换为相同的类型，然后判断它们的值是否相等。

王小婷

2023/10/16

4960

序列化和反序列化的底层实现原理是什么？

文件存储 java c++编程算法 https

（1）Java序列化是指把Java对象转换为字节序列的过程，而Java反序列化是指把字节序列恢复为Java对象的过程；

chengcheng222e

2021/11/04

4690

“//”在python中是什么意思？

python 存储编程算法

要在 Python 中进行楼层划分，请使用双斜杠 // 运算符。此 // 运算符将第一个数字除以第二个数字，并将结果舍入到最接近的整数（或整数）。

很酷的站长

2023/02/21

5.4K0

“//”在python中是什么意思？

点击加载更多

相似问题

在OCaml中序列化记录的标准方法是什么？

12

将Java对象(反)序列化到文件的最佳方法是什么

32

反数字位的最快方法是什么？

57

passport.js多个反/序列化方法

113

如何命名同时公开序列化和反序列化/反编组/反编组方法的类

166

活动推荐

提供大模型在企业的应用构建、高效便捷

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例