首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >在apache_beam中反序列化to记录的方法是什么?

在apache_beam中反序列化to记录的方法是什么?
EN

Stack Overflow用户
提问于 2017-09-19 10:31:28
回答 1查看 1.3K关注 0票数 2

我在apache_beam中找到了专门用于tfrecords的io函数,这可以实现:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from apache_beam.io.tfrecordio import ReadFromTFRecord
class VerifyOutput(beam.DoFn):
    def process(self, pcollection):
        try:
            pcollection = pcollection.element
        except AttributeError:
            pass
        logging.info(pcollection.subject_id)


(pipeline |  ReadFromTFRecord(opt.input_path, compression_type='auto', validate=True) 
          | beam.ParDo(VerifyOutput()) )

这将打印出tfrecord的字节串。如何在束流管道中解析这一点?这样才能把个别元素拿回来?

我确实找到了tensorflow成语用于阅读tfrecords 这里,但这对我没有用,我想是因为beam并不是“线程安全的”(挂起永远挂起)。

另外,在没有实际运行管道的情况下运行ReadFromTFRecord (用于调试/学习/测试)是否可能?比如在一个衣冠楚楚的笔记本里?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-06-06 23:19:09

您需要指定编码器来解码这些特性。像这样的事情应该能做好:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import tensorflow as tf
import tensorflow_transform as tft
from apache_beam.io.tfrecordio import ReadFromTFRecord
from tensorflow_transform.beam import impl as beam_impl
from tensorflow_transform.beam import tft_beam_io 
from tensorflow_transform.tf_metadata import dataset_metadata
from tensorflow_transform.tf_metadata import dataset_schema

...

# for each feature, adapt accordingly:
column_schemas['FEATURE_NAME']= dataset_schema.ColumnSchema(tf.int64, [], dataset_schema.FixedColumnRepresentation())

raw_data_metadata = dataset_metadata.DatasetMetadata(dataset_schema.Schema(column_schemas))
data_coder = tft.coders.ExampleProtoCoder(raw_data_metadata.schema)

_ = (pipeline | ReadFromTFRecord(opt.input_path, coder=data_coder, compression_type='auto', validate=True) 
              | beam.ParDo(VerifyOutput()) )

有关更详细的示例,请参见这里

但是,考虑到也有(较新的)替代方案来处理TF记录文件和数据集(例如,请参见这里这里)。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/46307498

复制
相关文章
【SEO优化】在SEO优化中,反链是什么意思?
在做网站SEO优化的时候,有些SEO人员怎么优化网站都排不到搜索引擎的首页,文章每天都有发,而且都被收录了,外链也正常发,就是排名没有变化,这是为什么呢?其实,就是SEO人员都忽略了反链的作用。接下来就一起了解一下反链吧!
鸣奔博客
2023/03/23
2K0
【SEO优化】在SEO优化中,反链是什么意思?
反卷积是什么?反卷积的作用
反卷积与卷积 反卷积,顾名思义是卷积操作的逆向操作。 为了方便理解,假设卷积前为图片,卷积后为图片的特征。 卷积,输入图片,输出图片的特征,理论依据是统计不变性中的平移不变性(translation
机器人网
2018/04/24
4.8K0
反卷积是什么?反卷积的作用
反爬虫的方法
反爬虫的方法 robots.txt配置 ——反爬等级 ★ User-Agent检测 ——反爬等级 ★ 账户进行访问控制 ——反爬等级 ★★ 有限数据访问 ——反爬等级 ★★★ 访问频率限制 ——反爬等级 ★★★ cookie/token等有效时间 ——反爬等级 ★★★ ip黑名单 ——反爬等级 ★★★ ID连续性问题——反爬等级 ★★★★ JS动态加载 ——反爬等级 ★★★★ 信息图片化 ——反爬等级 ★★★★ 接口加密 ——反爬等级 ★★★★ 接口加密 ——反爬等级 ★★★★★ 验证码 ——反爬等级 ★★
友儿
2022/09/11
2680
Json序列化在golang中的应用
golang对json序列化和反序列化的操作实在是难受,所以说用习惯了高级语言特性,再转到这些偏原生的写法上就会很难受。
happlyfox
2021/03/25
2.2K0
记录GOPATH在GOLAND中的坑
这里的GOPATH已经出错了,所以编译找不到,我检查了go env也是正确的GOPATH....
超蛋lhy
2018/08/31
1.8K0
记录GOPATH在GOLAND中的坑
[cloc]在Windows中配置cloc的记录
https://github.com/AlDanial/cloc/releases
逝水经年
2022/03/14
2.9K0
反大数据反算法,“反”的究竟是什么?丨科技云·视角
企业都想借大数据技术浪潮,反大数据和算法的公司、社交平台却掀起一阵小波澜,是大数据出了问题吗?
科技云报道
2022/04/14
5550
PHPDOM中的children方法是什么
在PHP开发中,PHPDOM是一个非常常用的类库,该类库是基于DOM模型的PHP扩展,主要用于处理XML和HTML文档。而其中的children方法是一种非常重要的函数,用于获取某个元素的所有子元素。
用户10354340
2023/07/26
1480
在.Net Core中记录日志
一个完善的系统,必然会有非常完善的日志记录,用户的操作、系统的运行状况等信息被完整的记录下来,方便我们对系统进行维护和改进。.net core 也为日志记录提供了内置的支持。
拓荒者IT
2019/09/23
1.3K0
UITableView在Flutter中是什么?
前面我们学习了文本、图片和按钮这些基本元素,这些基本元素需要进行排列组合,才能构成我们看到的UI视图。那么,当这些基本元素的排列布局超过屏幕显示尺寸(即超过一屏)时,我们就需要引入列表控件来展示视图的完整内容,并根据元素的多少进行自适应滚动展示。
拉维
2019/08/12
5.6K0
UITableView在Flutter中是什么?
java 中的序列化是什么意思?有什么好处?
简单说就是为了保存在内存中的各种对象的状态,并且可以把保存的对象状态再读出来。虽然你可以用你自己的各种各样的方法来保存Object States,但是Java给你提供一种应该比你自己好的保存对象状态的机制,那就是序列化。
lyb-geek
2018/07/26
5930
DateTime在ExtJs中无法正确序列化的问题
这几天在学习ExtJs + Wcf的过程中,发现一个问题,如果Class中有成员的类型为DateTime,即使我们正常标识了[DataMember],序列化成JSON时,会生成一种特有的格式: ..."AddTime":"\/Date(1213718400000+0800)\/"}... 这种格式ExtJs并不识别,导致最终的组件,比如Grid上无法正常显示,解决办法有二个: 1.将Class的成员,手动改成String类型,不过个人不推荐这种方式,毕竟将数据类型都改了,相应的服务端很多地方都可能会做相
菩提树下的杨过
2018/01/22
2.7K0
Java对象的序列化和反序列化是什么?
Java对象的序列化和反序列化是Java中常用的一种数据持久化方式。简单地说,序列化是将一个Java对象转换为字节流的过程,而反序列化则是将字节流转换回Java对象的过程。 Java对象序列化的主要目的是将对象转换为字节流,以便在网络上传输或将对象持久化到本地磁盘上。当一个Java对象被序列化后,它的所有属性和成员变量的值都被转换成字节流,并可以通过网络或者存储到本地磁盘上。由于Java对象序列化后可以被传输和存储,因此它在分布式系统和网络编程中扮演着非常重要的角色。
用户1289394
2023/08/22
2300
Java对象的序列化和反序列化是什么?
在Pyppeteer中实现反爬虫策略和数据保护
爬虫是我们获取互联网数据的神奇工具,但是面对越来越严格的反爬虫措施,我们需要一些我们获取数据的利器来克服这些障碍。本文将带您一起探索如何使用Pyppeteer库来应对这些挑战。
小白学大数据
2023/09/26
3680
在MySQL中查找重复记录
I want to pull out duplicate records in a MySQL Database. 我想在MySQL数据库中提取重复记录。 This can be done with: 这可以通过以下方式完成:
kirin
2021/04/30
3.8K0
MySQL 在查询结果中记录行号
在其他的关系型数据库中,都有rownum这类型的内置函数来提供查询结果的行号,但是MySQL没有,阿福也一直觉得奇怪。
用户2353021
2020/05/09
6.6K0
在JavaScript中,“=” 、“==”和“===”的区别是什么
上述代码中,5 和 "5" 在使用 == 进行比较时会被转换为相同的类型,然后判断它们的值是否相等。
王小婷
2023/10/16
4960
序列化和反序列化的底层实现原理是什么?
(1)Java序列化是指把Java对象转换为字节序列的过程,而Java反序列化是指把字节序列恢复为Java对象的过程;
chengcheng222e
2021/11/04
4690
“//”在python中是什么意思?
要在 Python 中进行楼层划分,请使用双斜杠 // 运算符。此 // 运算符将第一个数字除以第二个数字,并将结果舍入到最接近的整数(或整数)。
很酷的站长
2023/02/21
5.4K0
“//”在python中是什么意思?
点击加载更多

相似问题

在OCaml中序列化记录的标准方法是什么?

12

将Java对象(反)序列化到文件的最佳方法是什么

32

反数字位的最快方法是什么?

57

passport.js多个反/序列化方法

113

如何命名同时公开序列化和反序列化/反编组/反编组方法的类

166
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文