首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何处理PDF文件中的9位字符串?

如何处理PDF文件中的9位字符串?
EN

Stack Overflow用户
提问于 2013-06-27 12:47:02
回答 2查看 194关注 0票数 1

在PDF文件中,数据类型字符串有9位字符.虽然十六进制编码的字符串只有8位,但在“普通”字符串中,可以为单个字符表示512个不同的值。这是使用反斜杠后的字符的八进制表示来实现的。

在解析PDF文件时,我应该使用什么数据类型来存储这样的字符串?这真的很烦人,因为我不能像字节数组那样处理它们,然后在数组上应用utf-8这样的编码,但我也不能将其用作已解码的字符串,因为512个不同的字符不足以存储unicode字符,所以这9位字符串再次需要以某种方式进行编码:/我只是不知道编码/解码从/从字节到比特“字节”.

你对此有什么建议/最佳实践吗?

更新

正如R.Martinho Fernandes所指出的:

如果理论上可以用3位八进制数字来表示最高可达512的值,则只有表示小于256的值才有效。唯一奇怪的是,为什么他们使用三位数-八进制表示法而不仅仅是两位十六进制表示法?

我认为答案是,这样\b和\f将被视为十六进制值。但我不确定。

不管怎么说,我很高兴在adobe的人没有喝醉时,他们做PDF格式:)和:我需要一个答案,以接受男生!

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-06-27 13:31:23

PDF格式只允许8位字节的字符串.八进制转义可以表示9位单位,但第9位可能的位代表8位字节是无用的。这是常见的做法,例如,C++八进制转义也是如此。所以,不用担心,PDF中没有9位字符串:)

票数 4
EN

Stack Overflow用户

发布于 2013-06-27 12:54:26

如果你没有真正的内存空间,为什么不简单地使用16位类型呢?

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/17343590

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档