首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

PDF Explained(翻译)第七章 文档元数据和导航

这些大纲条目是通过一个大纲字典和许多大纲项目字典定义的。文档目录中的/Outlines指向大纲字典。条目的子条目可以默认展开或收起。...如果没有打开的条目,可以省略。 大纲项目字典中的条目如下表所示,*是必选项: 键 值类型 值 /Title* 文本字串 条目文本 /Parent* 间接引用字典 指向该项目在大纲树中的父节点。...文档级元数据流扩展并取代文档信息字典(为了与旧的PDF程序兼容,几乎总是包含该字典)。 元数据以未压缩方式存储,通常不会加密。这样的方式使得外部工具可以很容易地在PDF文件中找到它。...可以使用页面字典中的条目/Annots下的数组将一个或多个注释与页面相关联。 每个注释都是一个字典。字典中的条目在下表中描述,*为必选项。每种类型的注释都有额外的条目。...可以使用不同的边框样式,包括使链接矩形不可见的样式。 文件附件 附件是一种在PDF文档中包含一个或多个文件(任何类型)的方法。文件可以附加到整个文档上,也可以附加到单个页面上。

1.1K20

如何用pycococreator将自己的数据集转换为COCO类型

COCO是最早出现的不只用边界框来注释对象的大型数据集之一,因此它成了用于测试新的检测模型的普遍基准。...这种二进制掩码很容易理解并创建。这就是为什么在你使用pycococreator创建COCO类型的版本之前,你需要转换数据集格式。你可能会想,为什么不使用png二进制掩码格式?它不是更好理解吗?...但我们可以用pycococreator来解决这部分问题。让我们首先把简单的问题解决掉,我们使用python列表和字典库来描述我们的数据集,然后将它们导出为json格式。 ?...在第90和91行创建了图像条目,而在第112-114行进行了注释处理。 ? ? ? COCO支持的注释有两种类型,它们的格式取决于注释是单个对象还是多个对象。...在创建了COCO类型的数据集之后,你可以使用COCO API将其可视化来测试它。以pycococreator中的Jupyter Notebook为例,你应该会看到类似的情况: ?

2.5K50
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    左右用R右手Pyhon系列——趣直播课程抓取实战

    我一眼就看到了一个以listOrderByPlanTs?limit=30命名的请求项目,该项目中含有list关键词、limit关键词,这些关键词很可能是api用于限定信息展示条目的限制参数。...从Response Headers中可以得知服务器 返回的数据类型是application/json格式,utf-8编码。这决定着我们使用什么工具来解析返回内容。...然后我有个大胆的想法,我们可以篡改url啊我擦~ ? 改成100果然就显示100了哈哈哈,那就索性再大胆一些,改成1000如何???...当显示出了112门课程的时候,你可以直接Ctrl+S保存该网页为.json文件,直接解析,当然我们还是要做的优雅一点,直接写在请求语句中,然后友好的返回规整的数据框。...啦啦啦,多么完美的结局呀,你看数据框都不用处理缺失值,简直是太神奇了。接下来我们仅需要剔除那些我们不想要的列就可以了。

    83570

    如何画技术架构图

    平时做过一些系统设计,也写过一些系统分析文章,从组件、关系、交互等方面提供一些建议,并用我之前写文章画的一些图举些例子。 构成系统的组件 通过形状、颜色、名称来逼近其概念。...持久化的多副本状态机模块用圆柱体:存储、数据库等持久化组件的多用柱形。 组件间的关系 通过分割线、分割框来表达是否在同一层级、是否有包含关系。...LevelDB 源码解析之 LRUCache 上图来自LevelDB 源码解析之 LRUCache[3], 在 LRU 算法中,需要用以两种形式组织数据条目,以达到缓存达到阈值时驱逐最老的数据: 以字典维护键值映射...因此任意一个数据条目 LRUHandle 都同时归属于字典和链表,但字典的表头和链表的表头是各自独立的。...我是青藤木鸟,一个喜欢摄影的分布式系统程序员,欢迎关注我的公众号:“木鸟杂记”。等之后我会在博客中加一个页面:按图索文,想想也挺有趣。

    1.4K10

    【愚公系列】2023年11月 WPF控件专题 2023秋招WPF高频面试题

    可以创建和动画 3D 图形。可以轻松绘制可缩放的矢量图形而不会出现锯齿状锯齿。2. 说说WPF中的XAML是什么?为什么需要它?它只存在于WPF吗?...资源提供了一种简单的方法来重用已定义的对象和值。 WPF 中的资源允许一次设置多个控件的属性。 例如,可以使用单个资源在 WPF 应用程序中的多个元素上设置背景属性。...值转换器充当目标和源之间的桥梁,当目标与一个源绑定数据类型不一致时,需要值转换器来做中转。例如有一个文本框和一个按钮控件, 当文本框的文本被填充或为空时,希望启用或禁用按钮控件。...CanExecute 方法只是告诉用户,我可以执行这个 Action 吗? 这对于控制 GUI 元素的可操作性非常有用。 ICommand 非常简单,但是也可以完在更加有趣和复杂的功能。...依赖属性通过仅在实例中存储修改的属性来解决这些问题。 默认值在依赖属性中存储一次。值继承当访问依赖项属性时,将使用值解析策略来解析该值。

    53222

    ​Python 之父的解析器系列之三:生成一个 PEG 解析器

    我们需要两个东西:一个东西读取语法,并构造一个表现语法规则的数据结构;还有一个东西则用该数据结构来生成解析器。我们还需要无聊的胶水,我就不提啦。...有个简单地表示元语法的方法,主要是使用内置的数据类型:一条规则的右侧只是由一系列的条目组成的列表,且这些条目只能是字符串。...注意@memoize 装饰器:我“偷运”(smuggle)它进来,以便转向另一个主题:使用记忆法(memoization)来加速生成的解析器。...缓存负数的结果也很重要——实际上大多数对解析方法的调用都是负数的结果。在此情况下,返回值为 None,而输入位置不会变。你可以加一个assert 断言来检查它。...但我们不这么做:因为我在一个最后时刻的调试会话中发现,每个 Parser 实例都必须拥有自己的缓存。然而,你可以用(pos, func, args) 作为 key,以摆脱嵌套字典的设计。

    75520

    PubMed使用者指南(一)

    14.在我检索的结果出现更新时,我可以收到邮件吗? 15.如何在PubMed报告错误及双重引用? 16.如何引用一篇文章或者将引文导出至我的文献管理软件中? 17.如何获得目录链接及分享我的检索?...为了限制检索结果的数量: 用更具体的检索条目替代广泛的条目(如下背痛而非背痛) 在检索中包括额外的条目 使用侧边栏的过滤器来限制结果,如出版时间、拥有全文、文章类型等 我检索了太少引文,如何扩展?...如果要检索到当前日期为止的日期范围,请不要编辑“当前”日期框。 3.点击检索 在检索框内使用单个日期 输入日期,格式为yyyy/mm/dd[日期字段]。...6.创建日期Create Date[crdt]——引文记录首次创建的日期。 月份和日期是可选的。...一些子集被关闭,不再分配给当前数据。 要检索期刊/引文子集,在检索框中输入:“jsubset?”,这里“?”表示子集代码。期刊/引文子集不需要检索标签。

    8.8K10

    利用Python爬虫某招聘网站岗位信息

    正当我不明所以之际,盆友的微信语音通话接了进来 友:“看你在学python,爬虫写的怎么样了呀,我想抓一下某招聘网站的数据,能帮我整一个吗,不行的话我也去看看” 我:“哦哦,你不是技术嘛,自己来嘛 友:...操作流程: 第1步,获取数据源URL地址: F12 打开浏览器开发者工具调试页面,选中network——xhr,刷新网页后选择 招聘,可以看见右侧有刷新调试页面有内容刷新,选中最近一个刷新的条目即可获取数据源...第二层:字典 ? 第三层:列表 ? 第四层:字典 ? 4)输出你需要的数据 通过理清原始数据结构,结合你需要的数据,咱们就可以进行数据简单过滤选择了 直接创建一个空字典,存储你需要的数据信息 ?...20条岗位信息,逐一采集 for i in range(len(data['normal_data'])): n = n+1 #创建空字典用于存储单个岗位信息...,end=' ') #单页显示20条岗位信息,逐一采集 for i in range(len(data['normal_data'])): n = n+1 #创建空字典用于存储单个岗位信息

    89340

    PDF Explained(翻译)第四章 文档结构

    > ] >> 处理了trailer字典后,我们就可以继续读取文档信息字典和文档目录。...文档信息字典 文档信息字典包含文件的创建日期和修改日期,以及一些简单的元数据。 文档信息中的条目如下表所示,表中提到的“文本字串”和日期字串将在后文中详述。...同时还包含页面大小,以及一些裁剪框。 下表列出了页面字典中的条目,*为必选条目。...如果缺少此条目,则其值将从父节点继承。 /MediaBox* 长方形 页面的媒体框。大多数情况指页面大小。如果缺少此条目,将从父节点继承。 /CropBox 长方形 页面的裁剪框。...如果不存在,则取媒体框的值。 用于媒体框和其它框的矩形数据结构是包含四个数字的数组。它们定义了矩形的对角–数组的前两个元素是一个角的x和y坐标,后两个元素是另一个角的x和y坐标。

    1K20

    PDF Explained(翻译)第三章 文件结构

    key是句子,值可以是任意PDF对象。字典数据写在>之间。例: > //One映射为1 //Two映射为2 字典是可以包含其他字典。...对象和交叉引用流 从PDF 1.5开始,引入了一种新机制来进一步压缩PDF文件。这种机制允许将多个对象放入单个对象流,然后再对整个流进行压缩。同时引入了一种引用流中对象的机制–交叉引用流。...我们希望第一页快速显示,并且可以尽快跳转到另一页(通过单击超链接或书签)。 在单个页面较大时,我们希望页面内容逐步显示,最重要的内容首先出现。 网络传输机制例如HTTP 通常允许获取任意数据块。...然后读取trailer字典以及交叉引用表开关位置的字节偏移。 读取交叉引用表,获取每个对象在文件中的位置。 在此阶段,可以读取和解析所有对象,也可以在需要时再对每个对象进行处理。...使用数据提取页面,解析图形内容,提取元数据等。 这不是详尽的描述,因为可能存在许多复杂的情况(加密,线性化,对象和交叉引用流)。 下面以伪代码给出的递归数据结构可以表示一个PDF对象。

    1.4K40

    什么策略模式,我大python一个关键字搞定(并没有)所有

    行8:界面每次输入框中按回车,就会触发此函数 行8:参数 input 就是界面输入框的内容 比如,直接调用 build_go ,可以控制小球移动: 现在输入任何内容,小球总是往右移动。...最简单就是使用 if 判断: 注意到吗,我们需要先判断文本按空格划分后的列表结构(必须得有2个元素): 这是我认为 python 中使用 match 语法的一个重要场景,结构匹配(序列匹配)。...字典匹配的实现在 main_by_dict_match.py 字典匹配 我们把解析流程修改一下: 专门有函数负责第一层解析,返回一个字典。 字典总有一个 action 键值对,表示具体指令。...比如 "走"、"还原" 等 针对不同的命令,字典有不同的键值对 解析成字典的函数,问人工智能"好朋友"就可以了: 用到的都是前面的知识 单独实现函数的好处是,很容易测试和定位问题: 有了命令信息字典,现在看看怎么使用...从这个案例中可以看到,我们不必把所有处理逻辑集中到一个 match 中。而是适当把逻辑拆分一下。 对于非结构匹配需求,我认为没太多必要使用 match 。而是可以考虑使用字典匹配。

    13810

    Matplotlib 中文用户指南 3.6 图例指南

    - 但值得注意的是,并非所有艺术家都可以添加到图例中, 这种情况下会创建『代理』(请参阅特地为添加到图例创建艺术家(也称为代理艺术家),来了解更多详细信息)。...(也称为代理艺术家) 并非所有的句柄都可以自动转换为图例条目,因此通常需要创建一个可转换的艺术家。...假设我们想创建一个图例,其中有一些数据表示为红色: import matplotlib.patches as mpatches import matplotlib.pyplot as plt red_patch...plt.subplot(211) plt.plot([1,2,3], label="test1") plt.plot([3,2,1], label="test2") # 将图例放到这个子图上方, # 扩展自身来完全利用提供的边界框...然后我们可以将实例的字典作为关键字handler_map传给legend。

    1.6K10

    (数据科学学习手札69)详解pandas中的map、apply、applymap、groupby、agg

    2.1 map()   类似Python内建的map()方法,pandas中的map()方法将函数、字典索引或是一些需要接受单个输入值的特别的对象与对应的单个列的每一个元素建立联系并串行得到结果,譬如这里我们想要得到...map()可以传入的内容有时候可以很特殊,如下面的例子: ● 特殊对象   一些接收单个输入值且有输出的对象也可以用map()方法来处理: data.gender.map("This kid's gender...可以看到它此时是生成器,下面我们用列表解析的方式提取出所有分组后的结果: #利用列表解析提取分组结果 groups = [group for group in groups]   查看其中的一个元素:...● 聚合数据框   对数据框进行聚合时因为有多列,所以要使用字典的方式传入聚合方案: data.agg({'year': ['max','min'], 'count': ['mean','std']})...可以注意到虽然我们使用reset_index()将索引列还原回变量,但聚合结果的列名变成红色框中奇怪的样子,而在pandas 0.25.0以及之后的版本中,可以使用pd.NamedAgg()来为聚合后的每一列赋予新的名字

    5.1K60

    检索帮助学习

    创建及查询输入字段的方法有三种 1、利用ABAP数据字典的输入帮助 在T-CODE:SE11中创建检索帮助后分配给表字段。另外,画面字段可以参照表字段生成,即可以继承输入帮助的功能。...定义程序的PARAMETERS变量时也使用MATCHCODE命令来追加检索帮助。一般用下列语句将检索帮助连接到PARAMETERS上。...PARAMTERS MATCHCODE OBJECT 创建检索帮助 各个选项的定义 选择方法 检索帮助是在执行时刻从数据库中读取数据构成值列表。...此时使用的数据库对象称为选择方法。其中,ABAP数据字典表与视图可作为选择方法来使用。但是,维护视图则不能。值列表中显示的是可能输入的值。当需要的数据在一个表中存在时,在选择方法中选择相应的表即可。...如果其包含的条目多余100个,那么显示限制值用的对话框。 C 具有值限制的对话 带有值限制的对话:立即显示限制值的对话框。如果正常情况下可能条目的清单非常大,则选择该选项。

    76430

    使用Selenium爬取淘宝商品

    在前一章中,我们已经成功尝试分析Ajax来抓取相关数据,但是并不是所有页面都可以通过分析Ajax来完成抓取。...整个流程相对比较复杂,所以这里我们直接用跳转的方式来爬取页面。 当我们成功加载出某一页商品列表时,利用Selenium即可获取页面源代码,然后再用相应的解析库解析即可。...解析商品列表 接下来,我们就可以实现get_products()方法来解析商品列表了。...CSS选择器,就可以获取单个商品的特定内容了。...可以发现,这些商品信息的结果都是字典形式,它们被存储到MongoDB里面。 再看一下MongoDB中的结果,如下图所示。 ? 可以看到,所有的信息都保存到MongoDB里了,这说明爬取成功。 10.

    3.7K70

    Python Selenium 爬虫淘宝案例

    前言 在前一章中,我们已经成功尝试分析 Ajax 来抓取相关数据,但是并不是所有页面都可以通过分析 Ajax 来完成抓取。...整个流程相对比较复杂,所以这里我们直接用跳转的方式来爬取页面。 当我们成功加载出某一页商品列表时,利用 Selenium 即可获取页面源代码,然后再用相应的解析库解析即可。...解析商品列表 接下来,我们就可以实现 get_products 方法来解析商品列表了。...() 方法,传入 CSS 选择器,就可以获取单个商品的特定内容了。...运行 运行代码,可以发现首先会弹出一个 Chrome 浏览器,然后会访问淘宝页面,接着控制台便会输出相应的提取结果。 可以发现,这些商品信息的结果都是字典形式,它们被存储到 MongoDB 里面。

    96122

    OMIM使用简要说明【论坛精选优秀帖】

    所以我们可以通过表型或者基因型来搜索对应的信息。通过网址登陆到OMIM的主页:https://www.omim.org/ ?...1994年5月15日后) 另外OMIM数据库的内容主要包括如下信息: 表型 示例 单个基因的孟德尔疾病、失调和表型 囊性纤维化,镰状细胞性贫血,软骨发育不全,表型性特征例如头发眼睛颜色不同,药物反应例如恶性高体热和华法林敏感性...作为搜索条目的通配符,*表示搜索条目接多个字符,?表示搜索条目接单个字符 dystroph* dystrophi? dystro??i?...,下面2号框(Hightlights)我们可以选择在结果中高亮搜索条目;在3号框位置的第一个返回结果为前缀为#号的描述性结果(#168600,PARKINSO DISEASE,LATE-ONSET; PD...最后对OMIM的数据下载就不做介绍,我使用了同学的edu后缀邮箱注册了,但是还未通过,但是网站有无需注释的txt文件可供下载,感兴趣的可以下来打开看看(mim2gene.txt)。

    2.8K110

    Python入门(三):数据结构

    02 列表 list 保存有序项集合、大小可变(可以增加和删除项)的数据结构。...列表推导式 列表推导式(又称列表解析式)提供了一种简明扼要的方法来创建列表。 ?...03、元组 tuple 一种类似列表的数据序列类型 要点是不可变,不可以添加、删除、更新元素 用两个小括号包括起来,元素之间用逗号分隔 创建方式 student = (1001, 'xiaoming',...20)# 元组的括号可以省略:tup = "a", "b", "c", "d"# 创建空元组和单个元素元组的方式:tup = ()tup = (50,) 索引和切片 # 元组和列表一样支持索引和切片,...04 字典 dict 字典dict是一种KEY:VALUE的数据结构,可以根据KEY设置和获取对应的VALUE 语法: dict = {key1:value1, key2:value2}举例: d =

    1K30
    领券