有没有办法在python中设置一个pdf的标题和作者元数据属性？ - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

DiscoTOC - 自动内容表格

在默认情况下，当前的内容的标题将会被标记为 toc（通过 composer 按钮来完成上面的操作的），同时如果你的当前主题是被标记的话，这个也将会被转换为 toc（这个与当前标题的层次有关），所有的内容标题都会被转换为 TOC —— 这就意味着，你的 MD 文件的标题设置是必须正确的，如果你的标题设置层级有错误，那么转换的结果也会出错.。

00

DiscoTOC - 自动内容表格

在默认情况下，当前的内容的标题将会被标记为 toc（通过 composer 按钮来完成上面的操作的），同时如果你的当前主题是被标记的话，这个也将会被转换为 toc（这个与当前标题的层次有关），所有的内容标题都会被转换为 TOC —— 这就意味着，你的 MD 文件的标题设置是必须正确的，如果你的标题设置层级有错误，那么转换的结果也会出错.。

02

您找到你想要的搜索结果了吗？

是的

没有找到

陌溪在百度上搜索蘑菇博客，被吓了一跳

最近，有很多小伙伴反馈，说在部署蘑菇博客后，发现没有办法修改网站的 meta 信息，也就是浏览器上的 icon图标和标题信息，没有办法自定义。

01

Power BI从动态标题到多行标题，这里的车速足够快，抓紧来看！

举个例子，比如我们刚刚做了一个报告，想截图某视觉对象到PPT中，但是筛选器可能离着该可视化比较远，如下图：如果截上面柱状图，我们可以将年度切片器一起截取下来，但是如果你想单独截取下面的柱状图放到ppt里，别人根本不知道这张图想表达什么意思：

04

我是怎么保存公众号历史文章合集到本地的？当然是用python了！

偶然间，关注了一个自己特别感兴趣的公众号，感觉就像是挖到了一个宝藏。于是，我们就想翻一翻宝藏里都有什么。

02

用js在控制台打印html页面,vue 使用print-js 打印html页面

打印json时可以添加表头。打印html页时可以继承原有页面的样式，局部打印，过滤掉要打印的元素，及其方便。

03

TS 设计模式05 - 装饰者模式

在 oop 中，继承是实现多态最简单的方案。同一类的对象会有不同表现时，我们基于此基类去写派生类即可。但有时候，过度使用继承会导致程序无法维护。比如说，人有一个展示自己外观的方法，穿上不同的衣服这个展现形式就不一样。一个人可以选择穿 T-shirt，裤子，裙子，外套等等，它的顺序和搭配是不固定的，如果使用继承，我们对每种组合都需要去定义一个类，比如穿裤子的人，穿裙子的人，穿裤子和裙子的人，先穿裤子再穿外套的人......这样会是我们的程序变得非常庞大而难以维护。事实上，不管穿什么衣服，本质上仍然是人，衣服只是基于人类的装饰而已。装饰器模式允许向一个现有的对象添加新的功能，同时又不改变其结构。这种类型的设计模式属于结构型模式，它是作为现有的类的一个包装。

01

FastAPI（7）- 详解 Path

Path 也可以添加元数据相关信息，这些信息将包含在生成的 OpenAPI 中，并由文档用户界面和外部工具使用

03

Vue学习笔记之Vue组件

vue的核心基础就是组件的使用，玩好了组件才能将前面学的基础更好的运用起来。组件的使用更使我们的项目解耦合。更加符合vue的设计思想MVVM。

01

使用Python提取PDF文件里的内容

PDF文件，是我们工作和学习中经常见到的文件。阅读体验非常好。常用的Python操作PDF文件的第三方库，包含pyPdf、pyPdf2、pyPdf3、pyPdf4、pdfrw。

03

python之PDF提取文字(超级简单)

在python中，有一些可以用来从PDF文件中提取文本内容的包。以下是几个常用的包，有了前辈们的努力, 我们就可以直接使用轮子了, 直接上代码

01

如何对PDF文献做可视化分析？

看了大量文献后，你的硬盘上想必存下不少PDF文件。能否充分利用它们，挖掘出你独特的领域知识地图呢？本文为你提供一种简便易行的办法。

02

北大研究人员这次发现了AI「躺平」原因，都是数据集的错！

---- 新智元报道来源：arXiv 编辑：好困【新智元导读】你有没有发现，每当AI发现了偷懒的小技巧之后，就不再去学习那些有挑战的问题并开始「躺平」？北大的研究人员表示：最好去看看你的训练集了。在训练人工「智障」的时候，AI最后经常会学到一些莫名其妙的方式来完成人类的的任务。有一些AI就会去学习如何通过「卡bug」来快速通关。还有一些AI学会了「‍只要把游戏暂停了，我就不会输」这‍个终极哲学。‍ AI也想「躺平」为了让模型能够提高准确性，通常会设置相应的奖励，但有时候模型在前期

02

通过使用Apache Lucene和Tika了解信息检索 - 第1部分

在本教程中，将通过它们的核心概念（例如语法解析，MIME检测，内容分析法，索引，scoring方法，boosting方法）来解释Apache Lucene和Apache Tika框架，这些示例不仅适用于经验丰富的软件开发人员，还适用于内容分析法和编程的初学者。我们假设您具备Java™编程语言应用知识和大量可供分析的内容。

02

Google Earth Engine（GEE）—geemap图像元数据和属性获取

在 Python 中探索图像波段和属性，print()图像与getInfo()函数。也可以通过编程方式访问此信息。例如，以下演示了如何访问有关波段、投影和其他元数据的信息：

01

如何将HTML表格转换成精美的PDF

包含表格、图表和图形的 Web 应用程序通常包含将数据导出为 PDF 的选项。你有没有想过，作为一个用户，当你点击那个按钮时，幕后发生了什么？

02

使用Spire.Office for .NET(Word、Excel、PPT、PDF等)的初步感受

本文大部分内容来自http://www.codeproject.com/Articles/710747/First-thoughts-on-Spire-Doc-for-NET。

03

Angular开发实践（五）：深入解析变化监测

什么是变化监测在使用 Angular 进行开发中，我们常用到 Angular 中的绑定——模型到视图的输入绑定、视图到模型的输出绑定以及视图与模型的双向绑定。而这些绑定的值之所以能在视图与模型之间保持同步，正是得益于Angular中的变化监测。简单来说，变化监测就是 Angular 用来监测视图与模型之间绑定的值是否发生了改变，当监测到模型中绑定的值发生改变时，则同步到视图上，反之，当监测到视图上绑定的值发生改变时，则回调对应的绑定函数。变化监测的源头变化监测的关键在于如何最小粒度地监测到绑定的值是

08

Python-EEG工具库MNE中文教程(14)-Epoch对象中的元数据(metadata)

本案例演示使用Epochs元数据。关于Epochs数据结构:可以查看文章Python-EEG工具库MNE中文教程(2)-MNE中数据结构Epoch及其创建方法和Python-EEG工具库MNE中文教程(3)-MNE中数据结构Epoch及其用法简介

01

Adobe acrobat软件下载安装教程-全版本PDF编辑器

acrobat 9Adobe Acrobat软件是一款广泛使用的PDF编辑器和阅读器，其中包含许多有用的功能，其中之一是协作。

03

用 Elasticsearch 造个“知网”难不难？

近期“知网”的热度一直不减，本来可以拿一些热点图片、网友评论作为开场。算了，这不是我一个技术博主该做的。

03

玩机器学习，再也不缺数据集了

众所周知，arXiv 是我们搜索、浏览和下载学术论文的重要工具。近 30 年来，arXiv 为公众和研究社区提供了开放获取学术论文的服务。这些论文涉及物理学的庞大分支和计算机科学的众多子学科，如数学、统计学、电气工程、定量生物学和经济学等等。

01

Python网络爬虫笔记（四）：使用selenium获取动态加载的内容

（一）说明上一篇只能下载一页的数据，第2、3、4....100页的数据没法获取，在上一篇的基础上修改了下，使用selenium去获取所有页的href属性值。使用selenium去模拟浏览器有点麻烦，例如有300页就要点300次（按博客园这种一页20条，也就是6000条数据。要是几百万条，这个就得点好长时间了）研究下有没有办法调用JS修改页面默认显示的数据条数（例如：博客园默认1页显示20条，改成默认显示1万条数据）。（二）完整代码 delayed.py的代码还是和之前一样。最好限速，不限速很

06

R沟通｜Bookdown中文书稿写作手册（中）

这是第 2 章的内容，概要性地讲解基于bookdown拓展包进行图书排版的整体思路与实现方式.

01

打印小册子中断了怎么办呢_pdf小册子双面打印

不知道大家有没有打印过小册子，就是为了升值上，不但正反面打，而且会将A4纸分为左右两部分打印，这样就可以成为一本32开的小册子。

03

python获取linux环境变量_linux如何设置环境变量

为了演示我的意思,采用两个大致相同的程序(C中的第一个,python中的另一个)：

02

斯坦福 | 提出PDFTriage，解决结构化文档的问题，提升「文档问答」准确率

关于大型语言模型(LLMs)的应用落地，目前最值的关注要数文档问答了。其主要的工作思路是将文档进行文本分割存入向量数据库，当遇到问题请求的时候，依据问题检索出向量数据库相关的文章片段，通过Prompt引导大模型给出答案。然而，该方法对于纯文本文档QA效果较好，当面对PDF、网页和演示文稿等不同文档结构时却存在一定的挑战。

02

脑电分析系列[MNE-Python-14]| Epoch对象中的元数据(metadata)

脑电分析系列[MNE-Python-2]| MNE中数据结构Epoch及其创建方法

04

这才叫良心软件！！

PDF 文档是现在很常用的格式，有时候需要把 PDF 文档转换成图片或文档、合并内容、甚至编辑内容等，都需要借助相关软件。然而目前有些 PDF 软件要么需要付费，又或者功能比较零散单一。

02

Hadoop 对象存储 Ozone

Apache Hadoop 项目至今已经有十多年的历史了，作为大数据的基石，自从投放之社区之后就引来了不少的眼球，进而也孕育出了众多的Apache项目，例如HBase，Hive , Spark 等等这些优秀的数据存储和处理等项目，从而构造成了一个庞大的生态圈。参考了世界级标准的，也就是 Hadoop的HDFS，一直在跟IEEE的POSIX文件系统API标准靠拢，因此我觉得，HDFS是长久的，因为它的API足够的标准化。API足够的标准化也就意味着照着实现的东西考虑的是很全面的。但是这并不代表HDFS本身的设计不存在问题或缺陷。

04

零基础学Flink：状态与容错

在上一篇《零基础学Flink：实时热销榜Top5（案例）》文档中我们介绍了如何计算实时热销榜。在案例的最后TopNHot类中，我们使用了状态类。

02

PDF文件使用指南

它是公认的分享文档的最佳格式。但是，这种格式的文件，必须用专门的阅读器打开，而且不能编辑，所以对使用者来说，会遇到很多问题。

02

C# Attribute

C#中的Attribute（特性）是一种元数据，在C#中的作用是为元数据添加内容。元数据是关于程序中各种元素的信息，如类、方法、属性等。Attribute允许开发者在这些元素上附加额外的信息，以提供更多的上下文或指导编译器、工具或运行时环境的行为。

01

JPEG/Exif/TIFF格式解读(2):图片元数据保存及EXIF详解

元数据（Metadata），又称中介数据、中继数据，为描述数据的数据（data about data），主要是描述数据属性（property）的信息。用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。

03

SpringDataJPA笔记(1)-基础概念和注解

JPA是Java Persistence API的简称，中文名Java持久层API，是JDK 5.0注解或XML描述对象－关系表的映射关系，并将运行期的实体对象持久化到数据库中。

02

是的，这里有3种使用Vue 3创建多布局系统的方法

与Nuxt不同，Vue 3并没有内置的布局系统，但是别担心，这里将向你展示3种简单的方法来实现这一点。

05

Python自动化办公之 Excel 自动绘制图表

今天的主题是 Excel，相信大家都比较熟悉吧。而且我相信，大家在日常使用 Excel 的时候，肯定会遇到很多重复繁琐的工作，因为我也同样遇到过。这个时候我通常都会思考下，有没有办法让繁琐的事情变得简单些呢，毕竟我们是 Python 使用者嘛！

01

「数据架构」数据模型，数据字典，数据库模式和ERD的比较

所有这些数据库设计术语都可能令人困惑。在这篇短文中，我将试着解释它们是什么以及它们之间的区别。

01

Typecho | 博客结构与插件开发笔记：附件及扩展方法

最近在学习Typecho插件开发，对于Typecho博客的数据表结构和一些基础插件方法有了一定了解，这篇笔记主要记录Typecho的七大数据表之一contents表及其用于存放attachment类的数据时的一些使用心得。

02

Angular 英雄编辑器

应用程序现在有了基本的标题。接下来你要创建一个新的组件来显示英雄信息并且把这个组件放到应用程序的外壳里去。

07

Angular 英雄编辑器

应用程序现在有了基本的标题。接下来你要创建一个新的组件来显示英雄信息并且把这个组件放到应用程序的外壳里去。

05

ASP.NET MVC Model元数据及其定制：一个重要的接口IMetadataAware

在介绍用于自定义Model元数据属性的AdditionalMetadataAttribute特性时我们提到了它实现的接口IMedataAware，我们说这是一个非常重要并且有用的接口，通过自定义实现该接口的特性我们可以对最终生成的Model元数据进行自由地定制。如下面的代码片断所示，IMedataAware接口具有唯一的方法成员OnMetadataCreated。当Model元数据被创建出来后，会先获取上述的这一系列标注特性对其进行初始化，然后获取应用在目标元素上所有实现了IMedataAware接口的特性

06

Markdown如何学习，看完这篇文章就够了。

不论是开发者还是写文章的博主。现在主流编辑器是Markdown，所以学习Markdown语法对提升技能很有帮助。想要学习Markdown，这篇文章就够了。

04

Markdown如何学习，看完这篇文章就够了。

不论是开发者还是写文章的博主。现在主流编辑器是Markdown，所以学习Markdown语法对提升技能很有帮助。想要学习Markdown，这篇文章就够了。

07

【NLP】听李宏毅点评GPT-3：来自猎人暗黑大陆的模型

OpenAI 发表了新的巨大的 language model，在此之前 OpenAI 已经发表了 GPT，还有轰动一时的 GPT-2，现在到了 GPT-3（GPT-3 的论文题目为 Language Models are Few-Shot Learners）。

01

【合合TextIn】智能文档处理系列—电子文档解析技术全格式解析

在当今的数字化时代，电子文档已成为信息存储和交流的基石。从简单的文本文件到复杂的演示文档，各种格式的电子文档承载着丰富的知识与信息，支撑着教育、科研、商业和日常生活的各个方面。随着信息量的爆炸性增长，如何高效、准确地处理和分析这些电子文档，已经成为信息技术领域面临的一大挑战。在这一背景下，电子文档解析技术应运而生，并迅速发展成为智能文档处理技术中的一个关键组成部分。

01

如何使用Python玩转PDF各种骚操作？

Portable Document Format（可移植文档格式），或者PDF是一种文件格式，可以用于跨操作系统的呈现和文档交换。尽管PDF最初是由Adobe发明的，但它现在是由国际标准化组织（ISO）维护的开放标准。你可以通过使用PyPDF2包在Python中处理已先存在的PDF。

02

干货 | 知识库全文检索的最佳实践

很多文档已经被转化成扫描版的PDF，之前我们认为PDF类型是最终的文档格式，现在看来，我们想听听建议（比如：xml是不是更好呢？）

01

我是如何将博客转成PDF的

之前有读者问过我：“3y你的博客有没有电子版的呀？我想要份电子版的”。我说：“没有啊，我没有弄过电子版的，我这边有个文章导航页面，你可以去文章导航去找来看呀”..然后就没有然后了。

02

Power BI数据回写SQL Server（1）没有中间商赚差价

我们在【重磅来袭】在Power BI 中使用Python（4）——PQ数据导出&写回SQL 讲过如何在Power BI中调用Python实现powerquery获取和处理的数据回写到MySQL中。

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭