内存中的临时文件，用于python doc到docx的转换_python中从.doc到.docx的转换_转换docx。到linux中的python中的pdf - 腾讯云开发者社区

xml、python-2.7、docx、elementtree、doc

我已经使用使用.docx的ElementTree包成功地读取了zipfile文件。但我意识到，.doc文件没有存档“.doc”。我查看了文档，但没有找到任何文档。如何读取?对于docx，我使用了： import zipfile as zf import xml.etree.ElementTree as ET z = zf.ZipFile("test.docx") doc_xml = z.open('word/document.xml') tree = ET.parse(doc_xml) 将上面的内容用于.doc提供如下内容： KeyError: "The

浏览 21提问于2014-09-15得票数 1

回答已采纳

2回答

将DOCX字节流转换为PDF字节流Python

python、pdf、io、docx、bytestream

我目前有一个使用python-docx库生成.docx文档的程序。在完成.docx文件的构建后，我将其保存到字节流中 file_stream = io.BytesIO() document.save(file_stream) file_stream.seek(0) 现在，我需要将此word文档转换为PDF。我已经研究了一些不同的转换库，比如docx2pdf，甚至可以使用comtype手动进行转换，如下所示 import sys import os import comtypes.client wdFormatPDF = 17 in_file = "Input_file_path.

浏览 11提问于2020-09-05得票数 5

1回答

如何使用python-docx模块读取'.doc‘文件

python、python-3.x、aws-lambda、python-docx、doc

我正在尝试使用python-docx模块读取.doc文件，我正在做 import docx path = 'Sample-doc-file-100kb.doc' doc = docx.Document(path) #extracting texts from doc 这对.docx很有效，但对于.doc文件会出现ValueError: file 'Sample-doc-file-100kb.doc' is not a Word file, content type is 'application/vnd.openxmlformats-officedo

浏览 6提问于2021-02-16得票数 0

1回答

Python中的父和子子弹

python、python-docx

我有一份包含以下示例文本的文档， This is a document which contains parent and child • Photosynthesis • CO~2~ in • H~2~0 in • Sunlight in • Glucose • CO~2~ in • C~6~H~12~O~6~ • Oxygen out 如何在Python中分离父子弹和子子弹，我使用了python-docx。 import docx doc = do

浏览 0提问于2018-09-13得票数 0

1回答

将扫描的PDF或tessaract可搜索的PDF转换为docx/doc，并使用python维护所有格式和布局

python、python-3.x、image-processing、python-tesseract、pdfminer

需要将扫描的pdf转换为docx文档转换方法1.使用pytessaract pytesseract.image_to_pdf_or_hocr()将扫描的pdf转换为可搜索的pdf 2.然后使用lowriter 'lowriter -- .The --.The- to docx"{}“将可搜索的pdf转换为docx 但这导致了docx /doc中的格式和布局问题，并且在所得到的docx文件中存在文本和图像的重叠。请帮帮忙

浏览 16提问于2020-01-20得票数 1

1回答

如何将pyinstaller与docxtpl一起使用？

python、templates、jinja2、pyinstaller、docx

我正在尝试使用python代码上的pyinstaller来制作一个可执行的.exe，该代码使用了docxtpl包以及自制的docx模板。我使用的是Windows 10、conda 4.8.2和python 3.7.6 context是一个通过填充docx模板自动生成报告的程序。当程序不是可执行文件时，它工作得很好，而我也设法生成了一个可执行文件。当我执行我的可执行文件时，问题出现了。我收到这个错误消息： docx.opc.exceptions.PackageNotFoundError: Package not found at C:\Users\username\AppData\Local

浏览 32提问于2020-03-07得票数 1

1回答

OfficeR错误："Docx已经被编辑了“，但是文件甚至还不存在。会发生什么事？

r、officer

我有一个很难复制的问题，所以我只想知道这个错误背后的原因。当我创建一个docx (希望将它保存在我办公室的NAS中)时，我会得到这个错误(其中doc2是docx，Direc4是我的方向)： print.rdocx中的错误(doc2，target = Direc4)： H:\DpProMon\DPM\Programa Monetario Diario\2021\Actas\23，Informe comitémonetario y cambiario.docx已经编辑完毕。必须关闭文档才能写入文件。然而，文件还不存在。会发生什么事？有时，当我试图使用office保存一个实际的单词时，我可能会

浏览 2提问于2021-08-23得票数 3

1回答

我需要使用python将.doc和.docx文件转换为.pdf。

python、pdf、converter、doc

我需要使用python将.doc和.docx文件转换为.pdf。--我已经看到了一些可用的答案，但它们是使用comtype和打开WordApplication的。我不能这么做。我想要的是使用一些保存字体、表、标题大小和图像的python库，而不打开MS Word或LibreOffice，或者类似于将.doc和.docx文件转换成某种中间格式(然后将该格式转换为pdf)，如果需要的话，也可以。请帮助我的代码或指导说明(我不是专业的python)，我应该遵循。

浏览 0提问于2018-03-06得票数 1

回答已采纳

1回答

尝试使用FastAPI和python库读取docx文件: AttributeError：“字节”对象没有属性“查找”错误

python、python-docx、fastapi

我正在使用FastAPI (不是异步)和python库，试图读取docx文件。我在试图读取docx文件时出错。我的密码- @app.post('/translate_docx', response_class=PlainTextResponse) def translateDocx(docFile: UploadFile = File(...), fileExtension: str = Form(...)): if(fileExtension == 'docx'): raw_txt = readDocx(docFile.file.

浏览 2提问于2020-10-15得票数 2

回答已采纳

1回答

在C#中将Office文档的ByteArray转换为PDF的ByteArray

c#、arrays、pdf、office-interop

如何将Office文档的byte[] (.doc、.docx、.xlsx、.pptx)转换为byte[]文档(假设已安装Office并使用Microsoft.Office.Interop？我从数据库中获取文件的byteArray以及它们的名称。我想首先转换每个文件到一个PDF文件，然后组合所有的PDF文件到一个单一的PDF使用PDFSharp (这部分已经实现)。代码： foreach (Entity en in res.Entities) { byte[] fileByteArray = Convert.FromBase64String(en.GetAttributeValu

浏览 13提问于2021-02-16得票数 1

回答已采纳

2回答

从.doc (非docx)中提取文本

python、doc

我在stackoverflow和其他中检查了很多问题和答案，有很多方法可以打开和读取.docx文件，而不是用python 我已经检查过python-docx库，但它只支持docx。我想打开并提取.doc文件(不是docx)中的文本。请帮帮我，因为我是python新手

浏览 0提问于2017-04-20得票数 1

1回答

如何直接嵌入ole对象。而不将任何文件保存在磁盘中

c#、.net、ole、aspose、aspose-cells

我已经通过aspose.word创建了一个docx文件，我需要将一个工作表嵌入到这个文件中，因此我创建了一个工作簿和工作表。 Document doc = new Document(); Workbook workbook = new Workbook(); int i = workbook.Worksheets.Add(); Worksheet sheet = workbook.Worksheets[i]; 在表格中填充单元格后，我将excel文件保存在存储中，然后使用insertOleObject将其嵌入到docx中，然后使用文件流将文件地址传递给这种方法。 workbook.Sav

浏览 4提问于2017-11-20得票数 1

回答已采纳

1回答

将docx的一部分提取到新的docx中

python-2.7、python-docx

我有一个只包含文本的docx文件。我想创建一个新的docx文件，其中只包含原始docx中页面的一部分。为此，我使用python-docx。到目前为止，我已经能够遍历原始docx文档，并将原始文档中的每个所需段落/运行复制到新文档中，如下所示(我相信这个示例应该会生成一个完全相同的副本)： Doc = docx.Document('/tmp/input.docx') OutDoc = docx.Document() for para in Doc.paragraphs: currentParagraph = OutDoc.add_paragraph(style=para

浏览 3提问于2015-07-16得票数 0

1回答

提取文本并写入新的Word文件

python、python-3.x、tkinter、docx、python-docx

我正在尝试做一个图形用户界面Tkinter，与2个按钮，每个按钮都是:提取段落(1,2,3随便)和复制到新的文本文件(Pyhton3.8，PyCharm (Windows10，操作系统)。但问题是，它提取，复制到新文件，但不添加，它只提取/复制到新文件，一个按钮，而不是两个。以下是代码(请记住，我完全是业余爱好者，在Python中只有2周的活跃时间:D) from tkinter import * import docx from docx import Document doc = docx.Document("C:/Users/Dorian/Desktop/Descrier

浏览 12提问于2020-06-21得票数 0

回答已采纳

1回答

表格解析，将图像、图形等从一个docx复制到新docx - Python

python、python-3.x、ms-word、docx、python-docx

pydocx 我想知道有没有办法用python将图片、表格等从一个docx保存到一个新的docx中？我正在使用python-docx来读取一个docx，并对文本逐段执行一些操作，然后将其复制到一个新的docs中，但在此活动中，任何表格或图片都会丢失。看起来代码本身并不读取它。我想要的图片，图表，列等在他们的地方。有可能吗？请在这方面帮帮我。 import docx doc = docx.Document('demo.docx') doc1 = docx.Document() l =len(doc.paragraphs) for i in range(l): d = d

浏览 4提问于2018-09-13得票数 1

2回答

堆大小错误Aspose

java、aspose、aspose.words

当使用Aspose转换pdf文件中的docx文件时，我得到这个heap size error.here是代码此docx文件大小为44Mb public void convertDoc(String Path, String destPath) throws Exception{ Document doc = new Document(Path); //At this line heap size error comes doc.save(destPath); System.out.println("doc converted to

浏览 2提问于2013-04-15得票数 1

回答已采纳

1回答

Python:编辑已存在的运行

python-3.x、python-docx

import docx doc = docx.Document('CLT.docx') test = doc.paragraphs[12].runs[2].text print(test) doc.save(input('Name of docx file? Make sure to add file extension ')) 我试图找到一些方法来使用python将文本添加/编辑到已有的运行中。我尝试过test.clear()，只是想看看是否可以删除它，但这似乎不起作用。此外，我尝试了test.add_run('test')，但这也不起作用。我

浏览 2提问于2019-12-16得票数 1

回答已采纳

4回答

.docx :是否将.doc转换为Python？

python、linux、ubuntu、ms-word、automation

我找到了几个与我的问题相似的问题，但没有一个答案接近我需要的。说明:我正在使用Python 3，没有MS Word。我的编程机器运行的是OS，云机器也是linux/ubuntu。我正在使用python-docx从每晚发送给我的.doc文件中提取值。但是，python-docx只适用于.docx文件，因此我需要首先将文件转换为该扩展名。因此，我有一个需要转换为.docx的.doc文件。这个脚本可能必须在云中运行，所以我不能安装任何类型的Office或类似Office的软件。这可以做到吗？

浏览 29提问于2017-03-01得票数 7

3回答

Python docx2pdf AttributeError: Open.SaveAs

python、docx、pywin32、python-docx、comtypes

我试图使用docx2pdf库将docx文件转换为pdf，使用以下代码： from docx2pdf import convert convert("generated.docx") 正如所写的。但我有个错误： Traceback (most recent call last): File "c:\Users\user\Desktop\folder\script.py", line 29, in <module> convert("generated.docx") File "C:\Users\user\App

浏览 103提问于2022-02-28得票数 1

5回答

基本Powershell -批量将Word Docx转换为PDF

powershell、powershell-2.0、powershell-3.0

我正在尝试使用PowerShell批量转换Word Docx到PDF -使用在这个网站上找到的脚本： # Acquire a list of DOCX files in a folder $Files=GET-CHILDITEM "C:\docx2pdf\*.DOCX" $Word=NEW-OBJECT –COMOBJECT WORD.APPLICATION Foreach ($File in $Files) { # open a Word document, filename from the directory $Doc=$Word.Documents.O

浏览 7提问于2013-05-14得票数 33

回答已采纳

1回答

在python中使用font.name或font.size时不能使用RTL方向。

python、python-3.x、python-docx

我用python来写新的ms单词。Python3.8-Win10 x32 有以下代码： doc = docx.Document() style = doc.styles['Normal'] font = style.font font.name = 'B Mitra' font.size = docx.shared.Pt(13) font.rtl = True doc.add_paragraph("Hi in Persian= سلام") doc.save("tst.docx") 没有font.rtl=True，font.siz

浏览 1提问于2020-08-18得票数 1

回答已采纳

1回答

如何使用docx模块将样式对象的格式化值添加到Word文档表中？

pandas、dataframe、number-formatting、python-docx

我是在Word文档中添加表格，使用熊猫和Python模块使用数据数据。我希望数据值以我应用于dataframe的格式样式出现在Word文档表中。有些列有带有逗号分隔符{：、}的数字格式，而有些列具有百分比格式{:.2%}。但是，在我将格式样式添加到dataframe之后，dataframe就变成了一个样式对象。然后，我无法在Word中将样式对象的值添加到表中。如何将格式样式应用于dataframe中的值，以便它们在Word文档表中显示样式？ import pandas as pd import docx import openpyxl # initialize list of li

浏览 1提问于2021-03-04得票数 0

回答已采纳

1回答

在django中输出doc文件

python、django

我想将结果输出到doc文件中。我已经得到了pdf格式的结果 pdf = pisa.pisaDocument(StringIO.StringIO(html.encode("UTF-8")), dest=result, link_callback=fetch_resources ) 我想在python-docx中使用上面的替代代码。请提供任何链接，给出详细的python docx示例。但同样的文件也会在天平办公室打开。我不知道怎么做。我用过 report_mail(request,result,email,message) response = HttpRe

浏览 1提问于2014-05-24得票数 2

1回答

如何在python中为段落应用自定义(专有)字体？

python-docx

我有点迷上阅读python文档了。我用专有字体读取文件。 document_original = docx.Document('doc_orig.docx') styles = document_original.styles propitiatory_default = styles['Default'] 我检查样式确实有我需要的字体。 print(proprietary_default.font.name) 我创建一个新的文档与文字与我需要的样式和字体。 doc = docx.Document() para = doc.add_paragraph() pa

浏览 2提问于2020-06-10得票数 1

回答已采纳

1回答

respond_to和服务对象

ruby-on-rails、ruby-on-rails-4、controller、respond-to、service-object

我目前正在使用来自动将数据插入到一组文档中。gem非常简单；基本上它运行在rails控制器中的一个特殊方法中，如下所示(引用文档)： def user_report @user = User.find(params[:user_id]) respond_to do |format| format.docx do # Initialize DocxReplace with your template doc = DocxReplace::Doc.new("#{Rails.root}/lib/docx_templates/my_template.d

浏览 2提问于2015-05-13得票数 1

回答已采纳

2回答

从Django填充MS Word模板

django、ms-word、docx

我在这个链接中找到了一些与docxtpl相关的python文档：我按照指令输入在这个站点上找到的代码到视图中，并创建了相关的URL。当我转到URL时，我希望生成一个文档--但是我得到了一个错误，即没有返回HTTP响应。我知道我没有定义HTTP响应，但我对我需要定义的HTTP响应感到有点困惑(我对此仍然非常陌生)。我保存的MS word模板名为“template.docx”。任何帮助都将不胜感激！ VIEWS.PY def doc_test(request): doc = DocxTemplate("template.docx") context = {

浏览 1提问于2019-07-15得票数 2

回答已采纳

2回答

理想的“中间”文件格式用于结构化/样式的文本？

python、files、date-format、export、import

我有希望以多种格式提供的文件： HTML PDF格式 EPUB 纯文本(可能) 大多数文件将以doc、docx或rtf格式提供，因此需要考虑这一点。因此，我需要某种格式，这种格式可以很好地从docx、doc和rtf转换，并且有大量的库可以转换为PDF、EPUB、HTML等。理想情况下，Python中的库是可以使用的，但Java也可以。

浏览 0提问于2012-11-02得票数 -1

回答已采纳

1回答

如何将XML Word文档转换为DOCX？

python、xml、ms-word、ms-office、python-docx

我得到了一系列的文件夹，其中包含大量的.xml格式的Word文档。它们都包含一些VBA代码，但是它们上的代码都已经运行过了，所以我不需要保留这些代码。我需要打印每个文件夹中的所有文件，但是由于网络上对XML文件的限制，我不能简单地从Windows中大量打印它们，所以我需要首先将它们转换为.docx (或.doc)。我该怎么做呢？我使用python尝试了一个简单的python脚本： import os from docx import Document folderPath=<folderpath> fileNamesList=os.listdir(folderPath) for

浏览 3提问于2017-04-26得票数 1

回答已采纳

1回答

通用PDF转换器

python、pdf、libreoffice、converters、doc

我正在寻找一个“任何文档转换器”的帮助，其中任何文档文件文档，docx，ppt，pptx将转换为pdf。DOCX和PPTX很容易使用python库，但是DOC和PPT有点棘手。我7个月前得到的相当难处理。特别是使用Unoconv的用户(现在不再支持Unoserv，改为Unoserv)。初始代码示例： import os import shutil src = ".../srcpaths" dst = ".../dstpaths" ext = ['ppt', 'pptx', 'doc', 'docx&#

浏览 18提问于2022-05-17得票数 -1

回答已采纳

1回答

如何使用python模板(docxtpl)生成.docx文档？Django Python

python、django-rest-framework、python-docx、docxtpl

为此，我试图在Django中生成一个.docx文档，为此，我使用docxtpl (Python模板)通过.docx模板生成文档。我试图用这些数据生成文档： listaFinal = [ [ { "-":"LIBROS" }, { "":"Responsabilidad Social de las Organizaciones (RSO): Avances y propuestas en América Latina", "Edi

浏览 5提问于2021-07-19得票数 0

回答已采纳

1回答

DocX C#库在InsertSectionPageBreak上更改页面格式

c#、ms-word、docx

我正在使用DocX，这是一个用于在c#中创建Microsoft.docx文件的库。我正在加载一个预先存在的文件到程序中，然后添加内容。这是获得预定义头的最简单的方法。我注意到，如果我使用InsertSectionPageBreak，以这种方式创建的所有页面的页面格式将从A4更改为信函。我尝试使用一个新的模板文件(空文件)，结果是一样的。 var doc = DocX.Load(fileName); doc.InsertSectionPageBreak(); doc.InsertSectionPageBreak(); doc.InsertSectionPageBreak(); doc.Sav

浏览 2提问于2015-05-22得票数 1

回答已采纳

1回答

Python:如何使用python库设置字体？

python-3.x、python-docx

对于现有的.docx文件，我可以使用python访问字体信息： import docx doc = docx.Document(*some file*) some_font = doc.paragraphs[0].runs[0].font 但是，当我尝试将此字体应用于新文档中的新运行时，它将失败： newdoc = docx.Document() p = newdoc.add_paragraph() r = p.add_run(*some string*) r.font = some_font 它返回一个错误： AttributeError: can't set attribute 我

浏览 1提问于2016-06-13得票数 0

回答已采纳

2回答

保存附件联系人表7

wordpress、contact-form-7

我在WordPress中使用联系人表单7，根据用户提交的数据动态创建Word文档，并希望将该文件保存到用户从联系人表单7发送的服务器上。但我在任何地方都看不到文件。我哪里错了？我现在有以下代码： <h3 class="anchor">PLEASE UPLOAD COPIES OF YOUR MEDICAL CARD AND CDL . </h3> <label> Here is my medical card: [file step_2_medical_card_upl filetypes:doc|docx|pdf|jpg|jpe

浏览 1提问于2019-03-07得票数 0

回答已采纳

2回答

如何用Python在Mac上将docx转换成pdf？

python、python-3.x、pdf、docx、converters

我查了几个这样和其他网页，但我没有发现任何可行的东西。我编写的脚本打开了docx，更改了一些单词，然后将其保存在某个文件夹中作为docx。然而，我希望它保存为一个pdf，但我不知道如何。这是我正在使用的代码的一个示例： # Opening the original document doc = Document('./myDocument.docx') # Some code which changes the doc # Saving the changed doc as a docx doc.save('/my/folder/myChangedDocumen

浏览 8提问于2020-06-19得票数 8

回答已采纳

1回答

Python:在用户输入时打印一个或多个文件(副本)

python、python-2.7

我是Python新手。我试图创建一个程序来打印我通常每周手工打印的一组文档，但是我遇到了几个问题：以下是代码： import os file_list = os.listdir("C:/Python27/Programs/PrintNgo/Files2print") print ("List of available documents to print" '\n') enum_list = ('\n'.join('{}: {}'.format(*k) for k in enumerate(file_list

浏览 3提问于2016-09-24得票数 1

回答已采纳

2回答

如何使用Python将docx转换为doc？

python、docx、doc、file-conversion

如何使用Python将file.docx转换为file.doc？我有一个以docx格式输出文件的代码，但是这个程序是为只能使用Word2003的人编写的，所以我需要使用Python将该文件转换为.doc。我该怎么做呢？提前谢谢你。

浏览 47提问于2021-04-01得票数 0

1回答

用python替换`.doc`文件中的短语

python、linux、ms-word、python-docx、.doc

我有一个包含文本的.doc文件，我需要用这个文档中的另一个短语替换特定的短语。我尝试使用python-docx，但它不支持.doc格式。我也尝试过使用普通的字符串替换功能，但它损坏了doc文件 with open("input.doc") as r: text = r.read().replace("old text", "new text") with open("output.doc", "w") as w: w.write(text) 我不能更改文件的扩展名，我想用python来更改。

浏览 5提问于2021-06-09得票数 0

2回答

如何在java中打印.doc和.docx

java、printing、ms-word、apache-poi、docx

我刚刚学习了如何使用Apache-POI进行一些基本的.doc和.docx操作。现在我要做的是尝试从我的应用程序中打印这些文档。你知道我该怎么做吗？下面是我创建文档的方式： public void newWordDoc(String filename) throws FileNotFoundException, IOException { XWPFDocument document = new XWPFDocument(); XWPFParagraph tmpParagraph = document.createParagraph(); XWPFRun tmpRun =

浏览 4提问于2011-03-02得票数 2

回答已采纳

5回答

以只读方式打开文件

c#、winforms、readonly

在C# WinForms应用程序中，我使用System.IO.Diagnostics.Process.Start(fileName)打开文件。文件类型可以是.doc、.docx、.xls、.xlsx、.csv、.pdf或.txt。有没有办法强制这些文件以只读方式打开？

浏览 0提问于2009-10-27得票数 6

回答已采纳

1回答

通过升级Python无法在Word中获取ContentControl中的文本。

python、ms-word、python-docx

我对Python和编码很陌生。新的我有问题需要你的帮助。我试图使用Python读取docx文档，但是我想要的所有文本都在ContentControl中。当我尝试用ContentControl打印段落的文本时，会发生错误。举个例子，我试着打印第一张副刊，用 import docx doc= docx.Document("C:\ContentControl.docx") p=doc.paragraphs print(p[0].text) 然后我得到了一个错误，比如： UnicodeEncodeError: 'gbk' codec can't encode

浏览 1提问于2018-03-07得票数 2

回答已采纳

1回答

如何使用Python从PDF文件中识别删除文本

python、pdf、pypdf2、strikethrough、pymupdf

我只想从.pdf文件中提取删除文本.我已经尝试了下面的代码，它是与一个样本pdf文件我有工作。但它不工作的另一个pdf文件，我认为是一个扫描的文件。是否有任何标准的方法可以使用python从pdf文件中提取只删除的文本？任何帮助都会很感激的。这是我使用的代码： from pydoc import doc from pdf2docx import parse from typing import Tuple from docx import Document def convert_pdf2docx(input_file: str, output_file: str, pages: Tupl

浏览 5提问于2022-06-13得票数 0

回答已采纳

2回答

将Docx转换为纯文本

python、python-2.7、docx

我正在尝试将docx文件转换为文本，但一直收到错误。我用的是python 2-7 import docx def getText(filename): doc = docx.Document(filename) fullText = [] for para in doc.paragraphs: fullText.append(para.text) return '\n'.join(fullText) 回溯： return codecs.charmap_encode(input,errors,encoding_map) Unico

浏览 29提问于2017-06-25得票数 2

回答已采纳

2回答

在ASP.NET核心或通过API从word转换到gif的第三方库

windows、c#、microsoft-word、image-conversion、gif

我正在寻找一个第三方库，它将把doc/docx扩展转换为gif。如果可以更容易地从doc/docx转换为pdf，然后再转换为gif，那也不错。我正在使用ASP.NET核心，很难找到这样做的库，但我愿意付费。

浏览 0提问于2019-01-04得票数 0

回答已采纳

1回答

如何从快速响应返回PIL图像文件列表？

python、python-3.x、python-imaging-library、fastapi、uvicorn

我使用docx2pdf创建了一个rest-api，它以一个文档(pdf)作为输入，并返回它的jpeg映像，我使用一个名为docx2pdf的库进行转换。 from docx2pdf import convert_to from fastapi import FastAPI, File, UploadFile app = FastAPI() @app.post("/file/convert") async def convert(doc: UploadFile = File(...)): if doc.filename.endswith(".pdf

浏览 4提问于2021-01-06得票数 2

回答已采纳

2回答

使用纯python将docx转换为pdf (在linux上，没有libreoffice)

python、pdf、docx、pythonanywhere、python-docx

我正在处理一个问题，试图开发一个web应用程序，其中的一部分转换上传的docx文件为pdf文件(经过一些处理)。使用python-docx和其他方法，我不需要安装了word的windows计算机，甚至不需要linux上的libreoffice来完成大部分处理(我的web服务器是pythonanywhere - linux，但没有libreoffice，也没有sudo或apt install权限)。但转换为pdf似乎需要其中之一。从这里和其他地方探索问题，这是我到目前为止得到的： import subprocess try: from comtypes import client ex

浏览 8提问于2018-06-22得票数 20

回答已采纳

1回答

如何将.doc文件转换为超文本标记语言？

python、doc

我有一堆.doc文件(不是.docx)，我想把它们转换成HTML文件。我也尝试过Python的docx2html模块，但它只支持.docx文件，不支持文档。那么，我如何才能实现它呢？

浏览 1提问于2014-06-19得票数 0

1回答

python如何使用Python将开放XML格式的文件转换为MS ole格式？

python、excel、ms-office

我想转换开放的XML格式的文件，如docx，xlsx，ppsx到MS OLE格式，如doc，xls，pps使用python。有没有这样做的库呢？我必须在没有安装Microsoft office的linux服务器上运行python代码。所以有没有可能用python来做这件事，或者用代码做呢？

浏览 3提问于2016-03-08得票数 1

2回答

从命令行将DOCX文件转换为PDF

python、pdf、pdf-generation、docx

我正在写一个python脚本，并想转换为PDF的DOCX。有什么方法可以做到这一点吗？下面是我当前的代码： printer_path = 'C:\\Program Files\\Nitro\\Pro\\12\\NitroPDF.exe' doc_path = 'Test.docx' subprocess.call([printer_path, doc_source_path]) Nitro PDF将打开并开始转换文件，但不会完成。感谢您的任何意见。编辑1:为了让subprocess.call工作，我必须让两个输入都是绝对路径，例如doc_path = &

浏览 47提问于2019-02-21得票数 0

回答已采纳

2回答

python-docx：‘未找到包’

python、python-docx

我在‘/var/ doc.docx /oa’中有一个代码文件。我需要使用python-docx来读取它。我这样写： from docx import Document document = Document('/var/code/oa/doc.docx') 然后，有错误..PackageNotFoundError:在'/var/code/oa/doc.docx‘中找不到包为什么？ “谢谢。”呃，这很愚蠢。原因是文件，它一定是docx文件。我只是将文件名从doc改为docx，它并不是一个真正的docx文件。

浏览 0提问于2014-09-01得票数 9

2回答

如何使用python修改docx中的custom.xml

python、xml、lxml、elementtree、python-docx

我一直在使用python以编程方式更改需要每月更新的word文档(*.docx)的部分内容。我现在的问题是编辑模板中的自定义属性，特别是“日期完成”属性。我当前简化的python代码如下： import python-docx doc = docx.Document('MonthlyUpdate.docx') help(doc.core_properties) #only shows author, category, etc, but no 'Date Completed' 相关文件似乎在*.docx\docProps**custom.xml**中，但我

浏览 10提问于2016-09-26得票数 0

回答已采纳