如何使用Python将包括表在内的整个Word文档复制到另一个?

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (1)
  • 关注 (0)
  • 查看 (751)

我需要将模板的全部内容复制到新文档中,我的问题是不能复制表 。

def get_para_data(output_doc_name, paragraph):
    output_para = output_doc_name.add_paragraph()
    for run in paragraph.runs:
        output_run = output_para.add_run(run.text)
        # Run's bold data
        output_run.bold = run.bold
        # Run's italic data
        output_run.italic = run.italic
        # Run's underline data
        output_run.underline = run.underline
        # Run's color data
        output_run.font.color.rgb = run.font.color.rgb
        # Run's font data
        output_run.style.name = run.style.name
    # Paragraph's alignment data
    output_para.paragraph_format.alignment = 
paragraph.paragraph_format.alignment
input_doc=Document('templatemain.docx')
output_doc=Document()
for para in input_doc.paragraphs:
    get_para_data(output_doc, para)
output_doc.save('OutputDoc.docx')

我为复制表找到的大部分帮助是附加它们。但是我正在将一个模板复制到一个空白文档中,这样对我一点帮助都没有。

提问于
用户回答回答于

你只是在迭代.paragraphs属性。

你需要按文档顺序循环遍历文档正文的所有子元素,否则将所有段落和表合并在一起。

例如,简化版本如下:

from docx.oxml.text.paragraph import CT_P
from docx.oxml.table import CT_Tbl
from docx.table import Table
from docx.text.paragraph import Paragraph


# select only paragraphs or table nodes
for child in input_doc.element.body.xpath('w:p | w:tbl'):
    if isinstance(child, CT_P):
        paragraph = Paragraph(child, input_doc)
        get_para_data(output_doc, paragraph)
    elif isinstance(child, CT_Tbl):
        table = Table(child, input_doc)
        # do something with the table

扫码关注云+社区

领取腾讯云代金券