首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python 写的文档批量翻译工具,效果竟然超越付费软件?

本文将给大家分享一个实用的Python办公自动化脚本 「利用Python批量翻译英文Word文档保留格式」,最终效果甚至比部分收费的软件还要好!先来看看具体的工作内容。...2.2 段落样式 段落样式包括对齐、缩进、间距等等,原文档中采取了段后缩进,标题是居中对齐。这些设置在变量传递中能够很好完成。如果原文档中没有设置的变量值为 None ?...整体实现步骤 现在每个部分操作均以完成,考虑到本例中有多个文档均需要翻译,故全部逻辑如下: 利用 glob 模块批处理框架可获取某个文件的绝对路径 由 python-docx 完成 Word 文件实例化后对段落进行解析...解析出的段落文本交给百度通用翻译 API,解析返回的 Json 格式结果(上面的修改 demo 中已经完成了这一步)并重新写入新的文件 同个文件全部解析、翻译写入新文件后保存文件 三、代码实现 导入需要的模块...代码运行完毕后得到五个新的翻译文件 ? 翻译效果如下,可以看到英文被翻译成中文,并且样式大部分保留! ?

2.2K41
您找到你想要的搜索结果了吗?
是的
没有找到

在OpenOffice.org和微软Office之间共享文档

翻译可能也比较随意。 本文版权请向原文网站及原作者咨询。仅在已经获取原文使用权的情况下,以下文字可自由使用。本翻译未获原网站或原作者授权。...但如果想在共享中完美地保留格式,则还需要一些手段。而如果你在设定格式时使用样式,而不是手工设定字符和段落,则这个手段会变得很简单。样式可以保存在一个模板文件中,因此你只需要设定一次即可。...其中有些设置,是为了让OOo像MS Word那样增加行距和对象边距的:   在段落和表格之间添加空白(当前文档)   不在行间增加额外间距   在表格单元的底部增加段落和表格间距   定位对象时考虑折行...如果是在导入MS Word文档,应该选中“在页顶部(当前文档)增加段落和表格间距”。...所以共享方案只能是保留原始文件,但输出成图片。 结论 这还不是一个完整的能否工作的特性列表,事实上也还没有这个列表。

2.6K70

提示词的高阶用法:思维链

比如给AI一个文件,请帮我总结/分析这个文件;请帮我翻译成中文;直接根据文件询问某些问题的答案; 比如:帮我把下面英文翻译成中文:"As we move forward, it's crucial that...还是以上面的翻译为例: 提示词:你是一位精通简体中文的专业翻译,曾在多个国际项目中担任主要翻译工作。请将以下英文段落翻译成中文,同时确保翻译的准确性和流畅性。...保留引用的论文,例如 [20] 这样的引用;同时也要保留针对图例的引用,例如保留 Figure 1 翻译为图 1。 全角括号换成半角括号,并在左括号前面加半角空格,右括号后面加半角空格。...输入格式为Markdown格式,输出格式也必须保留原始Markdown格式 现在有三个角色: 英语老师,精通英文,能精确的理解英文并用中文表达 中文老师,精通中文,擅长按照中文使用喜欢撰写通俗易懂的科普文...校长,精通中文和英文,擅长校对审查 按步骤来翻译这篇文章,每一步都必须遵守以上规则,打印每一步的输出结果: Step 1:现在你是英语老师,精通英文,对原文按照字面意思直译,务必遵守原意,翻译时保持原始英文的段落结构

17110

零代码编程:用ChatGPT批量设置Word文件格式

文本文件如下: 在chatgpt中输入提示词: 你是一个Python编程专家,要完成一个处理word内容的任务,具体步骤如下: 打开文件夹:D:\lexfridman-podtext; 将里面所有的txt...文本文件转换为word文件; 删除word文件中所有的空白段落:如果一个段落后面紧跟着另一个空白段落,那么就删除这个空白段落; 在word文件页眉的左上角添加页码; word文件的页边距设置为上:1cm...,下:1cm,左:1cm,右:1cm; word文件的行距设为单倍行距; word文件段落之间的间距段前设为0行,段后设为0磅; Word文件中的字体设为Cambria字体,字号设为10号; 注意:每一步都要输出相关信息..., filename), "rb") as file: result = chardet.detect(file.read()) # 打开txt文件读取内容 with open(os.path.join...print("设置行距和段落间距...") for paragraph in doc.paragraphs: paragraph_format = paragraph.paragraph_format

7210

Python PDF转DOCX好用工具

本频道我专注于分享Github和Gitee上的高质量开源项目,致力于推动前沿技术的分享。 功能描述: pdf2docx是一个开源的Python库,用于将PDF文档转换为DOCX格式。...该库使用PyMuPDF从PDF中提取数据,如文本、图片和绘图,使用python-docx来解析布局生成DOCX文档。...功能特点: 1.解析和重新创建页面布局 页面边距 段落分区和列(仅支持1列或2列) 页面页眉和页脚(待办) 2.解析和重新创建段落 OCR文本(待办) 文本水平/垂直方向:从左到右,从下到上 字体样式,...如字体名称、大小、粗细、斜体和颜色 文本格式,如高亮、下划线、删除线 列表样式(待办) 外部超链接 段落水平对齐(左/右/居中/两端)和垂直间距 3.解析和重新创建图片 行内图片 灰度/RGB/CMYK...一些常见的使用场景包括: 将从PDF文件中提取的文本、图片和表格重新排版为可编辑的Word文档 在处理PDF报告或论文时,保持原始格式和结构的完整性 自动化文档转换过程,提高工作效率减少手动操作 pdf2docx

15510

WordPress 主题教程 #5c:日志元数据

同样请打开 XAMPP,主题文件夹,浏览器以及 index.php 文件,先让我们复习下,现在的 index.php 文件应该有下面这些代码了: 把主题教程源代码 postmetadata.txt 文件中的代码复制到...下面的屏幕截图是为了适应日志的大小而只裁剪了一部分,它主要你关注日志元数据代码的位置: 保存刷新浏览器,现在应该是: 我们同样可以通过查看源代码来看日志元数据是怎样的?...如果没有段落标签,日志元数据信息将在日志内容结束的地方继续,这样就没有任何间距去区别内容和日志元数据。..._e() 是用来创建可以翻译的主题,如果主题被来自不同国家的上百人使用的话,这是非常重要的。如果你是创建公共使用的主题,最后加上 _e() 以便你的主题可翻译化。 - 如果你想要一个空行,又不想用段落标签来产生行间距,使用 BR。注意斜线 / 。这是能自我关闭的标签。 <?

30930

PPT自动化处理

python-pptx模块 可以创建、修改PPT(.pptx)文件Python标准模块,需要单独安装 在线安装方式  pip install python-pptx  读取slide幻灯片 .slides...中写入数据 添加幻灯片slide      add_slide(prs.slide_layouts[0]) 向占位符中添加内容   shape.text= 字符串 添加段落paragraph      ...3 .line_spacing 段落间距 4 .runs 段落内的文字块 5 .space_after 段后间距 6 .space_before 段前间距  设置字体样式 序号 样式 描述 1 ....非Python标准模块,需要单独安装 pdfplumber模块  可以更好地读取PDF文件内容 可以提取PDF中的表格 非Python标准模块,需要单独安装 pip install pypdf2 pip...() 提取表格     .extract_table() 提取多张表格口   .extract_tables() 使用Python操作PDF文档 打开指定的PDF文件    PdfFileReader(

7810

《GPTs 实战:新春贺卡制作》

- 确定行间距: * 设置适当的行间距(例如30像素),以确保文本的可读性和美观性。 - 调整段落间距: * 将每个段落之间的距离设置为正常行间距的3倍。...- 图像的最终组合: * 将处理过的文本区域图片放在原始图片的右侧组成新的图片 + 使用python执行上述内容时,务必按照以下顺序创建代码 1....- 确定行间距: * 设置适当的行间距(例如30像素),以确保文本的可读性和美观性。 - 调整段落间距: * 将每个段落之间的距离设置为正常行间距的3倍。...- 图像的最终组合: * 将处理过的文本区域图片放在原始图片的右侧组成新的图片 + 使用python执行上述内容时,务必按照以下顺序创建代码 1....- 确定行间距: * 设置适当的行间距(例如30像素),以确保文本的可读性和美观性。 - 调整段落间距: * 将每个段落之间的距离设置为正常行间距的3倍。

23010

这52页pdf,顶10篇python自动化办公文章

大家好,我是黄同学 发现很多读者对python自动化办公(python操作Excel、Word、PDF)的文章都很喜欢,希望能够应用到工作中去。...1)修改表格中的内容 ① 向某个格子中写入内容保存 ② .append():向表格中插入行数据 ③ 在python中使用excel函数公式(很有用) ④ .insert_cols()和.insert_rows...remove():删除某个sheet表 ⑨ .copy_worksheet():复制一个sheet表到另外一张excel表 ⑩ sheet.title:修改sheet表的名称 ⑪ 创建新的excel表格文件...① python-docx提取文字 ② python-docx提取文字块儿 3)利用Python向Word文档写入内容 ① 添加段落 ② 添加文字块儿 ③ 添加一个分页 ④ 添加图片 ⑤ 添加表格 ⑥...提取word表格,保存在excel中(很重要) 3、利用Python调整Word文档样式 1)修改文字字体样式 2)修改段落样式 ① 对齐样式 ② 行间距调整 ③ 段前与段后间距 欢迎关注黄同学的

4K20

语音转文字

将音频翻译并转录为英文。目前,文件上传限制为 25 MB,支持以下输入文件类型:mp3、mp4、mpeg、mpga、m4a、wav 和 webm。...翻译翻译 API 接受任何支持的语言的音频文件作为输入,并在必要时将音频转录成英文。这与我们的 /Transcriptions 终点不同,因为输出不是原始输入语言,而是转译成英文文本。...我们目前仅支持将文本翻译成英文。...timestamp_granularities[] 参数可以启用更结构化和带有时间戳的 json 输出格式,时间戳可以在段落级别、单词级别或两者都有。...为了保留被分割成段落文件的上下文,您可以使用前一段的转录作为提示。这样会使转录更准确,因为模型将使用前一个音频的相关信息。模型只会考虑提示的最后 224 个标记,忽略之前的任何内容。

16410

微信图片翻译技术优化之路

2.1.1 ViT 原始 ViT 结构如下图(源自[1]): 这里简要介绍 ViT 的 forward 过程: 将原始图片切分为固定大小(如 16*16*3)的 patches。...优化前后的段落框检测结果对比样例如下图: 原始 DBNet 优化后 DBNet 结果 2.3 文本段落矫正 上述段落结果主要是基于视觉信息(图像层面)来做段落的检测,但是在实际 case 存在一定的情况...有了基于 BERT 的文本段落模型之后,在原始段落的基础上,我们对其进行矫正,基础的矫正策略如下: 判断同一个文本框相邻文本是否不属于同一个段落,若是则进行段落拆分。...与正常图文合成不同,这里第一步需要擦除原图文字内容、保留原图的背景,之后将翻译文字贴回原图位置,而且文字清晰可阅读。...2.5.1 Image Inpainting 从图片中擦除文字内容,且保留背景可以作为一种图片修复(Image Inpainting [16])任务,首先对于图片中的文字区域进行 mask 选定,之后对于图片中的缺失内容

2.3K20

Python文件自动化处理

os模块 Python标准库 和操作系统有关的操作 创建、移动、复制文件文件文件路径和名称处理 路径的操作 获取当前Python程序运行路径 不同操作系统之间路径的表示方式  windows中采用反斜杠...向Excel表格中写入内容  向某个格子写入内容 sheet[‘A1’]=‘hello,Python’ 用某个格子写入内容 cell.value=‘hello,Python’  使用Python列表数据插入一行...(.docx)文件Python标准模块,需要安装才能使用  获取文档对象   Document() 获得段落列表    doc.paragraphs 获取段落文字内容  paragraphs.text...(‘段落文字内容’) 添加文字块       paragraph.add_run(‘文字内容’) 保存文件           doc.save(‘文件名.docx’) 添加图片 doc.add_picture...  paragraph.alignment=对齐方式 行间距 paragraph.paragraph_format.line_spacing=2.0  段前与段后间距 paragraph.paragraph_format.space_before

6110

AI办公自动化:批量根据Excel表格内容制作Word文档

工作任务:Excel表格中有大量文本,根据这些文本自动生成word文档 在chatgpt中输入提示词: 你是一个Python编程专家,写一个Python脚本,具体步骤如下: 读取Excel文件:"F:\...AI自媒体内容\AI视频教程下载\udemy课程信息-部分-翻译版.xlsx"; 读取A列第1行单元格内容,作为word文档的文件名,在文件夹“F:\AI自媒体内容\AI视频教程下载\新建文件夹”中新建...文档的第3段落,写入word文档; 循环以上步骤,直到第67行; 注意:每一步都要输出信息到屏幕 文件系统对文件名有一些限制,如不能包含某些特殊字符(如 :、/、*、?...在文件名中可能存在这些非法字符,导致 python-docx 在保存文档时出现问题。需要在创建文件名之前清理这些非法字符。...\AI视频教程下载\udemy课程信息-部分-翻译版.xlsx' # Word 文档输出目录 output_dir = r'F:\AI自媒体内容\AI视频教程下载\新建文件夹' # 创建输出目录如果不存在

10210

LaTeX基础操作

段落 使用空行分隔不同的段落,使用\\进行强制换行 多个空格在LaTeX中通常被视为一个空格,插入多个空格使用\hspace{}命令 使用center,flushleft和flushright环境设置居中...、左对齐或右对齐 可以通过调整\parskip(段落间距)和\parindent(首行缩进)的值来改变段落间距和缩进 列表 无序列表(itemize环境) 有序列表(enumerate环境) 每个列表项使用...\item命令开始 \begin{itemize} \item 第一项 \item 第二项 \end{itemize} 调整列表间距:\itemsep(项间距)和\parsep(段落间距) 列表之间可以嵌套形成层级结构...\\ 1 & 2 & 3 \\ \end{tabular} 跨行或跨列的单元格:\multirow和\multicolumn booktabs:设置表格线条 tabularx:指定表格的总宽度,自动调整列宽以适应...} 插入图片宽度与文本宽度相同,高度自动调整,保持原始横纵比例: \includegraphics[width=\textwidth]{example.png} 缩放图片,设定scale比例: \includegraphics

19310

最全总结 | 聊聊 Python 办公自动化之 Word(中)

属性获取段落的基本格式信息 包含:对齐方式、左右缩进、行间距段落前后间距等 # 2、获取某一个段落的格式信息 paragraph_someone = paragraphs[0] # 2.1 段落内容...:', first_line_indent) # 2.2.4 行间距 line_spacing = paragraph_format.line_spacing print('段落间距:', line_spacing...) # 2.2.5 段落前后间距 space_before, space_after = paragraph_format.space_before, paragraph_format.space_after...print('段落前、后间距分别为:', space_before, ',', space_after) 4....提取文档图片有 2 种方法,分别是: 解压文档文件,将对应目录下的图片拷贝出来 使用 python-docx 内置的方法提取图片( 推荐 ) def get_word_pics(doc, word_path

2K20
领券