首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Docparser详细教程:手把手教你整理电脑文件,效率翻倍!

——从零开始,轻松搞定发票、合同、简历归档,看完就能上手

一、准备工作:注册与安装

注册Docparser账号

打开Docparser官网,点击“Sign Up”注册账号(支持Google账号一键登录)。

选择免费试用计划(14天无限制使用)。

安装Docparser插件(可选)

如果需要从Gmail、Google Drive等工具直接上传文件,可以安装Docparser的浏览器插件。

二、Step 1:上传文件

登录Docparser

进入Docparser后台,点击“Upload Files”按钮。

选择文件

从电脑中选择需要整理的文件(支持PDF、Word、Excel格式),支持批量上传。

也可以直接从Gmail、Google Drive、Dropbox导入文件。

创建解析器(Parser)

上传文件后,系统会提示你创建一个新的解析器(Parser),点击“Create New Parser”。

为解析器命名,例如“发票整理”或“合同归档”。

三、Step 2:设置解析规则

选择解析模式

表单模式(Form Mode):适合结构化数据(如发票、表格);

文档模式(Document Mode):适合非结构化数据(如合同、简历)。

Docparser提供两种模式:

拖拽选择数据字段

在文件预览界面,用鼠标拖拽选择需要提取的数据(如发票号、金额、日期)。

每个字段可以自定义名称(如“Invoice Number”或“Total Amount”)。

OCR识别(可选)

如果文件是扫描件或图片,开启OCR功能,Docparser会自动识别文字内容。

保存解析规则

设置完成后,点击“Save & Run”保存解析规则并运行。

四、Step 3:智能分类与命名

设置分类规则

按“供应商名称”分类:/Invoices/Supplier_A/;

按“日期”分类:/Invoices/2023-10/。

在解析器设置页面,点击“Output Settings”。

选择“Folder Structure”,按提取的数据字段(如发票号、客户名称)自动分类文件。

例如:

设置命名规则

发票号_金额_日期.pdf;

合同编号_客户名称.docx。

在“File Naming”选项中,选择“Custom Naming”。

根据提取的数据字段自定义文件名,例如:

测试规则

上传一份测试文件,检查分类和命名是否符合预期。

五、Step 4:导出与保存

选择导出格式

在“Output Settings”中,选择导出格式(如Excel、CSV、JSON)。

设置保存位置

选择保存到本地文件夹,或直接同步到Google Drive、Dropbox等云存储。

自动化流程(可选)

收到邮件附件 自动上传到Docparser 提取数据 保存到指定文件夹。

使用Zapier设置自动化工作流:

六、实战案例:整理发票

上传发票PDF

将本月所有发票PDF上传到Docparser。

设置解析规则

拖拽选择“发票号”、“金额”、“日期”字段。

分类与命名

按“供应商名称”分类,文件名格式为发票号_金额_日期.pdf。

导出与保存

导出为Excel表格,并保存到/财务/2023-10/发票/文件夹。

效果:原本需要3小时的手动整理工作,10分钟搞定!

七、高级技巧:清理重复文件

上传文件夹

将需要清理的文件夹上传到Docparser。

设置去重规则

在解析器设置中,选择“Duplicate Detection”。

设置去重规则(如文件名、内容相似度)。

一键清理

运行解析器,Docparser会自动识别重复文件并生成清理报告。

八、立即行动,开启高效人生!

转发金句

“职场从不奖励苦劳,只认可功劳。

用对工具,你的努力才会被看见!”

——分享给每个不想熬夜加班的打工人

行动指南

点赞收藏:防止下次找不到;

转发朋友圈:@你的领导/同事,暗示团队需要高效工具;

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OV3L4RnImXyaygzrJlr4MN5Q0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券