图片版的PDF文件,怎么才能借助AI工具来提取其中全部的文字内容呢?
第一步:将PDF文件转换成图片格式
具体方法参见文章:《零代码编程:用kimichat将图片版PDF自动批量分割成多个图片》
第二步:识别图片中的文字
将第一步pdf转换成的图片,上传到kimichat
注意:kimichat目前上传图片一次最多50张图片,单个大小不超过100M
上传完成后,kimichat会进行解析。
部分图片会提示:未提取到文字或者解析失败
点击这些解析失败图片的右上角红色X,把这些无法解析的图片删除掉
然后回车,就全部识别出来到了。但是,识别的顺序不是按照文件标题名来的,有些乱,可以让kimichat调整下:
请按照图片标题顺序排列
Kimichat最终的输出结果:
当然,根据您提供的图片标题顺序,这里是整理后的文字内容:
- T-shirt
- overalls
- boots
这些文字内容似乎是从一本关于职业和角色扮演的儿童书中提取的。
本文分享自 Dance with GenAI 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!