我刚刚删除了一个扫描的pdf文件。
我正试图用scalpel
来恢复它。
问题是手术刀将恢复许多已删除的文件并对其进行数字命名(例如0001.pdf、0002.pdf、. 9999.pdf)。
根据本教程,我可以使用一个grep
命令并在被删除的文件中搜索一些文本。
问题是,文件被扫描了(我知道原始文件名),所以我不知道要搜索什么。
发布于 2016-04-07 15:43:15
尝试在您的文件上运行pdfinfo
。
输出中可能包含Creator: Simple Scan
或类似的内容,因此可以搜索它。
如果您知道创建的大致日期,也可以尝试使用CreationDate
字段。
当然,如果文件不是PDF文件,pdfinfo
将返回一个错误,因此您需要将错误发送到/dev/null
。
尝试使用简单扫描扫描文档,并查看pdfinfo
返回的输出。
发布于 2016-04-07 14:11:47
PDF文件中的扫描图像数据很可能前面有类似的内容
<</BitsPerComponent 1/ColorSpace/DeviceGray/DecodeParms<</Columns 2480/K -1>>/Filter/CCITTFaxDecode/Height 3507/Length 96349/Name/Im0/Subtype/Image/Type/XObject/Width 2480>>stream
因此,我开始缩小grep -Fil 'subtype/image' filenames
的范围。这至少将排除不包含图像的PDF文件。
https://unix.stackexchange.com/questions/275008
复制相似问题