我正在运行PyMuPDF 1.16.17文档中的以下Python代码,它将每个页面的PNG图像保存到一个PDF文件中。pix.writePNG("F:/cynthia/page-%i.png" % page.number) # store image as a PNG 生成的PNG图像的颜色与PDF原始图像不一致(太饱和且
我希望将pdf文件中由PyMuPDF找到的所有图像作为opencv图像来读取,尽管它们来自源(避免可能导致精度损失的时髦格式转换)。基本上,我希望结果与我正在执行的cv2.imread(filename): (输出类型、颜色空间等)完全相同。range(len(pdf)): for im in page.getIma
我需要帮助从扫描的pdf提取文本。我试过用pymupdf和枕头及pytesseract来提取它,但是我没有得到正确的结果,有一些文本被错误地返回。我试着增加锐度和亮度,但仍然没有取得好的效果。我已经使用OpenCV检查了许多答案,但我对OpenCV相当陌生。请帮帮忙。#print(f'Extracting {n} image') if r