linux pdf tif_linux tif_ABCpdf -将pdf流转换为tif流 - 腾讯云开发者社区

performance、pdf、imagemagick、tesseract

我一直在linux上使用tesseract (Ver3)从扫描的pdf文件中提取文本。问题是整个过程很慢，非常慢。例如，提取这个() 20页文档需要514秒(8+分钟) 为了转换pdf，我使用了Image Magick转换应用程序。下面是我使用的set命令。转换-density 288 src.pdf -colorspace灰度-depth 8 -alpha off tmp.tif tesseract tmp.tif out.txt 请注意，288dpi是必需的，否则tesseract将无法从我测试的扫描文件中提取文本。有没有人知道如何在不影响结果质量的情况下提高速度？

浏览 1提问于2011-05-02得票数 1

1回答

修改刮掉的url并更改其扩展

python-3.x、pdf、web-scraping、beautifulsoup、html-parsing

我是新编程和尝试下载图片和PDF从一个网站。在源代码中，我需要的项目在带有部分urls的选项标签中。该网站在下拉菜单中列出了这些项目，并在iframe中显示，但是每个项目都可以使用其完整的url在自己的页面上打开。到目前为止，我的代码找到了选项，将部分url附加到页面的基本地址，为每个选项创建完整的url，并从.tif和.TIF url中删除最终的“/”，并添加一个".pdf“。但是，对于.tif和.TIF urls，我需要将“转换”更改为"pdf“，以便在新页面中打开它们。是否有一种方法只对.tif.pdf和.TIF.pdf urls执行此操作，而将其他urls保持不变？

浏览 3提问于2017-12-02得票数 0

回答已采纳

1回答

img2pdf:使页面保持良好的顺序

rename、sort、konsole

img2pdf非常快速地处理数百个图像，并使用如下命令创建一个pdf img2pdf *.tif -o out.pdf 但在我的情况下，页码是错的。我在Kubuntu20.04下运行了konsole命令。图像文件在表单中被命名(在Dolphin文件管理器中重命名) Vol_1.tif Vol_2.tif Vol_3.tif ... Vol_430.tif 得到的pdf从名为Vol_100.tif的文件/页面开始，这有点道理(100在1或11之前就可以看到)。然后，Vol_119.tif后面跟着Vol_11.tif，Vol_129.tif后面跟着Vol_12.tif……Vol_189.tif后

浏览 0提问于2021-08-24得票数 1

回答已采纳

1回答

为Tesseract准备PDF时的文本质量

pdf、imagemagick、tesseract

我有一个扫描过的文档，我想使用Tesseract来获取其中的文本。下面是我的PDF质量的一个例子：如您所见，“维护”的"c“上方有一个小圆点。Tesseract使用以下命令将该单词翻译为："maﬁntenanée“： tesseract 1.pdf final -l eng --oem 2 tesseract 1.pdf final -l eng --oem 1 tesseract 1.pdf final -l eng 我负担不起这种检测，所以我试着用imagemagick改进我的PDF。我已经尝试了以下所有命令： convert 1.pdf -resize

浏览 15提问于2017-07-17得票数 0

回答已采纳

1回答

使用Ghostscript自动转换文件夹中的每个文件

macos、pdf、tiff、ghostscript

目前，我正在使用此命令将文件X.pdf转换为X.tif。 gs -q -sDEVICE=tiffg4 -r300 -dBATCH -dPDFFitPage -dNOPAUSE -sOutputFile=tif/X.tif pdf/X.pdf 是否有一种顺利的方法来做相当于 gs -q -sDEVICE=tiffg4 -r300 -dBATCH -dPDFFitPage -dNOPAUSE -sOutputFile=tif/*.tif pdf/*.pdf就像使用搜索查询一样吗？(我用*替换了X)这个方法显然不起作用，但是可能有类似的语法吗？还是我要写个批处理文件之类的？ PS:我在OSX上

浏览 0提问于2016-01-04得票数 1

回答已采纳

2回答

Linux用于快速浏览CMYK分离的多页PDF？

linux、gui、printing、color

是否有一个在Linux上运行的免费/开源应用程序，其中我可以指定一个多页PDF作为输入，然后指定一个页码，然后获得该页面的彩色呈现以及每一个青色、品红色、黄色和黑色的分隔？(不确定这是否称为用于打印的“预飞”软件)。此外，如果该应用程序能够计算纯黑色和白色(即仅在K/黑色分隔上有内容)和有颜色内容的页面的总数(以及哪一个)，那就太好了。对于单个页面PDF，从命令行使用ghostscript相对容易；例如，使用此Latex代码test.tex： \documentclass{standalone} \usepackage{tikz} \begin{document} \begin{tikzpi

浏览 0提问于2015-05-03得票数 2

回答已采纳

1回答

用Magick.NET创建多页TIFF

c#、tiff、magick.net

我正在使用Magick.NET并尝试创建多页面-TIFF-文件。我的输入是PDF文件。但是，将结果写入MemoryStream或将其作为字节数组获得将导致一个错误： iisexpress.exe:在写目录之前刷新数据的错误。@error/tiff.c/TIFFError/551 但是，当我将结果写入硬盘上的文件时，没有错误，文件也很好。这是我的代码： var outputStream = new MemoryStream(); using (var inputPdf = new MagickImageCollection()) { inputPdf.Read(rawData,

浏览 1提问于2015-05-20得票数 5

2回答

如何将TIF文件转换为PDF文件

powershell

我正在尝试将TIF文件转换为PDF文件。下面是执行转换的代码，但是，当它转换时，我失去了TIF文件中的内容，只得到空白的PDF文件。如何转换文件并将图片保留在原始TIF文件中。 $InputLocation = "C:\convert" $tool = 'C:Program Files (x86)\PDFCreator\PDFCreator.exe' $tiffs = get-childitem -filter *.tif -path $InputLocation foreach($tiff in $tiffs) { $filename =

浏览 1提问于2013-07-08得票数 1

回答已采纳

1回答

使用iTextSharp将某些TIF压缩转换为PDF的问题

itextsharp、itext

我正在使用iTextSharp转换和缝合单页TIF文件到多页PDF文件。单页TIF文件具有不同的位深度和压缩. 这是密码- private void button1_Click(object sender, EventArgs e) { List<string> TIFfiles = new List<string>(); Document document; PdfWriter pdfwriter; Bitmap tifFile; pdfFilename = <file path>.PDF; TIFfiles

浏览 6提问于2015-04-08得票数 2

回答已采纳

1回答

创建批文件的算法

c#、algorithm、lambda、expression、linq-query-syntax

我有一个目录，所有不同版本的文件都可用。喜欢, ABC.pdf ABC_1.pdf . XYZ.tif .....XYZ_25.tif MNO.tiff 我想按所用的要求制作n批m文件。假设，文件夹中有ABC.pdf到ABC_24.pdf，XYZ.tif到XYZ_24.tif文件。总共有50个文件。我想创建两个批次，每批25个文件。因此，首先(我/如何)需要确保对列表中的所有文件进行排序，然后执行一些逻辑，将列表划分为两个适当的批。 1) ABC.pdf到ABC_24.pdf 2) XYZ.tif到XYZ_24.tif ，但如果我有26个文件(如开头所述)，那么它将类似于 1) ABC.pd

浏览 1提问于2014-02-16得票数 0

回答已采纳

1回答

将.tif转换为.tiff以进行pdf转换

python、pdf、type-conversion、format、tiff

我正在尝试规范我的文档数据输入，我面临着大量的.pdf、.tiff和.tiff文档。我希望将所有文档标准化，将其转换为.pdf格式，但在my转换函数中面对.tif文档的问题。问题是如何处理 def tiff_to_pdf(tiff_path: str) -> str: if tiff_path.endswith(".tif"): tiff_path.replace(".tif", ".tiff") pdf_path = tiff_path.replace('.tiff', '.pd

浏览 29提问于2022-04-01得票数 -1

回答已采纳

2回答

使用Windows批处理中的创建日期和时间重命名文件

windows、date、batch-file、time、renaming

我有一个包含数千个pdf和tif的目录树。一个文件夹可以包含多个pdf或tif，在这种情况下，它们的编号为1.pdf、2.pdf等...我必须让它们可用，并确保它们首先是主要处理的最旧文件-所以我想用它们的创建日期和时间来重命名它们(1.pdf -> 20150415481876.pdf)：目前我使用的是 @echo off set datetime=%~t1 set name=%~n1 set extension=%~x1 set year=%datetime:~6,4% set month=%datetime:~3,2% set day=%datetime:~0,2% set

浏览 3提问于2015-05-06得票数 5

1回答

使用Zend Framework将多页.tif文件加载到PDF

pdf、tiff、zend-pdf

我可以使用ZendFramework成功地将单页.tif图像加载到PDF中，以下是代码： $pdf = new Zend_Pdf(); $page = new Zend_Pdf_Page(Zend_Pdf_Page::SIZE_LETTER); $image = Zend_Pdf_Image::imageWithPath('/tmp/test.tif'); $pageHeight = $page->getHeight(); $pageWidth = $page->getWidth(); $page->drawImage($image, 0, 0, $pageW

浏览 0提问于2011-04-14得票数 0

回答已采纳

1回答

使用MVC 4动作结果在新选项卡中显示图像

c#、asp.net-mvc-4、razor、devexpress-mvc

我读过很多关于这方面的文章，但我还没有找到解决办法。情况很简单：我有一个图像超链接。单击时，我希望在新选项卡中打开链接文件。文件可以是pdf (application/pdf)或Tif (image/tif)。我让它处理PDF文件，但是如果该文件是一个TIF图像，浏览器希望下载该文件，而不是打开新的选项卡。这是我的控制器代码： [Authorize] public ActionResult GetFile(string fileName) { string UploadDirectory = System.Configu

浏览 4提问于2016-08-25得票数 0

回答已采纳

2回答

我想删除文件夹中具有特定扩展名且与指定字符串不匹配的一组文件。

cmd、batch-processing

我是新手，命令提示符脚本和批处理文件。我有一个包含以下内容的文件夹： file1.pdf file1.tif file1_cropped.tif file1.txt file2.pdf file2.tif file2_cropped.tif 文件2. filen.pdf filen.tif filen_cropped.tif filen.txt 我想删除文件名中没有"_cropped“的所有tif文件。我已经看到了一些删除具有指定扩展名或匹配特定字符串的文件的解决方案，但我试图将两者结合起来。非常感谢，马克。

浏览 0提问于2014-03-24得票数 0

回答已采纳

1回答

将单页.tif文件从文件名中读取为multipage.tiff

python、tesseract、filenames、tiff、python-tesseract

更新:我发现从OCRed文件创建pdf文件是不合理的。所以最好还是不改信就行了。我仍然有一个问题，一些图像是连接的，而另一些是一个寻呼机。 data = [] listOfPages = glob.glob(r"C:/Users/name/test/*.tif") for entry in listOfPages: text = pytesseract.image_to_string( Image.open(entry), lang="en" ) data.append(text) df0 = pd.Da

浏览 9提问于2021-10-06得票数 3

回答已采纳

2回答

无法使用Python2.7、QFileDialog 4.11和Windows764位设置QFileDialog的默认筛选器

python、python-2.7、pyqt4

我见过其他几个 (和)试图做我在这里要求的事情，但这仍然不起作用。我还引用了这个，并在python中检查了帮助(QFileDialog.getSaveFileName)。不确定它是否与环境有关，或者我的代码忽略了什么。我在Windows764bit上使用Python2.7和PyQt 4.11.4。我尝试过直接对象构造和静态方法(如本中所建议的)，但以下代码都不允许我为文件对话框设置默认筛选器或初始筛选器。打开文件对话框时会选择第一个文件类型(pdf)，大概是因为它是列表中的第一个。 if self.dlg.formatBox.currentIndex() == 1 : # if extens

浏览 6提问于2016-12-20得票数 0

2回答

用Ghostscript将PDF转换为TIFF的Powershell脚本

pdf、powershell、ghostscript

我被要求编写一个脚本，自动将PDF文件转换为TIFF文件，以便处理furter文件。在谷歌和这个网站的帮助下。(我从未学习过任何编程语言)我创建了下面的代码。尽管它现在正在工作，但它并不是我所希望的那样，因为它每次在只创建一个文件的地方运行时都会创建13个文件。有人能帮我看一下剧本然后告诉我哪里出了问题吗？提前谢谢你！编辑:在这个(测试)的情况下，文件夹中只有一个PDF，它被命名为test.pdf，但是这个想法是脚本查看给定文件夹中的所有PDF，因为它不确定在任何给定时间文件夹中有多少PDF。让它在后台作为服务运行(？) 我将用错误代码/描述编辑文章，一旦我找到了如何获得它们，我就跟不上

浏览 7提问于2014-03-18得票数 0

回答已采纳

2回答

OSError:打开的文件太多

windows、ghostscript

我在Windows上通过python2.7运行ghostscript，将一堆1页的PDF文件转换成TIFF图像。 from os import listdir, remove from os.path import isfile, join import ghostscript import os import time import sys #Assumption #1: The input folder, output_tif_folder and output_pdf_folder #Assumption #2: Paths in windows use a backslash for

浏览 1提问于2017-01-24得票数 0

2回答

使用Magick.NET将第一页转换为tif

c#、imagemagick-convert、graphicsmagick、magick.net

下面的gm转换命令将首页 of source.pdf转换为output.tif convert source.pdf[0] output.tif 我想知道如何使用Magick.NET库来实现它？下面的代码不适用于我。 using (MagickImage image = new MagickImage("source.pdf")) { image.Write("output.tif"); }

浏览 1提问于2017-07-09得票数 1

回答已采纳

2回答

如何在angular中获取图像的扩展？

javascript、angular

在这里，我使用以下代码检查图像扩展。使用split and pop我得到了图像扩展，但在此之后，我必须检查此扩展是否与此匹配，因为我必须检查多个or条件，因此它使代码的过程很慢，因此是否有任何可能使代码减少和减少OR条件。例如。如果jpEg扩展映像时间只有一个条件(extn == jpeg)是选中所有类型小，则大写扩展('jpeg','Jpeg','jPeg','jpEg','jpeG','JPeg','JpEg','JpeG','jPEg',&#

浏览 29提问于2018-12-22得票数 1

回答已采纳

1回答

如何使用java将多个多页tiff文件合并成单个pdf？

java、pdf、itext

我使用以下代码将多个多页tif文件转换为pdf。 import java.io.File; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.log4j.Logger; import com.itextpdf.text.BaseColor; import com.itextpdf.text.Document; import com.itextpdf.text.Element; import com.itextp

浏览 0提问于2017-07-18得票数 0

回答已采纳

1回答

Ghostscript :如何将%d命令设置为特定值

ghostscript

我在这个命令行中使用GS gswin32c.exe -sDEVICE=tiffg4 -dSAFER -dBATCH -dNOPROMPT -sPAPERSIZE=a4 -dFIXEDMEDIA -dPDFFitPage -dNOPAUSE -r600 -g6120x7920 -dPrinted=false -sOutputFile="C:\test\test_%d.tif c:\test\xyz.pdf 这很好，但是它总是以"1“值开始，所以输出是"test_1.tif”。我需要如何修改comanndline，以强制GS从另一个值开始，例如7.因此GS将多页PDF

浏览 2提问于2022-01-26得票数 1

回答已采纳

1回答

处理TIF文件--将此转换从ImageMagick转换为Java

java、image、imagemagick、ocr

我正在尝试将PDF预处理为TIF图像以进行OCR。在命令行上，我可以通过使用以下ImageMagick命令将PDF转换为TIF来完成此操作： $ convert -density 300 /path/to/my/document.pdf -depth 8 -strip -background white -alpha off file.tiff 我怎样才能在Java中得到相同的结果？我目前可以使用tess4j将PDF转换为TIF，但如何重新缩放和预处理生成的tif？哪些库可以让我快速、轻松地完成这项工作？

浏览 11提问于2019-01-24得票数 0

回答已采纳

1回答

将.tif转换为pdf/A1.4或1.5

shell、pdf、imagemagick、ghostscript、tiff

使用shell命令，我能够将.tif文件转换为pdf文件。不幸的是，输出的文件是在pdf/Aver1.3，我需要它的pdf/A v1.4或1.5。这是我的命令(在1.3版中输出)： Convert test.tif test.pdf 我认为该命令是使用imagemagick工具(使用鬼怪脚本)进行转换。因此，我尝试了这个(仍然是1.3，但pdf/A是无效的)： convert test.tif pdfa:test.pdf 然后我试着用鬼怪脚本把pdf转换成1.5 gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.5 -dNOPAUSE -dQUIET

浏览 6提问于2017-05-17得票数 0

1回答

对pdf珠中的输入文件进行排序

sort、pdf、images

我正试图用pdfbeads从数百张D0图像中制作一个pdf。我不能让程序按照正确的数字顺序使用图像。例如，在此过程中，我看到： Prepared data for processing image-098.tif Prepared data for processing image-099.tif Prepared data for processing image-100.tif Prepared data for processing image-1000.tif Prepared data for processing image-1001.tif Prepared data for p

浏览 0提问于2020-06-22得票数 0

回答已采纳

2回答

用于从列中获取特定模式的查询

sql、plsql

浏览 0提问于2015-07-27得票数 0

3回答

Perl:三部分代码彼此独立工作，混合时脚本将失败。

perl

我有下面的脚本，从jpgs，tifs，和pngs制作pdf。每个部分(从#开始工作正常)都很好。换句话说，当我评论JPG部分时，脚本适用于PNG，当我评论JPG和PNG部分时，它适用于TIF。但是，它不能用于所有扩展: JPG、PNG和TIF。我希望脚本在文件夹中查找JPG。如果他们被发现，应该创建一个pdf (只有那时，我不想要一个空的pdf)和脚本应该退出。如果没有JPG，脚本应该查找PNG。如果找到它们，应该创建一个pdf，脚本应该退出。如果没有PNG，脚本应该查找TIF。如果找到它们，应该创建一个pdf，脚本应该退出。该脚本如下： #!/usr/bin/perl use PDF::A

浏览 5提问于2015-12-17得票数 0

回答已采纳

3回答

用PdfSharp将Tif文档转换为PDF格式

c#、.net、image、winforms、pdf

我在用WinForms。在我的表单中，我有一个显示tif图像文档的picturebox。我使用PdfSharp作为引用之一，将tif文档转换为pdf文档。好消息是我可以转换当前显示在picturebox中的一个tif页面。问题是，当我有一个有超过1页的tif文档时，我不能将它们全部转换成一个Pdf文件。例如，如果我有一个包含5页的tif文档图像，我需要按一个按钮并将这5个tif页面转换成5个pdf页面。对于测试，这里是一个5页的tif文档。链接：我的代码： using PdfSharp; using PdfSharp.Pdf; using PdfSharp.Drawing;

浏览 2提问于2016-02-04得票数 4

回答已采纳

2回答

如何将多个tif文件合并为单个tif文件？

pdf、merge、tiff、ghostscript

我有这么多的tif文件，所以我想要转换成一个文件。我在Ubuntu11.04上，我怎么做呢？我试着把tif转换成一个pdf，但是当把pdf转换成tif时，我使用ghoscript命令： gs -dNOPAUSE -q -g300x300 -sDEVICE=tiffg4 -dBATCH -sOutputFile=result.tif source.pdf 但结果不是很好。*对我的问题有什么建议吗？谢谢你之前。

浏览 5提问于2012-06-21得票数 5

1回答

仅将部分页面从PDF转换为带有xpdf的TIF

xpdf

我使用此命令将stdout上的PDF转换为TIF图像： convert -density 300 -depth 8 -compress lzw my.pdf tif:- 如果PDF有多个页面，如何只转换第一页？

浏览 5提问于2016-02-15得票数 0

回答已采纳

1回答

ImageMagick:在不使用外部文本文件的情况下将选择性图像转换为多页PDF？

imagemagick、imagemagick-convert

假设我有一个目录，其中包含5个TIFF文件，我想将其中一些文件转换为多页PDF，但在同一目录中有其他TIFF文件，我不希望在同一PDF中。换句话说，我想转换file1.TIF，file2.TIF，file3.TIF --> foo.pdf，但是我想忽略位于同一文件夹中的file4.TIF和file5.TIF。从文档中看，唯一的方法是为ImageMagick提供一个列出文件的文本文件，然后在调用程序时指向它，如下所示： convert @FilesToConvert.txt C:\foo3.pdf 有没有办法使调用内联，这样我就不必为每个转换创建一个单独的文本文件？提前感谢！

浏览 11提问于2016-09-23得票数 0

回答已采纳

1回答

由于正确的MIME类型不匹配，自动下载已停止

ruby、mime-types、selenium-webdriver、ruby-1.9.3

我已经编写了一个脚本来自动从web上下载文件，如下所示： #Automatically download files to a given folder profile settings #--------------------------------------------------------------- profile = Selenium::WebDriver::Firefox::Profile.new profile['browser.download.dir'] = 'C:\Documents and Settings\My Documents\use

浏览 2提问于2013-03-01得票数 0

3回答

如何使用列表文件重命名文件？

powershell、rename

我有1000多个文件，我想以一种特定的方式重新命名，根据相关列表。我不像下面这样重复相同的cmdlet，而是将cmdlet指向包含新旧名称的两个列表文件，比如old.txt和new.txt。如何使用PowerShell完成此操作？示例： Rename-Item -Path "E:\MyFolder\old1.pdf" -NewName new1.pdf Rename-Item -Path "E:\MyFolder\old2.tif" -NewName new2.pdf Rename-Item -Path "E:\MyFolder\old3.pdf

浏览 6提问于2015-06-23得票数 2

回答已采纳

1回答

如何将一个文件夹中的所有tif文件转换为pdf，并以bash脚本保存到另一个位置而不循环通过？

bash

find /home/folder1/folder2/folder3/my\ Raw\ Data/"$1"/"$2"/"$3"/"$4" -type f -name "*.tif" -exec bash -c 'tiff2pdf "$1" -o "${1%.tif}".pdf' - '{}' \; 这是我的bash脚本，将/home/folder1/folder2/folder3/my\ Raw\ Data/"$1"/"$2&#

浏览 6提问于2020-04-06得票数 1

回答已采纳

2回答

批处理文件变量值在循环外部不可用

variables、batch-file、for-loop

我正在尝试编写一个批处理文件，该文件将在目录中搜索*.pdf文件扩展名，然后用ImageMagic将它们转换为*.tif文件扩展名。如果目录中有一个PDF文件，我就能做到这一点，但如果有多个PDF文件，我就不知道如何用正确的名称转换它们。问题是在循环中，似乎没有分配fName变量，但是在循环之外的有一个值. 下面是用于单个PDF文件和多个PDF文件的代码，但是名称包含".pdf"： echo off set dSource=C:\Users\Nick\Documents\Research\Journal Article\Figures set fType=*.pdf for /

浏览 0提问于2013-09-27得票数 0

回答已采纳

2回答

将文件夹中的所有文件合并为pdf

javascript、acrobat

我当前的问题是，从根文件夹开始，我必须查看每个文件夹，如果存在一个文件，那么将其保存为一个pdf，文件夹名位于不同的位置。如果存在多个文件，然后将其合并到一个文件中，将其保存为一个pdf，文件夹名位于不同的位置。示例： - Root Folder - Folder1 - FileA.tif - FileB.tif - Folder2 - FileC.tif - Result Folder - Folder1.pdf (Contains FileA.tif and Fi

浏览 6提问于2011-11-16得票数 2

1回答

在r中的pdf上执行ocr时出错

r、pdf、ocr、tesseract、lapply

在r中的pdf上尝试OCR，这给了我错误。运行代码后，也会生成"i.txt“文件，但仍然会出现错误。 pdftoppm version 4.00 Copyright 1996-2017 Glyph & Cog, LLC Usage: pdftoppm [options] <PDF-file> <PPM-root> -f <int> : first page to print -l <int> : last page to print -r <number> :

浏览 3提问于2017-09-20得票数 0

4回答

SHELL:如何在定义字符串时使用或运算符

linux、shell、glob

这可能是不可能的，但我正在编写我的第一个shell脚本，并且我需要在我的字符串中使用regexp类型运算符(如下所示) FILES=tif2/name(45|79)*.pdf 这个是可能的吗？或者我只需要有两根弦。 FILES=tif2/name45*.pdf FILES=tif2/name79*.pdf

浏览 13提问于2011-02-18得票数 0

回答已采纳

1回答

使用R在单个.pdf中保存多个栅格的有效方法

我对R非常陌生，我想知道是否有一种更快的方法来在单个.pdf中保存多个栅格，而不是像下面这样手动输入每个栅格文件名： pdf(file = "file_name.pdf", width = 11, height = 8.5) plot(raster(file.path(dir_path_data,"nutrient_pollution_2003_impact.tif"))) plot(raster(file.path(dir_path_data,"nutrient_pollution_2004_impact.tif"))) plot(raster

浏览 3提问于2020-05-30得票数 0

回答已采纳

2回答

用R做OCR

r、shell、pdf、ocr、tesseract

我一直试图在R内做OCR (读取PDF数据作为扫描图像)。一直在读到这个@ 这是个很好的职位。有效的3个步骤：将pdf转换为ppm (图像格式) 将ppm转换为tif，准备好进行训练(使用ImageMagick进行转换) 将tif转换为文本文件上述三个步骤的有效代码，如链接所示： lapply(myfiles, function(i){ # convert pdf to ppm (an image format), just pages 1-10 of the PDF # but you can change that easily, just remove

浏览 7提问于2015-08-13得票数 14

2回答

循环浏览文件夹时，Powershell将文件保存在原始文件夹中

powershell

我正在尝试使用我在这里找到的Powershell脚本将PDF文件转换为TIFF文件。我已经运行了大部分脚本，但是我似乎不知道如何将TIFF文件保存在PDF所在的原始文件夹中。 #Path to your Ghostscript EXE $tool = 'C:\Program Files\gs\gs9.25\bin\gswin64c.exe' #Directory containing the PDF files that will be converted $inputDir = 'C:\Temp\Test_ED_Data\1\' #Output path

浏览 0提问于2018-10-02得票数 1

1回答

我想使用regex创建一个匹配三个单词的词干的模式，而不管它们的顺序如何。

regex

我正在使用黑板创建一个测试。其中一个问题的答案是：TIF, PDF, or Native。黑板有能力使用模式匹配，以验证答案填补空白的问题. 什么样的regex会接受包含所有这些单词的答案，而不管顺序如何，如果学生在答案中添加了" and“，那么忽略它呢？可能的正确答案： TIF PDF Native Tifs, Pdfs, and natives native and pdf and tif pdf, tifs natives tifs with text and metadata, PDF, Native 我需要这三个词，但我可以忽略多余的单词。我会对答案进行质量

浏览 3提问于2016-11-29得票数 1

回答已采纳

1回答

无法删除Spring Integration Flow中的通知中的文件资源

spring-integration、spring-integration-dsl、spring-integration-sftp

我在一个文件中定义了3个流，用于轮询tif文件并将其发送到通道。该频道链接到另一个流，该流转换并复制到同一位置的pdf文件。然后第三个流ftp是pdf文件。建议链接到ftp flow，其中tif和pdf文件都要在成功表达式后删除： @Bean public IntegrationFlow rtwInflow() { return IntegrationFlows .from(rtwTifFileSharePoller() , e -> e.poller(Pollers.fixedDelay(15000)))

浏览 1提问于2019-02-15得票数 0

3回答

c#将PDF转换为Tif

c#、ocr

我正在使用ghostscript转换PDF的Tif与C$类包装，然后是使用光学字符识别tessnet2读取图像文件的内容，但tif图像是相当不可读，图像是相当褪色的，看起来不正确，光学字符识别引擎无法读取任何东西。有没有开放源码或库，可以花我几块钱就可以将PDF转换成高质量的TIf？或者任何可以读取PDF的开源光学字符识别引擎，因为tessnet2不能读取PDF。

浏览 6提问于2012-08-31得票数 0

回答已采纳

1回答

ABCpdf -将pdf流转换为tif流

pdf、stream、tiff、abcpdf

我的网页有一个文档查看器(画布)，我将在其中绑定多页tif文件流。有一个从文件中删除页面的功能，我使用ABCpdf库将tif文件流转换成pdf流并删除特定的页面。但是我看不到任何方法可以将pdf流转换回tif流。请帮帮忙。

浏览 28提问于2019-10-09得票数 0

1回答

Powershell脚本将特定的PDF页面打印到图像中

powershell、pdf、printing、ghostscript

我怎样才能更改这个powershell脚本 Start-Process –FilePath “C:\Data\PROJECTS\ABC.pdf” –Verb Print -PassThru | %{sleep 10;$_} | kill 至：打印PDF的特定页面，直接指向图像(如png、jpg、tif等)，以及相应地保存它们？例如，我希望将ABC.pdf的第3页、第4页、第7页打印成三个单独的文件，名为ABC_3.png、ABC_4.png和ABC_7.png；图像文件可以是任何格式(.png、.jpg、.tif等)。我计划调用一个.csv列表来获取所有参数值(例

浏览 4提问于2016-04-07得票数 3

回答已采纳

2回答

tiff输出的质量Imagemagick与Ghostscript

pdf、ghostscript、tiff、imagemagick-convert

我目前正在开发工作流。从PDF中生成tif有两种选择：鬼怪脚本： gswin64c.exe -r300x300 -dBATCH -dNOPAUSE -sDEVICE=tiff24nc -sOutputFile=thetif.tif -sCompression=lzw thepdf.pdf -c退出-q Imagemagick -皈依：转换-background白色-alpha离开-density 300 thepdf.pdf -depth 8 -compress zip thetif.tif 对于(任意)示例文件，提取的tif用于gswin64c的大小大约是转换结果的五倍。

浏览 4提问于2017-10-30得票数 1

回答已采纳

1回答

将pdf转换为tiff与a pdf在结果中提供一个黑色多边形

converter、tiff、abcpdf

我们有一个PDF文档，我们想要转换成一个TIF文件。pdf包含一个带有浅灰背景的方框。当将此灰度转换为tif中的黑色多边形时。无论呈现的设置是什么，它都是黑色的。我能做些什么来影响TIF的渲染，这样这个灰色的盒子就不会变成黑色了吗？我们使用以下代码： using ( Doc doc = new Doc() ) { XReadOptions options = new XReadOptions { ReadModule = ReadModuleType.Pdf }; doc.Read( bytes, options

浏览 8提问于2014-03-26得票数 1

回答已采纳

1回答

使用基于lastwriteaccess的itextsharp将多个tiff合并为一个pdf

vb.net、datetime、last-modified、datemodified

真的不知道该怎么做？我可以把一个tif格式转换成pdf格式。我可以将一个目录中的所有tif转换为一个pdf。我想要做的是根据一组tif的上次写入访问、创建日期或修改日期来转换它们。例如，如果我在一个目录中有7个tif，其中3个具有相同的时间戳，4个具有另一个相同的时间戳，我想将这3个文件合并到一个pdf中，然后将另4个文件合并到另一个pdf中。我有点卡在如何处理这个问题上了。我是否需要创建所有文件的列表，然后对它们进行分组，或者我可以合并3，然后使用for each进行下一组合并，等等，等等？下面的代码是我用来收集前5个文件的代码： Dim dir As New DirectoryInfo

浏览 10提问于2017-08-17得票数 2