我正在使用C#的ImageMagick.NET库,我想从.PDF文档中的每个页面获取一些信息。下面是我当前的代码:
var list = new MagickImageCollection();
list.Read(file.FullName);
foreach (var page in list)
{
if (!backgroundWorker.CancellationPending)
{
pageCount.pageColorspace(page);
isFormat(page.Width, page.Height);
pageCount.incPdfPages();
}
}
但在我看来,它的表现真的很慢。对于10个703页的PDF文件,需要4分钟。这是一种更快获得它的方法吗?
发布于 2014-10-20 11:06:09
您可以通过逐页读取文件来提高性能。如果您读取整个文件,则内存中将有703个页面。您的机器可能无法分配那么多内存,然后ImageMagick将使用磁盘来存储像素,这将降低性能。
可以使用MagickReadSettings类的FrameIndex属性指定要读取的页。如果指定的页面太高,将引发异常(需要Magick.NET 7.0.0.0005或更高版本),并显示一条消息,指出您正在请求无效的页面。您需要这样做,因为ImageMagick不知道PDF文件的页数。下面是你如何做到这一点的一个例子。
int page = 0;
while (true)
{
MagickReadSettings settings = new MagickReadSettings()
{
FrameIndex = page
};
try
{
using (MagickImage image = new MagickImage(@"C:\YourFile.pdf", settings))
{
// Do something with the image....
}
}
catch (MagickException ex)
{
if (ex.Message.Contains("Requested FirstPage is greater"))
break;
else
throw;
}
page++;
}
https://stackoverflow.com/questions/25910033
复制