如何使用C#从pdf文件中提取图像

要使用C#从PDF文件中提取图像，您可以使用第三方库，例如iTextSharp或PdfSharp。以下是使用iTextSharp提取图像的示例代码：

using System;
using System.IO;
using iTextSharp.text.pdf;
using iTextSharp.text.pdf.parser;

namespace ExtractImagesFromPdf
{
    class Program
    {
        static void Main(string[] args)
        {
            string inputFile = "path/to/your/pdf/file.pdf";
            string outputFolder = "path/to/your/output/folder";

            using (PdfReader pdfReader = new PdfReader(inputFile))
            {
                for (int pageNumber = 1; pageNumber <= pdfReader.NumberOfPages; pageNumber++)
                {
                    ExtractImagesFromPage(pdfReader, pageNumber, outputFolder);
                }
            }
        }

        private static void ExtractImagesFromPage(PdfReader pdfReader, int pageNumber, string outputFolder)
        {
            PdfDictionary pageDictionary = pdfReader.GetPageN(pageNumber);
            PdfDictionary resourcesDictionary = pageDictionary.GetAsDict(PdfName.RESOURCES);
            PdfDictionary xObjectDictionary = resourcesDictionary.GetAsDict(PdfName.XOBJECT);

            if (xObjectDictionary != null)
            {
                foreach (PdfName imageName in xObjectDictionary.Keys)
                {
                    if (xObjectDictionary.GetAsDict(imageName).GetAsName(PdfName.SUBTYPE) == PdfName.IMAGE)
                    {
                        ExtractImage(xObjectDictionary.GetAsStream(imageName), outputFolder, pageNumber);
                    }
                }
            }
        }

        private static void ExtractImage(PdfStream imageStream, string outputFolder, int pageNumber)
        {
            byte[] imageBytes = PdfReader.GetStreamBytes(imageStream);
            string imageName = $"image_{pageNumber}_{Guid.NewGuid()}.jpg";
            string imagePath = Path.Combine(outputFolder, imageName);

            using (FileStream fs = new FileStream(imagePath, FileMode.Create))
            {
                fs.Write(imageBytes, 0, imageBytes.Length);
            }
        }
    }
}

在这个示例中，我们首先创建一个PdfReader对象来读取PDF文件。然后，我们遍历每一页，并使用ExtractImagesFromPage方法提取每一页中的图像。在这个方法中，我们首先获取页面的资源字典，然后获取XObject字典，最后遍历XObject字典中的每个图像，并使用ExtractImage方法将其保存到磁盘上。

请注意，这个示例仅适用于使用iTextSharp库的PDF文件。如果您使用的是其他库，例如PdfSharp，则需要使用不同的方法来提取图像。