如何以编程方式在c#中搜索PDF文档

在C#中搜索PDF文档可以使用第三方库，如iTextSharp或PDF.js。以下是使用iTextSharp库搜索PDF文档的示例代码：

using System;
using System.IO;
using iTextSharp.text.pdf;
using iTextSharp.text.pdf.parser;

class Program
{
    static void Main(string[] args)
    {
        string pdfFilePath = "path/to/your/pdf/file.pdf";
        string searchText = "text to search";

        using (PdfReader pdfReader = new PdfReader(pdfFilePath))
        {
            for (int pageNumber = 1; pageNumber <= pdfReader.NumberOfPages; pageNumber++)
            {
                ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
                string currentPageText = PdfTextExtractor.GetTextFromPage(pdfReader, pageNumber, strategy);

                if (currentPageText.Contains(searchText))
                {
                    Console.WriteLine($"Text found on page {pageNumber}.");
                }
            }
        }
    }
}

在这个示例中，我们使用iTextSharp库打开PDF文件，并使用SimpleTextExtractionStrategy从每一页中提取文本。然后，我们检查每一页中是否包含要搜索的文本，如果找到了，就输出页码。

需要注意的是，这种方法只能提取PDF文档中的纯文本内容，无法搜索图片或其他非文本内容。

推荐的腾讯云相关产品：

云服务器：提供可靠的服务器计算资源，可以运行C#程序。
对象存储：可以存储PDF文档等文件，方便访问和管理。
云数据库：可以存储PDF文档的元数据，方便搜索和管理。

产品介绍链接地址：

云服务器：https://cloud.tencent.com/product/cvm
对象存储：https://cloud.tencent.com/product/cos
云数据库：https://cloud.tencent.com/product/cdb

用Java和FOP设置PDF标题

、、

我正在使用Apache v0.94生成一些PDF文件。我用谷歌搜索了一下，但没有得到任何有用的信息。先谢谢你...

浏览 0提问于2009-10-20得票数 0

回答已采纳

1回答

以编程方式下载Google？

谷歌文档有一个“下载作为.”菜单选项，有几种格式的选择，如PDF，文本等。如何以编程方式下载特定的Google文档？

浏览 2提问于2015-08-25得票数 2

回答已采纳

4回答

只将第一个Word文档页转换为PDF

、、、

我正在使用Office2010Interop和C# 4。如何将word文档的第一页转换为PDF？ (“如何以编程方式将Word文件转换为PDF？”)帮助我入门，但它只告诉我如何将整个文档保存为PDF格式。我该怎么做呢？

浏览 11提问于2012-04-01得票数 3

回答已采纳

1回答

如何使用iTextSharp读取PDF组合

、、

我正在使用iTextSharp，在一个C#应用程序中读取PDF文件，并将页面分解为单独的PDF文档。它运行良好，除了在投资组合的情况。现在，我正试图弄清楚如何读取包含两个嵌入式PDF文档的PDF组合(或集合，在iText中似乎称为它们)。我只想打开投资组合，枚举嵌入的文件，然后将它们保存为单独的、简单的PDF文件。有一个很好的例子说明如何以<em

浏览 4提问于2012-08-17得票数 2

回答已采纳

2回答

以编程方式编辑google文档

、、、

我需要简单的搜索-替换从谷歌文档导出的文档文件。然后上传到谷歌文档。google doc也支持pdf导出。如果编辑pdf比较容易，我会试一下，而不是doc。只是想不出如何以编程方式编辑文件。

浏览 0提问于2011-03-30得票数 1

回答已采纳

1回答

在多个设置输出中打印c#？

、、

我在c#中有一个.net应用程序，我正在尝试使用左侧的pdf文档和右侧的文本说明进行打印。到目前为止，我已经成功地将两个输出合并到一个pdf文件中，但在如何以编程方式完成这一点上遇到了困难，这样当我要打印时，在Page file & Handling部分，选择"Multiple“并将pages我的猜测是，它是一个流程打印功能，但似乎找不到任何示例或明确的文档来做到这一点。请指教，谢

浏览 19提问于2016-08-08得票数 0

1回答

如何使用谷歌文档将PDF内容提取到.txt文件中？

、、、

如何以编程方式使用google文档从pdf文件中以编程方式提取文本？我已经准备好了，我知道还有其他的选择，但是，我很好奇是否可以使用google文档来实现这些目的。

浏览 2提问于2017-05-01得票数 2

回答已采纳

3回答

如何以编程方式从Mac上的PDF文档中删除页面？

、

我有一堆PDF文档，所有文档都包含一个我想要删除的标题页。我发现的大多数PDF实用程序只能合并文档，而不能删除页面。在打印对话框中，我可以选择第2页，然后打印到一个文件，但是我找不到任何以编程方式访问此函数的方法。

浏览 2提问于2010-09-29得票数 6

回答已采纳

1回答

在pdf.js查看器中呈现时，根据pdf文档上的文本位置添加HTML/CSS覆盖

、、、

如何以编程方式：作为一个具体的例子，如果知道短语‘这是我的文

浏览 12提问于2015-01-07得票数 8

回答已采纳

1回答

Sharepoint MOSS 2007高级搜索自定义

、

在我的sharepoint站点中，母版页模板已更改，我们将搜索框移动到显示为web部件的站点中，当用户在该框中输入搜索字符串时，它应该搜索站点本身、文档库、web上的博客、论坛和wikis中的任何可用材料因此，我认为我需要一种方法来弄清楚这些类型的搜索是如何使用sharepoint完成的，以及如何以编程方式向高级搜索提供搜索字符串并接收搜

浏览 2提问于2010-10-01得票数 1

3回答

如何以编程方式将JavaScript注入PDF文件？

、

如何以编程方式将JavaScript注入PDF文件？我知道这可以通过嵌入到文档中的JavaScript代码来完成。

浏览 4提问于2008-10-16得票数 7

7回答

如何将文件上载到sharepoint中的文档库？

、、

如何以编程方式将文件上载到sharepoint中的文档库？我目前正在使用C#制作一个Windows应用程序，它将把文档添加到文档库列表中。

浏览 8提问于2009-01-22得票数 51

回答已采纳

1回答

如何重新排序PDF文档页？

、、

我正试着重新排序我的pdf页面。有716页，每页都有编号。并不是所有的页面都在同一个位置编号，但它们都是按“样式”编号的。我想知道如何根据文档中页面上的页码重新排序页面？pdf页码是可编辑的文本。

浏览 0提问于2016-02-24得票数 0

1回答

如何使用react-native-svg模块以编程方式向组件添加SVG元素？

、

我在网上到处搜索关于如何使用react-native-svg特性在React-Native中创建SVG Rect元素的信息，但没有成功。到目前为止，我所做的是在组件中定义一些SVG元素，并将prop传递给现有的SVG元素，如Rect、Circle等。但是，如何以编程方式创建随机数量的SVG元素并将它们附加到组件？遗憾的是，文档中没有对此进行说明。

浏览 23提问于2019-02-02得票数 1

1回答

将权限设置为“可以查看”以编程方式共享的Word文档

、

在Word中，您可以选择“共享”，然后将权限设置为“查看、编辑或查看”。我想以编程方式与Can权限共享Word文档。我找到了有关如何以编程方式共享Onedrive上的文档以及如何设置允许编辑或不允许编辑的权限的信息。但是，我还没有找到以编程方式设置权限的方法。我该怎么做？需要从C#客户端应用程序执行此操作。

浏览 3提问于2022-10-12得票数 0

3回答

如何在c#中以编程方式搜索PDF文档

、、、

我需要搜索pdf文件以查看是否存在某个字符串。所讨论的字符串肯定被编码为文本(即.它不是一个图像或任何东西)。我试着像搜索纯文本一样搜索文件，但这不起作用。有可能做到这一点吗？有没有.net2.0的库可以帮我从pdf文件中提取/解码所有的文本？

浏览 0提问于2009-02-20得票数 22

回答已采纳

2回答

生成Reporting Services 2005 PDF报表并将其存储在磁盘上

、、、、

有没有一种简单的方法可以从上传到报表管理器的RDL生成PDF报表，并将该文件放在服务器磁盘上的某个位置？我已经在磁盘上放置文件的位置，我只需要知道如何以编程方式生成PDF。用VB或C#编写的代码都可以。

浏览 1提问于2008-10-07得票数 1

回答已采纳

1回答

如何以编程方式创建和分配静态TwiML Bin作为短消息响应？

、、、

我正试图弄清楚如何以编程的方式(在C#中)创建并为传入的短消息分配一个TwiML短信响应到一个电话号码。消息将永远不会改变，因此使用回调或更强大的编程功能是没有意义的。我只想能够以与UI类似的方式，以类似的方式，以编程方式将一个TwiML bin分配给一个电话号码。我在PHP中看到了一些示例，它们展示了如何以编程方式创建和更新

浏览 0提问于2020-07-23得票数 1

回答已采纳

1回答

C#在wpf应用中编程打印pdf文件

、

我有一个WPF应用程序，我希望能够打印PDF文档，但我不想使用Adobe Reader (因为我不知道客户机上是否安装了adobe )。有没有其他方法可以在C#中以不同的方式以编程方式打印pdf。

浏览 1提问于2013-09-20得票数 2

回答已采纳

1回答

如何以编程方式追加到系统路径？

、、

在python中，我如何以编程方式追加到我的系统路径？我知道sys.path.append，并且刚刚搜索了文档，但我有点困惑。是否有一种方法可以通过编程方式临时附加到系统路径中？

浏览 4提问于2016-10-28得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何以编程方式在c#中搜索PDF文档

相关·内容

用Java和FOP设置PDF标题

以编程方式下载Google？

只将第一个Word文档页转换为PDF

如何使用iTextSharp读取PDF组合

以编程方式编辑google文档

在多个设置输出中打印c#？

如何使用谷歌文档将PDF内容提取到.txt文件中？

如何以编程方式从Mac上的PDF文档中删除页面？

在pdf.js查看器中呈现时，根据pdf文档上的文本位置添加HTML/CSS覆盖

Sharepoint MOSS 2007高级搜索自定义

如何以编程方式将JavaScript注入PDF文件？

如何将文件上载到sharepoint中的文档库？

如何重新排序PDF文档页？

如何使用react-native-svg模块以编程方式向组件添加SVG元素？

将权限设置为“可以查看”以编程方式共享的Word文档

如何在c#中以编程方式搜索PDF文档

生成Reporting Services 2005 PDF报表并将其存储在磁盘上

如何以编程方式创建和分配静态TwiML Bin作为短消息响应？

C#在wpf应用中编程打印pdf文件

如何以编程方式追加到系统路径？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐