我正在c#中使用iTextSharp,根据页码将pdf文件拆分为多个文件(1 pdf 100页将是100 pdf 1页)现在,我必须根据条件“电话号码”拆分pdf每当我使用电话号码时,都必须创建一个新的pdf。不,我会从1页创建2-3-4甚至更多pdf。问题是我不了解按内容拆分pdf的热度。
我在pdf上有一些重复
phone number: 111-222
phone number: 555-999
phone number: 888-000
并且我需要为此示例创建3个pdf文件。
基于页码的拆分代码是:
FileInfo file = new FileInfo(inputPath);
using (PdfReader reader = new PdfReader(inputPath))
{
for (int pagenumber = start_to_split; pagenumber <= reader.NumberOfPages; pagenumber++)
{
string filename = pagenumber.ToString() + ".pdf";
Document document = new Document();
PdfCopy copy = new PdfCopy(document, new FileStream(outputPath + "\\" + filename, FileMode.Create));
document.Open();
copy.AddPage(copy.GetImportedPage(reader, pagenumber));
document.Close();
}
return reader.NumberOfPages;
}
如何按内容拆分pdf?