天津建设银行官方网站,网络营销企业网站推广,网站 必须有的功能,福州做网站的获取PDF文件中文字或图片的坐标可以实现精确定位#xff0c;这对于快速提取指定区域的元素#xff0c;以及在PDF中添加注释、标记或自动盖章等操作非常有用。本文将详解如何使用国产PDF库通过C# 提取PDF中指定文本或图片的坐标位置#xff08;X, Y轴#xff09;。
✍ 用于…获取PDF文件中文字或图片的坐标可以实现精确定位这对于快速提取指定区域的元素以及在PDF中添加注释、标记或自动盖章等操作非常有用。本文将详解如何使用国产PDF库通过C# 提取PDF中指定文本或图片的坐标位置X, Y轴。
✍ 用于操作PDF文件的第三方库为Spire.PDF for .NET。可以下载产品包后手动安装或者直接通用Nuget安装。
开始前我们首先了解该库关于PDF中坐标系的一些信息
Spire.PDF for .NET使用 PdfPageBase 类表示PDF页面由内容区域和四周的页边距组成。页面上坐标系的原点位于内容区域的左上角x 轴从原点开始水平向右延伸y 轴从原点开始垂直向下延伸 如下图所示。 通过指定坐标XY轴我们可以在PDF页面指定位置处绘制文本、图片、表格等元素。当然Spire.PDF for .NET也提供了相应的接口来帮助大家获取已有PDF文件中指定文本或图片的坐标信息。具体操作如下。 C# 获取 PDF 中指定文本的坐标
要指定文本的坐标主要分为两步实现
首先需要使用 PdfTextFinder.Find() 方法查找PDF文件中所有指定文本查找到文本后再通过 PdfTextFragment.Positions 属性进一步获取其 (X, Y) 坐标信息。
代码:
using Spire.Pdf;
using Spire.Pdf.Texts;
using System.Drawing;namespace GetCoordinatesOfText
{class Program{static void Main(string[] args){//创建PdfDocument对象PdfDocument pdf new PdfDocument();//加载PDF文件pdf.LoadFromFile(大数据.pdf);//遍历所有页面foreach (PdfPageBase page in pdf.Pages){//创建PdfTextFinder对象PdfTextFinder finder new PdfTextFinder(page);//设置查找选项PdfTextFindOptions options new PdfTextFindOptions();options.Parameter TextFindParameter.IgnoreCase;finder.Options options;//查找页面中所有指定文本ListPdfTextFragment fragments finder.Find(海量);//遍历所有查找的文本foreach (PdfTextFragment fragment in fragments){//获取文本的坐标信息PointF found fragment.Positions[0];Console.WriteLine(found);}}}}
}C# 获取 PDF 中指定图片的坐标
与获取文字坐标类似获取图片坐标主要也分为两步
首先使用 PdfImageHelper.GetImagesInfo() 方法获取某个PDF页面中所有图片信息获取图片后再通过 PdfImageInfo.Bounds 属性获取其 (X, Y) 坐标信息。
代码
using Spire.Pdf;
using Spire.Pdf.Utilities;
using System;namespace GetCoordinatesOfImage
{class Program{static void Main(string[] args){//创建PdfDocument对象PdfDocument pdf new PdfDocument();//加载PDF文件pdf.LoadFromFile(大数据.pdf);//获取指定页面PdfPageBase page pdf.Pages[0];//创建PdfImageHelper对象PdfImageHelper helper new PdfImageHelper();//获取页面中的图片信息PdfImageInfo[] images helper.GetImagesInfo(page);//获取第一张图片的 X、Y 坐标float xPos images[0].Bounds.X;float yPos images[0].Bounds.Y;Console.WriteLine(图片坐标为{0},{1}, xPos, yPos);}}
}加载的示例文档 获取PDF中文字坐标的返回结果 获取PDF中图片坐标的返回结果 相关推荐阅读
C# 提取 PDF 文档中的文本
C# 提取PDF中的图片
C# 查找并高亮PDF中的指定文本
Spire.PDF for .NET库的API文档