基于pdfbox识别的技术要点

一、pdf主要概念概念

X、Y、Z坐标

起始及结束坐标

二、识别步骤

1、独立文本列表(转换为绝对值坐标)

2、根据内容定义坐标范围

3、根据坐标识别具体内容

未完待续