date:20181108

Re: PDFTextStripper() does not extract text correct

2018-11-08 Thread Tilman Hausherr

Am 08.11.2018 um 15:54 schrieb JZ Q: Hi everyone, I used the following code (lib version 2.0.12) to extract text from some PDF file. It appears number "3" is occasionally interpreted as "6", for example, E4283211 becomes E4286211. Is it normally? Is the code using OCR? Thanks. No, PDFBox does

PDFTextStripper() does not extract text correct

2018-11-08 Thread JZ Q

Hi everyone, I used the following code (lib version 2.0.12) to extract text from some PDF file. It appears number "3" is occasionally interpreted as "6", for example, E4283211 becomes E4286211. Is it normally? Is the code using OCR? Thanks. PDFTextStripper pdfStripper = new PDFTextStripper(); p