Bug#796179: tesseract-ocr: tesseract fails to generate output

2015-09-08 Thread Boris Pek
control: severity 796179 normal
control: tags 796179 = moreinfo unreproducible


Hi,

I have tested [1] tesseract/3.04.00-5 [2] on two Debian testing systems (amd64)
and on two Debian unstable systems (amd64 and i386) and I can not reproduce this
problem. All works as expected. Therefore I decrease the severity of this bug
and tag it as moreinfo and unreproducible. Maybe it should be closed at all.
But this is a maintainer decision.

Best regards,
Boris


[1] Only english and russian text were checked from yagf and from command line.
[2] List of tesseract packages:
$ LC_ALL=C dpkg -l '*tesseract*'
Desired=Unknown/Install/Remove/Purge/Hold
| Status=Not/Inst/Conf-files/Unpacked/halF-conf/Half-inst/trig-aWait/Trig-pend
|/ Err?=(none)/Reinst-required (Status,Err: uppercase=bad)
||/ NameVersion  Architecture Description
+++-===---===
ii  libtesseract3   3.04.00-5i386 Tesseract OCR 
library
ii  tesseract-ocr   3.04.00-5i386 Tesseract command 
line OCR tool
un  tesseract-ocr-data(no description 
available)
ii  tesseract-ocr-eng   3.04.00-1all  tesseract-ocr 
language files for English
ii  tesseract-ocr-equ   3.04.00-1all  tesseract-ocr 
language files for equations
ii  tesseract-ocr-osd   3.04.00-1all  tesseract-ocr 
language files for script and
ii  tesseract-ocr-rus   3.04.00-1all  tesseract-ocr 
language files for Russian
ii  tesseract-ocr-ukr   3.04.00-1all  tesseract-ocr 
language files for Ukranian



Bug#796179: tesseract-ocr: tesseract fails to generate output

2015-08-29 Thread Florian Schlichting
works fine for me.

I notice that in the reporter's apt-get output, tesseract-ocr version
3.04.00-5 is being installed. 'tesseract -v' however shows a version
3.03 is running, and that is clearly also the engine version in use when
no output is produced.

My guess is that Bernhard has a version 3.03 binary of tesseract
somewhere in his PATH, which takes priority over the system version but
fails to produce output together with version 3.04 language files.

Bernhard, what's the output of which tesseract on your system? Does
the stretch version produce output when called as /usr/bin/tesseract ?



Bug#796179: tesseract-ocr: tesseract fails to generate output

2015-08-24 Thread Jeff Breidenbach
I'd like to think if this were widespread, I'd be hearing about it
from multiple sources. So any sort of confirmation (or refutation)
from others is appreciated.


Bug#796179: tesseract-ocr: tesseract fails to generate output

2015-08-21 Thread Jeff Breidenbach
That's unexpected. Can you please tell me if you also have trouble with
English using the attached image?

tesseract phototest.tif -


Bug#796179: tesseract-ocr: tesseract fails to generate output

2015-08-19 Thread Bernhard Marx
Package: tesseract-ocr
Version: 3.04.00-5
Severity: grave
Justification: renders package unusable

Dear Maintainer,


after installing tesseract-ocr from testing, the command tesseract test.tif -l
deu output does not seem to generate any output on my system:

/tmp/tesseract$ sudo apt-get install tesseract-ocr/testing tesseract-ocr-
deu/testing
Paketlisten werden gelesen... Fertig
Abhängigkeitsbaum wird aufgebaut.
Statusinformationen werden eingelesen Fertig
Version »3.04.00-5« (Debian:testing [i386]) für »tesseract-ocr« gewählt.
Version »3.04.00-1« (Debian:testing [all]) für »tesseract-ocr-deu«
gewählt.
Die folgenden Pakete werden aktualisiert (Upgrade):
  tesseract-ocr tesseract-ocr-deu
2 aktualisiert, 0 neu installiert, 0 zu entfernen und 0 nicht aktualisiert.
Es müssen noch 0 B von 4.301 kB an Archiven heruntergeladen werden.
Nach dieser Operation werden 11,0 MB Plattenplatz zusätzlich benutzt.
(Lese Datenbank ... 359612 Dateien und Verzeichnisse sind derzeit installiert.)
Vorbereitung zum Entpacken von .../tesseract-ocr_3.04.00-5_i386.deb ...
Entpacken von tesseract-ocr (3.04.00-5) über (3.03.03-1) ...
Vorbereitung zum Entpacken von .../tesseract-ocr-deu_3.04.00-1_all.deb ...
Entpacken von tesseract-ocr-deu (3.04.00-1) über (3.02-2) ...
Trigger für man-db (2.7.0.2-5) werden verarbeitet ...
tesseract-ocr (3.04.00-5) wird eingerichtet ...
tesseract-ocr-deu (3.04.00-1) wird eingerichtet ...
/tmp/tesseract$ apt-show-versions tesseract-ocr tesseract-ocr-deu
tesseract-ocr:i386/testing 3.04.00-5 uptodate
tesseract-ocr-deu:all/testing 3.04.00-1 uptodate
/tmp/tesseract$ tesseract -v
tesseract 3.03
 leptonica-1.72
  libgif 4.1.6(?) : libjpeg 6b (libjpeg-turbo 1.4.0) : libpng 1.2.50 : libtiff
4.0.3 : zlib 1.2.8 : libwebp 0.4.3 : libopenjp2 2.1.0

/tmp/tesseract$ ls
test.tif
/tmp/tesseract$ tesseract test.tif -l deu output
Tesseract Open Source OCR Engine v3.03 with Leptonica
/tmp/tesseract$ ls
test.tif




Version 3.03 from stable however is working fine:


/tmp/tesseract$ sudo apt-get install tesseract-ocr/jessie tesseract-ocr-
deu/jessie
[sudo] password for root:
Paketlisten werden gelesen... Fertig
Abhängigkeitsbaum wird aufgebaut.
Statusinformationen werden eingelesen Fertig
Version »3.03.03-1« (Debian:8.1/stable [i386]) für »tesseract-ocr«
gewählt.
Version »3.02-2« (Debian:8.1/stable [all]) für »tesseract-ocr-deu«
gewählt.
Die folgenden Pakete werden durch eine ÄLTERE VERSION ERSETZT (Downgrade):
  tesseract-ocr tesseract-ocr-deu
0 aktualisiert, 0 neu installiert, 2 durch eine ältere Version ersetzt, 0 zu
entfernen und 0 nicht aktualisiert.
Es müssen noch 0 B von 1.127 kB an Archiven heruntergeladen werden.
Nach dieser Operation werden 11,0 MB Plattenplatz freigegeben.
Möchten Sie fortfahren? [J/n]
dpkg: Warnung: Version 3.04.00-1 des Paketes tesseract-ocr-deu wird durch
ältere Version 3.02-2 ersetzt
(Lese Datenbank ... 359612 Dateien und Verzeichnisse sind derzeit installiert.)
Vorbereitung zum Entpacken von .../tesseract-ocr-deu_3.02-2_all.deb ...
Entpacken von tesseract-ocr-deu (3.02-2) über (3.04.00-1) ...
dpkg: Warnung: Version 3.04.00-5 des Paketes tesseract-ocr wird durch ältere
Version 3.03.03-1 ersetzt
Vorbereitung zum Entpacken von .../tesseract-ocr_3.03.03-1_i386.deb ...
Entpacken von tesseract-ocr (3.03.03-1) über (3.04.00-5) ...
Trigger für man-db (2.7.0.2-5) werden verarbeitet ...
tesseract-ocr-deu (3.02-2) wird eingerichtet ...
tesseract-ocr (3.03.03-1) wird eingerichtet ...
/tmp/tesseract$ apt-show-versions tesseract-ocr tesseract-ocr-deu
tesseract-ocr:i386/jessie 3.03.03-1 uptodate
tesseract-ocr-deu:all/jessie 3.02-2 uptodate
/tmp/tesseract$ tesseract -v
tesseract 3.03
 leptonica-1.72
  libgif 4.1.6(?) : libjpeg 6b (libjpeg-turbo 1.4.0) : libpng 1.2.50 : libtiff
4.0.3 : zlib 1.2.8 : libwebp 0.4.3 : libopenjp2 2.1.0

/tmp/tesseract$ ls
test.tif
/tmp/tesseract$ tesseract test.tif -l deu output
Tesseract Open Source OCR Engine v3.03 with Leptonica
/tmp/tesseract$ ls
output.txt  test.tif
/tmp/tesseract$ cat output.txt
ständliche Sprache bemühte. Wir haben versucht, diese uns über—
  [...]





-- System Information:
Debian Release: 8.1
  APT prefers stable
  APT policy: (990, 'stable'), (60, 'testing'), (50, 'unstable')
Architecture: i386 (i686)

Kernel: Linux 3.16.0-4-686-pae (SMP w/4 CPU cores)
Locale: LANG=de_DE.UTF-8, LC_CTYPE=de_DE.UTF-8 (charmap=UTF-8)
Shell: /bin/sh linked to /bin/dash
Init: sysvinit (via /sbin/init)

Versions of packages tesseract-ocr depends on:
ii  libc62.19-18
ii  libcairo21.14.0-2.1
ii  libfontconfig1   2.11.0-6.3
ii  libgcc1  1:4.9.2-10
ii  libglib2.0-0 2.42.1-1
ii  libicu52 52.1-8
ii  liblept4 1.72-3
ii  libpango-1.0-0   1.36.8-3
ii  libpangocairo-1.0-0  1.36.8-3
ii  libpangoft2-1.0-01.36.8-3
ii  libstdc++6   4.9.2-10
ii  libtesseract33.03.03-1
ii  tesseract-ocr-eng3.02-2
ii  tesseract-ocr-equ3.02-2
ii  tesseract-ocr-osd3.02-2

tesseract-ocr