pero ora ho trovato che tesseract è estremamente migliore di cuneiform nel riconoscimento del testo senza neanche indicargli in che lingua è documento.
ciao MAX 2014-06-21 19:21 GMT+02:00, MaX <maxlinux2...@gmail.com>: > lo sto provando, ma per ora mi va in crash cuneiform con questi errori: > > inizio cuneiform > Cuneiform for Linux 1.1.0 > inizio hocrpdf > Warning: tag mismatch: 'b' can not close last open: 'i' > Warning: tag mismatch: 'span' can not close last open: 'b' > Warning: tag mismatch: 'p' can not close last open: 'b' > Warning: tag mismatch: 'i' can not close last open: 'b' > Warning: tag mismatch: 'span' can not close last open: 'i' > Warning: tag mismatch: 'p' can not close last open: 'i' > Warning: tag mismatch: 'div' can not close last open: 'i' > Warning: tag mismatch: 'body' can not close last open: 'i' > Warning: tag mismatch: 'html' can not close last open: 'i' > Warning: unclosed tag: 'i' > Warning: unclosed tag: 'span' > Warning: unclosed tag: 'p' > Warning: unclosed tag: 'b' > Warning: unclosed tag: 'span' > Warning: unclosed tag: 'p' > Warning: unclosed tag: 'div' > Warning: unclosed tag: 'body' > Warning: unclosed tag: 'html' > max@debian:~/Desktop/test-archiviatore$ > > > ci sto indagando, cmq se funzionasse, per me sarebbe un ottima > soluzione... scansiono i documenti con simplescan o qualche cosa del > genere e li salvo in pdf, poi li do in pasto allo script per renderli > con il testo inglobato in modo da poter fare una ricerca nel > filesystem, con find o anche semplicemente locate. > > ciao > MaX > > 2014-06-21 16:33 GMT+02:00, Gerlos <gerlo...@gmail.com>: >> Il 21/06/2014 11:55, MaX ha scritto: >>> purtroppo il sito non funziona :( >>> >>> http://www.watchocr.com >> >> Beh, nel frattempo puoi provare anche questo: >> http://oscarmanual.org/oscar_emr_12/developers/4.9-utilities/pdfsearch >> >> saluti >> gerlos >> >> -- >> "Life is pretty simple: You do some stuff. Most fails. Some works. You do >> more >> of what works. If it works big, others quickly copy it. Then you do >> something >> else. The trick is the doing something else." >> < http://gerlos.altervista.org > >> gerlos +- - - > gnu/linux registred user #311588 >> >> > > > -- > ciao, > MaX > -- ciao, MaX -- Per REVOCARE l'iscrizione alla lista, inviare un email a debian-italian-requ...@lists.debian.org con oggetto "unsubscribe". Per problemi inviare un email in INGLESE a listmas...@lists.debian.org To UNSUBSCRIBE, email to debian-italian-requ...@lists.debian.org with a subject of "unsubscribe". Trouble? Contact listmas...@lists.debian.org Archive: https://lists.debian.org/CAEyAVmvubQ5Wny0FKwrerZM3KJ0=ZBFr0iazeDC7sbhsg+h=_...@mail.gmail.com