Re: Convertire pdf in bianco e nero
Il 2021-06-27 23:56 Davide Meloni ha scritto: Il 25/06/21 11:18, Marco Bodrato ha scritto: Sì, in Gimp, Immagine -> Modalità e se si sceglie "indicizzata" c'è tra le opzioni "tavolozza bianco e nero (1 bit)" che è quello veniva richiesto. Ringrazio tutti per l'interessamento. Ho provato tutti, o quasi, i suggerimenti proposti ma questo è quello che ha dato i migliori risultati. Felice di esserti stato utile, e dire che avevo scritto il mio messaggio quasi più "per completezza di informazione" che con la speranza che fosse la proposta più pratica :-D Non ho utilizzato però la tavolozza a 1 bit ma quella ottimizzata a 3 colori, al fine di migliorare la leggibilità. Certo, lo sfondo tende un po' al verdino ma pazienza... Già, come dicevo, per ottenere una cosa leggibile a due colori spesso bisogna pre-lavorare l'immagine di partenza. Se poi in partenza il foglio non è stato illuminato in maniera uniforme (non è l'immagine che viene da uno scanner, ma una fotografia) capita anche che la lavorazione necessaria possa essere decisamente impegnativa! Comunque, viva Gimp! Mi trovo giusto ora da "stampare-firmare-ridigitalizzare-rispedire" due documenti da 11 pagine l'uno con una bella manciata di punti sparsi dove apporre il mio scarabocchio e... vediamo se indovinate come lo farò? :-) Ĝis, m
Re: Convertire pdf in bianco e nero
Il 25/06/21 11:18, Marco Bodrato ha scritto: Sì, in Gimp, Immagine -> Modalità e se si sceglie "indicizzata" c'è tra le opzioni "tavolozza bianco e nero (1 bit)" che è quello veniva richiesto. Ringrazio tutti per l'interessamento. Ho provato tutti, o quasi, i suggerimenti proposti ma questo è quello che ha dato i migliori risultati. Non ho utilizzato però la tavolozza a 1 bit ma quella ottimizzata a 3 colori, al fine di migliorare la leggibilità. Certo, lo sfondo tende un po' al verdino ma pazienza... Sono passato dai circa 15,4 mega agli 1,8; con la tavolozza 1 bit avrei ottenuto un file da circa 600 kB ma la leggibilità era difficoltosa. Per chi lo ha domandato devo solo conservare dei documenti il cui originale devo poi restituire (è tempo di dichiarazioni). Grazie ancora, Davide
Re: Convertire pdf in bianco e nero
Il 25/06/21 11:18, Marco Bodrato ha scritto: Sì, in Gimp, Immagine -> Modalità e se si sceglie "indicizzata" c'è tra le opzioni "tavolozza bianco e nero (1 bit)" che è quello veniva richiesto. Ringrazio tutti per l'interessamento. Ho provato tutti, o quasi, i suggerimenti proposti ma questo è quello che ha dato i migliori risultati. Non ho utilizzato però la tavolozza a 1 bit ma quella ottimizzata a 3 colori, al fine di migliorare la leggibilità. Certo, lo sfondo tende un po' al verdino ma pazienza... Sono passato dai circa 15,4 mega agli 1,8; con la tavolozza 1 bit avrei ottenuto un file da circa 600 kB ma la leggibilità era difficoltosa. Per chi lo ha domandato devo solo conservare dei documenti il cui originale devo poi restituire (è tempo di dichiarazioni). Grazie ancora, Davide
Re: Convertire pdf in bianco e nero
On Thu, Jun 24, 2021 at 09:03:01AM +0200, Paolo Redælli wrote: > > Il 24/06/21 08:48, Marco Ciampa ha scritto: > > On Tue, Jun 22, 2021 at 06:56:21PM +0200, Davide Meloni wrote: > > > Buonasera. > > > Generalmente scansiono i documenti di testo nella modalità "bianco e nero" > > > (non scala di grigi) al fine di ottenere un file quanto più leggero > > > possibile. > > Sarebbe utile sapere il perché. Se è per uso archiviazione documentale > > sappi che lo standard è usare : > > > > 1) 400dpi > > Che risoluzione insolita... nei dispositivi che ho visto negli anni ho quasi > sempre visto 150, 300, 600, 1200dpi. Un tempo c'era anche 75dpi, quella dei > fax "bassa qualità" ma oramai è in disuso. > > 400dpi credo di non averli mai visti... son riportati in qualche standard? Si come ho detto riportato anche ad una conferenza di catalogatori, ma ora come ora non so risalire allo standard... -- Saluton, Marco Ciampa
Re: Convertire pdf in bianco e nero
Ciao, Il Mer, 23 Giugno 2021 7:42 pm, Davide Prina ha scritto: On 22/06/21 19:57, Filippo Dal Bosco - wrote: gimp ha una opzione ( mai usata) per convertire immagini a colori in scala di grigi. Sì, in Gimp, Immagine -> Modalità e se si sceglie "indicizzata" c'è tra le opzioni "tavolozza bianco e nero (1 bit)" che è quello veniva richiesto. gimp gestisce anche il formato pdf io ho usato alcune volte questa funzionalità, ad esempio per modificare un PDF. Il risultato però non è eccellente poiché esportando in formato PDF l'immagine resta un po' sfocata e alla fine viene ad occupare più spazio di quello necessario. Se il PDF di partenza era vettoriale (testo), Gimp lo trasforma in immagine per punti e l'effetto è quello: ottenere un risultato "un po' sfocato" e più pesante dell'originale. Se però l'immagine di partenza è essa stessa una digitalizzazione "fotografica", come sembrerebbe nello scenario proposto, e si sceglie una risoluzione adeguata, il risultato può essere decisamente buono. In più lavorando coi filtri (curve, contrasti, luminosità, soglie... ognuno usi quello che preferisce) si può migliorare parecchio il risultato finale che sarà 1 bit per punto, evitando che un grigio di fondo si trasformi in un "dithering" di inutili puntini sparsi per il documento o che alcune lettere o righe un poco sbiadite del documento originale "dimagriscano" troppo fino a sparire. Se c'è da lavorare di fino sulla visibilità del risultato finale, con Gimp si può fare. Il 2021-06-23 20:10 Davide Prina ha scritto: On 23/06/21 19:42, Davide Meloni wrote: Mentre Gimp suggerito da Filippo non mi pare che operi su file di più pagine (ne ho 36). in realtà gimp lo puoi anche eseguire a riga di comando, senza interfaccia utente. In questo modo puoi fargli processare più pagine. Quando si chiede a Gimp di importare un PDF, anche da interfaccia grafica, si può richiedere di importare tutte le pagine. In questo caso tutte le pagine vengono importate su una singola immagine con più livelli. Se si ha l'accortezza, riesportando, di ricordare a Gimp di esportare i livelli come pagine, si ottiene nuovamente un PDF con molte pagine. Se non ricordo male, bisogna però specificare di "girare l'ordine delle pagine" altrimenti si ottengono le pagine dall'ultima alla prima... Detto ciò (che Gimp è in grado di assolvere al compito richiesto), di certo ci sono programmi dedicati specificamente alla manipolazione dei PDF che possono far meglio. Anche solo decidendo di lavorare con Gimp, talvolta mi è capitato di usare prima "pdfimages" per estrarre dal PDF le immagini, esattamente con la risoluzione con la quale erano state generate, per evitare di riscalare durante l'importazione in Gimp che rischia di perdere qualità o efficienza. Ĝis, m
Re: Convertire pdf in bianco e nero
Il 24/06/21 08:48, Marco Ciampa ha scritto: On Tue, Jun 22, 2021 at 06:56:21PM +0200, Davide Meloni wrote: Buonasera. Generalmente scansiono i documenti di testo nella modalità "bianco e nero" (non scala di grigi) al fine di ottenere un file quanto più leggero possibile. Sarebbe utile sapere il perché. Se è per uso archiviazione documentale sappi che lo standard è usare : 1) 400dpi Che risoluzione insolita... nei dispositivi che ho visto negli anni ho quasi sempre visto 150, 300, 600, 1200dpi. Un tempo c'era anche 75dpi, quella dei fax "bassa qualità" ma oramai è in disuso. 400dpi credo di non averli mai visti... son riportati in qualche standard?
Re: Convertire pdf in bianco e nero
On Tue, Jun 22, 2021 at 06:56:21PM +0200, Davide Meloni wrote: > Buonasera. > Generalmente scansiono i documenti di testo nella modalità "bianco e nero" > (non scala di grigi) al fine di ottenere un file quanto più leggero > possibile. Sarebbe utile sapere il perché. Se è per uso archiviazione documentale sappi che lo standard è usare : 1) 400dpi 2) compressione fax CCITT gruppo 4 o altro (vedi sotto) 3) profondità immagini 1 bit 4) incapsulamento tiff (ma lo stesso si può fare con il formato contenitore pdf) recentemente è uscito un formato (sono scaduti i diritti) di compressione che non ricordo che è ancora migliore del CCITT. Credo che lo supporti nativamente djpdf. Strumenti consigliati quindi: - GIMP - Imagemagick - Scan Taylor (o S. T. Advanced) ma soprattutto: - djpdf che trovi su flatpak con il supporto di un mucchio di lingue (compreso l'Esperanto!) per la procedura di OCR necessaria per ottenere dei pdf il cui testo possa essere copiato. https://flathub.org/apps/details/com.github.unrud.djpdf https://github.com/Unrud/djpdf Facendo: flatpak search djpdf Ecco il risultato: Name Description Application ID Version Branch Remotes OCR Yoruba OCR extension for Yoruba language (yor) com.github.unrud.djpdf.OCR.Yor stable flathub OCR Yiddish OCR extension for Yiddish language (yid) com.github.unrud.djpdf.OCR.Yid stable flathub OCR Vietnamese OCR extension for Vietnamese language (vie) com.github.unrud.djpdf.OCR.Vie stable flathub OCR Uzbek - Cyrilic OCR extension for Uzbek - Cyrilic language (uzb_cyrl)com.github.unrud.djpdf.OCR.UzbCyrl stable flathub OCR UzbekOCR extension for Uzbek language (uzb) com.github.unrud.djpdf.OCR.Uzb stable flathub OCR Urdu OCR extension for Urdu language (urd) com.github.unrud.djpdf.OCR.Urd stable flathub OCR UkrainianOCR extension for Ukrainian language (ukr) com.github.unrud.djpdf.OCR.Ukr stable flathub OCR Uighur; Uyghur OCR extension for Uighur; Uyghur language (uig) com.github.unrud.djpdf.OCR.Uig stable flathub OCR Turkish OCR extension for Turkish language (tur) com.github.unrud.djpdf.OCR.Tur stable flathub OCR TongaOCR extension for Tonga language (ton) com.github.unrud.djpdf.OCR.Ton stable flathub OCR Tigrinya OCR extension for Tigrinya language (tir) com.github.unrud.djpdf.OCR.Tir stable flathub OCR Thai OCR extension for Thai language (tha) com.github.unrud.djpdf.OCR.Tha stable flathub OCR Tagalog (new - Filipino) OCR extension for Tagalog (new - Filipino) language (tgl)com.github.unrud.djpdf.OCR.Tgl stable flathub OCR TajikOCR extension for Tajik language (tgk) com.github.unrud.djpdf.OCR.Tgk stable flathub OCR Telugu OCR extension for Telugu language (tel) com.github.unrud.djpdf.OCR.Tel stable flathub OCR TatarOCR extension for Tatar language (tat) com.github.unrud.djpdf.OCR.Tat stable flathub OCR TamilOCR extension for Tamil language (tam) com.github.unrud.djpdf.OCR.Tam stable flathub OCR Syriac OCR extension for Syriac language (syr) com.github.unrud.djpdf.OCR.Syr stable flathub OCR Swedish OCR extension for Swedish language (swe) com.github.unrud.djpdf.OCR.Swe stable flathub OCR Swahili OCR extension for Swahili language (swa) com.github.unrud.djpdf.OCR.Swa stable flathub OCR SundaneseOCR extension for Sundanese language (sun) com.github.unrud.djpdf.OCR.Sun stable flathub OCR Serbian -
Re: Convertire pdf in bianco e nero
Il 23/06/21 19:42, Davide Meloni ha scritto: Il 23/06/21 08:28, Piviul ha scritto: in che senso? Io mi trovo molto bene con ghostscript con risultati ottimi; ad esempio per convertirli in scala di grigi uso un comando tipo: gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook -dNOPAUSE -dQUIET -dBATCH -dDetectDuplicateImages -sProcessColorModel=DeviceGray -sColorConversionStrategy=Gray -dOverrideICC -sOutputFile="BNFile.pdf" "colorFile.pdf" Con questo comando sono passato da 15,4 MB a 6,8. Con gscan2pdf suggerito da Valerio e risoluzione a 150, 8,8 MB. Se rimuovesse il colore forse qualcosa la si recupererebbe. Mentre Gimp suggerito da Filippo non mi pare che operi su file di più pagine (ne ho 36). Comunque io non voglio la scala di grigi, voglio il bianco e nero che hanno gli scanner. I font saranno anche meno definiti, comunque leggibili, ma il file pesa decisamente meno. AFAIK "il bianco e nero che hanno gli scanner" è la scala di grigi Piviul
Re: Convertire pdf in bianco e nero
On 23/06/21 19:42, Davide Meloni wrote: Mentre Gimp suggerito da Filippo non mi pare che operi su file di più pagine (ne ho 36). in realtà gimp lo puoi anche eseguire a riga di comando, senza interfaccia utente. In questo modo puoi fargli processare più pagine. Lo avevo usato anni fa in questo modo per applicare determinate operazioni su un numero molto elevato di file immagine. Ciao Davide -- Strumenti per l'ufficio: https://www.libreoffice.org GNU/Linux User: 302090: http://counter.li.org Non autorizzo la memorizzazione del mio indirizzo su outlook
Re: Convertire pdf in bianco e nero
On 22/06/21 18:56, Davide Meloni wrote: Ora ho ricevuto un documento di diverse pagine scansionato nella modalitï¿œ "colore" che vorrei ridurre: > ï¿œ possibile convertirlo nella modalitï¿œ "bianco e nero"? Sapete come fare? Oltre a quanto ti hanno già suggerito, se il PDF contiene molto testo e la scansione è buona, allora puoi provare a trasformarlo in un testo con un lettore di OCR, estrarre le immagini e ricrearti il file. Però dipende molto dal layout (che perdi) e la cosa potrebbe diventare molto difficile da realizzare per layout complessi. Avevo fatto delle prove tempo fa e in alcuni casi il risultato ottenuto era buono. Non mi ricordo quale OCR, presente in Debian, abbia usato all'epoca (forse tesseract-ocr?) Poi anche con questo dovresti poter convertire un PDF da colori in bianco e nero: $ apt show mupdf-tools Qui trovi un po' di soluzioni al problema: https://unix.stackexchange.com/questions/93959/how-to-convert-a-color-pdf-to-black-white https://forums.linuxmint.com/viewtopic.php?t=285720 ... Ho provato soluzioni come quella qui illustrata https://itsfoss.com/compress-pdf-linux/ che utilizza ghostscript ma senza risultati accettabili. c'è anche la possibilità di comprimere un PDF e ne ho sperimentati vari. Il miglior risultato l'ho ottenuto usando qpdf e i seguenti parametri: $ qpdf --recompress-flate --compression-level=9 --optimize-images \ $IN.pdf $OUT.pdf però dipende dalla sorgente: se chi ha creato il PDF ha già compresso il contenuto, allora puoi ottenere un file più grande dell'originale, ma in vari casi ho ottenuto una riduzione veramente consistente. Ciao Davide -- Browser: http://www.mozilla.org/products/firefox GNU/Linux User: 302090: http://counter.li.org Non autorizzo la memorizzazione del mio indirizzo su outlook
Re: Convertire pdf in bianco e nero
On 22/06/21 19:57, Filippo Dal Bosco - wrote: gimp ha una opzione ( mai usata) per convertire immagini a colori in scala di grigi. gimp gestisce anche il formato pdf io ho usato alcune volte questa funzionalità, ad esempio per modificare un PDF. Il risultato però non è eccellente poiché esportando in formato PDF l'immagine resta un po' sfocata e alla fine viene ad occupare più spazio di quello necessario. Ciao Davide -- Dizionari: http://linguistico.sourceforge.net/wiki $ Perché microsoft continua a compiere azioni illegali?: http://linguistico.sf.net/wiki/doku.php?id=traduzioni:ms_illegal GNU/Linux User: 302090: http://counter.li.org Non autorizzo la memorizzazione del mio indirizzo su outlook
Re: Convertire pdf in bianco e nero
Il 23/06/21 08:28, Piviul ha scritto: in che senso? Io mi trovo molto bene con ghostscript con risultati ottimi; ad esempio per convertirli in scala di grigi uso un comando tipo: gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook -dNOPAUSE -dQUIET -dBATCH -dDetectDuplicateImages -sProcessColorModel=DeviceGray -sColorConversionStrategy=Gray -dOverrideICC -sOutputFile="BNFile.pdf" "colorFile.pdf" Con questo comando sono passato da 15,4 MB a 6,8. Con gscan2pdf suggerito da Valerio e risoluzione a 150, 8,8 MB. Se rimuovesse il colore forse qualcosa la si recupererebbe. Mentre Gimp suggerito da Filippo non mi pare che operi su file di più pagine (ne ho 36). Comunque io non voglio la scala di grigi, voglio il bianco e nero che hanno gli scanner. I font saranno anche meno definiti, comunque leggibili, ma il file pesa decisamente meno. Grazie per ora, Davide
Re: Convertire pdf in bianco e nero
Il 22/06/21 18:56, Davide Meloni ha scritto: [...] Ho provato soluzioni come quella qui illustrata https://itsfoss.com/compress-pdf-linux/ che utilizza ghostscript ma senza risultati accettabili. in che senso? Io mi trovo molto bene con ghostscript con risultati ottimi; ad esempio per convertirli in scala di grigi uso un comando tipo: gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook -dNOPAUSE -dQUIET -dBATCH -dDetectDuplicateImages -sProcessColorModel=DeviceGray -sColorConversionStrategy=Gray -dOverrideICC -sOutputFile="BNFile.pdf" "colorFile.pdf" Piviul
Re: Convertire pdf in bianco e nero
Il giorno Tue, 22 Jun 2021 18:56:21 +0200 Davide Meloni ha scritto: > > Ora ho ricevuto un documento di diverse pagine scansionato nella > modalitᅵ "colore" che vorrei ridurre: ᅵ possibile convertirlo > nella modalitᅵ "bianco e nero"? Sapete come fare? gimp ha una opzione ( mai usata) per convertire immagini a colori in scala di grigi. gimp gestisce anche il formato pdf -- Filippo
Re: Convertire pdf in bianco e nero
Il 22/06/21 18:56, Davide Meloni ha scritto: Buonasera. Generalmente scansiono i documenti di testo nella modalitï¿œ "bianco e nero" (non scala di grigi) al fine di ottenere un file quanto piï¿œ leggero possibile. Ora ho ricevuto un documento di diverse pagine scansionato nella modalitï¿œ "colore" che vorrei ridurre: ï¿œ possibile convertirlo nella modalitï¿œ "bianco e nero"? Sapete come fare? Ho provato soluzioni come quella qui illustrata https://itsfoss.com/compress-pdf-linux/ che utilizza ghostscript ma senza risultati accettabili. Grazie, Davide ciao, hai mai usato gscan2pdf? non l'ho mai usato per quello che vuoi fare tu, ma penso che abbia molte potenzialità valerio