Re: Convertire pdf in bianco e nero
On Tue, Jun 22, 2021 at 06:56:21PM +0200, Davide Meloni wrote: > Buonasera. > Generalmente scansiono i documenti di testo nella modalità "bianco e nero" > (non scala di grigi) al fine di ottenere un file quanto più leggero > possibile. Sarebbe utile sapere il perché. Se è per uso archiviazione documentale sappi che lo standard è usare : 1) 400dpi 2) compressione fax CCITT gruppo 4 o altro (vedi sotto) 3) profondità immagini 1 bit 4) incapsulamento tiff (ma lo stesso si può fare con il formato contenitore pdf) recentemente è uscito un formato (sono scaduti i diritti) di compressione che non ricordo che è ancora migliore del CCITT. Credo che lo supporti nativamente djpdf. Strumenti consigliati quindi: - GIMP - Imagemagick - Scan Taylor (o S. T. Advanced) ma soprattutto: - djpdf che trovi su flatpak con il supporto di un mucchio di lingue (compreso l'Esperanto!) per la procedura di OCR necessaria per ottenere dei pdf il cui testo possa essere copiato. https://flathub.org/apps/details/com.github.unrud.djpdf https://github.com/Unrud/djpdf Facendo: flatpak search djpdf Ecco il risultato: Name Description Application ID Version Branch Remotes OCR Yoruba OCR extension for Yoruba language (yor) com.github.unrud.djpdf.OCR.Yor stable flathub OCR Yiddish OCR extension for Yiddish language (yid) com.github.unrud.djpdf.OCR.Yid stable flathub OCR Vietnamese OCR extension for Vietnamese language (vie) com.github.unrud.djpdf.OCR.Vie stable flathub OCR Uzbek - Cyrilic OCR extension for Uzbek - Cyrilic language (uzb_cyrl)com.github.unrud.djpdf.OCR.UzbCyrl stable flathub OCR UzbekOCR extension for Uzbek language (uzb) com.github.unrud.djpdf.OCR.Uzb stable flathub OCR Urdu OCR extension for Urdu language (urd) com.github.unrud.djpdf.OCR.Urd stable flathub OCR UkrainianOCR extension for Ukrainian language (ukr) com.github.unrud.djpdf.OCR.Ukr stable flathub OCR Uighur; Uyghur OCR extension for Uighur; Uyghur language (uig) com.github.unrud.djpdf.OCR.Uig stable flathub OCR Turkish OCR extension for Turkish language (tur) com.github.unrud.djpdf.OCR.Tur stable flathub OCR TongaOCR extension for Tonga language (ton) com.github.unrud.djpdf.OCR.Ton stable flathub OCR Tigrinya OCR extension for Tigrinya language (tir) com.github.unrud.djpdf.OCR.Tir stable flathub OCR Thai OCR extension for Thai language (tha) com.github.unrud.djpdf.OCR.Tha stable flathub OCR Tagalog (new - Filipino) OCR extension for Tagalog (new - Filipino) language (tgl)com.github.unrud.djpdf.OCR.Tgl stable flathub OCR TajikOCR extension for Tajik language (tgk) com.github.unrud.djpdf.OCR.Tgk stable flathub OCR Telugu OCR extension for Telugu language (tel) com.github.unrud.djpdf.OCR.Tel stable flathub OCR TatarOCR extension for Tatar language (tat) com.github.unrud.djpdf.OCR.Tat stable flathub OCR TamilOCR extension for Tamil language (tam) com.github.unrud.djpdf.OCR.Tam stable flathub OCR Syriac OCR extension for Syriac language (syr) com.github.unrud.djpdf.OCR.Syr stable flathub OCR Swedish OCR extension for Swedish language (swe) com.github.unrud.djpdf.OCR.Swe stable flathub OCR Swahili OCR extension for Swahili language (swa) com.github.unrud.djpdf.OCR.Swa stable flathub OCR SundaneseOCR extension for Sundanese language (sun) com.github.unrud.djpdf.OCR.Sun stable flathub OCR Serbian - Lat
Re: alleluia !!! Nuovo NFC reader
Il 23/06/21 19:38, Davide Prina ha scritto: On 20/06/21 14:43, valerio wrote: Il 20/06/21 14:09, Davide Prina ha scritto: $ systemctl status pcscd ● pcscd.service - PC/SC Smart Card Daemon Loaded: loaded (/lib/systemd/system/pcscd.service; indirect; vendor preset: enabled) Active: active (running) since Sun 2021-06-20 09:02:21 CEST; 5h 37min ago TriggeredBy: ● pcscd.socket qui ti dice chi lo attiva, puoi analizzarlo nello stesso modo: $ systemctl status pcscd.socket Docs: man:pcscd(8) Main PID: 3339 (pcscd) Tasks: 5 (limit: 19040) Memory: 3.3M CPU: 53ms CGroup: /system.slice/pcscd.service └─3339 /usr/sbin/pcscd --foreground --auto-exit giu 20 09:02:21 systemd[1]: Started PC/SC Smart Card Daemon. giu 20 09:02:21 pcscd[3339]: ccid_usb.c:1286:ControlUSB() control failed (1/5): -9 LIBUSB_ERROR_PIPE giu 20 10:07:20 pcscd[3339]: ccid_usb.c:858:WriteUSB() write failed (1/5): -4 LIBUSB_ERROR_NO_DEVICE giu 20 14:38:23 pcscd[3339]: ccid_usb.c:1286:ControlUSB() control failed (1/6): -9 LIBUSB_ERROR_PIPE questi sono strani, io ho (ho tolto parti non interessanti, sostituite con [...]): [...] systemd[1]: Stopping PC/SC Smart Card Daemon... [...] systemd[1]: pcscd.service: Succeeded. [...] systemd[1]: Stopped PC/SC Smart Card Daemon. [...] systemd[1]: Started PC/SC Smart Card Daemon Se invece guardo chi lo attiva: $ systemctl status pcscd.socket ● pcscd.socket - PC/SC Smart Card Daemon Activation Socket Loaded: loaded (/lib/systemd/system/pcscd.socket; enabled; vendor preset: enabled) Active: active (running) since [...] Triggers: ● pcscd.service Listen: /run/pcscd/pcscd.comm (Stream) CGroup: /system.slice/pcscd.socket [...] systemd[1]: pcscd.socket: Succeeded. [...] systemd[1]: Closed PC/SC Smart Card Daemon Activation Socket. [...] systemd[1]: Stopping PC/SC Smart Card Daemon Activation Socket. [...] systemd[1]: Listening on PC/SC Smart Card Daemon Activation Socket. Per i tuoi messaggi ho trovato questo bug: $ querybts 989316 questo bug riporta questo: $ pcsc_scan Using reader plug'n play mechanism Scanning present readers... 0: BIT4ID mLector AIR DI V3 [miniLector AIR DI v3 CLESS] 00 00 1: BIT4ID mLector AIR DI V3 [miniLector AIR DI v3 Contact] 01 00 2: BIT4ID mLector AIR DI V3 [miniLector AIR DI v3 SAM1] 02 00 3: BIT4ID mLector AIR DI V3 [miniLector AIR DI v3 SAM2] 03 00 ma a me pcsc-scan ha questo: Wed Jun 23 22:00:11 2021 Reader 0: BIT4ID miniLector AIR NFC v3 [miniLector AIR DI v3 CLESS] 00 00 Event number: 2 Card state: Card removed, ovviamente senza card. forse non capisco, devo dare altri comandi? o è un altro dispositivo? questa la descrizione del lettore: Bus 001 Device 005: ID 25dd:3403 BIT4ID miniLector AIR NFC v3 Device Descriptor: bLength18 bDescriptorType 1 bcdUSB 1.10 bDeviceClass0 bDeviceSubClass 0 bDeviceProtocol 0 bMaxPacketSize032 idVendor 0x25dd idProduct 0x3403 bcdDevice3.51 iManufacturer 1 BIT4ID iProduct2 miniLector AIR NFC v3 iSerial 0 bNumConfigurations 1 che indica che ha dei ritardi prima che possa utilizzare il lettore di carta bit4id... e ha 2 SAM slot che causano dei ritardi perché cerca in tali lettori una carta non presente. Fornisce un workaround per evitare questo ritardo in questa casistica Ciao Davide grazie delle delucidazioni ciao valerio
Re: Convertire pdf in bianco e nero
Il 23/06/21 19:42, Davide Meloni ha scritto: Il 23/06/21 08:28, Piviul ha scritto: in che senso? Io mi trovo molto bene con ghostscript con risultati ottimi; ad esempio per convertirli in scala di grigi uso un comando tipo: gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook -dNOPAUSE -dQUIET -dBATCH -dDetectDuplicateImages -sProcessColorModel=DeviceGray -sColorConversionStrategy=Gray -dOverrideICC -sOutputFile="BNFile.pdf" "colorFile.pdf" Con questo comando sono passato da 15,4 MB a 6,8. Con gscan2pdf suggerito da Valerio e risoluzione a 150, 8,8 MB. Se rimuovesse il colore forse qualcosa la si recupererebbe. Mentre Gimp suggerito da Filippo non mi pare che operi su file di più pagine (ne ho 36). Comunque io non voglio la scala di grigi, voglio il bianco e nero che hanno gli scanner. I font saranno anche meno definiti, comunque leggibili, ma il file pesa decisamente meno. AFAIK "il bianco e nero che hanno gli scanner" è la scala di grigi Piviul
Re: Convertire pdf in bianco e nero
On 23/06/21 19:42, Davide Meloni wrote: Mentre Gimp suggerito da Filippo non mi pare che operi su file di più pagine (ne ho 36). in realtà gimp lo puoi anche eseguire a riga di comando, senza interfaccia utente. In questo modo puoi fargli processare più pagine. Lo avevo usato anni fa in questo modo per applicare determinate operazioni su un numero molto elevato di file immagine. Ciao Davide -- Strumenti per l'ufficio: https://www.libreoffice.org GNU/Linux User: 302090: http://counter.li.org Non autorizzo la memorizzazione del mio indirizzo su outlook
Re: Convertire pdf in bianco e nero
On 22/06/21 18:56, Davide Meloni wrote: Ora ho ricevuto un documento di diverse pagine scansionato nella modalitï¿œ "colore" che vorrei ridurre: > ï¿œ possibile convertirlo nella modalitï¿œ "bianco e nero"? Sapete come fare? Oltre a quanto ti hanno già suggerito, se il PDF contiene molto testo e la scansione è buona, allora puoi provare a trasformarlo in un testo con un lettore di OCR, estrarre le immagini e ricrearti il file. Però dipende molto dal layout (che perdi) e la cosa potrebbe diventare molto difficile da realizzare per layout complessi. Avevo fatto delle prove tempo fa e in alcuni casi il risultato ottenuto era buono. Non mi ricordo quale OCR, presente in Debian, abbia usato all'epoca (forse tesseract-ocr?) Poi anche con questo dovresti poter convertire un PDF da colori in bianco e nero: $ apt show mupdf-tools Qui trovi un po' di soluzioni al problema: https://unix.stackexchange.com/questions/93959/how-to-convert-a-color-pdf-to-black-white https://forums.linuxmint.com/viewtopic.php?t=285720 ... Ho provato soluzioni come quella qui illustrata https://itsfoss.com/compress-pdf-linux/ che utilizza ghostscript ma senza risultati accettabili. c'è anche la possibilità di comprimere un PDF e ne ho sperimentati vari. Il miglior risultato l'ho ottenuto usando qpdf e i seguenti parametri: $ qpdf --recompress-flate --compression-level=9 --optimize-images \ $IN.pdf $OUT.pdf però dipende dalla sorgente: se chi ha creato il PDF ha già compresso il contenuto, allora puoi ottenere un file più grande dell'originale, ma in vari casi ho ottenuto una riduzione veramente consistente. Ciao Davide -- Browser: http://www.mozilla.org/products/firefox GNU/Linux User: 302090: http://counter.li.org Non autorizzo la memorizzazione del mio indirizzo su outlook
Re: Convertire pdf in bianco e nero
On 22/06/21 19:57, Filippo Dal Bosco - wrote: gimp ha una opzione ( mai usata) per convertire immagini a colori in scala di grigi. gimp gestisce anche il formato pdf io ho usato alcune volte questa funzionalità, ad esempio per modificare un PDF. Il risultato però non è eccellente poiché esportando in formato PDF l'immagine resta un po' sfocata e alla fine viene ad occupare più spazio di quello necessario. Ciao Davide -- Dizionari: http://linguistico.sourceforge.net/wiki $ Perché microsoft continua a compiere azioni illegali?: http://linguistico.sf.net/wiki/doku.php?id=traduzioni:ms_illegal GNU/Linux User: 302090: http://counter.li.org Non autorizzo la memorizzazione del mio indirizzo su outlook
Re: Convertire pdf in bianco e nero
Il 23/06/21 08:28, Piviul ha scritto: in che senso? Io mi trovo molto bene con ghostscript con risultati ottimi; ad esempio per convertirli in scala di grigi uso un comando tipo: gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook -dNOPAUSE -dQUIET -dBATCH -dDetectDuplicateImages -sProcessColorModel=DeviceGray -sColorConversionStrategy=Gray -dOverrideICC -sOutputFile="BNFile.pdf" "colorFile.pdf" Con questo comando sono passato da 15,4 MB a 6,8. Con gscan2pdf suggerito da Valerio e risoluzione a 150, 8,8 MB. Se rimuovesse il colore forse qualcosa la si recupererebbe. Mentre Gimp suggerito da Filippo non mi pare che operi su file di più pagine (ne ho 36). Comunque io non voglio la scala di grigi, voglio il bianco e nero che hanno gli scanner. I font saranno anche meno definiti, comunque leggibili, ma il file pesa decisamente meno. Grazie per ora, Davide
Re: alleluia !!! Nuovo NFC reader
On 20/06/21 14:43, valerio wrote: Il 20/06/21 14:09, Davide Prina ha scritto: $ systemctl status pcscd ● pcscd.service - PC/SC Smart Card Daemon Loaded: loaded (/lib/systemd/system/pcscd.service; indirect; vendor preset: enabled) Active: active (running) since Sun 2021-06-20 09:02:21 CEST; 5h 37min ago TriggeredBy: ● pcscd.socket qui ti dice chi lo attiva, puoi analizzarlo nello stesso modo: $ systemctl status pcscd.socket Docs: man:pcscd(8) Main PID: 3339 (pcscd) Tasks: 5 (limit: 19040) Memory: 3.3M CPU: 53ms CGroup: /system.slice/pcscd.service └─3339 /usr/sbin/pcscd --foreground --auto-exit giu 20 09:02:21 anarres systemd[1]: Started PC/SC Smart Card Daemon. giu 20 09:02:21 anarres pcscd[3339]: ccid_usb.c:1286:ControlUSB() control failed (1/5): -9 LIBUSB_ERROR_PIPE giu 20 10:07:20 anarres pcscd[3339]: ccid_usb.c:858:WriteUSB() write failed (1/5): -4 LIBUSB_ERROR_NO_DEVICE giu 20 14:38:23 anarres pcscd[3339]: ccid_usb.c:1286:ControlUSB() control failed (1/6): -9 LIBUSB_ERROR_PIPE questi sono strani, io ho (ho tolto parti non interessanti, sostituite con [...]): [...] systemd[1]: Stopping PC/SC Smart Card Daemon... [...] systemd[1]: pcscd.service: Succeeded. [...] systemd[1]: Stopped PC/SC Smart Card Daemon. [...] systemd[1]: Started PC/SC Smart Card Daemon Se invece guardo chi lo attiva: $ systemctl status pcscd.socket ● pcscd.socket - PC/SC Smart Card Daemon Activation Socket Loaded: loaded (/lib/systemd/system/pcscd.socket; enabled; vendor preset: enabled) Active: active (running) since [...] Triggers: ● pcscd.service Listen: /run/pcscd/pcscd.comm (Stream) CGroup: /system.slice/pcscd.socket [...] systemd[1]: pcscd.socket: Succeeded. [...] systemd[1]: Closed PC/SC Smart Card Daemon Activation Socket. [...] systemd[1]: Stopping PC/SC Smart Card Daemon Activation Socket. [...] systemd[1]: Listening on PC/SC Smart Card Daemon Activation Socket. Per i tuoi messaggi ho trovato questo bug: $ querybts 989316 che indica che ha dei ritardi prima che possa utilizzare il lettore di carta bit4id... e ha 2 SAM slot che causano dei ritardi perché cerca in tali lettori una carta non presente. Fornisce un workaround per evitare questo ritardo in questa casistica comunque mi sembra indipendente dalla registrazione del dispositivo su firefox naturalmente questa parte è completamente indipendente da Firefox o altro browser. Però nella casistica sopra riportata il lettore non può essere usato subito (a meno di adottare il workaround) perché il driver cerca qualcosa che non esiste. Ciao Davide -- Motivi per non comprare/usare ms-windows7: http://windows7sins.org/ Non autorizzo la memorizzazione del mio indirizzo su outlook
Re: Convertire pdf in bianco e nero
Il 22/06/21 18:56, Davide Meloni ha scritto: [...] Ho provato soluzioni come quella qui illustrata https://itsfoss.com/compress-pdf-linux/ che utilizza ghostscript ma senza risultati accettabili. in che senso? Io mi trovo molto bene con ghostscript con risultati ottimi; ad esempio per convertirli in scala di grigi uso un comando tipo: gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook -dNOPAUSE -dQUIET -dBATCH -dDetectDuplicateImages -sProcessColorModel=DeviceGray -sColorConversionStrategy=Gray -dOverrideICC -sOutputFile="BNFile.pdf" "colorFile.pdf" Piviul