date:20210623

Re: Convertire pdf in bianco e nero

2021-06-23 Per discussione Marco Ciampa

On Tue, Jun 22, 2021 at 06:56:21PM +0200, Davide Meloni wrote:
> Buonasera.
> Generalmente scansiono i documenti di testo nella modalità "bianco e nero"
> (non scala di grigi) al fine di ottenere un file quanto più leggero
> possibile.

Sarebbe utile sapere il perché. Se è per uso archiviazione documentale
sappi che lo standard è usare :

1) 400dpi
2) compressione fax CCITT gruppo 4 o altro (vedi sotto)
3) profondità immagini 1 bit
4) incapsulamento tiff (ma lo stesso si può fare con il formato contenitore pdf)

recentemente è uscito un formato (sono scaduti i diritti) di compressione
che non ricordo che è ancora migliore del CCITT. Credo che lo supporti
nativamente djpdf.

Strumenti consigliati quindi:

- GIMP
- Imagemagick
- Scan Taylor (o S. T. Advanced)

ma soprattutto:

- djpdf che trovi su flatpak con il supporto di un mucchio di lingue
(compreso l'Esperanto!) per la procedura di OCR necessaria per ottenere
dei pdf il cui testo possa essere copiato.

https://flathub.org/apps/details/com.github.unrud.djpdf
https://github.com/Unrud/djpdf

Facendo: flatpak search djpdf

Ecco il risultato:

Name Description
  Application ID   Version 
Branch Remotes
OCR Yoruba   OCR extension for Yoruba language (yor)
  com.github.unrud.djpdf.OCR.Yor   
stable flathub
OCR Yiddish  OCR extension for Yiddish language (yid)   
  com.github.unrud.djpdf.OCR.Yid   
stable flathub
OCR Vietnamese   OCR extension for Vietnamese language (vie)
  com.github.unrud.djpdf.OCR.Vie   
stable flathub
OCR Uzbek - Cyrilic  OCR extension for Uzbek - Cyrilic language 
(uzb_cyrl)com.github.unrud.djpdf.OCR.UzbCyrl
   stable flathub
OCR UzbekOCR extension for Uzbek language (uzb) 
  com.github.unrud.djpdf.OCR.Uzb   
stable flathub
OCR Urdu OCR extension for Urdu language (urd)  
  com.github.unrud.djpdf.OCR.Urd   
stable flathub
OCR UkrainianOCR extension for Ukrainian language (ukr) 
  com.github.unrud.djpdf.OCR.Ukr   
stable flathub
OCR Uighur; Uyghur   OCR extension for Uighur; Uyghur language 
(uig)  com.github.unrud.djpdf.OCR.Uig   
stable flathub
OCR Turkish  OCR extension for Turkish language (tur)   
  com.github.unrud.djpdf.OCR.Tur   
stable flathub
OCR TongaOCR extension for Tonga language (ton) 
  com.github.unrud.djpdf.OCR.Ton   
stable flathub
OCR Tigrinya OCR extension for Tigrinya language (tir)  
  com.github.unrud.djpdf.OCR.Tir   
stable flathub
OCR Thai OCR extension for Thai language (tha)  
  com.github.unrud.djpdf.OCR.Tha   
stable flathub
OCR Tagalog (new - Filipino) OCR extension for Tagalog (new - Filipino) 
language (tgl)com.github.unrud.djpdf.OCR.Tgl
   stable flathub
OCR TajikOCR extension for Tajik language (tgk) 
  com.github.unrud.djpdf.OCR.Tgk   
stable flathub
OCR Telugu   OCR extension for Telugu language (tel)
  com.github.unrud.djpdf.OCR.Tel   
stable flathub
OCR TatarOCR extension for Tatar language (tat) 
  com.github.unrud.djpdf.OCR.Tat   
stable flathub
OCR TamilOCR extension for Tamil language (tam) 
  com.github.unrud.djpdf.OCR.Tam   
stable flathub
OCR Syriac   OCR extension for Syriac language (syr)
  com.github.unrud.djpdf.OCR.Syr   
stable flathub
OCR Swedish  OCR extension for Swedish language (swe)   
  com.github.unrud.djpdf.OCR.Swe   
stable flathub
OCR Swahili  OCR extension for Swahili language (swa)   
  com.github.unrud.djpdf.OCR.Swa   
stable flathub
OCR SundaneseOCR extension for Sundanese language (sun) 
  com.github.unrud.djpdf.OCR.Sun   
stable flathub
OCR Serbian - Lat

Re: alleluia !!! Nuovo NFC reader

2021-06-23 Per discussione valerio





Il 23/06/21 19:38, Davide Prina ha scritto:

On 20/06/21 14:43, valerio wrote:



Il 20/06/21 14:09, Davide Prina ha scritto:



$ systemctl status pcscd



● pcscd.service - PC/SC Smart Card Daemon
  Loaded: loaded (/lib/systemd/system/pcscd.service; indirect; 
vendor preset: enabled)
  Active: active (running) since Sun 2021-06-20 09:02:21 CEST; 5h 
37min ago

TriggeredBy: ● pcscd.socket


qui ti dice chi lo attiva, puoi analizzarlo nello stesso modo:
$ systemctl status pcscd.socket


    Docs: man:pcscd(8)
    Main PID: 3339 (pcscd)
   Tasks: 5 (limit: 19040)
  Memory: 3.3M
 CPU: 53ms
  CGroup: /system.slice/pcscd.service
  └─3339 /usr/sbin/pcscd --foreground --auto-exit

giu 20 09:02:21 systemd[1]: Started PC/SC Smart Card Daemon.
giu 20 09:02:21 pcscd[3339]:  
ccid_usb.c:1286:ControlUSB() control failed (1/5): -9 LIBUSB_ERROR_PIPE
giu 20 10:07:20 pcscd[3339]:  
ccid_usb.c:858:WriteUSB() write failed (1/5): -4 LIBUSB_ERROR_NO_DEVICE
giu 20 14:38:23 pcscd[3339]:  
ccid_usb.c:1286:ControlUSB() control failed (1/6): -9 LIBUSB_ERROR_PIPE


questi sono strani, io ho (ho tolto parti non interessanti, sostituite 
con [...]):

[...] systemd[1]: Stopping PC/SC Smart Card Daemon...
[...] systemd[1]: pcscd.service: Succeeded.
[...] systemd[1]: Stopped PC/SC Smart Card Daemon.
[...] systemd[1]: Started PC/SC Smart Card Daemon

Se invece guardo chi lo attiva:
$ systemctl status pcscd.socket
● pcscd.socket - PC/SC Smart Card Daemon Activation Socket
  Loaded: loaded (/lib/systemd/system/pcscd.socket; enabled; vendor 
preset: enabled)

  Active: active (running) since [...]
    Triggers: ● pcscd.service
  Listen: /run/pcscd/pcscd.comm (Stream)
  CGroup: /system.slice/pcscd.socket

[...] systemd[1]: pcscd.socket: Succeeded.
[...] systemd[1]: Closed PC/SC Smart Card Daemon Activation Socket.
[...] systemd[1]: Stopping PC/SC Smart Card Daemon Activation Socket.
[...] systemd[1]: Listening on PC/SC Smart Card Daemon Activation Socket.

Per i tuoi messaggi ho trovato questo bug:
$ querybts 989316



questo bug riporta questo:

$ pcsc_scan
Using reader plug'n play mechanism
Scanning present readers...
0: BIT4ID mLector AIR DI V3 [miniLector AIR DI v3 CLESS] 00 00
1: BIT4ID mLector AIR DI V3 [miniLector AIR DI v3 Contact] 01 00
2: BIT4ID mLector AIR DI V3 [miniLector AIR DI v3 SAM1] 02 00
3: BIT4ID mLector AIR DI V3 [miniLector AIR DI v3 SAM2] 03 00


ma a me pcsc-scan ha questo:

Wed Jun 23 22:00:11 2021
 Reader 0: BIT4ID miniLector AIR NFC v3 [miniLector AIR DI v3 CLESS] 00 00
  Event number: 2
  Card state: Card removed,


ovviamente senza card.

forse non capisco, devo dare altri comandi?
o è un altro dispositivo?

questa la descrizione del lettore:

Bus 001 Device 005: ID 25dd:3403 BIT4ID miniLector AIR NFC v3
Device Descriptor:
  bLength18
  bDescriptorType 1
  bcdUSB   1.10
  bDeviceClass0
  bDeviceSubClass 0
  bDeviceProtocol 0
  bMaxPacketSize032
  idVendor   0x25dd
  idProduct  0x3403
  bcdDevice3.51
  iManufacturer   1 BIT4ID
  iProduct2 miniLector AIR NFC v3
  iSerial 0
  bNumConfigurations  1




che indica che ha dei ritardi prima che possa utilizzare il lettore di 
carta bit4id... e ha 2 SAM slot che causano dei ritardi perché cerca in 
tali lettori una carta non presente.

Fornisce un workaround per evitare questo ritardo in questa casistica





Ciao
Davide


grazie delle delucidazioni
ciao
valerio

Re: Convertire pdf in bianco e nero

2021-06-23 Per discussione Piviul


Il 23/06/21 19:42, Davide Meloni ha scritto:

Il 23/06/21 08:28, Piviul ha scritto:
in che senso? Io mi trovo molto bene con ghostscript con risultati 
ottimi; ad esempio per convertirli in scala di grigi uso un comando 
tipo:


gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook 
-dNOPAUSE -dQUIET -dBATCH -dDetectDuplicateImages 
-sProcessColorModel=DeviceGray -sColorConversionStrategy=Gray 
-dOverrideICC -sOutputFile="BNFile.pdf" "colorFile.pdf"


Con questo comando sono passato da 15,4 MB a 6,8.

Con gscan2pdf suggerito da Valerio e risoluzione a 150, 8,8 MB. Se 
rimuovesse il colore forse qualcosa la si recupererebbe.


Mentre Gimp suggerito da Filippo non mi pare che operi su file di più 
pagine (ne ho 36).


Comunque io non voglio la scala di grigi, voglio il bianco e nero che 
hanno gli scanner. I font saranno anche meno definiti, comunque 
leggibili, ma il file pesa decisamente meno.

AFAIK "il bianco e nero che hanno gli scanner" è la scala di grigi

Piviul

Re: Convertire pdf in bianco e nero

2021-06-23 Per discussione Davide Prina


On 23/06/21 19:42, Davide Meloni wrote:
Mentre Gimp suggerito da Filippo non mi pare che operi su file di più 
pagine (ne ho 36).


in realtà gimp lo puoi anche eseguire a riga di comando, senza 
interfaccia utente.

In questo modo puoi fargli processare più pagine.

Lo avevo usato anni fa in questo modo per applicare determinate 
operazioni su un numero molto elevato di file immagine.


Ciao
Davide
--
Strumenti per l'ufficio: https://www.libreoffice.org
GNU/Linux User: 302090: http://counter.li.org
Non autorizzo la memorizzazione del mio indirizzo su outlook

Re: Convertire pdf in bianco e nero

2021-06-23 Per discussione Davide Prina


On 22/06/21 18:56, Davide Meloni wrote:

Ora ho ricevuto un documento di diverse pagine scansionato nella 
modalitï¿œ "colore" che vorrei ridurre: > ï¿œ possibile convertirlo nella

modalitï¿œ "bianco e nero"? Sapete come fare?


Oltre a quanto ti hanno già suggerito, se il PDF contiene molto testo e 
la scansione è buona, allora puoi provare a trasformarlo in un testo con 
un lettore di OCR, estrarre le immagini e ricrearti il file.
Però dipende molto dal layout (che perdi) e la cosa potrebbe diventare 
molto difficile da realizzare per layout complessi.


Avevo fatto delle prove tempo fa e in alcuni casi il risultato ottenuto 
era buono. Non mi ricordo quale OCR, presente in Debian, abbia usato 
all'epoca (forse tesseract-ocr?)


Poi anche con questo dovresti poter convertire un PDF da colori in 
bianco e nero:

$ apt show mupdf-tools

Qui trovi un po' di soluzioni al problema:
https://unix.stackexchange.com/questions/93959/how-to-convert-a-color-pdf-to-black-white
https://forums.linuxmint.com/viewtopic.php?t=285720
...


Ho provato soluzioni come quella qui illustrata
https://itsfoss.com/compress-pdf-linux/
che utilizza ghostscript ma senza risultati accettabili.


c'è anche la possibilità di comprimere un PDF e ne ho sperimentati vari.
Il miglior risultato l'ho ottenuto usando qpdf e i seguenti parametri:
$ qpdf --recompress-flate --compression-level=9 --optimize-images \
  $IN.pdf $OUT.pdf

però dipende dalla sorgente: se chi ha creato il PDF ha già compresso il 
contenuto, allora puoi ottenere un file più grande dell'originale, ma in 
vari casi ho ottenuto una riduzione veramente consistente.


Ciao
Davide
--
Browser: http://www.mozilla.org/products/firefox
GNU/Linux User: 302090: http://counter.li.org
Non autorizzo la memorizzazione del mio indirizzo su outlook

Re: Convertire pdf in bianco e nero

2021-06-23 Per discussione Davide Prina


On 22/06/21 19:57, Filippo Dal Bosco - wrote:


gimp ha una opzione ( mai usata) per convertire immagini a colori in
scala di grigi.

gimp gestisce anche il formato pdf


io ho usato alcune volte questa funzionalità, ad esempio per modificare 
un PDF.
Il risultato però non è eccellente poiché esportando in formato PDF 
l'immagine resta un po' sfocata e alla fine viene ad occupare più spazio 
di quello necessario.


Ciao
Davide
--
Dizionari: http://linguistico.sourceforge.net/wiki
$
Perché microsoft continua a compiere azioni illegali?:
http://linguistico.sf.net/wiki/doku.php?id=traduzioni:ms_illegal
GNU/Linux User: 302090: http://counter.li.org
Non autorizzo la memorizzazione del mio indirizzo su outlook

Re: Convertire pdf in bianco e nero

2021-06-23 Per discussione Davide Meloni


Il 23/06/21 08:28, Piviul ha scritto:
in che senso? Io mi trovo molto bene con ghostscript con risultati 
ottimi; ad esempio per convertirli in scala di grigi uso un comando tipo:


gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook 
-dNOPAUSE -dQUIET -dBATCH -dDetectDuplicateImages 
-sProcessColorModel=DeviceGray -sColorConversionStrategy=Gray 
-dOverrideICC -sOutputFile="BNFile.pdf" "colorFile.pdf"


Con questo comando sono passato da 15,4 MB a 6,8.

Con gscan2pdf suggerito da Valerio e risoluzione a 150, 8,8 MB. Se 
rimuovesse il colore forse qualcosa la si recupererebbe.


Mentre Gimp suggerito da Filippo non mi pare che operi su file di più 
pagine (ne ho 36).


Comunque io non voglio la scala di grigi, voglio il bianco e nero che 
hanno gli scanner. I font saranno anche meno definiti, comunque 
leggibili, ma il file pesa decisamente meno.


Grazie per ora,
Davide

Re: alleluia !!! Nuovo NFC reader

2021-06-23 Per discussione Davide Prina


On 20/06/21 14:43, valerio wrote:



Il 20/06/21 14:09, Davide Prina ha scritto:



$ systemctl status pcscd



● pcscd.service - PC/SC Smart Card Daemon
  Loaded: loaded (/lib/systemd/system/pcscd.service; indirect; 
vendor preset: enabled)
  Active: active (running) since Sun 2021-06-20 09:02:21 CEST; 5h 
37min ago

TriggeredBy: ● pcscd.socket


qui ti dice chi lo attiva, puoi analizzarlo nello stesso modo:
$ systemctl status pcscd.socket


    Docs: man:pcscd(8)
    Main PID: 3339 (pcscd)
   Tasks: 5 (limit: 19040)
  Memory: 3.3M
     CPU: 53ms
  CGroup: /system.slice/pcscd.service
  └─3339 /usr/sbin/pcscd --foreground --auto-exit

giu 20 09:02:21 anarres systemd[1]: Started PC/SC Smart Card Daemon.
giu 20 09:02:21 anarres pcscd[3339]:  
ccid_usb.c:1286:ControlUSB() control failed (1/5): -9 LIBUSB_ERROR_PIPE
giu 20 10:07:20 anarres pcscd[3339]:  ccid_usb.c:858:WriteUSB() 
write failed (1/5): -4 LIBUSB_ERROR_NO_DEVICE
giu 20 14:38:23 anarres pcscd[3339]:  
ccid_usb.c:1286:ControlUSB() control failed (1/6): -9 LIBUSB_ERROR_PIPE


questi sono strani, io ho (ho tolto parti non interessanti, sostituite 
con [...]):

[...] systemd[1]: Stopping PC/SC Smart Card Daemon...
[...] systemd[1]: pcscd.service: Succeeded.
[...] systemd[1]: Stopped PC/SC Smart Card Daemon.
[...] systemd[1]: Started PC/SC Smart Card Daemon

Se invece guardo chi lo attiva:
$ systemctl status pcscd.socket
● pcscd.socket - PC/SC Smart Card Daemon Activation Socket
 Loaded: loaded (/lib/systemd/system/pcscd.socket; enabled; vendor 
preset: enabled)

 Active: active (running) since [...]
   Triggers: ● pcscd.service
 Listen: /run/pcscd/pcscd.comm (Stream)
 CGroup: /system.slice/pcscd.socket

[...] systemd[1]: pcscd.socket: Succeeded.
[...] systemd[1]: Closed PC/SC Smart Card Daemon Activation Socket.
[...] systemd[1]: Stopping PC/SC Smart Card Daemon Activation Socket.
[...] systemd[1]: Listening on PC/SC Smart Card Daemon Activation Socket.

Per i tuoi messaggi ho trovato questo bug:
$ querybts 989316

che indica che ha dei ritardi prima che possa utilizzare il lettore di 
carta bit4id... e ha 2 SAM slot che causano dei ritardi perché cerca in 
tali lettori una carta non presente.

Fornisce un workaround per evitare questo ritardo in questa casistica

comunque mi sembra indipendente dalla registrazione del dispositivo su 
firefox


naturalmente questa parte è completamente indipendente da Firefox o 
altro browser. Però nella casistica sopra riportata il lettore non può 
essere usato subito (a meno di adottare il workaround) perché il driver 
cerca qualcosa che non esiste.


Ciao
Davide
--
Motivi per non comprare/usare ms-windows7:
http://windows7sins.org/
Non autorizzo la memorizzazione del mio indirizzo su outlook

Re: Convertire pdf in bianco e nero

2021-06-23 Per discussione Piviul


Il 22/06/21 18:56, Davide Meloni ha scritto:

[...]
Ho provato soluzioni come quella qui illustrata
https://itsfoss.com/compress-pdf-linux/
che utilizza ghostscript ma senza risultati accettabili.


in che senso? Io mi trovo molto bene con ghostscript con risultati 
ottimi; ad esempio per convertirli in scala di grigi uso un comando tipo:


gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook 
-dNOPAUSE -dQUIET -dBATCH -dDetectDuplicateImages 
-sProcessColorModel=DeviceGray -sColorConversionStrategy=Gray 
-dOverrideICC -sOutputFile="BNFile.pdf" "colorFile.pdf"


Piviul

Re: Convertire pdf in bianco e nero

Re: alleluia !!! Nuovo NFC reader

Re: Convertire pdf in bianco e nero

Re: Convertire pdf in bianco e nero

Re: Convertire pdf in bianco e nero

Re: Convertire pdf in bianco e nero

Re: Convertire pdf in bianco e nero

Re: alleluia !!! Nuovo NFC reader

Re: Convertire pdf in bianco e nero

9 matches

Site Navigation

Mail list logo

Footer information