Il 11/10/2017 00:05, paolo ha scritto:
Si in effetti concordo con te nel avere dei dubbi dato che non
forniscono il sorgente.
Sembra che pacchetti di questo tipo, previa valutazione, possano essere
accettati nel repo non-free.
Debian Policy Manual
2.2.3. The non-free archive area
Si in effetti concordo con te nel avere dei dubbi dato che non
forniscono il sorgente.
Sembra che pacchetti di questo tipo, previa valutazione, possano essere
accettati nel repo non-free.
Debian Policy Manual
2.2.3. The non-free archive area
Il 10/10/2017 09:31, paolo ha scritto:
E' vero purtroppo le licenze sono come quelle di tanti prodotti
commerciali.
Un programma del genere nella sua versione free potrebbe finire nel repo
non-free o e´ per policy da escludere da qualsiasi repo debian?
Paolo
Non saprei, i binari sono per
Il 10/10/2017 09:31, paolo ha scritto:
E' vero purtroppo le licenze sono come quelle di tanti prodotti
commerciali.
Un programma del genere nella sua versione free potrebbe finire nel repo
non-free o e´ per policy da escludere da qualsiasi repo debian?
Paolo
Non saprei, i binari sono
E' vero purtroppo le licenze sono come quelle di tanti prodotti
commerciali.
Un programma del genere nella sua versione free potrebbe finire nel repo
non-free o e´ per policy da escludere da qualsiasi repo debian?
Paolo
Il 09/10/17 19:15, liste DOT girarsi AT posteo DOT eu ha scritto:
Il
Il 09/10/2017 19:01, paolo ha scritto:
Ciao a tutti,
mi permetto, per trattare pdf, di segnalare "master pdf" se non lo
conoscete.
https://code-industry.net/free-pdf-editor/
Spero sia d´aiuto.
Paolo
Licenza prevede l'uso non commerciale, e altro, vi invito a vedere la
licenza,
Il 09/10/2017 19:01, paolo ha scritto:
Ciao a tutti,
mi permetto, per trattare pdf, di segnalare "master pdf" se non lo
conoscete.
https://code-industry.net/free-pdf-editor/
Spero sia d´aiuto.
Paolo
Licenza prevede l'uso non commerciale, e altro, vi invito a vedere la
licenza,
Ciao a tutti,
mi permetto, per trattare pdf, di segnalare "master pdf" se non lo
conoscete.
https://code-industry.net/free-pdf-editor/
Spero sia d´aiuto.
Paolo
Il 06/10/17 16:15, Piviul ha scritto:
Il 06/10/2017 16:06, peterpunk ha scritto:
On Fri, 6 Oct 2017 14:38:22 +0200 Piviul
Il 06/10/2017 16:06, peterpunk ha scritto:
On Fri, 6 Oct 2017 14:38:22 +0200 Piviul wrote:
[...] Sono io che sono impedito o
proprio non funziona?
ok, ho capito, non c'è bisogno di dir nulla!
Piviul
On Fri, 6 Oct 2017 14:38:22 +0200 Piviul wrote:
> Scusate ma chiedo lumi non sull'OCR in generale ma sull'utilizzo
> di gimagereader. Io non sono proprio riuscito a farlo funzionare
> nel senso che una volta aperto il pdf con gimagereader non so cosa
> fare: ho provato a selezionare, spingere
Il 06/10/2017 12:32, liste DOT girarsi AT posteo DOT net ha scritto:
[...]
Come ti è stato suggerito, per il riconoscimento, seppur parziale del
testo in un'immagine, affidati ad un OCR, il resto, a mio avviso, è aver
dimestichezza con questi strumenti.
Io lo uso poco o nulla, ma dipende
Il 06/10/2017 08:33, Piviul ha scritto:
Il 05/10/2017 17:08, peterpunk ha scritto:
On Thu, 05 Oct 2017 16:40:53 +0200 Michele wrote:
Se non è il DRM (che però dovrebbe darti il messaggio relativo)
potrebbe essere che il contenuto proviene da una scansione (ovvero
è solo grafico e non
Il 06/10/2017 08:33, Piviul ha scritto:
Il 05/10/2017 17:08, peterpunk ha scritto:
On Thu, 05 Oct 2017 16:40:53 +0200 Michele wrote:
Se non è il DRM (che però dovrebbe darti il messaggio relativo)
potrebbe essere che il contenuto proviene da una scansione (ovvero
è solo grafico e non
Il 05/10/2017 17:08, peterpunk ha scritto:
On Thu, 05 Oct 2017 16:40:53 +0200 Michele wrote:
Se non è il DRM (che però dovrebbe darti il messaggio relativo)
potrebbe essere che il contenuto proviene da una scansione (ovvero
è solo grafico e non testuale)
Verifica con pdfinfo e/o pdfimages
On Thu, 5 Oct 2017 19:04:39 +0200 Lucio wrote:
> Ciao, installa tesseract-oct-ita
^^^
Giusto, segnalo giusto un refuso, il pacchetto infatti è
tesseract-ocr-ita
Strano però che installando gimagereader - che è (solo) un frontend
grafico per tesseract-ocr - il gioco
Il giorno 5 ottobre 2017 17:46, Portobello ha
scritto:
> Quando avvio il programma, mi dà un errore, dice che non ha nessun
> linguaggio installato. Se vado nelle preferenze, c'è un elenco di molti
> linguaggi, ma se provo a selezionare inglese ed italiano mi dà
Il 05/10/2017 17:25, Portobello ha scritto:
> Il 05/10/2017 16:40, Michele Orsenigo ha scritto:
>> On gioved� 5 ottobre 2017 15:57:38 CEST Portobello wrote:
>>> Buon giorno Lista,
>>>
>>> Utilizzo debian Stretch (Con PC Amd64).
>>> L'altro giorno
Il 05/10/2017 17:08, peterpunk ha scritto:
> On Thu, 05 Oct 2017 16:40:53 +0200 Michele wrote:
>
>> Se non � il DRM (che per� dovrebbe darti il messaggio relativo)
>> potrebbe essere che il contenuto proviene da una scansione (ovvero
>> � solo grafico e non testuale)
>> Verifica con pdfinfo e/o
Il 05/10/2017 16:40, Michele Orsenigo ha scritto:
> On gioved� 5 ottobre 2017 15:57:38 CEST Portobello wrote:
>> Buon giorno Lista,
>>
>> Utilizzo debian Stretch (Con PC Amd64).
>> L'altro giorno ho scaricato dei files pdf da un sito.
>> Il problema � che da alcu
Il 05/ott/2017 17:15, "peterpunk" ha scritto:
On Thu, 05 Oct 2017 16:40:53 +0200 Michele wrote:
> Se non è il DRM (che però dovrebbe darti il messaggio relativo)
> potrebbe essere che il contenuto proviene da una scansione (ovvero
> è solo grafico e non testuale)
>
On Thu, 05 Oct 2017 16:40:53 +0200 Michele wrote:
> Se non è il DRM (che però dovrebbe darti il messaggio relativo)
> potrebbe essere che il contenuto proviene da una scansione (ovvero
> è solo grafico e non testuale)
> Verifica con pdfinfo e/o pdfimages
>
In questi casi programmi come
On giovedì 5 ottobre 2017 15:57:38 CEST Portobello wrote:
> Buon giorno Lista,
>
> Utilizzo debian Stretch (Con PC Amd64).
> L'altro giorno ho scaricato dei files pdf da un sito.
> Il problema è che da alcuni files pdf riesco a selezionare il testo, con
> il mouse, per fare co
Il 05/ott/2017 16:18, "Portobello" <c.portobe...@fastwebnet.it> ha scritto:
Buon giorno Lista,
Ciao Portobello,
in attesa di risposte più esaustive
Utilizzo debian Stretch (Con PC Amd64).
L'altro giorno ho scaricato dei files pdf da un sito.
Il problema è che da alcuni
Buon giorno Lista,
Utilizzo debian Stretch (Con PC Amd64).
L'altro giorno ho scaricato dei files pdf da un sito.
Il problema è che da alcuni files pdf riesco a selezionare il testo, con
il mouse, per fare copia ed incolla sul browser (per copiare dei link a
dei siti web). Da altri files pdf
Il 4 ottobre 2008 10.42, Antonio Macchi [EMAIL PROTECTED] ha scritto:
vabbe'... questa e' proprio la versione definitiva...
spero la cosa possa esserti stata utile
buona fortuna
ciao
sicuramente mi sarà utile, e se avete altre idee non esitate a
postarle... non voglio però farvi perdere
magari non ti servira' a niente... ma io mi son molto divertito...
cosi' gli ho fatto un'ultima miglioria...
in pratica ho inserito nello script anche la trasformazione da pdf a txt
quindi e' sufficiente che tu abbia una directory con i file pdf
ci metti dentro questo script (con chmod +x) e lo
vabbe'... questa e' proprio la versione definitiva...
--
#!/bin/bash -e
trap rm elenco; rm contenuto; 0
mkdir newpdf 2/dev/null || :
mkfifo elenco
mkfifo contenuto
IFS=$'\n'
find -maxdepth 1 -iname *pdf -type f elenco
exec 90
while read nomefilepdf
do
dunque, passando da pdf a testo con pdftotext ottengo un file di testo
decente ma non so come spiegare al computer qual'è il titolo, perché
prima ci sono scritte altre cose, per quanto riguarda gli archivi
forse faccio prima a mettere gli indirizzi perché sono un po' diversi
tra loro... gli
brunetto ha scritto:
dunque, passando da pdf a testo con pdftotext ottengo un file di testo
decente ma non so come spiegare al computer qual'è il titolo, perché
prima ci sono scritte altre cose, per quanto riguarda gli archivi
forse faccio prima a mettere gli indirizzi perché sono un po' diversi
brunetto wrote:
dunque, passando da pdf a testo con pdftotext ottengo un file di testo
decente ma non so come spiegare al computer qual'è il titolo, perché
prima ci sono scritte altre cose, per quanto riguarda gli archivi
ciao... ho fatto un po' di prove..
la strada di usare la rete non e'
nel caso volevi provarlo, gli ho dato una aggiustatina...
$ ( IFS=$'\n'; for file in `ls -1d *pdf`; do echo $file; pdftotext
$file; done; )
questa riga ti conviene cambiarla con quest'altra... che trasforma solo
la prima pagina (se hai pdf molto lunghi, aspetteresti tempo per niente)
(
occhio ai file e ai titoli con gli spazi... se ne contengono, devi virgolettare
infatti, ma cosa devo virgolettare?
e poi non e' detto che pdfinfo dia sempre un titolo... alcuni possono non
averne... nel quel caso ti ritrovi con file senza nome...
infatti... la maggior parte non hanno titolo
brunetto wrote:
infatti... la maggior parte non hanno titolo nelle info pdf o il
titolo è nuovamente unna stringa inutile...
se hai tanti file e l'esigenza di ricercarli puoi darlo in pasto
a Google se l'archivio è pubblico, se privato puoi cercare di
implementare un
sistema di ricerca in
files pdf nel pc questi hanno nomi
inutili per un essere umano, per cui cercare un articolo che mi
interessa leggere vuol dire aprirli tutti, oppure rinominarli a mano
uno ad uno..
recoll?
Description: Personal full text search package with a QT GUI
This package is a personal full text search
archivi scarico diciamo 50
articoli. una volta scaricati i files pdf nel pc questi hanno nomi
inutili per un essere umano, per cui cercare un articolo che mi
interessa leggere vuol dire aprirli tutti, oppure rinominarli a mano
uno ad uno..
Ciao Brunetto,
nel momento in cui scarichi gli articoli
scaricati sul pc...
spiego: faccio una ricerca in diversi archivi con varie parole
chiave, a seconda dei titoli (degli articoli disponibili per il
download) visualizzati nei siti dei vari archivi scarico diciamo 50
articoli. una volta scaricati i files pdf nel pc questi hanno nomi
inutili per un essere
infatti... la maggior parte non hanno titolo nelle info pdf o il
titolo è nuovamente unna stringa inutile...
una cosa (ultima speranza per le mie competenze) sarebbe questa
porta alcuni di questi file da pdf a ps, e poi dai ps2ascii .. e vedi se
ti vengono fuori nelle prime righe delle
nei siti dei vari archivi scarico diciamo 50
articoli. una volta scaricati i files pdf nel pc questi hanno nomi
inutili per un essere umano, per cui cercare un articolo che mi
interessa leggere vuol dire aprirli tutti, oppure rinominarli a mano
uno ad uno..
Ciao Brunetto,
nel momento in cui
saggissimi... vi ringrazio tutti vista anche la mia mostruosa pochezza
nell'elaborare scripts... appena ho sotto mano un computer decente
(questa sera) posto tutto!!!
grazie!!
brunetto
--
In piedi davanti al mare... meravigliato della meraviglia... io... un
universo di atomi... un atomo
Voglio dire, magari ti ritrovi con una lista di link del tipo:
a href=20081002qwerty.pdfSviluppo di sistemi open source/a
possiamo studiare un semplice script che salvi il file come
sviluppo_di_sistemi_open_source.pdf invece che come
20081002qwerty.pdf.
io avrei scritto una pipe che estrae
io avrei scritto una pipe che estrae da un file html tutti i link, e dai
grazie ancora... purtroppo non sono ancora riuscito a provare tutto...
appena riesco mi metto d'impegno!
grazie della disponibilità, veramente!!
brunetto
--
In piedi davanti al mare... meravigliato della meraviglia...
ciao a tutti!
ho una cartella con parecchi files pdf i cui nomi sono stringhe di
lettere e numeri inutili (x me), cerco un modo (molto debian, così non
vado OT, :-P) di rinominarli con il titolo presente nel documento.
Per il momento devo aprirli in evince, selezionare il titolo e
copiarlo
brunetto wrote:
ciao a tutti!
ho una cartella con parecchi files pdf i cui nomi sono stringhe di
lettere e numeri inutili (x me), cerco un modo (molto debian, così non
vado OT, :-P) di rinominarli con il titolo presente nel documento.
Per il momento devo aprirli in evince, selezionare il
for i in `ls -1 *pdf`;
do
TITLE=`pdfinfo $i | grep Title | cut -d : -f 2`
mv $i $TITLE.pdf
done
exit 0
occhio ai file e ai titoli con gli spazi... se ne contengono, devi
virgolettare
e poi non e' detto che pdfinfo dia sempre un titolo... alcuni
44 matches
Mail list logo