nel caso volevi provarlo, gli ho dato una aggiustatina...
$ ( IFS=$'\n'; for file in `ls -1d *pdf`; do echo "$file"; pdftotext
"$file"; done; )
questa riga ti conviene cambiarla con quest'altra... che trasforma solo
la prima pagina (se hai pdf molto lunghi, aspetteresti tempo per niente)
( IFS=$'\n'; for file in `ls -1d *pdf`; do echo "$file"; pdftotext -l 1
"$file"; done; )
e anche lo script l'ho riscritto un po' piu' pulito...
----------------------------------------------
#!/bin/bash -e
mkdir newpdf 2>/dev/null || :
mkfifo elenco 2>/dev/null || :
mkfifo contenuto 2>/dev/null || :
IFS=$'\n'
ls -1d *.txt > elenco &
exec 9<&0
while read nomefiletxt
do
while true
do
clear
echo "$nomefiletxt"
echo "----------------------------"
sed 's/[^[:alnum:][:space:]]//g' "$nomefiletxt" > contenuto &
while read riga
do
test -z "$riga" && continue
echo
echo "nuovo titolo: $riga"
echo -n "[S]i [R]icomincia [A]ltro Invio=nuovo titolo ? "
read risposta 0<&9
case $risposta in
r|R)
continue 2
;;
s|S)
mv "${nomefiletxt%txt}pdf" "newpdf/${riga}.pdf"
rm "$nomefiletxt"
continue 3
;;
a|A)
continue 3
;;
esac
done < contenuto
break
done
done < elenco
exec 9<&-
----------------------------------------------
e la questione dei file corrotti e' stato un mio errore...
alcuni link di file pdf portavano in realta' ad una finestra html di
login.... (che io salvavo come file pdf...)
quindi forse alla fine la cosa potra' tornarti utile...
--
Per REVOCARE l'iscrizione alla lista, inviare un email a
[EMAIL PROTECTED] con oggetto "unsubscribe". Per
problemi inviare un email in INGLESE a [EMAIL PROTECTED]
To UNSUBSCRIBE, email to [EMAIL PROTECTED]
with a subject of "unsubscribe". Trouble? Contact [EMAIL PROTECTED]