2013/4/14 Daniele Forsi <dfo...@gmail.com>

> Il 12 aprile 2013 11:31, Andrea Musuruane ha scritto:
>
> > Molto interessante. Sarebbe utile inserire qualche algoritmo di matching
> di
> > tipo fuzzy per identificare possibili piccoli errori (o orrori).
>
> c'è già fin dall'inizio in tutti e 3 gli "stradari", in ognuno un po'
> diverso perché diversi sono i formati originali: in tutti i casi ho
> ignorato le lettere accentate, poi quello di Trento ho gestito
> esplicitamente le abbreviazioni perché sono tante, questo di Venezia
> ne ha poche e quindi le ho ignorate, quello di Bari ha un ordine
> particolare delle parole quindi controllo solo che siano presenti in
> qualsiasi ordine
> c'è qualcosa che mi è sfuggito?
>

Vado a memoria su quello che avevo notato a Venezia: assenza di spazi tra
due parole (alTraghetto invece di al Traghetto), lettera mancante in una
parola (Ognisanti, ognissanti), uso di lettere romane (Pio X, Pio Decimo),
uso cifre (6 maggio, Sei maggio), uso di preposizioni differenti
(dell'Anzolo, de l'Anzolo).

Ci sono delle librerie specifiche che aiutano a rilevare queste
similitudini. In quale linguaggio hai scritto il tuo programma?

Ciao,

Andrea.
_______________________________________________
Talk-it mailing list
Talk-it@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-it

Rispondere a