al On Saturday 12 December 2015, at 17:43 +0100, Daniele Forsi wrote: Ciao,
> tempo fa ho scritto un'interfaccia web per cercare del testo nelle > descrizioni dei pacchetti, ieri sera ho aggiornato i dati e spero che > possa essere utile ad altri L'ho usata e la uso. Grazie è molto utile. Non lo ricordo se l'ho inserito, ma se ti va vuoi mettere una sezione/paragrafo su di essa nella pagina del wiki, tra gli strumenti di traduzione forse e dove ti sembra ci stia. Altrimenti con il tempo... prima o poi posso farlo io, ma sarebbe bello fossi tu stesso a descriverla che sai come funziona. È un vero peccato che lo sviluppo del DDTSS sembra essersi fermato, la versione di prova per il futuro era molto promettente, e avrebbe dovuto fare qualcosa di simile a mostrare le descrizioni simili con suggerimenti di traduzione. Da qualche parte in rete penso sia ancora disponibile la versione di prova... Forse è arrivato il momento di smuovere un po' le acque. Volevo farlo in ogni caso anche per vedere di capire se è possibile accedere al database del DDTP e per vedere se si può incorporare uno script su cui ha lavorato "s3v" che è anch'esso molto utile per trovare le descrizioni che richiedono "poco" lavoro per essere complete. > l'ideale per me sarebbe ottenere dei suggerimenti di traduzione, ad > esempio individuando due frasi originali diverse solo per dei dettagli > (come Python 2 vs Python 3), qualcuno conosce un sistema già pronto > per fare cose del genere? Mi hanno parlato della cluster analysis con > R. OH! beh effettivamente... io l'ho usata (poco) e vista usare per sequenze di caratteri molto molto corte (fino ad una decina) e inoltre mi accontentavo del grafico del cluster non dovevo poi andare programmaticamente a riprendere le voci nello stesso raggruppamento. Con la distanza di Levehnstein (o come diavolo si scrive) dovrebbe proprio essere fattibile. Però non ho idea di quanto tempo richieda il calcolo per le migliaia di descrizioni dei pacchetti e soprattutto la lunghezza delle stringhe. Immagino pensi di usare l'intero paragrafo come stringa. Se fai progressi facci sapere!! e grazie mille per il lavoro, beatrice
signature.asc
Description: PGP signature