Perdon si tiras algo mas de data podemos ver que onda.. 2010/11/3 Diogenes Moreira <[email protected]>
> El problema lo estas teniendo en la búsqueda en las colecciones ?? hiciste > un profiling y encontraste que ese el punto?? o el acceso a la info.. La > busqueda esta muy optimizada. Como dijo Andres reimplementando eso 2 metodos > debería andar muy rapido. > > Tengo una aplicación productiva que tiene ciento de miles de objetos en una > colección y la busqueda no llega a segundos. > > Saludos. > > 2010/11/3 Andres Valloud <[email protected]> > >> Tambien podes implementar #= y #hash de alguna manera que corresponda, >> >> y poner todo en un Set... >> >> 2010/11/3 Esteban Lorenzano <[email protected]>: >> > supongo que algún problema de indices tenés... pero esto que digo es tan >> una >> > trivialidad que seguro ya lo intentaste: armar un btree ordenado según >> el >> > índice por el cual buscas los duplicados? >> > Saludos, >> > E >> > >> > El 03/11/2010, a las 4:04p.m., Norberto Manzanos escribió: >> > >> > Muchachos ( y no tanto) de ClubSmalltalk >> > >> > Tengo un problema bastante grande y quería ver si alguien me puede dar >> un >> > consejo. >> > Tengo una colección de datos en archivos (no es exactamente una base de >> > datos, pero parecido) entre los cuales hay duplicados. Los duplicados no >> son >> > triviales, hay que hacer algunas cosas para detectarlos, pero ese no es >> el >> > punto. >> > Una vez que estos datos estén normalizados pueden persistirse de varias >> > formas, tampoco ese es el problema. >> > El cuello de botella es la búsqueda en las colecciones. Probé >> colecciones en >> > memoria, colecciones Magma, Sandstone y el problema es siempre el mismo: >> el >> > tiempo que tarda la búsqueda. Magma, que fue lo más eficiente, podría >> llegar >> > a tardar 2 o 3 días para procesar 76000 registros. Un proceso similar, >> > aunque con objetos más complicados, me tardó 2 semanas hace un tiempo. >> Los >> > de Magma siempre me dicen que algo mal debo estar haciendo, pero nunca >> > aparece que es eso que está mal. No creo estar haciendo nada que pueda >> hacer >> > que un proceso que debería tardar algunas horas tarde varios días o más. >> > Estoy a punto de intentar con una base SQL, lo cual me deprime mucho. >> > ¿Alguien conoce algo para Squeak que permita detectar elementos en >> > colecciones en forma más eficiente? ¿Algún truco al menos? >> > >> > Gracias >> > >> > -- >> > Norberto Manzanos >> > Instituto de Investigaciones en Humanidades y Ciencias Sociales (IdIHCS) >> > FaHCE/UNLP - CONICET >> > Calle 48 e/ 6 y 7 s/Nº - 8º piso - oficina 803 >> > Tel: +54-221-4230125 interno 262 >> > >> > -- >> > To post to this group, send email to [email protected] >> > To unsubscribe from this group, send email to >> > [email protected]<clubsmalltalk%[email protected]> >> > >> > http://www.clubSmalltalk.org >> > >> > -- >> > To post to this group, send email to [email protected] >> > To unsubscribe from this group, send email to >> > [email protected]<clubsmalltalk%[email protected]> >> > >> > http://www.clubSmalltalk.org >> >> -- >> To post to this group, send email to [email protected] >> To unsubscribe from this group, send email to >> [email protected]<clubsmalltalk%[email protected]> >> >> http://www.clubSmalltalk.org >> > > -- To post to this group, send email to [email protected] To unsubscribe from this group, send email to [email protected] http://www.clubSmalltalk.org
