mmm... es cierto que 76k de registros es muy poco... esa búsqueda debería ser 
bastante rápida aún haciendo un full scan cada vez (con los objetos en memoria, 
claro)


El 03/11/2010, a las 4:27p.m., Facundo Vozzi escribió:

> Norberto,
> para buscar en una MagmaCollection usaste where: y configuraste los indices? 
> Todavía no probé con 76000 registros, voy a probar.
> 
> Abrazo
> 
> 2010/11/3 Norberto Manzanos <[email protected]>
> No, la verdad que no lo probé. Confié demasiado en que esa tarea la haría 
> Magma. Voy a probarlo. Gracias.
> 
> 2010/11/3 Esteban Lorenzano <[email protected]>
> supongo que algún problema de indices tenés... pero esto que digo es tan una 
> trivialidad que seguro ya lo intentaste: armar un btree ordenado según el 
> índice por el cual buscas los duplicados?
> 
> Saludos,
> E
> 
> El 03/11/2010, a las 4:04p.m., Norberto Manzanos escribió:
> 
>> 
>> Muchachos ( y no tanto) de ClubSmalltalk
>> 
>> Tengo un problema bastante grande y quería ver si alguien me puede dar un 
>> consejo.
>> Tengo una colección de datos en archivos (no es exactamente una base de 
>> datos, pero parecido) entre los cuales hay duplicados. Los duplicados no son 
>> triviales, hay que hacer algunas cosas para detectarlos, pero ese no es el 
>> punto.
>> Una vez que estos datos estén normalizados pueden persistirse de varias 
>> formas, tampoco ese es el problema. 
>> El cuello de botella es la búsqueda en las colecciones. Probé colecciones en 
>> memoria, colecciones Magma, Sandstone y el problema es siempre el mismo: el 
>> tiempo que tarda la búsqueda. Magma, que fue lo más eficiente, podría llegar 
>> a tardar 2 o 3 días para procesar 76000 registros. Un proceso similar, 
>> aunque con objetos más complicados, me tardó 2 semanas hace un tiempo. Los 
>> de Magma siempre me dicen que algo mal debo estar haciendo, pero nunca 
>> aparece que es eso que está mal. No creo estar haciendo nada que pueda hacer 
>> que un proceso que debería tardar algunas horas tarde varios días o más. 
>> Estoy a punto de intentar con una base SQL, lo cual me deprime mucho.
>> ¿Alguien conoce algo para Squeak que permita detectar elementos en 
>> colecciones en forma más eficiente? ¿Algún truco al menos?
>> 
>> Gracias
>> 
>> -- 
>> Norberto Manzanos
>> Instituto de Investigaciones en Humanidades y Ciencias Sociales (IdIHCS)
>> FaHCE/UNLP - CONICET
>> Calle 48 e/ 6 y 7 s/Nº - 8º piso - oficina 803
>> Tel: +54-221-4230125 interno 262
>> 
>> -- 
>> To post to this group, send email to [email protected]
>> To unsubscribe from this group, send email to 
>> [email protected]
>>  
>> http://www.clubSmalltalk.org
> 
> 
> -- 
> To post to this group, send email to [email protected]
> To unsubscribe from this group, send email to 
> [email protected]
>  
> http://www.clubSmalltalk.org
> 
> 
> 
> -- 
> Norberto Manzanos
> Instituto de Investigaciones en Humanidades y Ciencias Sociales (IdIHCS)
> FaHCE/UNLP - CONICET
> Calle 48 e/ 6 y 7 s/Nº - 8º piso - oficina 803
> Tel: +54-221-4230125 interno 262
> 
> -- 
> To post to this group, send email to [email protected]
> To unsubscribe from this group, send email to 
> [email protected]
>  
> http://www.clubSmalltalk.org
> 
> 
> -- 
> To post to this group, send email to [email protected]
> To unsubscribe from this group, send email to 
> [email protected]
>  
> http://www.clubSmalltalk.org

-- 
To post to this group, send email to [email protected]
To unsubscribe from this group, send email to 
[email protected]

http://www.clubSmalltalk.org

Responder a