Re: [clubSmalltalk] Buscar en colecciones

Diogenes Moreira Wed, 03 Nov 2010 12:30:01 -0700

Perdon si tiras algo mas de data podemos ver que onda..

2010/11/3 Diogenes Moreira <[email protected]>


> El problema lo estas teniendo en la búsqueda en las colecciones ?? hiciste
> un profiling y encontraste que ese el punto?? o el acceso a la info.. La
> busqueda esta muy optimizada. Como dijo Andres reimplementando eso 2 metodos
> debería andar muy rapido.
>
> Tengo una aplicación productiva que tiene ciento de miles de objetos en una
> colección y la busqueda no llega a segundos.
>
> Saludos.
>
> 2010/11/3 Andres Valloud <[email protected]>
>
>> Tambien podes implementar #= y #hash de alguna manera que corresponda,
>>
>> y poner todo en un Set...
>>
>> 2010/11/3 Esteban Lorenzano <[email protected]>:
>> > supongo que algún problema de indices tenés... pero esto que digo es tan
>> una
>> > trivialidad que seguro ya lo intentaste: armar un btree ordenado según
>> el
>> > índice por el cual buscas los duplicados?
>> > Saludos,
>> > E
>> >
>> > El 03/11/2010, a las 4:04p.m., Norberto Manzanos escribió:
>> >
>> > Muchachos ( y no tanto) de ClubSmalltalk
>> >
>> > Tengo un problema bastante grande y quería ver si alguien me puede dar
>> un
>> > consejo.
>> > Tengo una colección de datos en archivos (no es exactamente una base de
>> > datos, pero parecido) entre los cuales hay duplicados. Los duplicados no
>> son
>> > triviales, hay que hacer algunas cosas para detectarlos, pero ese no es
>> el
>> > punto.
>> > Una vez que estos datos estén normalizados pueden persistirse de varias
>> > formas, tampoco ese es el problema.
>> > El cuello de botella es la búsqueda en las colecciones. Probé
>> colecciones en
>> > memoria, colecciones Magma, Sandstone y el problema es siempre el mismo:
>> el
>> > tiempo que tarda la búsqueda. Magma, que fue lo más eficiente, podría
>> llegar
>> > a tardar 2 o 3 días para procesar 76000 registros. Un proceso similar,
>> > aunque con objetos más complicados, me tardó 2 semanas hace un tiempo.
>> Los
>> > de Magma siempre me dicen que algo mal debo estar haciendo, pero nunca
>> > aparece que es eso que está mal. No creo estar haciendo nada que pueda
>> hacer
>> > que un proceso que debería tardar algunas horas tarde varios días o más.
>> > Estoy a punto de intentar con una base SQL, lo cual me deprime mucho.
>> > ¿Alguien conoce algo para Squeak que permita detectar elementos en
>> > colecciones en forma más eficiente? ¿Algún truco al menos?
>> >
>> > Gracias
>> >
>> > --
>> > Norberto Manzanos
>> > Instituto de Investigaciones en Humanidades y Ciencias Sociales (IdIHCS)
>> > FaHCE/UNLP - CONICET
>> > Calle 48 e/ 6 y 7 s/Nº - 8º piso - oficina 803
>> > Tel: +54-221-4230125 interno 262
>> >
>> > --
>> > To post to this group, send email to [email protected]
>> > To unsubscribe from this group, send email to
>> > [email protected]<clubsmalltalk%[email protected]>
>> >
>> > http://www.clubSmalltalk.org
>> >
>> > --
>> > To post to this group, send email to [email protected]
>> > To unsubscribe from this group, send email to
>> > [email protected]<clubsmalltalk%[email protected]>
>> >
>> > http://www.clubSmalltalk.org
>>
>> --
>> To post to this group, send email to [email protected]
>> To unsubscribe from this group, send email to
>> [email protected]<clubsmalltalk%[email protected]>
>>
>> http://www.clubSmalltalk.org
>>
>
>

-- 
To post to this group, send email to [email protected]
To unsubscribe from this group, send email to 
[email protected]

http://www.clubSmalltalk.org

Re: [clubSmalltalk] Buscar en colecciones

Responder a