Re: [R-es] Como reordenar datos para analisis multiples correspondencias (MCA)

2019-05-18 Por tema Juan Abasolo
Tomo nota.
Miré alguna vez lo de redes, pero creo que tengo que ir pasito a pasito.
Ahora voy con el analisis de correspondencias  despacito pero firme (creo y
espero).

Lo que comentás del ébola en África, aviones y enfermeras, me resulta
interesante. Más de una vez aprovecho los videos de reuniones (R Madrid
basntantes veces), para entretenimiento y buscar inspiración. Si vez un
video de algún buen comunicador explicando esa investigación, pasamelo.
Terminará acompañandome algun almuerzo o desayuno relajado.

Me gustó lo de los nombres. Y, ya hace añazos que me  fui del sur, me
acordé de alguna reunión en la uno  decía *guaso *(será con z?), otro, *bo*,
otro *chabón* ... cada uno marcando origen. Me hizo reír. Me acuerdo de uno
al que le dije *hermano* y me espetó *tio, no eres mi hermano*. Mirá al
sobrino como se pone, papá!



Hau idatzi du Javier Marcuzzi (javier.ruben.marcu...@gmail.com)
erabiltzaileak (2019 mai. 16, og. (14:58)):

> Comprendo. En ese caso podría ser algo de redes, ojo, no redes neuronales,
> network, donde hay relaciones como la citación a un libro, también esta la
> posibilidad de armar clusters dentro de la red, lo que no conozco muy bien
> es como utilizar la zona geográfica, pero por ejemplo, se ha utilizado para
> investigar al ébola en Africa donde uno de los parámetros eran los aviones,
> se puede calcular el efecto de la enfermera a lo largo del tiempo, la
> enfermera en su caso podría ser una novela popular. Los números internos
> son complicados, pero podría predecir el peso del vos, tu , el, el guaso,
> el negro, flaco, guirí, de acuerdo al lugar, nivel social, sexo, tiempo,
> por ejemplo, Jerazale, creo que se escribe así, en mi zona era un nombre
> totalmente desconocido, luego de la novela la mil y una noches, quedó el
> nombre grabado en la población, esto en un análisis de red tendría que
> saltar en forma ponderable.
>
> El jue., 16 may. 2019 a las 9:34, Juan Abasolo ()
> escribió:
>
>> Muchas gracias, Javier, por tu explicación.
>> Los dotos que manejo son todos datos linguisticos individualizados según
>> variables geográficas y sociologicas; o sea que no hay que preocuparse
>> demasiado por la peligrosidad de mis aseveraciones.
>> El ejemplo lo hice a lo bruto para que se entendiera cómo se estructuran
>> los datos, pensando que así no generaría distración sobre el objeto de mi
>> problema. Lo de las alergias es porque mi hijo empezó ahora con alergias a
>> esto y aquello, me pareció didáctico. Como Bart Simpson hablando de sus
>> zapatos.
>>
>> Lo que quiero hacer no me consta que se esté haciendo con datos
>> lingüísticos (geo- socio-...) entonces tengo que ver quién necesita
>> organizar categorías de estructura similar, cómo lo hace, cómo lo estudia y
>> para qué. Y después tengo que ver que sea coherente con la literatura del
>> tema, con datos históricos o distancias geográficas y por ahí. Pero nada
>> peligroso para la salud de nadie. Para la mía algún día.
>>
>> Por eso me tiene inquieto si está bien plantear un modelo en el que le da
>> X valor a la ausencia de las características, en vez de solamente ver la
>> presencia. Digamos, que en Provincia de Buenos Aires para un uso de segunda
>> persona singular cercana yo diga [+vos]. Para mí es dato suficiente, no
>> tiene mucho sentido describir Sevilla o Santiago de Cuba con una variable
>> [-vos]:
>> Buenos Aires [+vos]
>> Santiago de Cuba [+tu],
>> Sevilla  [+tu],
>> El Salvador  [+vos][+tu]
>>
>> Todo esto lo expliqué con lo de tu y vos, que en castellano es muy
>> característico y se toma por prototípico. Pero, ponele que siguiente
>> clasifico no sé qué habla de colombia, en la que se usa [+usted] para
>> esta cercanía (una mamá a un nene de cinco años digamos).
>>
>> ¿No sería infromación redundante las variables -tu - vos y -usted? ¿No
>> exageraría las diferencias?
>> Amén de que hace muy difícil de explicar las gráficas.
>>
>> El ejemplo que di es minimísimo. Hay solamente una respuesta por sitio y
>> una sola pregunta, pero yo trabajo con muchas preguntas y algunas de esas
>> tienen respuestas múltiples, como las del ejemplo original. Pero siempre
>> lingüísticas.
>>
>>
>>
>> Hau idatzi du Javier Marcuzzi (javier.ruben.marcu...@gmail.com)
>> erabiltzaileak (2019 mai. 16, og. (00:24)):
>>
>>> Estimado Juan Abasolo
>>>
>>> Habría que estudiar el caso, puede no ser tan simple, por un lado el
>>> peso que se toma en algunos modelos está disponible, pero posiblemente
>>> antes de esto el problema puede estar en otro lado, yo soy veterinario y
>>> veo muchas cosas donde desde la estadística o informática dicen sobre
>>> ciertas enfermedades, y esto no es compatible, la medicina no es tan simple
>>> para que un ingeniero la resuelva con un algoritmo, yo llevo años en eso y
>>> lo que en ciertas áreas da en otras trae errores, la presencia o ausencia
>>> desde el punto estadístico o de preparación en R puede tener importancia,
>>> pero no desde el médico, es más probable que nunca tengas n

Re: [R-es] Identificar todos los repetidos y "marcarlos".

2019-05-18 Por tema Carlos J. Gil Bellosta
Afortunadamente, en R no hay una función para cada cosa que a uno se le
ocurra hacer. El diccionario de funciones sería infinito.

Lo que quieres hacer es una línea de código:

library(plyr)
tmp <- iris

res <- ddply(tmp, .(Species), transform, reps = count(Species))

En "reps" tienes el número de veces que se repite cada "id" y puedes hacer
lo que quieras con esas filas donde reps > 1.

Salud,

Carlos J. Gil Bellosta
http://www.datanalytics.com

El sáb., 18 may. 2019 a las 19:07, Samura . ()
escribió:

> Hola,
> gracias por la respuesta.
>
> Por como funciona "duplicate" el dato original que se repite no lo marca,
> y si que necesitaba marcarlo, ya que el objetivo era obtener un data frame
> con todos dnis  repetidos y ver en que se diferencian observando el resto
> de variables.
>
> Al final lo he resuelto de una manera un poco artesanal, obteniendo los
> dnis unicos de los duplicados y filtrando
> pero pensaba que habria alguna funcion que te diera todos los repetidos de
> golpe.
>
> Un saludo.
>
> 
> De: Salvador Castillo Raya 
> Enviado: sábado, 18 de mayo de 2019 0:31
> Para: Samura .; r-help-es@r-project.org
> Asunto: RE: Identificar todos los repetidos y "marcarlos".
>
>
> Hola,
>
>
>
> Te serviría algo así:
>
>
>
> df <- data.frame(x=c(1, 1, 4, 5, 4, 6))
>
>
>
> df <- cbind(df, ind_duplicado = as.integer(duplicated(df)))
>
>
>
> df_sindup <-subset(df, ind_duplicado == 0)
>
>
>
> Saludos.
>
>
>
> 
> From: R-help-es  on behalf of Samura . <
> tontit...@hotmail.com>
> Sent: Saturday, May 18, 2019 2:10:37 AM
> To: r-help-es@r-project.org
> Subject: [R-es] Identificar todos los repetidos y "marcarlos".
>
> Hola,
> Tengo la siguiente duda:
> �existe algo parecido a identificar casos repetidos en R al estilo de como
> lo hace spss? (a�adiendo una nueva columna de datos y marcando los casos)
>
> Estoy probando con "duplicated" pero no es lo que busco.
>
>
> Gracias.
>
> [[alternative HTML version deleted]]
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Identificar todos los repetidos y "marcarlos".

2019-05-18 Por tema Carlos Ortega
Hola,

Mira esta alternativa que sí que consigue lo que buscas:

https://stackoverflow.com/questions/7854433/finding-all-duplicate-rows-including-elements-with-smaller-subscripts

Utilizando el parámetro "fromLast" de duplicated, haces dos pasada una de
principio a final del vector y luego al revés, comenzandos desde el final.

Saludos,
Carlos Ortega
www.qualityexcellence.es



El sáb., 18 may. 2019 a las 19:07, Samura . ()
escribió:

> Hola,
> gracias por la respuesta.
>
> Por como funciona "duplicate" el dato original que se repite no lo marca,
> y si que necesitaba marcarlo, ya que el objetivo era obtener un data frame
> con todos dnis  repetidos y ver en que se diferencian observando el resto
> de variables.
>
> Al final lo he resuelto de una manera un poco artesanal, obteniendo los
> dnis unicos de los duplicados y filtrando
> pero pensaba que habria alguna funcion que te diera todos los repetidos de
> golpe.
>
> Un saludo.
>
> 
> De: Salvador Castillo Raya 
> Enviado: sábado, 18 de mayo de 2019 0:31
> Para: Samura .; r-help-es@r-project.org
> Asunto: RE: Identificar todos los repetidos y "marcarlos".
>
>
> Hola,
>
>
>
> Te serviría algo así:
>
>
>
> df <- data.frame(x=c(1, 1, 4, 5, 4, 6))
>
>
>
> df <- cbind(df, ind_duplicado = as.integer(duplicated(df)))
>
>
>
> df_sindup <-subset(df, ind_duplicado == 0)
>
>
>
> Saludos.
>
>
>
> 
> From: R-help-es  on behalf of Samura . <
> tontit...@hotmail.com>
> Sent: Saturday, May 18, 2019 2:10:37 AM
> To: r-help-es@r-project.org
> Subject: [R-es] Identificar todos los repetidos y "marcarlos".
>
> Hola,
> Tengo la siguiente duda:
> �existe algo parecido a identificar casos repetidos en R al estilo de como
> lo hace spss? (a�adiendo una nueva columna de datos y marcando los casos)
>
> Estoy probando con "duplicated" pero no es lo que busco.
>
>
> Gracias.
>
> [[alternative HTML version deleted]]
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Identificar todos los repetidos y "marcarlos".

2019-05-18 Por tema Samura .
Hola,
gracias por la respuesta.

Por como funciona "duplicate" el dato original que se repite no lo marca, y si 
que necesitaba marcarlo, ya que el objetivo era obtener un data frame con todos 
dnis  repetidos y ver en que se diferencian observando el resto de variables.

Al final lo he resuelto de una manera un poco artesanal, obteniendo los dnis 
unicos de los duplicados y filtrando
pero pensaba que habria alguna funcion que te diera todos los repetidos de 
golpe.

Un saludo.


De: Salvador Castillo Raya 
Enviado: sábado, 18 de mayo de 2019 0:31
Para: Samura .; r-help-es@r-project.org
Asunto: RE: Identificar todos los repetidos y "marcarlos".


Hola,



Te serviría algo así:



df <- data.frame(x=c(1, 1, 4, 5, 4, 6))



df <- cbind(df, ind_duplicado = as.integer(duplicated(df)))



df_sindup <-subset(df, ind_duplicado == 0)



Saludos.




From: R-help-es  on behalf of Samura . 

Sent: Saturday, May 18, 2019 2:10:37 AM
To: r-help-es@r-project.org
Subject: [R-es] Identificar todos los repetidos y "marcarlos".

Hola,
Tengo la siguiente duda:
�existe algo parecido a identificar casos repetidos en R al estilo de como lo 
hace spss? (a�adiendo una nueva columna de datos y marcando los casos)

Estoy probando con "duplicated" pero no es lo que busco.


Gracias.

[[alternative HTML version deleted]]


[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es