Re: [R-es] Como reordenar datos para analisis multiples correspondencias (MCA)
Tomo nota. Miré alguna vez lo de redes, pero creo que tengo que ir pasito a pasito. Ahora voy con el analisis de correspondencias despacito pero firme (creo y espero). Lo que comentás del ébola en África, aviones y enfermeras, me resulta interesante. Más de una vez aprovecho los videos de reuniones (R Madrid basntantes veces), para entretenimiento y buscar inspiración. Si vez un video de algún buen comunicador explicando esa investigación, pasamelo. Terminará acompañandome algun almuerzo o desayuno relajado. Me gustó lo de los nombres. Y, ya hace añazos que me fui del sur, me acordé de alguna reunión en la uno decía *guaso *(será con z?), otro, *bo*, otro *chabón* ... cada uno marcando origen. Me hizo reír. Me acuerdo de uno al que le dije *hermano* y me espetó *tio, no eres mi hermano*. Mirá al sobrino como se pone, papá! Hau idatzi du Javier Marcuzzi (javier.ruben.marcu...@gmail.com) erabiltzaileak (2019 mai. 16, og. (14:58)): > Comprendo. En ese caso podría ser algo de redes, ojo, no redes neuronales, > network, donde hay relaciones como la citación a un libro, también esta la > posibilidad de armar clusters dentro de la red, lo que no conozco muy bien > es como utilizar la zona geográfica, pero por ejemplo, se ha utilizado para > investigar al ébola en Africa donde uno de los parámetros eran los aviones, > se puede calcular el efecto de la enfermera a lo largo del tiempo, la > enfermera en su caso podría ser una novela popular. Los números internos > son complicados, pero podría predecir el peso del vos, tu , el, el guaso, > el negro, flaco, guirí, de acuerdo al lugar, nivel social, sexo, tiempo, > por ejemplo, Jerazale, creo que se escribe así, en mi zona era un nombre > totalmente desconocido, luego de la novela la mil y una noches, quedó el > nombre grabado en la población, esto en un análisis de red tendría que > saltar en forma ponderable. > > El jue., 16 may. 2019 a las 9:34, Juan Abasolo () > escribió: > >> Muchas gracias, Javier, por tu explicación. >> Los dotos que manejo son todos datos linguisticos individualizados según >> variables geográficas y sociologicas; o sea que no hay que preocuparse >> demasiado por la peligrosidad de mis aseveraciones. >> El ejemplo lo hice a lo bruto para que se entendiera cómo se estructuran >> los datos, pensando que así no generaría distración sobre el objeto de mi >> problema. Lo de las alergias es porque mi hijo empezó ahora con alergias a >> esto y aquello, me pareció didáctico. Como Bart Simpson hablando de sus >> zapatos. >> >> Lo que quiero hacer no me consta que se esté haciendo con datos >> lingüísticos (geo- socio-...) entonces tengo que ver quién necesita >> organizar categorías de estructura similar, cómo lo hace, cómo lo estudia y >> para qué. Y después tengo que ver que sea coherente con la literatura del >> tema, con datos históricos o distancias geográficas y por ahí. Pero nada >> peligroso para la salud de nadie. Para la mía algún día. >> >> Por eso me tiene inquieto si está bien plantear un modelo en el que le da >> X valor a la ausencia de las características, en vez de solamente ver la >> presencia. Digamos, que en Provincia de Buenos Aires para un uso de segunda >> persona singular cercana yo diga [+vos]. Para mí es dato suficiente, no >> tiene mucho sentido describir Sevilla o Santiago de Cuba con una variable >> [-vos]: >> Buenos Aires [+vos] >> Santiago de Cuba [+tu], >> Sevilla [+tu], >> El Salvador [+vos][+tu] >> >> Todo esto lo expliqué con lo de tu y vos, que en castellano es muy >> característico y se toma por prototípico. Pero, ponele que siguiente >> clasifico no sé qué habla de colombia, en la que se usa [+usted] para >> esta cercanía (una mamá a un nene de cinco años digamos). >> >> ¿No sería infromación redundante las variables -tu - vos y -usted? ¿No >> exageraría las diferencias? >> Amén de que hace muy difícil de explicar las gráficas. >> >> El ejemplo que di es minimísimo. Hay solamente una respuesta por sitio y >> una sola pregunta, pero yo trabajo con muchas preguntas y algunas de esas >> tienen respuestas múltiples, como las del ejemplo original. Pero siempre >> lingüísticas. >> >> >> >> Hau idatzi du Javier Marcuzzi (javier.ruben.marcu...@gmail.com) >> erabiltzaileak (2019 mai. 16, og. (00:24)): >> >>> Estimado Juan Abasolo >>> >>> Habría que estudiar el caso, puede no ser tan simple, por un lado el >>> peso que se toma en algunos modelos está disponible, pero posiblemente >>> antes de esto el problema puede estar en otro lado, yo soy veterinario y >>> veo muchas cosas donde desde la estadística o informática dicen sobre >>> ciertas enfermedades, y esto no es compatible, la medicina no es tan simple >>> para que un ingeniero la resuelva con un algoritmo, yo llevo años en eso y >>> lo que en ciertas áreas da en otras trae errores, la presencia o ausencia >>> desde el punto estadístico o de preparación en R puede tener importancia, >>> pero no desde el médico, es más probable que nunca tengas n
Re: [R-es] Identificar todos los repetidos y "marcarlos".
Afortunadamente, en R no hay una función para cada cosa que a uno se le ocurra hacer. El diccionario de funciones sería infinito. Lo que quieres hacer es una línea de código: library(plyr) tmp <- iris res <- ddply(tmp, .(Species), transform, reps = count(Species)) En "reps" tienes el número de veces que se repite cada "id" y puedes hacer lo que quieras con esas filas donde reps > 1. Salud, Carlos J. Gil Bellosta http://www.datanalytics.com El sáb., 18 may. 2019 a las 19:07, Samura . () escribió: > Hola, > gracias por la respuesta. > > Por como funciona "duplicate" el dato original que se repite no lo marca, > y si que necesitaba marcarlo, ya que el objetivo era obtener un data frame > con todos dnis repetidos y ver en que se diferencian observando el resto > de variables. > > Al final lo he resuelto de una manera un poco artesanal, obteniendo los > dnis unicos de los duplicados y filtrando > pero pensaba que habria alguna funcion que te diera todos los repetidos de > golpe. > > Un saludo. > > > De: Salvador Castillo Raya > Enviado: sábado, 18 de mayo de 2019 0:31 > Para: Samura .; r-help-es@r-project.org > Asunto: RE: Identificar todos los repetidos y "marcarlos". > > > Hola, > > > > Te serviría algo así: > > > > df <- data.frame(x=c(1, 1, 4, 5, 4, 6)) > > > > df <- cbind(df, ind_duplicado = as.integer(duplicated(df))) > > > > df_sindup <-subset(df, ind_duplicado == 0) > > > > Saludos. > > > > > From: R-help-es on behalf of Samura . < > tontit...@hotmail.com> > Sent: Saturday, May 18, 2019 2:10:37 AM > To: r-help-es@r-project.org > Subject: [R-es] Identificar todos los repetidos y "marcarlos". > > Hola, > Tengo la siguiente duda: > �existe algo parecido a identificar casos repetidos en R al estilo de como > lo hace spss? (a�adiendo una nueva columna de datos y marcando los casos) > > Estoy probando con "duplicated" pero no es lo que busco. > > > Gracias. > > [[alternative HTML version deleted]] > > > [[alternative HTML version deleted]] > > ___ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Re: [R-es] Identificar todos los repetidos y "marcarlos".
Hola, Mira esta alternativa que sí que consigue lo que buscas: https://stackoverflow.com/questions/7854433/finding-all-duplicate-rows-including-elements-with-smaller-subscripts Utilizando el parámetro "fromLast" de duplicated, haces dos pasada una de principio a final del vector y luego al revés, comenzandos desde el final. Saludos, Carlos Ortega www.qualityexcellence.es El sáb., 18 may. 2019 a las 19:07, Samura . () escribió: > Hola, > gracias por la respuesta. > > Por como funciona "duplicate" el dato original que se repite no lo marca, > y si que necesitaba marcarlo, ya que el objetivo era obtener un data frame > con todos dnis repetidos y ver en que se diferencian observando el resto > de variables. > > Al final lo he resuelto de una manera un poco artesanal, obteniendo los > dnis unicos de los duplicados y filtrando > pero pensaba que habria alguna funcion que te diera todos los repetidos de > golpe. > > Un saludo. > > > De: Salvador Castillo Raya > Enviado: sábado, 18 de mayo de 2019 0:31 > Para: Samura .; r-help-es@r-project.org > Asunto: RE: Identificar todos los repetidos y "marcarlos". > > > Hola, > > > > Te serviría algo así: > > > > df <- data.frame(x=c(1, 1, 4, 5, 4, 6)) > > > > df <- cbind(df, ind_duplicado = as.integer(duplicated(df))) > > > > df_sindup <-subset(df, ind_duplicado == 0) > > > > Saludos. > > > > > From: R-help-es on behalf of Samura . < > tontit...@hotmail.com> > Sent: Saturday, May 18, 2019 2:10:37 AM > To: r-help-es@r-project.org > Subject: [R-es] Identificar todos los repetidos y "marcarlos". > > Hola, > Tengo la siguiente duda: > �existe algo parecido a identificar casos repetidos en R al estilo de como > lo hace spss? (a�adiendo una nueva columna de datos y marcando los casos) > > Estoy probando con "duplicated" pero no es lo que busco. > > > Gracias. > > [[alternative HTML version deleted]] > > > [[alternative HTML version deleted]] > > ___ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > -- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Re: [R-es] Identificar todos los repetidos y "marcarlos".
Hola, gracias por la respuesta. Por como funciona "duplicate" el dato original que se repite no lo marca, y si que necesitaba marcarlo, ya que el objetivo era obtener un data frame con todos dnis repetidos y ver en que se diferencian observando el resto de variables. Al final lo he resuelto de una manera un poco artesanal, obteniendo los dnis unicos de los duplicados y filtrando pero pensaba que habria alguna funcion que te diera todos los repetidos de golpe. Un saludo. De: Salvador Castillo Raya Enviado: sábado, 18 de mayo de 2019 0:31 Para: Samura .; r-help-es@r-project.org Asunto: RE: Identificar todos los repetidos y "marcarlos". Hola, Te serviría algo así: df <- data.frame(x=c(1, 1, 4, 5, 4, 6)) df <- cbind(df, ind_duplicado = as.integer(duplicated(df))) df_sindup <-subset(df, ind_duplicado == 0) Saludos. From: R-help-es on behalf of Samura . Sent: Saturday, May 18, 2019 2:10:37 AM To: r-help-es@r-project.org Subject: [R-es] Identificar todos los repetidos y "marcarlos". Hola, Tengo la siguiente duda: �existe algo parecido a identificar casos repetidos en R al estilo de como lo hace spss? (a�adiendo una nueva columna de datos y marcando los casos) Estoy probando con "duplicated" pero no es lo que busco. Gracias. [[alternative HTML version deleted]] [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es