Hola.
Lo que quieres hacer es un join, te recomiendo usar el paquete data.table.
Lo que puede pasar es que esta variable "Reviewer.Usernames" no esté
homologada.
Al ser esta la "llave de cruce" debe tener el mismo formato en las dos
tablas, es decir, deben ser ambas números o ambas texto.
Si es
Hola,
Sí puedes hacer esto:
A) De lo que te propone Carlos Gil.
Hacer un muestro de tus datos, empezando con poca cantidad de datos y
generar tu NBClust.
Cómo hago un muestreo, te pongo un ejemplo con un 10% de los datos:
#--
perc_mu <- 0.1
rows_mu <- sample(1:nrow(datos_iniciales),
Hola,
Los data.frames *no* tienen porqué ser iguales en longitud, ni tan siquiera
en el número de columnas.
Para que al cruzar, te devuelva no sólo las filas comunes (una vez defines
la columna común) si no todas, tienes que indicar el parámetro "*all=TRUE*",
en el merge() como has hecho.
Las
Buenas tardes,
Estoy tratando de fusionar dos data.frames pero no obtengo lo deseado.
Un data.frame (Df1)tiene 53.657 observaciones (y 8 variables) que
pertenecen una a cada individuo de la muestra. El otro (Df2) tiene 63.987
observaciones (y 17 variables), de los 53.657 individuos previos
Busca "json" en
https://cran.r-project.org/web/packages/available_packages_by_name.html
Google suele ser más rápido que la lista para estos menesteres.
El día 16 de enero de 2017, 17:47, Horacio escribió:
> Hola, disculpen la pregunta si parece trivial, pero hay algún
Hola, disculpen la pregunta si parece trivial, pero hay algún paquete
o forma de leer archivos en formato "json"(1)?
(1) JSON, acrónimo de JavaScript Object Notation, es un formato de
texto ligero para el intercambio de datos. JSON es un subconjunto de
la notación literal de objetos de JavaScript
Hola, ¿qué tal?
Si R crea la matriz de distancias necesitarás, como poco, 29*29*8 MB
de RAM. Puede ser mucho para tu equipo. Trata de correr el código
usando subconjuntos de datos (1%, 5%, 10%, etc.) para ver desde fuera
cuánta RAM estás consumiendo.
Salud,
Carlos J. Gil Bellosta
Hola,
¿Has comprobado si antes de lanzar esta función tienes espacio en RAM
suficiente?.
Puedes poner antes de lanzarlo:
- gc() - para activar el garbage collector.
- Y podrías pre-dimensionar ("allocate") un vector de 2Gb con el mismo
nombre de la variable "nb" para que "NbClust"