Hola, ¿qué tal? Las condiciones que definen los cuatro conjuntos de datos, ¿son mutuamente exclusivas? Yo tratarÃa de comprobar si hay lÃneas que cumplen más de una de ellas.
PodrÃas crear un vector con etiquetas al principio que definiese qué filas van a cada conjunto de datos. Eso garantizarÃa que cada fila llega a uno y solo uno de ellos. TendrÃas, además, un diseño más limpio y fácil de interpretar y mantener. Un saludo, Carlos J. Gil Bellosta http://www.datanalytics.com 2014-07-09 13:56 GMT+02:00 Marta valdes lopez <martavalde...@gmail.com>: > Hola a todos, > > Me gustaria pedir vuestra ayuda a encontrar el error que no consigo > encontrar en este archivo. He revisado todo mil veces y probado y no doy > con ello.Adjunto el archivo con Google drive porque es muy grande. > > â > monicap_50.csv > <https://docs.google.com/file/d/0B8o2KrPEgG7ATlBMc19lTVk1d3M/edit?usp=drive_web> > â > Este es el script, y lo que no entiendo que pasa es que tengo 592044 datos > despues de limpiar los NA quedan 586561 datos , y cuando utilizo el script > la suma de z2+z4+z5+z6 , que son los estados deberia de darme lo mismo que > Z1 que es el valor total de datos pero no se que error existe que me dan > mas datos que los que hay.He comparado con el archivo en excel y los datos > de na estan correctos. > > library(chron) > library(xlsx) > filename<-"monicap_50.csv" > DBxy<-read.csv(filename, sep=";",header=TRUE,dec=",") > DBx<-na.omit(DBxy) > names(DBx)<-c("Boat","DateTime","TimeDiff", "Latitude", "Longitude", > "Course", "Speed", "distNm", "calcSpeed", "calcCourse", "distHb", > "Harbour", "idTrip","vmsAngle", "calcAngle", "vmsLeg", "calcLeg", > "Trip_vmsLeg", "Trip_calcLeg", "lengthTrip", "lengthTrip_vmsLeg", > "lengthTrip_calcLeg","Time", "Date") > #Formatting date and time variables > DBx$Date<-strptime(DBx$Date, "%d-%m-%Y") > DBx$Year<-as.POSIXlt(DBx$Date)$year+1900 > if(filename!="monicap_50.csv") {DBx$Time<-paste(DBx$Time, ":00", > sep="")} #NOT necessary for Monicap and Univerest_50 > DBx$Time<-times(DBx$Time) #Works for Monicap AND UNIVEREST_50 ONLY > DBx$Boat<-gsub("^\\s+|\\s+$", "", DBx$Boat) > #Read file with boat codes and gears > codeBoats<- read.csv("CODES_2002-2010New.csv", > sep=",",header=TRUE) #Laptop > codeBoats$CODIGO<-gsub("^\\s+|\\s+$", "", codeBoats$CODIGO) > #Assigning a Fishing license based on Boat and Year > DBx$gear<-codeBoats$Lic[match(paste(DBx$Boat,DBx$Year), > paste(codeBoats$CODIGO,codeBoats$Year))] > z0<-length(DBx$gear) > z1<-length(DBx$gear) > z1 > #defining speed and distance limits > speedFishing<-2.0 > speedHarb<-1.0 > distHbRule<-3.0 > speedSteam<-2.0 > minTime<-times(c("05:59:59")) #usual beginning of fishing > operations > maxTime<- times(c("20:59:59")) #usual finishing of fishing > operations > #Selecting Harbour > DBharbour<- na.omit(DBx[DBx$distHb<=distHbRule & > DBx$calcSpeed<=speedHarb,]) > DBharbour$State<-"Harbour" #MONICAP= 10618; UNIVER1= ; UNIVER2= > ; UNIVEREST= 1028 > z2<-length(DBharbour$State) > #Selecting Steaming > DBsteaming<- na.omit(DBx[(DBx$calcSpeed>speedFishing) | > (DBx$distHb<=distHbRule & DBx$calcSpeed>speedHarb),]) > DBsteaming$State<- "Steaming" #MONICAP= 88398; UNIVER1= ; UNIVER2= > ; UNIVEREST= 53748 > DBsteaming$Harbour<-"" > z4<-length(DBsteaming$State) > #Selecting Fishing > DBfishing<- na.omit(DBx[(DBx$calcSpeed<=speedFishing & > DBx$distHb>distHbRule & DBx$Time>minTime & DBx$Time<=maxTime),]) > DBfishing$State<-"Fishing" > DBfishing$Harbour<-"" > z5<-length(DBfishing$State) > #Selecting nigth > DBnight<- na.omit(DBx[(DBx$calcSpeed<=speedFishing & > DBx$distHb>distHbRule &(DBx$Time<=minTime | DBx$Time>maxTime)),]) > DBnight$State<-"Night" #MONICAP=10434; UNIVER1= 16677; UNIVER2= > 25789 > DBnight$Harbour<-"" > z6<-length(DBnight$State) > > Si alguien ve el error y puede echarme una mano agradeceria, si no pues > seguire peleandome con el archivo! > > Muchas gracias, un saludo > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > > [[alternative HTML version deleted]]
_______________________________________________ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es