Sem uma amostra dos dados ou informações mais detalhadas a estrutura do banco é difícil oferecer uma solução. Mas eu acredito que possa ser problema envolvendo os níveis dos fatores. Veja ?droplevels .
Daniel 2015-01-07 22:27 GMT-02:00 Daniel Marcelino <[email protected]>: > Sem uma amostra dos dados ou informações mais detalhadas a estrutura > do banco é difícil oferecer uma solução. Mas eu acredito que possa ser > problema envolvendo os níveis dos fatores. Veja ?droplevels . > > Daniel > > 2015-01-07 17:24 GMT-02:00 Fernando Antonio de souza <[email protected]>: >> Sua questão é interessante mas seu código não é reproduzível, o que >> difulcuta a ajuda. faça um dput() de parte de seu banco de dados copie e >> cole no e-mail para que possamos ter facil acesso e assim poder lhe ajudar. >> >> Seja mais clara sobre o seu problema para obter ajuda mais rapidamente. >> >> Em 7 de janeiro de 2015 15:13, Giselle Davi <[email protected]> >> escreveu: >>> >>> Prezados, >>> >>> Alguém poderia me ajudar a selecionar um dataframe, para este caso o nome >>> é list que corresponde à Lista de SNP's selecionados, a partir de de outro >>> dataframe, que para este caso corresponde ao gen1 ( sem precisar indicar a >>> posição das colunas )? >>> >>> Utilizei a rotina especificada abaixo, mas o comando não me disponibiliza >>> a seleção de todas as 22894 colunas, ou seja, de todos os SNP's. Existem 7 >>> deles que não conseguem ser selecionados por serem declarados como falsos. >>> Alguém poderia me ajudar ? Desde já agradeço. >>> >>> Att, >>> >>> Giselle >>> >>> >>> ROTINA: >>> #1)Lendo arquivo genotipos >>> gen=read.table("matriz_genotipos.txt",h=T)#lendo arquivo genotipos >>> dim(gen)#90 x 24165. Tem que colocar o nome dos cruzamentos na primerira >>> coluna >>> head(gen) >>> >>> #2)Gerando o arquivo com o nome dos SNP's selecionados >>> nomes<- read.table("D_F_nomes.txt",h=F, sep=",",row.names=1,quote="") >>> dim(nomes)#90 x 0 >>> >>> #3)Arquivo de genótipos com os indivíduos nas linhas e com todos SNP's nas >>> colunas >>> gen1<-cbind(nomes,gen) >>> head(gen1)#juntou ! >>> dim(gen1)#90 x 24165 >>> >>> #4)Lendo o arquivo de frequência alélica >>> freq=read.table("chr1_alefreq.txt",h=T) #lendo arquivo freq alel >>> dim(freq)#22894 x 4 >>> head(freq) >>> >>> #5) Gerando o arquivo com os SNP's selecionados pela MAF >>> lista_SNP_sel<- freq$nun_snp_freq >>> head(lista_SNP_sel)#Está como fator >>> list<-as.character(lista_SNP_sel) >>> head(list) >>> length(list) >>> dim(gen1) >>> >>> #6)Verificando se os SNP's selecionados são realmente os 22894 >>> selecionados pela MAF >>> table(list%in%colnames(gen1)) >>> >>> #SURPRESA:Existem 7 SNP's lidos como falsos e por isso não completam os >>> 22894 ! >>> logico<-colnames(gen1)%in%list >>> head(logico) >>> head(gen1) >>> head(list) >>> gen2<- gen1[,logico] >>> head(gen2) >>> dim(gen2)#90 x 22887 ( Existem 7 snps que estão sendo declarados como >>> falsos, por que ?) >>> >>> >>> _______________________________________________ >>> R-br mailing list >>> [email protected] >>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça >>> código mínimo reproduzível. >> >> >> >> _______________________________________________ >> R-br mailing list >> [email protected] >> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br >> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código >> mínimo reproduzível. _______________________________________________ R-br mailing list [email protected] https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
