Re: [R-br] Regressão não linear

2021-04-15 Por tôpico Cesar Rabak por (R-br)
Entendida a questão no, assim denominado, domínio do problema.

Aí você precisa encontrar nas referências sobre esse assunto qual seria o
ciclo de vida para as publicações sobre um assunto qualquer.

Visto doutra maneira, poder-se-ia fazer a pergunta desta forma: para um
período suficientemente curto uma hipótese de número de publicações por ano
linearmente dependente do ano (calendário) faz sentido?

Como as publicações são "perenes" isto é, salvo casos excruciantes que são
retratadas, elas permanecem para consulta até perderem valor intrínseco no
assunto e passam a ter valor histórico, sua hipótese que ano após ano o
número de publicações tem uma relação linear com o tempo indicaria uma
dinâmica específica sobre esse assunto.

Uma outra hipótese, só para não ficar no abstrato, mas usando um exemplo
artificial, imagine que para cada certo número de publicações existentes se
pudesse postular que uma nova seria gerada, algo como o famoso Jogo da Vida
de Conway ou o crescimento populacional dado pela sequência de Fibonacci.
Aí a modelagem matemática levaria a outro tipo de regressão.

Espero que este texto ajude mais que aumente o grau de confusão 邏!

HTH

--
Cesar Rabak


On Thu, Apr 15, 2021 at 1:23 PM Chiara Lubich 
wrote:

> Oi, César, tudo bem?
>
> Obrigada pelo retorno.
>
> Minha pergunta é se com o passar dos anos aumentou o número de publicações
> sobre determinado assunto.
> Ao meu ver, usaria uma regressão linear simples.
> Mas a tentativa de usar o ajuste não linear, foi mais devido à leitura da
> metodologia de alguns artigos que trabalhavam com esse mesmo tipo de
> informação.
> No qual alguns utilizaram o ajuste não linear era mais adequado, no
> entanto, não entendi muito bem o porquê, já que não havia explicações sobre
> tal escolha... Acho que por isso ficou evidente minhas dúvidas.
>
> Em qua., 14 de abr. de 2021 às 13:48, Cesar Rabak 
> escreveu:
>
>> Chiara,
>>
>> Você menciona « … esse tipo de distribuição … ».
>>
>> Qual tipo você acha que é?
>>
>> Pelos nomes que deste aos eixos, parece que a variável dependente é
>> inteira¹ ("Qtde. de artigos [N]"), por outro lado, a variável independente
>> é um ano calendário, que por definição é uma variável ordinal arbitrária (a
>> faixa 1994 -- 2021 poderia ser noutros calendários diferente, por exemplo
>> no Bahá'i de 157 a 178, etc.).
>>
>> Para decidir por uma regressão (de qualquer tipo) antes de mais nada
>> deve-se refletir sobre o fenômeno e a modelagem que o *processo* que
>> gera esses  dados.
>>
>> As regressões são abordagens que nos permitem fazer ajustes dos dados
>> experimentais à essas hipóteses modeladas e enfrenta os dois problemas dos
>> dados obtidos por meio de observação: a) amostragem; b) perturbações que
>> geram erros nas observações, modeladas como "ruído" ou "erros" com
>> distribuição gaussiana de média zero e variância em função da dispersão dos
>> dados vis-à-vis à abstração matemática (equação da regressão).
>>
>> Daí a sua confusão sobre « … como são feitas as escolhas para valores de
>> a=?, b=? e c=? » ser esperada.
>>
>> A equação da regressão ("não linear") propõe uma complexa equação
>> exponencia multiplicada pela variável independente, etc.
>>
>> O quê você precisa responder é: essa curva descreve um processo que
>> explica a geração dos dados que está em análise?
>>
>> OBS.: Faz sentido incluir um ano que ainda não acabou numa regressão que
>> conta eventos por unidade de ano calendário?
>>
>> HTH
>> --
>> Cesar Rabak
>>
>> [1] Mais importante, parece ser o tipo de dados "de contagem" que tem
>> outras restrições, como não poder ser menor que zero, etc.
>>
>> On Wed, Apr 14, 2021 at 12:01 PM Chiara Lubich por (R-br) <
>> r-br@listas.c3sl.ufpr.br> wrote:
>>
>>> Bom dia,
>>> Pessoal, fiz a plotagem dos meu dados:
>>> ano n
>>> 1994 1
>>> 1996 1
>>> 2001 1
>>> 2002 1
>>> 2004 1
>>> 2005 3
>>> 2006 3
>>> 2007 2
>>> 2008 4
>>> 2009 1
>>> 2010 3
>>> 2011 2
>>> 2012 5
>>> 2013 4
>>> 2014 5
>>> 2015 3
>>> 2016 8
>>> 2017 2
>>> 2018 4
>>> 2019 3
>>> 2020 12
>>> 2021 2
>>> [image: image.png]
>>> E vi na internet alguns vídeos em que gráficos que tinham esse tipo de
>>> distribuição, era feito o uso de Regressão Não Linear, por meio da função
>>> "nls". No entanto, tentei começar a digitar os comandos, mas não entendi
>>> como são feitas as escolhas para valores de a=?, b=? e c=?.
>>> Segue o script abaixo:
>>> plot(n ~ ano, data = chiara, xlab = "Ano da publicação", ylab =
>>> "Quantidade de artigos (N)")
>>> a_maximovalor=max(n)
>>> modelo<-nls(y~x*(1-exp(-b*x))^c, data=chiara, start = list(a=
>>> a_maximovalor, b=?, c=?))
>>>
>>> Agradeço desde já pela colaboração
>>>
>>> ___
>>> R-br mailing list
>>> R-br@listas.c3sl.ufpr.br
>>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>>> código mínimo reproduzível.
>>>
>>
___
R-br mailing list

Re: [R-br] Regressão não linear

2021-04-15 Por tôpico Chiara Lubich por (R-br)
Oi, César, tudo bem?

Obrigada pelo retorno.

Minha pergunta é se com o passar dos anos aumentou o número de publicações
sobre determinado assunto.
Ao meu ver, usaria uma regressão linear simples.
Mas a tentativa de usar o ajuste não linear, foi mais devido à leitura da
metodologia de alguns artigos que trabalhavam com esse mesmo tipo de
informação.
No qual alguns utilizaram o ajuste não linear era mais adequado, no
entanto, não entendi muito bem o porquê, já que não havia explicações sobre
tal escolha... Acho que por isso ficou evidente minhas dúvidas.

Em qua., 14 de abr. de 2021 às 13:48, Cesar Rabak 
escreveu:

> Chiara,
>
> Você menciona « … esse tipo de distribuição … ».
>
> Qual tipo você acha que é?
>
> Pelos nomes que deste aos eixos, parece que a variável dependente é
> inteira¹ ("Qtde. de artigos [N]"), por outro lado, a variável independente
> é um ano calendário, que por definição é uma variável ordinal arbitrária (a
> faixa 1994 -- 2021 poderia ser noutros calendários diferente, por exemplo
> no Bahá'i de 157 a 178, etc.).
>
> Para decidir por uma regressão (de qualquer tipo) antes de mais nada
> deve-se refletir sobre o fenômeno e a modelagem que o *processo* que gera
> esses  dados.
>
> As regressões são abordagens que nos permitem fazer ajustes dos dados
> experimentais à essas hipóteses modeladas e enfrenta os dois problemas dos
> dados obtidos por meio de observação: a) amostragem; b) perturbações que
> geram erros nas observações, modeladas como "ruído" ou "erros" com
> distribuição gaussiana de média zero e variância em função da dispersão dos
> dados vis-à-vis à abstração matemática (equação da regressão).
>
> Daí a sua confusão sobre « … como são feitas as escolhas para valores de
> a=?, b=? e c=? » ser esperada.
>
> A equação da regressão ("não linear") propõe uma complexa equação
> exponencia multiplicada pela variável independente, etc.
>
> O quê você precisa responder é: essa curva descreve um processo que
> explica a geração dos dados que está em análise?
>
> OBS.: Faz sentido incluir um ano que ainda não acabou numa regressão que
> conta eventos por unidade de ano calendário?
>
> HTH
> --
> Cesar Rabak
>
> [1] Mais importante, parece ser o tipo de dados "de contagem" que tem
> outras restrições, como não poder ser menor que zero, etc.
>
> On Wed, Apr 14, 2021 at 12:01 PM Chiara Lubich por (R-br) <
> r-br@listas.c3sl.ufpr.br> wrote:
>
>> Bom dia,
>> Pessoal, fiz a plotagem dos meu dados:
>> ano n
>> 1994 1
>> 1996 1
>> 2001 1
>> 2002 1
>> 2004 1
>> 2005 3
>> 2006 3
>> 2007 2
>> 2008 4
>> 2009 1
>> 2010 3
>> 2011 2
>> 2012 5
>> 2013 4
>> 2014 5
>> 2015 3
>> 2016 8
>> 2017 2
>> 2018 4
>> 2019 3
>> 2020 12
>> 2021 2
>> [image: image.png]
>> E vi na internet alguns vídeos em que gráficos que tinham esse tipo de
>> distribuição, era feito o uso de Regressão Não Linear, por meio da função
>> "nls". No entanto, tentei começar a digitar os comandos, mas não entendi
>> como são feitas as escolhas para valores de a=?, b=? e c=?.
>> Segue o script abaixo:
>> plot(n ~ ano, data = chiara, xlab = "Ano da publicação", ylab =
>> "Quantidade de artigos (N)")
>> a_maximovalor=max(n)
>> modelo<-nls(y~x*(1-exp(-b*x))^c, data=chiara, start = list(a=
>> a_maximovalor, b=?, c=?))
>>
>> Agradeço desde já pela colaboração
>>
>> ___
>> R-br mailing list
>> R-br@listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
>
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


Re: [R-br] Regressão não linear

2021-04-14 Por tôpico Cesar Rabak por (R-br)
Chiara,

Você menciona « … esse tipo de distribuição … ».

Qual tipo você acha que é?

Pelos nomes que deste aos eixos, parece que a variável dependente é
inteira¹ ("Qtde. de artigos [N]"), por outro lado, a variável independente
é um ano calendário, que por definição é uma variável ordinal arbitrária (a
faixa 1994 -- 2021 poderia ser noutros calendários diferente, por exemplo
no Bahá'i de 157 a 178, etc.).

Para decidir por uma regressão (de qualquer tipo) antes de mais nada
deve-se refletir sobre o fenômeno e a modelagem que o *processo* que gera
esses  dados.

As regressões são abordagens que nos permitem fazer ajustes dos dados
experimentais à essas hipóteses modeladas e enfrenta os dois problemas dos
dados obtidos por meio de observação: a) amostragem; b) perturbações que
geram erros nas observações, modeladas como "ruído" ou "erros" com
distribuição gaussiana de média zero e variância em função da dispersão dos
dados vis-à-vis à abstração matemática (equação da regressão).

Daí a sua confusão sobre « … como são feitas as escolhas para valores de
a=?, b=? e c=? » ser esperada.

A equação da regressão ("não linear") propõe uma complexa equação
exponencia multiplicada pela variável independente, etc.

O quê você precisa responder é: essa curva descreve um processo que explica
a geração dos dados que está em análise?

OBS.: Faz sentido incluir um ano que ainda não acabou numa regressão que
conta eventos por unidade de ano calendário?

HTH
--
Cesar Rabak

[1] Mais importante, parece ser o tipo de dados "de contagem" que tem
outras restrições, como não poder ser menor que zero, etc.

On Wed, Apr 14, 2021 at 12:01 PM Chiara Lubich por (R-br) <
r-br@listas.c3sl.ufpr.br> wrote:

> Bom dia,
> Pessoal, fiz a plotagem dos meu dados:
> ano n
> 1994 1
> 1996 1
> 2001 1
> 2002 1
> 2004 1
> 2005 3
> 2006 3
> 2007 2
> 2008 4
> 2009 1
> 2010 3
> 2011 2
> 2012 5
> 2013 4
> 2014 5
> 2015 3
> 2016 8
> 2017 2
> 2018 4
> 2019 3
> 2020 12
> 2021 2
> [image: image.png]
> E vi na internet alguns vídeos em que gráficos que tinham esse tipo de
> distribuição, era feito o uso de Regressão Não Linear, por meio da função
> "nls". No entanto, tentei começar a digitar os comandos, mas não entendi
> como são feitas as escolhas para valores de a=?, b=? e c=?.
> Segue o script abaixo:
> plot(n ~ ano, data = chiara, xlab = "Ano da publicação", ylab =
> "Quantidade de artigos (N)")
> a_maximovalor=max(n)
> modelo<-nls(y~x*(1-exp(-b*x))^c, data=chiara, start = list(a=
> a_maximovalor, b=?, c=?))
>
> Agradeço desde já pela colaboração
>
> ___
> R-br mailing list
> R-br@listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


[R-br] Regressão não linear

2021-04-14 Por tôpico Chiara Lubich por (R-br)
Bom dia,
Pessoal, fiz a plotagem dos meu dados:
ano n
1994 1
1996 1
2001 1
2002 1
2004 1
2005 3
2006 3
2007 2
2008 4
2009 1
2010 3
2011 2
2012 5
2013 4
2014 5
2015 3
2016 8
2017 2
2018 4
2019 3
2020 12
2021 2
[image: image.png]
E vi na internet alguns vídeos em que gráficos que tinham esse tipo de
distribuição, era feito o uso de Regressão Não Linear, por meio da função
"nls". No entanto, tentei começar a digitar os comandos, mas não entendi
como são feitas as escolhas para valores de a=?, b=? e c=?.
Segue o script abaixo:
plot(n ~ ano, data = chiara, xlab = "Ano da publicação", ylab = "Quantidade
de artigos (N)")
a_maximovalor=max(n)
modelo<-nls(y~x*(1-exp(-b*x))^c, data=chiara, start = list(a=
a_maximovalor, b=?, c=?))

Agradeço desde já pela colaboração
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


Re: [R-br] Regressão Logística pode ser influenciada pelo balanceamento de resultados de variável dependente

2020-04-22 Por tôpico Leonard Assis por (R-br)
Completando o Cesar:

Será que Regressão Logística é o método correto para o que você busca?

Você responderá a esta pergunta simplesmente revisitando "o que você quer
obter como resposta"

lmassis  yahoo  com  br
assis.leonard  gmail  com


On Tue, Apr 21, 2020 at 6:42 PM Cesar Rabak por (R-br) <
r-br@listas.c3sl.ufpr.br> wrote:

> Elias,
>
> Como cada VI « apresenta uma prevalência pequena da doença », que eu
> entendo como "cada VI tem uma contingência cruzada pequena para o caso de
> doença e exposição" você realmente está com um conjunto de variáveis que
> não vão conseguir explicar a VD como os testes que foram descritos mostram
> muito bem.
>
> Ademais, se a tab de exemplo for representativa das VI que você tem, ela
> pelo menos, mostra uma margem de presença da exposição muito pequena
> também, o que coloca a análise sob dificuldade epistemológica: como uma
> exposição presente em apenas 1% dos casos poderia explicar uma prevalência
> da doença de 12% ⁉
>
> Aparentemente seus dados dizem à sua pergunta : "A resposta é nenhuma
> delas".
>
> HTH
>
> --
> Cesar Rabak
>
>
> On Tue, Apr 21, 2020 at 5:57 PM Elias Carvalho por (R-br) <
> r-br@listas.c3sl.ufpr.br> wrote:
>
>> Tenho um banco de dados com 3074 linhas sem missing.
>>
>> Uma variável dependente binária e mais 42 variáveis independentes também
>> binárias (todas como fator).
>>
>> Minha pergunta é quals VIs contribuem para a doença que está em VD.
>>
>> Meu summary da VD apresenta o seguinte resultado:
>>
>> summary(data.to.work.train$NMM)
>> Sem doença  Com doença
>>  2715   359
>>
>> removi as variáveis com alta correlação (multicolinearidade) e fiz uma RL
>> com todas as variáveis e nada deu signficativo.
>>
>> Fiz tambem com variáveis individuais e nada de significativo.
>>
>> A maioria das variáveis apresenta uma prevalência pequena da doença:
>>
>>   Não  Sim
>>   Não 2683   32
>>   Sim  353 6
>>
>> Alguém poderia opinar sobre uma possível solução? Ou outros passos a
>> seguir?
>> --
>>
>>
>> *In Jesu et Maria*
>> *Obrigado*
>> *Prof. Elias Carvalho*
>>
>> *"Felix, qui potuit rerum cognoscere causas" (Virgil 29 BC)"Blessed is he
>> who has been able to understand the cause of things"*
>> ___
>> R-br mailing list
>> R-br@listas.c3sl.ufpr.br
>> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
>> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
>> código mínimo reproduzível.
>>
> ___
> R-br mailing list
> R-br@listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


Re: [R-br] Regressão Logística pode ser influenciada pelo balanceamento de resultados de variável dependente

2020-04-21 Por tôpico Cesar Rabak por (R-br)
Elias,

Como cada VI « apresenta uma prevalência pequena da doença », que eu
entendo como "cada VI tem uma contingência cruzada pequena para o caso de
doença e exposição" você realmente está com um conjunto de variáveis que
não vão conseguir explicar a VD como os testes que foram descritos mostram
muito bem.

Ademais, se a tab de exemplo for representativa das VI que você tem, ela
pelo menos, mostra uma margem de presença da exposição muito pequena
também, o que coloca a análise sob dificuldade epistemológica: como uma
exposição presente em apenas 1% dos casos poderia explicar uma prevalência
da doença de 12% ⁉

Aparentemente seus dados dizem à sua pergunta : "A resposta é nenhuma
delas".

HTH

--
Cesar Rabak


On Tue, Apr 21, 2020 at 5:57 PM Elias Carvalho por (R-br) <
r-br@listas.c3sl.ufpr.br> wrote:

> Tenho um banco de dados com 3074 linhas sem missing.
>
> Uma variável dependente binária e mais 42 variáveis independentes também
> binárias (todas como fator).
>
> Minha pergunta é quals VIs contribuem para a doença que está em VD.
>
> Meu summary da VD apresenta o seguinte resultado:
>
> summary(data.to.work.train$NMM)
> Sem doença  Com doença
>  2715   359
>
> removi as variáveis com alta correlação (multicolinearidade) e fiz uma RL
> com todas as variáveis e nada deu signficativo.
>
> Fiz tambem com variáveis individuais e nada de significativo.
>
> A maioria das variáveis apresenta uma prevalência pequena da doença:
>
>   Não  Sim
>   Não 2683   32
>   Sim  353 6
>
> Alguém poderia opinar sobre uma possível solução? Ou outros passos a
> seguir?
> --
>
>
> *In Jesu et Maria*
> *Obrigado*
> *Prof. Elias Carvalho*
>
> *"Felix, qui potuit rerum cognoscere causas" (Virgil 29 BC)"Blessed is he
> who has been able to understand the cause of things"*
> ___
> R-br mailing list
> R-br@listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


[R-br] Regressão Logística pode ser influenciada pelo balanceamento de resultados de variável dependente

2020-04-21 Por tôpico Elias Carvalho por (R-br)
Tenho um banco de dados com 3074 linhas sem missing.

Uma variável dependente binária e mais 42 variáveis independentes também
binárias (todas como fator).

Minha pergunta é quals VIs contribuem para a doença que está em VD.

Meu summary da VD apresenta o seguinte resultado:

summary(data.to.work.train$NMM)
Sem doença  Com doença
 2715   359

removi as variáveis com alta correlação (multicolinearidade) e fiz uma RL
com todas as variáveis e nada deu signficativo.

Fiz tambem com variáveis individuais e nada de significativo.

A maioria das variáveis apresenta uma prevalência pequena da doença:

  Não  Sim
  Não 2683   32
  Sim  353 6

Alguém poderia opinar sobre uma possível solução? Ou outros passos a seguir?
-- 


*In Jesu et Maria*
*Obrigado*
*Prof. Elias Carvalho*

*"Felix, qui potuit rerum cognoscere causas" (Virgil 29 BC)"Blessed is he
who has been able to understand the cause of things"*
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


Re: [R-br] Regressão Exponencial

2017-09-18 Por tôpico Cesar Rabak via R-br
Fabiana,

Se você não se importar de fazer um passo da matemática dessa solução "na
mão", a regressão exponencial é normalmente feita sem se necessitar de
pacotes mais sofisticados (nada contra o uso deles) empregando a
transformação da variável pra tornar regressão num caso de regressão linear:

> regr <- lm(log(x) ~ tempo)
> summary(regr)
> summary(lm(log(x) ~ tempo))

Call:
lm(formula = log(x) ~ tempo)

Residuals:
 Min   1Q   Median   3Q  Max
-1.18204 -0.17017 -0.08422  0.30765  0.77378

Coefficients:
  Estimate Std. Error t value Pr(>|t|)
(Intercept) -502.05994   59.90223  -8.381 2.33e-06 ***
tempo  0.250740.02981   8.410 2.24e-06 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.4974 on 12 degrees of freedom
Multiple R-squared:  0.855. Adjusted R-squared:  0.8429
F-statistic: 70.73 on 1 and 12 DF.  p-value: 2.245e-06

HTH
--
Cesar Rabak


2017-09-17 13:53 GMT-03:00 Fabiana Goncalves Barbosa via R-br <
r-br@listas.c3sl.ufpr.br>:

> Boa Tarde!
>
> Tenho os seguintes dados:
>
> x = c(1,1,2,2,1,3,10,15,9,17,13,18,21,27)
> tempo=c(2001,2003,2004,2006,2007,2008,2009,2010,2011,2012,
> 2013,2014,2015,2016)
>
> Ao plotar (x,y), verifico um crescimento exponencial do x ao longo do
> tempo.
>
> Alguém teria o script de regressão exponencial para me ajudar?
>
> Grata
> Fabiana
>
>
>
> ___
> R-br mailing list
> R-br@listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

Re: [R-br] Regressão Exponencial

2017-09-18 Por tôpico Delcio Rudinei Bortolanza via R-br
Olá!

O ajuste fica bom, mas o parâmetro "a" tem problemas (alguém da lista mais 
especializado poderia falar algo sobre).
Att.

y = c(1,1,2,2,1,3,10,15,9,17,13,18,21,27)
tempo=c(2001,2003,2004,2006,2007,2008,2009,2010,2011,2012,2013,2014,2015,2016)


library(minpack.lm)

exp<-nlsLM(y~a*exp(b*tempo),start = c(a=0,b=0.25),control=list(maxiter=500))
summary(exp)

a<-coef(exp)[1]
b<-coef(exp)[2]

par(mar=c(4,4,1,1))
plot(tempo,y,las=1)
curve(a*exp(b*tempo),xname="tempo",add = T)




De: R-br <r-br-boun...@listas.c3sl.ufpr.br> em nome de Fabiana Goncalves 
Barbosa via R-br <r-br@listas.c3sl.ufpr.br>
Enviado: domingo, 17 de setembro de 2017 13:53
Para: r-br@listas.c3sl.ufpr.br
Assunto: [R-br] Regressão Exponencial

Boa Tarde!

Tenho os seguintes dados:

x = c(1,1,2,2,1,3,10,15,9,17,13,18,21,27)
tempo=c(2001,2003,2004,2006,2007,2008,2009,2010,2011,2012,2013,2014,2015,2016)

Ao plotar (x,y), verifico um crescimento exponencial do x ao longo do tempo.

Alguém teria o script de regressão exponencial para me ajudar?

Grata
Fabiana


___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

[R-br] Regressão Exponencial

2017-09-17 Por tôpico Fabiana Goncalves Barbosa via R-br
Boa Tarde!

Tenho os seguintes dados:

x = c(1,1,2,2,1,3,10,15,9,17,13,18,21,27)
tempo=c(2001,2003,2004,2006,2007,2008,2009,2010,2011,2012,2013,2014,2015,2016)

Ao plotar (x,y), verifico um crescimento exponencial do x ao longo do tempo.

Alguém teria o script de regressão exponencial para me ajudar?

Grata
Fabiana
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

Re: [R-br] Regressão por polinômios ortogonais

2017-06-28 Por tôpico Fernando Antonio de souza via R-br
Forneça o código utilizado e os dados (total ou em parte) para que possamos compreender melhor a sua dúvida. faça um dput(dados) copie e cole no email juntamente com os comandos utilizados.Acredito que o experimento seja  fatorial 3x3  e os fatores são qualitativos e não quantitativos. Você está realizando uma análise de variância. Você deve ter utilizado um modelo do tipo  resposta ~ A+B+ (A*B) ou em linguagem r y~A*B. Se A e B são variáveis quantitativas então você está fazendo uma análise de regressão para avaliar a mundança na resposta(y) em função de mundança nos valores das variávies A e B. Ambos A e B são variáveis numérias e o modelo é y~A+BO teste F a que você se refere é o teste F global ele avalia se entre os níveis do fator A há no mínimo uma diferença significativa, o mesmo para os níveis do fator B e no caso da interação ele avalia se há no mínimo 1 combinação entre os fatores Ae B que seja significativa. Caso haja o valor Fcalc será maior que o valor Ftabelado e eassim háverá um efeito significativo.Se seu teste F deu não significativo, significa que para esse experimento não houve indícios suficientes que sustentem a hipótese alternativa (H1: Há um efeito significativo) e assim a hipotese nula (ausencia de efeito) é aceita.Se o teste F global não é significativo, não vejo porque proceder a análise. Outra coisa, procendo -se a analise de regressão apresento apenas o modelo em que a regressão foi significativa, mesmo o R^2 sendo elevado?Não entendi? R² elevado é algo ruim? Att=Fernando SouzaCelular: (31)99796-8781 (Vivo)E-mail:nandodeso...@gmail.com==
  

On Jun 28 2017, at 3:41 pm, Ana Beatriz Souza Souza via R-br  wrote:


  













Boa tarde!





Estou reproduzindo um exercício do Livro de Banzatto e Kronka no qual temos um experimento fatorial 3x3 com fatores quantitativos. O teste F para o fator A (quantitativo) não foi significativo e mesmo assim procedeu-se  o estudo de regressão. Pergunto: A
 regressão independe da significância do teste F? Outra coisa, procendo -se a analise de regressão apresento apenas o modelo em que a regressão foi significativa, mesmo o R^2 sendo elevado?


Se eu fizer essa análise no R usando o pacote ExpDes, a análise apresentada leva em conta o F?


Desde já agradeço


Att.,


Ana Beatriz






___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.

  
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

[R-br] Regressão por polinômios ortogonais

2017-06-28 Por tôpico Ana Beatriz Souza Souza via R-br




Boa tarde!


Estou reproduzindo um exercício do Livro de Banzatto e Kronka no qual temos um 
experimento fatorial 3x3 com fatores quantitativos. O teste F para o fator A 
(quantitativo) não foi significativo e mesmo assim procedeu-se  o estudo de 
regressão. Pergunto: A regressão independe da significância do teste F? Outra 
coisa, procendo -se a analise de regressão apresento apenas o modelo em que a 
regressão foi significativa, mesmo o R^2 sendo elevado?


Se eu fizer essa análise no R usando o pacote ExpDes, a análise apresentada 
leva em conta o F?


Desde já agradeço


Att.,


Ana Beatriz
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

Re: [R-br] Regressão linear - Excluindo outliers

2016-11-07 Por tôpico Fernando Antonio de souza via R-br
O arquivo água foi o meu banco de dados, vc pode rodar colocando seu
próprio dataframe contendo seus dados e fazer as modificações necessárias.
Att

Em 07/11/2016 21:42,  escreveu:

> Eu tentei rodar, e diz que não existe o arquivo água!
>
> Eu trabalho assim
> #-Analise de Cook's distance
> ---
> install.packages(sfsmisc); library(sfsmisc)
> analise<-lm(CONSUMO~factor(GEST)*factor(MANEJO),data=agua)
> n<-length(agua$CONSUMO)  # número de observações
> n.plot(cooks.distance(analise),seq(1:n),cex=.5,nam=agua$ANIMAL)
> criterio<-4/analise$df.residual
> abline(v=criterio)
> #Eliminacao de
> outiliers--
> ifelse(cooks.distance(analise)>criterio,1,0)->agua$cook
> analisecook<-lm(CONSUMO~factor(MANEJO)*factor(GEST),data=agua,subset=(cook==0
> & GEST!=0 )) #eliminando outliers.
> ==
> Fernando Souza
> Zootecnista, DSc. Produção e Alimentação Animal
> celular: (31)99796-8781 (Vivo) / (31)97358-4685 (Tim)
> e-mail:nandodeso...@gmail.com
> Lattes: http://lattes.cnpq.br/6519538815038307
> blog: https://producaoanimalcomr.wordpress.com/
> =
>
>
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

Re: [R-br] Regressão linear - Excluindo outliers

2016-11-07 Por tôpico Mauro Sznelwar via R-br
Eu tentei rodar, e diz que não existe o arquivo água!
 
Eu trabalho assim
#-Analise de Cook's distance ---
install.packages(sfsmisc); library(sfsmisc)
analise<-lm(CONSUMO~factor(GEST)*factor(MANEJO),data="" />
n<-length(agua$CONSUMO)  # número de observações
n.plot(cooks.distance(analise),seq(1:n),cex=.5,nam=agua$ANIMAL)
criterio<-4/analise$df.residual
abline(v=criterio)
#Eliminacao de outiliers--
ifelse(cooks.distance(analise)>criterio,1,0)->agua$cook
analisecook<-lm(CONSUMO~factor(MANEJO)*factor(GEST),data="" & GEST!=0 )) #eliminando outliers.==Fernando SouzaZootecnista, DSc. Produção e Alimentação Animalcelular: (31)99796-8781 (Vivo) / (31)97358-4685 (Tim)e-mail:nandodeso...@gmail.comLattes: http://lattes.cnpq.br/6519538815038307blog: https://producaoanimalcomr.wordpress.com/= 

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

Re: [R-br] Regressão linear - Excluindo outliers

2016-10-14 Por tôpico Mac David S. Pinto via R-br
oi Pessoa, boa noite
Vou tentar filtrar nos outliers pelos técnicas propostos por vocês.
Amanha posto aqui os resultados
Obrigado pela Ajuda
David 

Em Sexta-feira, 14 de Outubro de 2016 20:29, Cesar Rabak via R-br 
 escreveu:
 

 FCosta,
Você viu o posto do Valmes sobre o influence.measures()?

2016-10-14 17:45 GMT-03:00 Felinto COSTA via R-br :

  Antes do estabelecimento de critérios empíricos de corte para os valores da 
distância de Cook,
 há esse trabalho sobre sua distribuição exata:
 
https://www.researchgate.net/ publication/274062960_Exact_ 
distribution_of_Cook%27s_ distance_and_identification_ 
of_influential_observations
 
  FCosta
 
 
  Em 14/10/2016 17:03, Fernando Souza via R-br escreveu:
  
 Eu trabalho assim #-Analise de Cook's distance 
-- - install.packages(sfsmisc); 
library(sfsmisc)
 analise<-lm(CONSUMO~factor( GEST)*factor(MANEJO),data= agua)
 n<-length(agua$CONSUMO)  # número de observações 
n.plot(cooks.distance(analise) ,seq(1:n),cex=.5,nam=agua$ ANIMAL) 
criterio<-4/analise$df. residual abline(v=criterio) 
#- ---Eliminacao de outiliers- 
- ifelse(cooks.distance(analise) >criterio,1,0)->agua$cook 
analisecook<-lm(CONSUMO~ factor(MANEJO)*factor(GEST), data=agua,subset=(cook==0 
& GEST!=0 )) #eliminando outliers.
 == 
 Fernando Souza
 Zootecnista, DSc. Produção e  Alimentação Animal
 celular: (31)99796-8781 (Vivo)  / (31)97358-4685 (Tim)
 e-mail:nandodeso...@gmail.com
 Lattes: http://lattes.cnpq.br/ 6519538815038307
 blog: https:// producaoanimalcomr.wordpress. com/
 == === 
 
 Em Sex, Out 14, 2016 em 3:52 , Walmes Zeviani via R-br 
 escreveu:
 
  Além da distância de Cook, você tem mais opções de medidas de influência com 
a inflence.measures(). Dê uma olhada aqui para ver  exemplos 
http://leg.ufpr.br/~walmes/ cursoR/mgest/1medidas-influen. html. Eu gosto de 
usar o DFits como medida.
 
  À disposição.
  Walmes.
  ​ 

  
 __ _
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/ cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br- guia) e forne�a c�digo 
m�nimo reproduz�vel. 
 
 
__ _
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/ cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br- guia) e forneça código 
mínimo reproduzível.



___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne� c�igo m�imo 
reproduz�el.

   ___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

Re: [R-br] Regressão linear - Excluindo outliers

2016-10-14 Por tôpico Felinto COSTA via R-br
Antes do estabelecimento de critérios empíricos de corte para os valores 
da distância de Cook,

há esse trabalho sobre sua distribuição exata:

https://www.researchgate.net/publication/274062960_Exact_distribution_of_Cook%27s_distance_and_identification_of_influential_observations

FCosta


Em 14/10/2016 17:03, Fernando Souza via R-br escreveu:

Eu trabalho assim
#-Analise de Cook's distance 
---

install.packages(sfsmisc); library(sfsmisc)
analise<-lm(CONSUMO~factor(GEST)*factor(MANEJO),data=agua)
n<-length(agua$CONSUMO)  # número de observações
n.plot(cooks.distance(analise),seq(1:n),cex=.5,nam=agua$ANIMAL)
criterio<-4/analise$df.residual
abline(v=criterio)
#Eliminacao de 
outiliers--

ifelse(cooks.distance(analise)>criterio,1,0)->agua$cook
analisecook<-lm(CONSUMO~factor(MANEJO)*factor(GEST),data=agua,subset=(cook==0 
& GEST!=0 )) #eliminando outliers.

==
Fernando Souza
Zootecnista, DSc. Produção e Alimentação Animal
celular: (31)99796-8781 (Vivo) / (31)97358-4685 (Tim)
e-mail:nandodeso...@gmail.com
Lattes: http://lattes.cnpq.br/6519538815038307
blog: https://producaoanimalcomr.wordpress.com/
=

Em Sex, Out 14, 2016 em 3:52 , Walmes Zeviani via R-br 
 escreveu:
Além da distância de Cook, você tem mais opções de medidas de 
influência com a inflence.measures(). Dê uma olhada aqui para ver 
exemplos 
http://leg.ufpr.br/~walmes/cursoR/mgest/1medidas-influen.html 
. Eu 
gosto de usar o DFits como medida.


À disposição.
Walmes.
​



___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.


___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

Re: [R-br] Regressão linear - Excluindo outliers

2016-10-14 Por tôpico Fernando Souza via R-br

Eu trabalho assim
#-Analise de Cook's distance 
---

install.packages(sfsmisc); library(sfsmisc)
analise<-lm(CONSUMO~factor(GEST)*factor(MANEJO),data=agua)
n<-length(agua$CONSUMO)  # número de observações
n.plot(cooks.distance(analise),seq(1:n),cex=.5,nam=agua$ANIMAL)
criterio<-4/analise$df.residual
abline(v=criterio)
#Eliminacao de 
outiliers--

ifelse(cooks.distance(analise)>criterio,1,0)->agua$cook
analisecook<-lm(CONSUMO~factor(MANEJO)*factor(GEST),data=agua,subset=(cook==0 
& GEST!=0 )) #eliminando outliers.

==
Fernando Souza
Zootecnista, DSc. Produção e Alimentação Animal
celular: (31)99796-8781 (Vivo) / (31)97358-4685 (Tim)
e-mail:nandodeso...@gmail.com
Lattes: http://lattes.cnpq.br/6519538815038307
blog: https://producaoanimalcomr.wordpress.com/
=

Em Sex, Out 14, 2016 em 3:52 , Walmes Zeviani via R-br 
 escreveu:
Além da distância de Cook, você tem mais opções de medidas de 
influência com a inflence.measures(). Dê uma olhada aqui para ver 
exemplos 
http://leg.ufpr.br/~walmes/cursoR/mgest/1medidas-influen.html. Eu 
gosto de usar o DFits como medida.


À disposição.
Walmes.
​
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

Re: [R-br] Regressão linear - Excluindo outliers

2016-10-14 Por tôpico Walmes Zeviani via R-br
Além da distância de Cook, você tem mais opções de medidas de influência
com a inflence.measures(). Dê uma olhada aqui para ver exemplos
http://leg.ufpr.br/~walmes/cursoR/mgest/1medidas-influen.html. Eu gosto de
usar o DFits como medida.

À disposição.
Walmes.
​
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

Re: [R-br] Regressão linear - Excluindo outliers

2016-10-14 Por tôpico Paulo Dick via R-br
David,

Depende de como você identifica os outliers. Coloquei um exemplo usando a
distancia de Cook, mas da para generalizar com outros critérios

# gera dados e forca outlier
x <- 1:20
y <- 2*x + 5 + rnorm(20)
dados <- data.frame(x,y)
dados$y[c(7,11)] <- dados$y[c(7,11)] + 15

# modelo inicial e sem outliers
mod <- lm(y~x, dados)
outliers <- (cooks.distance(mod) > 0.2)
mod2 <- lm(y~x, subset(dados, !outliers))



*Paulo Dick*
Estatístico / Epidemiologia em Saúde Pública
Tel.: (55 21) 99591-2716

Em 14 de outubro de 2016 11:26, Mac David S. Pinto via R-br <
r-br@listas.c3sl.ufpr.br> escreveu:

> Pessoal, bom dia
>
> Estou fazendo algumas regressões lineares entre Comprimento x Peso de
> peixes com um conjunto de dados bastante extenso (+- 1000 linhas).
>
> Acontece que alguns destes valores são outliers (+- 50) e na analise, eles
> não são importantes.
>
> Tem alguma função no R que eu consiga "selecionar" os outliers e pedir que
> não seja considerado na analise? Sem precisa mudar minha planilha original
> (já que vou utilizar para outras coisas futuramente)
>
> Tem alguns valores que estão no meio dos planilhas de dados.
>
> Eu consegui resolver os extremos selecionado um conjunto de linhas
>
> Exemplo:
>
> Local.F.1<-lm(pt[4:970,7]~ls[4:970,6])
>
> ## Com este comando eu retire os outliers dos extremos (linhas 1 a 3 e
> linhas 971 a 1000), mais ainda tem alguns valores no meio do analise (+-
> entre as linhas  251 a 260)
>
> De já, eu agradeço a ajuda
>
> David
>
> ___
> R-br mailing list
> R-br@listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

[R-br] Regressão linear - Excluindo outliers

2016-10-14 Por tôpico Mac David S. Pinto via R-br
Pessoal, bom dia
Estou fazendo algumas regressões lineares entre Comprimento x Peso de peixes 
com um conjunto de dados bastante extenso (+- 1000 linhas).
Acontece que alguns destes valores são outliers (+- 50) e na analise, eles não 
são importantes.
Tem alguma função no R que eu consiga "selecionar" os outliers e pedir que não 
seja considerado na analise? Sem precisa mudar minha planilha original (já que 
vou utilizar para outras coisas futuramente)
Tem alguns valores que estão no meio dos planilhas de dados. 
Eu consegui resolver os extremos selecionado um conjunto de linhas
Exemplo:
Local.F.1<-lm(pt[4:970,7]~ls[4:970,6])
## Com este comando eu retire os outliers dos extremos (linhas 1 a 3 e linhas 
971 a 1000), mais ainda tem alguns valores no meio do analise (+- entre as 
linhas  251 a 260)
De já, eu agradeço a ajuda
David___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

Re: [R-br] regressão polinomial: gráfico e valor máximo (resolvido)

2016-06-21 Por tôpico Maurício Lordêlo via R-br
Muito obrigado a todos.
Tudo esclarecido.
Maurício

Em 21 de junho de 2016 13:42, Éder Comunello 
escreveu:

> Maurício e colegas, boa tarde!
>
> Mais uma opção de código para o problema.
> [image: Imagem inline 1]
>
> # 
> # DIC 4 rep x 7 doses de gesso (trat): 0, 50, 100, 150, 200, 250, 300
> kg/ha
> # Peso de 1.000 sementes (peso, gramas)
> peso  <- c(134.8, 139.7, 147.6, 132.3, 161.7, 157.7, 150.3, 144.7,
>160.7, 172.7, 163.4, 161.3, 169.8, 168.2, 160.7, 161.0,
>165.7, 160.0, 158.2, 151.0, 171.8, 157.3, 150.4, 160.4,
>154.5, 160.4, 148.8, 154.0)
> trat  <- rep(seq(0,300,50), each=4)
> dados <-  data.frame(peso, trat=as.factor(trat))
>
> # Método dos Polinômios Ortogonais - Banzato & Kronka, p. 204
> contrasts(dados$trat) = contr.poly(levels(dados$trat));
> contrasts(dados$trat)
>
> fit1 = aov(peso ~ trat, dados)
> summary(fit1) # anova(fit1)
> summary(fit1, split = list(trat = list(LIN = 1, QUA = 2, CUB=3,
> DESVIOS=4:6)))
> # Df Sum Sq Mean Sq F value   Pr(>F)
> # trat 6 1941.8   323.6   7.668 0.000188 ***
> #   trat: LIN  1  423.2   423.2  10.026 0.004653 **
> #   trat: QUA  1 1285.8  1285.8  30.465 1.78e-05 ***
> #   trat: CUB  1  155.0   155.0   3.673 0.068997 .
> #   trat: DESVIOS  3   77.825.9   0.614 0.613269
> # Residuals   21  886.342.2
>
> model.tables(fit1, "means")
> trat.m <- tapply(peso, trat, mean); trat.m
>
> # Uso do ajuste quadrático
> fit2 <- lm(peso ~ I(trat)+I(trat^2))
> summary(fit2)
> coef(fit2)
> eq  <- paste0("Y = ", round(coef(fit2)[1], 4), " + ",
>   round(coef(fit2)[2], 4), "X - ", abs(round(coef(fit2)[3],
> 6)), "X²"); eq
>
> # Coeficiente de determinação
> summary(fit2)$r.sq
> cor(fitted(fit2), peso)**2
> sumsq <- summary(fit1, split = list(trat = list(LIN = 1, QUA = 2, CUB=3,
> RES=4:6)))[[1]][2]
> rsq   <- sum(sumsq[2:3,])/sumsq[1,]; rsq # Banzato & Kronka, p. 209
> eq.r <- paste0("R² = ", round(rsq, 4)); eq.r
>
> # Predições
> pred<- data.frame(trat = seq(0,300,1))
> pred$val <- predict(fit2, pred); head(pred)
>
> # Gráfico
> par(xpd=T)
> plot(c(0,300), c(135,170), type="n", xlab="Doses de gesso (kg/ha)",
> ylab="Peso de 1.000 sementes (g)", bty="n", xaxs="i", yaxs="i", las=1)
> points(as.numeric(names(trat.m)), trat.m, pch=18, cex=1)
> lines(pred$trat, pred$val, lwd=2, lty=1, col=1)
> text(300, 129, "X")
> text(-27, 170, "Y")
> text(150, 153, eq,  adj=c(0.5,0.5))
> text(150, 151, eq.r, adj=c(0.5,0.5))
>
> # Max - Método 1
> ymax <- max(pred$val); ymax # 164.7042 gramas
> xmax <- pred[which.max(pred$val), "trat"]; xmax # com 175 Kg/ha de gesso
> segments(xmax, 135, xmax, ymax, lty=3, col=2)
> segments(0, ymax, xmax, ymax, lty=3, col=2)
> points(xmax, ymax, pch=20, col=2)
>
> # Max - Método 2
> # ax^2 + bx + c
> coefs <- data.frame(t(coef(fit2))); names(coefs) <- letters[3:1]; coefs
> with(coefs, -b/(2*a))  # 174.8403
> with(coefs, -(b^2 - 4*a*c)/(4*a))  # 164.7043
>
> # Max - Método 3
> fun <- function(x) 140.7839 + 0.2736*x - 0.000782*x**2
> fun(175)
> # optimize(fun, interval=c(0, 300), maximum=F)
> optimize(fun, interval=c(0, 300), maximum=T)
> # $maximum
> # [1] 174.9361
> #
> # $objective
> # [1] 164.7152
>
> # Max - Derivadas
>
> D1 <- D(expression(140.7839 + 0.2736*x - 0.000782*x**2), "x"); D1
> # 0.2736 - 0.000782 * (2 * x)
> # 0.2736 - 0.001564x
>
> D2 <- D(D1, "x"); D2
> # -(0.000782 * 2)
> # -0.001564
>
> # 0.2736 - 0.001564x = 0
> solve(0.001564, 0.2736) # Máximo
> # [1] 174.9361
> fun(174.9361) # 164.7152
>
> deriva <- deriv(~140.7839 + 0.2736*x - 0.000782*x**2,"x"); deriva
> x <- 175;  eval(deriva)
> x <- 174.8403; eval(deriva)
> x <- 174.9361; eval(deriva)
> # 
>
>
> 
> Éder Comunello
> Researcher at Brazilian Agricultural Research Corporation (Embrapa)
> DSc in Agricultural Systems Engineering (USP/Esalq)
> MSc in Environ. Sciences (UEM), Agronomist (UEM)
> ---
> Embrapa Agropecuária Oeste, Dourados, MS, Brazil ||
> 
> GEO, -22.2752, -54.8182, 408m
> UTC-04:00 / DST: UTC-03:00
>
>
>
>
> Em 20 de junho de 2016 19:34, Maurício Lordêlo 
> escreveu:
>
>> Saudações a todos desta lista,
>> Estou tentando reproduzir um exemplo de regressão polinomial do livro do
>> Banzatto e Kronka.
>> Minhas dúvidas são:
>> 1. Como reproduzir exatamente o gráfico ilustrado no exemplo? O gráfico
>> que consegui fazer está parecido porém não está igual.
>> O gráfico apresentado no livro encontra-se neste link:
>> https://www.dropbox.com/s/qyv7ofwryegcu7m/figura.jpg?dl=0
>> 2. Como encontrar o valor de X que anula a derivada primeira? E depois
>> como encontrar o máximo da função?
>> Grato,
>> Maurício
>>
>> Segue o CMR:
>>
>> 
>> #Experimento inteiramente casualizado com 4 repetições para estudar os
>> efeitos de
>> #7 doses de gesso (tratamentos):
>> 

Re: [R-br] regressão polinomial: gráfico e valor máximo

2016-06-21 Por tôpico Éder Comunello via R-br
Maurício e colegas, boa tarde!

Mais uma opção de código para o problema.
[image: Imagem inline 1]

# 
# DIC 4 rep x 7 doses de gesso (trat): 0, 50, 100, 150, 200, 250, 300 kg/ha
# Peso de 1.000 sementes (peso, gramas)
peso  <- c(134.8, 139.7, 147.6, 132.3, 161.7, 157.7, 150.3, 144.7,
   160.7, 172.7, 163.4, 161.3, 169.8, 168.2, 160.7, 161.0,
   165.7, 160.0, 158.2, 151.0, 171.8, 157.3, 150.4, 160.4,
   154.5, 160.4, 148.8, 154.0)
trat  <- rep(seq(0,300,50), each=4)
dados <-  data.frame(peso, trat=as.factor(trat))

# Método dos Polinômios Ortogonais - Banzato & Kronka, p. 204
contrasts(dados$trat) = contr.poly(levels(dados$trat));
contrasts(dados$trat)

fit1 = aov(peso ~ trat, dados)
summary(fit1) # anova(fit1)
summary(fit1, split = list(trat = list(LIN = 1, QUA = 2, CUB=3,
DESVIOS=4:6)))
# Df Sum Sq Mean Sq F value   Pr(>F)
# trat 6 1941.8   323.6   7.668 0.000188 ***
#   trat: LIN  1  423.2   423.2  10.026 0.004653 **
#   trat: QUA  1 1285.8  1285.8  30.465 1.78e-05 ***
#   trat: CUB  1  155.0   155.0   3.673 0.068997 .
#   trat: DESVIOS  3   77.825.9   0.614 0.613269
# Residuals   21  886.342.2

model.tables(fit1, "means")
trat.m <- tapply(peso, trat, mean); trat.m

# Uso do ajuste quadrático
fit2 <- lm(peso ~ I(trat)+I(trat^2))
summary(fit2)
coef(fit2)
eq  <- paste0("Y = ", round(coef(fit2)[1], 4), " + ",
  round(coef(fit2)[2], 4), "X - ", abs(round(coef(fit2)[3],
6)), "X²"); eq

# Coeficiente de determinação
summary(fit2)$r.sq
cor(fitted(fit2), peso)**2
sumsq <- summary(fit1, split = list(trat = list(LIN = 1, QUA = 2, CUB=3,
RES=4:6)))[[1]][2]
rsq   <- sum(sumsq[2:3,])/sumsq[1,]; rsq # Banzato & Kronka, p. 209
eq.r <- paste0("R² = ", round(rsq, 4)); eq.r

# Predições
pred<- data.frame(trat = seq(0,300,1))
pred$val <- predict(fit2, pred); head(pred)

# Gráfico
par(xpd=T)
plot(c(0,300), c(135,170), type="n", xlab="Doses de gesso (kg/ha)",
ylab="Peso de 1.000 sementes (g)", bty="n", xaxs="i", yaxs="i", las=1)
points(as.numeric(names(trat.m)), trat.m, pch=18, cex=1)
lines(pred$trat, pred$val, lwd=2, lty=1, col=1)
text(300, 129, "X")
text(-27, 170, "Y")
text(150, 153, eq,  adj=c(0.5,0.5))
text(150, 151, eq.r, adj=c(0.5,0.5))

# Max - Método 1
ymax <- max(pred$val); ymax # 164.7042 gramas
xmax <- pred[which.max(pred$val), "trat"]; xmax # com 175 Kg/ha de gesso
segments(xmax, 135, xmax, ymax, lty=3, col=2)
segments(0, ymax, xmax, ymax, lty=3, col=2)
points(xmax, ymax, pch=20, col=2)

# Max - Método 2
# ax^2 + bx + c
coefs <- data.frame(t(coef(fit2))); names(coefs) <- letters[3:1]; coefs
with(coefs, -b/(2*a))  # 174.8403
with(coefs, -(b^2 - 4*a*c)/(4*a))  # 164.7043

# Max - Método 3
fun <- function(x) 140.7839 + 0.2736*x - 0.000782*x**2
fun(175)
# optimize(fun, interval=c(0, 300), maximum=F)
optimize(fun, interval=c(0, 300), maximum=T)
# $maximum
# [1] 174.9361
#
# $objective
# [1] 164.7152

# Max - Derivadas

D1 <- D(expression(140.7839 + 0.2736*x - 0.000782*x**2), "x"); D1
# 0.2736 - 0.000782 * (2 * x)
# 0.2736 - 0.001564x

D2 <- D(D1, "x"); D2
# -(0.000782 * 2)
# -0.001564

# 0.2736 - 0.001564x = 0
solve(0.001564, 0.2736) # Máximo
# [1] 174.9361
fun(174.9361) # 164.7152

deriva <- deriv(~140.7839 + 0.2736*x - 0.000782*x**2,"x"); deriva
x <- 175;  eval(deriva)
x <- 174.8403; eval(deriva)
x <- 174.9361; eval(deriva)
# 



Éder Comunello
Researcher at Brazilian Agricultural Research Corporation (Embrapa)
DSc in Agricultural Systems Engineering (USP/Esalq)
MSc in Environ. Sciences (UEM), Agronomist (UEM)
---
Embrapa Agropecuária Oeste, Dourados, MS, Brazil ||

GEO, -22.2752, -54.8182, 408m
UTC-04:00 / DST: UTC-03:00




Em 20 de junho de 2016 19:34, Maurício Lordêlo 
escreveu:

> Saudações a todos desta lista,
> Estou tentando reproduzir um exemplo de regressão polinomial do livro do
> Banzatto e Kronka.
> Minhas dúvidas são:
> 1. Como reproduzir exatamente o gráfico ilustrado no exemplo? O gráfico
> que consegui fazer está parecido porém não está igual.
> O gráfico apresentado no livro encontra-se neste link:
> https://www.dropbox.com/s/qyv7ofwryegcu7m/figura.jpg?dl=0
> 2. Como encontrar o valor de X que anula a derivada primeira? E depois
> como encontrar o máximo da função?
> Grato,
> Maurício
>
> Segue o CMR:
>
> 
> #Experimento inteiramente casualizado com 4 repetições para estudar os
> efeitos de
> #7 doses de gesso (tratamentos):
> #0, 50, 100, 150, 200, 250 e 300 kg/ha sobre diversas características do
> feijoeiro
> #Para a característica "peso de 1000 sementes", tem-se os resultados
> obtidos em gramas
> peso = c(134.8, 139.7, 147.6, 132.3,
>  161.7, 157.7, 150.3, 144.7,
>  160.7, 172.7, 163.4, 161.3,
>  169.8, 168.2, 160.7, 161.0,
>  165.7, 160.0, 158.2, 151.0,
>  171.8, 

Re: [R-br] regressão polinomial: gráfico e valor máximo

2016-06-21 Por tôpico Walmes Zeviani via R-br
O ponto de máximo você aplica o cálculo. A expressão é simples.

Este conjunto de dados além de outros do Banzatto e Kronka e outras obras
(Pimental, Sonia Vieira, Zimmermann, mais de 15 obras e 350 datasets) então
sendo documentadas no pacote desenvolvimento pelo PET Estatística UFPR
(alerta de propaganda), o labestData (*lab*oratório de *est*atística):
https://github.com/pet-estatistica/labestData. Este dataset é chamado de
BanzattoQd7.2.1 no pacote (
https://github.com/pet-estatistica/labestData/blob/88f404857f39a1b047231d8a1aab8000fcb305b1/data-raw/BanzattoQd7.2.1.txt).
O meu CMR faz a leitura a partir do fonte dos dados no repositório. Se
instalar o pacote, terá à disposição datasets das obras nacionais de
estatística para usar em sala de aula e tutoriais.

rm(list = ls())

url <- paste0("https://raw.githubusercontent.com/pet-estatistica/;,
  "labestData/88f404857f39a1b047231d8a1aab8000fcb305b1/",
  "data-raw/BanzattoQd7.2.1.txt")
BanzattoQd7.2.1 <- read.table(url, header = TRUE, sep = "\t")
str(BanzattoQd7.2.1)

# Polinômio ortogonal.
m0 <- lm(peso ~ poly(gesso, degree = 2), data = BanzattoQd7.2.1)

# Polinômio.
m0 <- lm(peso ~ poly(gesso, degree = 2, raw = TRUE), data = BanzattoQd7.2.1)
m0 <- lm(peso ~ gesso + I(gesso^2), data = BanzattoQd7.2.1)

coef(m0)

pred <- data.frame(gesso = seq(min(BanzattoQd7.2.1$gesso),
   max(BanzattoQd7.2.1$gesso),
   length.out = 30))
ci <- predict(m0, newdata = pred, interval = "confidence")
pred <- cbind(pred, ci)

ylim <- extendrange(c(BanzattoQd7.2.1$peso, ci))
# Do cálculo: f(x) = a * x^2 + b * x +c,
# então f'(x) = 0 é max/min = -b/(2 * a).
xmax <- -coef(m0)["gesso"]/(2 * coef(m0)["I(gesso^2)"])

plot(peso ~ gesso, data = BanzattoQd7.2.1)
with(pred, matlines(x = gesso, y = cbind(fit, lwr, upr),
col = c(1, 2, 2), lty = c(1, 2, 2)))
abline(v = xmax,
   h = predict(m0, newdata = list(gesso = xmax)),
   lty = 2, col = 3)


​À
​ disposição.
Walmes.​
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

[R-br] regressão qauntilica

2015-09-25 Por tôpico geovane barbosa
 Olá pessoal tudo bem.
Estou trabalhando com a regressão quantilica. Abaixo segue um exemplo. Porém 
gostaria que a aproximação fosse por splines. Como posso fazer isso?



set.seed(1)
n <- 500x <- floor(runif(n, 18, 80))y <- 5*x - 0.05*x^2  + rnorm(n, mean=0, 
sd=10*sqrt(x))plot(x, y)taus <- 1:9/10
library(quantreg)modelo <- rq(y ~ x , tau=taus)
valoresPreditos <- predict(modelo)
dadosGraficos <- data.frame(valoresPre = as.numeric(valoresPreditos),           
                  tau = as.factor(rep(taus, each=n)),                           
 x = rep(x, times=length(taus)))
library(ggplot2)g <- ggplot(unique(dadosGraficos), aes(x=x, y=valoresPre, 
group=tau)) + theme_bw()g + geom_line(aes(linetype=tau))


Abaixo em anexo segue uma imagem do que realmente gostaria de visualizar. Como 
poderia fazer isso no R?
Obrigado 
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

[R-br] Regressão espacial com variavel transformada log normal

2015-06-10 Por tôpico Samuel luna de almeida
Bom dia pessoal,

Trabalhando com uma variável de taxas que que apresenta muitos valores
baixos, fui aconselhado a transforma-la com aplicação de log normal antes
de buscar correlações...
A variável foi transformada e inserida no dataframe  passando a apresentar
comportamento normal, no entanto apresenta alguns valores -inf como pode
ser visto no summary copiado abaixo:

TX_J04_10 LOGNTX_J04
Min.   :   0.0   Min.   :-Inf
1st Qu.:   0.0 1st Qu.:-Inf
Median : 138.4Median :  -4
Mean   : 240.7Mean   :-Inf
3rd Qu.: 295.23rd Qu.:  -4
Max.   :9626.1Max.   :   0

Acredito que seja por isso que não estou conseguindo gerar lm para rodar
regressão espacial, veja o erro que aparece:

 baseGN04_lm - lm(LOGNTX_J04 ~ DV_TOTAL + idhm_N_gri, data=baseG04)
Error in lm.fit(x, y, offset = offset, singular.ok = singular.ok, ...) :
  NA/NaN/Inf in 'y'

Será que é por isso mesmo, alguém poderia me indicar uma resolução?
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão espacial com variavel transformada log normal

2015-06-10 Por tôpico Luis Iván Ortiz Valencia
Log so para número maior que zero
 Em 10/06/2015 10:00, Samuel luna de almeida samuelgru...@gmail.com
escreveu:

 Bom dia pessoal,

 Trabalhando com uma variável de taxas que que apresenta muitos valores
 baixos, fui aconselhado a transforma-la com aplicação de log normal antes
 de buscar correlações...
 A variável foi transformada e inserida no dataframe  passando a apresentar
 comportamento normal, no entanto apresenta alguns valores -inf como pode
 ser visto no summary copiado abaixo:

 TX_J04_10 LOGNTX_J04
 Min.   :   0.0   Min.   :-Inf
 1st Qu.:   0.0 1st Qu.:-Inf
 Median : 138.4Median :  -4
 Mean   : 240.7Mean   :-Inf
 3rd Qu.: 295.23rd Qu.:  -4
 Max.   :9626.1Max.   :   0

 Acredito que seja por isso que não estou conseguindo gerar lm para rodar
 regressão espacial, veja o erro que aparece:

  baseGN04_lm - lm(LOGNTX_J04 ~ DV_TOTAL + idhm_N_gri, data=baseG04)
 Error in lm.fit(x, y, offset = offset, singular.ok = singular.ok, ...) :
   NA/NaN/Inf in 'y'

 Será que é por isso mesmo, alguém poderia me indicar uma resolução?

 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão espacial com variavel transformada log normal

2015-06-10 Por tôpico Paulo Justiniano


log(0) = -Inf

Veja que voce tem muitos zeros, mais que 25% dos teus dados, 
visto que o 1o quartil ainda é zero


Não tenhosugestão específica mas acredito que voce poderia:
- ver se seus zeros são zeros mesmo ou valores censurados abaixo de um 
cento limite de detecção


- sendo zeros mesmo eu procurar por algum modelo/distribuição que 
permitisse modelar esta proporção bem razoável de zeros que voce tem nos 
teus dados





On Wed, 10 Jun 2015, Samuel luna de almeida wrote:


Bom dia pessoal,

Trabalhando com uma variável de taxas que que apresenta muitos valores baixos, 
fui aconselhado a transforma-la com aplicação de log normal antes de buscar
correlações...
A variável foi transformada e inserida no dataframe  passando a apresentar comportamento 
normal, no entanto apresenta alguns valores -inf como pode ser visto no
summary copiado abaixo:

TX_J04_10     LOGNTX_J04 
Min.   :   0.0   Min.   :-Inf 
1st Qu.:   0.0 1st Qu.:-Inf 
Median : 138.4    Median :  -4 
Mean   : 240.7    Mean   :-Inf 
3rd Qu.: 295.2    3rd Qu.:  -4 
Max.   :9626.1    Max.   :   0

Acredito que seja por isso que não estou conseguindo gerar lm para rodar 
regressão espacial, veja o erro que aparece:

 baseGN04_lm - lm(LOGNTX_J04 ~ DV_TOTAL + idhm_N_gri, data=baseG04)
Error in lm.fit(x, y, offset = offset, singular.ok = singular.ok, ...) :
  NA/NaN/Inf in 'y'

Será que é por isso mesmo, alguém poderia me indicar uma resolução?

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão espacial com variavel transformada log normal

2015-06-10 Por tôpico Samuel luna de almeida
Muito obrigado Luis, Paulo e Luis!

São zero mesmo (locais onde não há casos para resultarem em taxas)...

Consegui gerar lm para a regressão espacial com os dados originais, com
muitos zeros, porém com a variável normalizada acho q o -inf impede...

Será q eu consigo considerar os -inf como zero de algum modo? Ou `e o
caso de encontrar um modelo/distribuição mais adequado mesmo?

Agradecido,
Samuel

Em 10 de junho de 2015 10:07, Paulo Justiniano paulo...@leg.ufpr.br
escreveu:


 log(0) = -Inf

 Veja que voce tem muitos zeros, mais que 25% dos teus dados, visto que o
 1o quartil ainda é zero

 Não tenhosugestão específica mas acredito que voce poderia:
 - ver se seus zeros são zeros mesmo ou valores censurados abaixo de um
 cento limite de detecção

 - sendo zeros mesmo eu procurar por algum modelo/distribuição que
 permitisse modelar esta proporção bem razoável de zeros que voce tem nos
 teus dados





 On Wed, 10 Jun 2015, Samuel luna de almeida wrote:

  Bom dia pessoal,

 Trabalhando com uma variável de taxas que que apresenta muitos valores
 baixos, fui aconselhado a transforma-la com aplicação de log normal antes
 de buscar
 correlações...
 A variável foi transformada e inserida no dataframe  passando a
 apresentar comportamento normal, no entanto apresenta alguns valores -inf
 como pode ser visto no
 summary copiado abaixo:

 TX_J04_10 LOGNTX_J04
 Min.   :   0.0   Min.   :-Inf
 1st Qu.:   0.0 1st Qu.:-Inf
 Median : 138.4Median :  -4
 Mean   : 240.7Mean   :-Inf
 3rd Qu.: 295.23rd Qu.:  -4
 Max.   :9626.1Max.   :   0

 Acredito que seja por isso que não estou conseguindo gerar lm para rodar
 regressão espacial, veja o erro que aparece:

  baseGN04_lm - lm(LOGNTX_J04 ~ DV_TOTAL + idhm_N_gri, data=baseG04)
 Error in lm.fit(x, y, offset = offset, singular.ok = singular.ok, ...) :
   NA/NaN/Inf in 'y'

 Será que é por isso mesmo, alguém poderia me indicar uma resolução?


 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão espacial com variavel transformada log normal

2015-06-10 Por tôpico Leonardo Ferreira Fontenelle
Não seria possível utilizar uma regressão Poisson, quasi-Poisson,
binomial negativa etc. nos dados originais? Você poderia indicar o
numerador da taxa como variável de resposta (inclusive zero, sem
resposta), e o denominador (pessoas-tempo em risco, ao algo assim) como
offset. No caso da quasi-Poisson, nem seria necessário separar
numerador e denominador; você poderia passar diretamente a taxa.

Leonardo Ferreira Fontenelle[1]


Em Qua 10 jun. 2015, às 10:34, Samuel luna de almeida escreveu:
 Muito obrigado Luis, Paulo e Luis!

 São zero mesmo (locais onde não há casos para resultarem em taxas)...

 Consegui gerar lm para a regressão espacial com os dados originais,
 com muitos zeros, porém com a variável normalizada acho q o -inf
 impede...

 Será q eu consigo considerar os -inf como zero de algum modo? Ou `e
 o caso de encontrar um modelo/distribuição mais adequado mesmo?

 Agradecido, Samuel

 Em 10 de junho de 2015 10:07, Paulo Justiniano paulo...@leg.ufpr.br
 escreveu:


log(0) = -Inf


Veja que voce tem muitos zeros, mais que 25% dos teus dados, visto que o
1o quartil ainda é zero


Não tenhosugestão específica mas acredito que voce poderia:

- ver se seus zeros são zeros mesmo ou valores censurados abaixo de um
  cento limite de detecção


- sendo zeros mesmo eu procurar por algum modelo/distribuição que
  permitisse modelar esta proporção bem razoável de zeros que voce tem
  nos teus dados






On Wed, 10 Jun 2015, Samuel luna de almeida wrote:

 Bom dia pessoal,


Trabalhando com uma variável de taxas que que apresenta muitos valores
baixos, fui aconselhado a transforma-la com aplicação de log normal
antes de buscar

correlações...

A variável foi transformada e inserida no dataframe  passando a
apresentar comportamento normal, no entanto apresenta alguns valores -
inf como pode ser visto no

summary copiado abaixo:


TX_J04_10     LOGNTX_J04

Min.   :   0.0   Min.   :-Inf

1st Qu.:   0.0 1st Qu.:-Inf

Median : 138.4    Median :  -4

Mean   : 240.7    Mean   :-Inf

3rd Qu.: 295.2    3rd Qu.:  -4

Max.   :9626.1    Max.   :   0


Acredito que seja por isso que não estou conseguindo gerar lm para rodar
regressão espacial, veja o erro que aparece:


 baseGN04_lm - lm(LOGNTX_J04 ~ DV_TOTAL + idhm_N_gri, data=baseG04)

Error in lm.fit(x, y, offset = offset, singular.ok = singular.ok, ...) :

NA/NaN/Inf in 'y'


Será que é por isso mesmo, alguém poderia me indicar uma resolução?

 ___

R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br

Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
código mínimo reproduzível.

 _
 R-br mailing list R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia
 de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo
 reproduzível.



Links:

  1. http://lattes.cnpq.br/9234772336296638
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão espacial com variavel transformada log normal

2015-06-10 Por tôpico Luis Paulo Braga
Se for o caso de dados censurados, há um pacote chamado NADA(NonDetects and
Data Analysis) no R, de autoria de Dennis R. Helsel, que apresenta bons
resultados.

Em 10 de junho de 2015 10:07, Paulo Justiniano paulo...@leg.ufpr.br
escreveu:


 log(0) = -Inf

 Veja que voce tem muitos zeros, mais que 25% dos teus dados, visto que o
 1o quartil ainda é zero

 Não tenhosugestão específica mas acredito que voce poderia:
 - ver se seus zeros são zeros mesmo ou valores censurados abaixo de um
 cento limite de detecção

 - sendo zeros mesmo eu procurar por algum modelo/distribuição que
 permitisse modelar esta proporção bem razoável de zeros que voce tem nos
 teus dados





 On Wed, 10 Jun 2015, Samuel luna de almeida wrote:

  Bom dia pessoal,

 Trabalhando com uma variável de taxas que que apresenta muitos valores
 baixos, fui aconselhado a transforma-la com aplicação de log normal antes
 de buscar
 correlações...
 A variável foi transformada e inserida no dataframe  passando a
 apresentar comportamento normal, no entanto apresenta alguns valores -inf
 como pode ser visto no
 summary copiado abaixo:

 TX_J04_10 LOGNTX_J04
 Min.   :   0.0   Min.   :-Inf
 1st Qu.:   0.0 1st Qu.:-Inf
 Median : 138.4Median :  -4
 Mean   : 240.7Mean   :-Inf
 3rd Qu.: 295.23rd Qu.:  -4
 Max.   :9626.1Max.   :   0

 Acredito que seja por isso que não estou conseguindo gerar lm para rodar
 regressão espacial, veja o erro que aparece:

  baseGN04_lm - lm(LOGNTX_J04 ~ DV_TOTAL + idhm_N_gri, data=baseG04)
 Error in lm.fit(x, y, offset = offset, singular.ok = singular.ok, ...) :
   NA/NaN/Inf in 'y'

 Será que é por isso mesmo, alguém poderia me indicar uma resolução?


 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão espacial com variavel transformada log normal

2015-06-10 Por tôpico Paulo Justiniano
Mas se são casos, voce poderia ao inves de modelar as taxas com uma 
distribuição para variáveis contínuas
usar as contagens mesmo com modelos binomiais ou Poisson (com offset de 
população) ou binomial negativo.


Isto é geral é equivalente mas melhor que modelar as taxas


On Wed, 10 Jun 2015, Samuel luna de almeida wrote:


Muito obrigado Luis, Paulo e Luis!

São zero mesmo (locais onde não há casos para resultarem em taxas)...

Consegui gerar lm para a regressão espacial com os dados originais, com muitos zeros, 
porém com a variável normalizada acho q o -inf impede...

Será q eu consigo considerar os -inf como zero de algum modo? Ou `e o caso de 
encontrar um modelo/distribuição mais adequado mesmo?

Agradecido,
Samuel

Em 10 de junho de 2015 10:07, Paulo Justiniano paulo...@leg.ufpr.br escreveu:

  log(0) = -Inf

  Veja que voce tem muitos zeros, mais que 25% dos teus dados, visto que o 
1o quartil ainda é zero

  Não tenhosugestão específica mas acredito que voce poderia:
  - ver se seus zeros são zeros mesmo ou valores censurados abaixo de um cento 
limite de detecção

  - sendo zeros mesmo eu procurar por algum modelo/distribuição que 
permitisse modelar esta proporção bem razoável de zeros que voce tem nos teus 
dados




  On Wed, 10 Jun 2015, Samuel luna de almeida wrote:

Bom dia pessoal,

Trabalhando com uma variável de taxas que que apresenta muitos 
valores baixos, fui aconselhado a transforma-la com aplicação de log normal
antes de buscar
correlações...
A variável foi transformada e inserida no dataframe  passando a 
apresentar comportamento normal, no entanto apresenta alguns valores
-inf como pode ser visto no
summary copiado abaixo:

TX_J04_10     LOGNTX_J04 
Min.   :   0.0   Min.   :-Inf 
1st Qu.:   0.0 1st Qu.:-Inf 
Median : 138.4    Median :  -4 
Mean   : 240.7    Mean   :-Inf 
3rd Qu.: 295.2    3rd Qu.:  -4 
Max.   :9626.1    Max.   :   0

Acredito que seja por isso que não estou conseguindo gerar lm para 
rodar regressão espacial, veja o erro que aparece:

 baseGN04_lm - lm(LOGNTX_J04 ~ DV_TOTAL + idhm_N_gri, 
data=baseG04)
Error in lm.fit(x, y, offset = offset, singular.ok = singular.ok, 
...) :
  NA/NaN/Inf in 'y'

Será que é por isso mesmo, alguém poderia me indicar uma resolução?


___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.



___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão espacial com variavel transformada log normal

2015-06-10 Por tôpico Samuel luna de almeida
Obrigado pelas considerações mais uma vez.



Em 10 de junho de 2015 10:58, Paulo Justiniano paulo...@leg.ufpr.br
escreveu:

 Mas se são casos, voce poderia ao inves de modelar as taxas com uma
 distribuição para variáveis contínuas
 usar as contagens mesmo com modelos binomiais ou Poisson (com offset de
 população) ou binomial negativo.

 Isto é geral é equivalente mas melhor que modelar as taxas



 On Wed, 10 Jun 2015, Samuel luna de almeida wrote:

  Muito obrigado Luis, Paulo e Luis!

 São zero mesmo (locais onde não há casos para resultarem em taxas)...

 Consegui gerar lm para a regressão espacial com os dados originais, com
 muitos zeros, porém com a variável normalizada acho q o -inf impede...

 Será q eu consigo considerar os -inf como zero de algum modo? Ou `e o
 caso de encontrar um modelo/distribuição mais adequado mesmo?

 Agradecido,
 Samuel

 Em 10 de junho de 2015 10:07, Paulo Justiniano paulo...@leg.ufpr.br
 escreveu:

   log(0) = -Inf

   Veja que voce tem muitos zeros, mais que 25% dos teus dados, visto
 que o 1o quartil ainda é zero

   Não tenhosugestão específica mas acredito que voce poderia:
   - ver se seus zeros são zeros mesmo ou valores censurados abaixo
 de um cento limite de detecção

   - sendo zeros mesmo eu procurar por algum modelo/distribuição que
 permitisse modelar esta proporção bem razoável de zeros que voce tem nos
 teus dados




   On Wed, 10 Jun 2015, Samuel luna de almeida wrote:

 Bom dia pessoal,

 Trabalhando com uma variável de taxas que que apresenta
 muitos valores baixos, fui aconselhado a transforma-la com aplicação de log
 normal
 antes de buscar
 correlações...
 A variável foi transformada e inserida no dataframe  passando
 a apresentar comportamento normal, no entanto apresenta alguns valores
 -inf como pode ser visto no
 summary copiado abaixo:

 TX_J04_10 LOGNTX_J04
 Min.   :   0.0   Min.   :-Inf
 1st Qu.:   0.0 1st Qu.:-Inf
 Median : 138.4Median :  -4
 Mean   : 240.7Mean   :-Inf
 3rd Qu.: 295.23rd Qu.:  -4
 Max.   :9626.1Max.   :   0

 Acredito que seja por isso que não estou conseguindo gerar lm
 para rodar regressão espacial, veja o erro que aparece:

  baseGN04_lm - lm(LOGNTX_J04 ~ DV_TOTAL + idhm_N_gri,
 data=baseG04)
 Error in lm.fit(x, y, offset = offset, singular.ok =
 singular.ok, ...) :
   NA/NaN/Inf in 'y'

 Será que é por isso mesmo, alguém poderia me indicar uma
 resolução?


 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.




 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão espacial com variavel transformada log normal

2015-06-10 Por tôpico Elias T. Krainski


Como os dados são contínuos seria necessário considerar uma distribuição 
contínua com mistura Bernoulli, veja uma proposta aqui:

http://jupiter.est.ufmg.br/~posgrad/mestrado/dissertacao_mestrado_zaida%20_quiroz.pdf
e um exemplo no script abaixo:

## hurdle model for zero-gamma (zero inflation and continuous outcome)
require(INLA)

### rainfall data from Parana' state in Brazil
data(PRprec)

### analize data from one location
PRprec[301,1:3]
y - as.matrix(PRprec[,-(1:3)])[301,]

summary(y)

plot.ts(y)
if (TRUE)
dev.off()

### organize the dataset to build a model for
### smoothing the rainfall amount over the year
### accounting for a smoothed zero probability as well
n - length(y)
dat - list(resp=cbind(
c((y0)+0, rep(NA,n)),
c(rep(NA,n), ifelse(y0,y,NA))),
t0=c(1:n, rep(NA,n)),
t1=c(rep(NA,n), 1:n))

### two choices to smooth the rainfall amount
form1 - resp ~ 0 +
f(t0, model='rw2', cyclic=TRUE) +
f(inla.group(t1, n=73), model='rw1', cyclic=TRUE)
form2 - resp ~ 0 +
f(t0, model='rw2', cyclic=TRUE) +
f(t1, model='rw2', cyclic=TRUE)
inla.setOption(scale.model=TRUE)

res1 - inla(form1, family=c('binomial', 'gamma'), data=dat)
res2 - inla(form2, family=c('binomial', 'gamma'), data=dat)

day - seq(ISOdate(2011,1,1), ISOdate(2011,12,31), 24*3600)
par(mfrow=c(2,1), mar=c(3,3,1,1), mgp=c(2,1,0))
plot(day, y0)
for (j in 4:6) {
lines(day, 1/(1+exp(-res1$summary.ran$t0[,j])), lty=2)
lines(day, 1/(1+exp(-res2$summary.ran$t0[,j])), lty=2, col=2)
}
plot(day, y, type='l')
for (j in 4:6) {
lines(day[seq(3,n,5)], exp(res1$summary.ran[[2]][,j]), lty=2)
lines(day, exp(res2$summary.ran[[2]][,j]), lty=2, col=2)
}


Elias
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


Re: [R-br] Regressão espacial com variavel transformada log normal

2015-06-10 Por tôpico salah
tente: log(x + 1)


Em Qua, 2015-06-10 às 10:34 -0300, Samuel luna de almeida escreveu:
 Muito obrigado Luis, Paulo e Luis!
 
 
 São zero mesmo (locais onde não há casos para resultarem em taxas)...
 
 
 Consegui gerar lm para a regressão espacial com os dados originais,
 com muitos zeros, porém com a variável normalizada acho q o -inf
 impede...
 
 
 Será q eu consigo considerar os -inf como zero de algum modo? Ou `e
 o caso de encontrar um modelo/distribuição mais adequado mesmo?
 
 
 Agradecido,
 
 Samuel
 
 
 Em 10 de junho de 2015 10:07, Paulo Justiniano paulo...@leg.ufpr.br
 escreveu:
 
 log(0) = -Inf
 
 Veja que voce tem muitos zeros, mais que 25% dos teus dados,
 visto que o 1o quartil ainda é zero
 
 Não tenhosugestão específica mas acredito que voce poderia:
 - ver se seus zeros são zeros mesmo ou valores censurados
 abaixo de um cento limite de detecção
 
 - sendo zeros mesmo eu procurar por algum modelo/distribuição
 que permitisse modelar esta proporção bem razoável de zeros
 que voce tem nos teus dados
 
 
 
 
 
 On Wed, 10 Jun 2015, Samuel luna de almeida wrote:
 
 Bom dia pessoal,
 
 Trabalhando com uma variável de taxas que que
 apresenta muitos valores baixos, fui aconselhado a
 transforma-la com aplicação de log normal antes de
 buscar
 correlações...
 A variável foi transformada e inserida no dataframe
 passando a apresentar comportamento normal, no entanto
 apresenta alguns valores -inf como pode ser visto no
 summary copiado abaixo:
 
 TX_J04_10 LOGNTX_J04 
 Min.   :   0.0   Min.   :-Inf 
 1st Qu.:   0.0 1st Qu.:-Inf 
 Median : 138.4Median :  -4 
 Mean   : 240.7Mean   :-Inf 
 3rd Qu.: 295.23rd Qu.:  -4 
 Max.   :9626.1Max.   :   0
 
 Acredito que seja por isso que não estou conseguindo
 gerar lm para rodar regressão espacial, veja o erro
 que aparece:
 
  baseGN04_lm - lm(LOGNTX_J04 ~ DV_TOTAL +
 idhm_N_gri, data=baseG04)
 Error in lm.fit(x, y, offset = offset, singular.ok =
 singular.ok, ...) :
   NA/NaN/Inf in 'y'
 
 Será que é por isso mesmo, alguém poderia me indicar
 uma resolução?
 
 
 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
 forneça código mínimo reproduzível.
 
 
 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
 mínimo reproduzível.


___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


Re: [R-br] Regressão espacial com variavel transformada log normal

2015-06-10 Por tôpico Samuel luna de almeida
Obrigado pelas considerações mais uma vez.
Vou explorar as possibilidades que me apresentaram e tentar chegar na
regressão espacial que é um objetivo da minha an'alise.

Em 10 de junho de 2015 13:35, Samuel luna de almeida samuelgru...@gmail.com
 escreveu:

 Obrigado pelas considerações mais uma vez.



 Em 10 de junho de 2015 10:58, Paulo Justiniano paulo...@leg.ufpr.br
 escreveu:

 Mas se são casos, voce poderia ao inves de modelar as taxas com uma
 distribuição para variáveis contínuas
 usar as contagens mesmo com modelos binomiais ou Poisson (com offset de
 população) ou binomial negativo.

 Isto é geral é equivalente mas melhor que modelar as taxas



 On Wed, 10 Jun 2015, Samuel luna de almeida wrote:

  Muito obrigado Luis, Paulo e Luis!

 São zero mesmo (locais onde não há casos para resultarem em taxas)...

 Consegui gerar lm para a regressão espacial com os dados originais, com
 muitos zeros, porém com a variável normalizada acho q o -inf impede...

 Será q eu consigo considerar os -inf como zero de algum modo? Ou `e o
 caso de encontrar um modelo/distribuição mais adequado mesmo?

 Agradecido,
 Samuel

 Em 10 de junho de 2015 10:07, Paulo Justiniano paulo...@leg.ufpr.br
 escreveu:

   log(0) = -Inf

   Veja que voce tem muitos zeros, mais que 25% dos teus dados, visto
 que o 1o quartil ainda é zero

   Não tenhosugestão específica mas acredito que voce poderia:
   - ver se seus zeros são zeros mesmo ou valores censurados abaixo
 de um cento limite de detecção

   - sendo zeros mesmo eu procurar por algum modelo/distribuição que
 permitisse modelar esta proporção bem razoável de zeros que voce tem nos
 teus dados




   On Wed, 10 Jun 2015, Samuel luna de almeida wrote:

 Bom dia pessoal,

 Trabalhando com uma variável de taxas que que apresenta
 muitos valores baixos, fui aconselhado a transforma-la com aplicação de log
 normal
 antes de buscar
 correlações...
 A variável foi transformada e inserida no dataframe
 passando a apresentar comportamento normal, no entanto apresenta alguns
 valores
 -inf como pode ser visto no
 summary copiado abaixo:

 TX_J04_10 LOGNTX_J04
 Min.   :   0.0   Min.   :-Inf
 1st Qu.:   0.0 1st Qu.:-Inf
 Median : 138.4Median :  -4
 Mean   : 240.7Mean   :-Inf
 3rd Qu.: 295.23rd Qu.:  -4
 Max.   :9626.1Max.   :   0

 Acredito que seja por isso que não estou conseguindo gerar
 lm para rodar regressão espacial, veja o erro que aparece:

  baseGN04_lm - lm(LOGNTX_J04 ~ DV_TOTAL + idhm_N_gri,
 data=baseG04)
 Error in lm.fit(x, y, offset = offset, singular.ok =
 singular.ok, ...) :
   NA/NaN/Inf in 'y'

 Será que é por isso mesmo, alguém poderia me indicar uma
 resolução?


 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.




 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.



___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão logística ordinal e uso de pesos amostrais | CROSSTAB

2014-12-22 Por tôpico Luciane Maria Pilotto
Os comandos estão abaixo.

###
 Acho que o valor é zero
 mesmo. Olhei o código da função
 print.htest() e descobri que o problema é que
 nela é valor é
 impresso por format.pval()
 enquanto a função print.CrossTable() usa
 cat(). Confira:
 
 # Início do código
 
 library(foreign)
 library(descr)
 
 ##Banco id3 - banco parcial para testes
 load(id3.rda)
 
 id3$q11 - as.factor(id3$q11)
 id3$q13 - as.factor(id3$q13)
 
 # attach() deve ficar depois
 de finalizada a manipulação dos dados
 attach(id3)
 
 table(q11,q13, useNA=always)
 
 # valor p é informado como
 0
 ct - crosstab(q11, q13, weight =
 bwgr_et, digits = 1, expected = TRUE,
    
            prop.r=TRUE, prop.c=TRUE, chisq =
 TRUE, format = SPSS,
        
        dnn = c(local
 atend,satisfação), plot =
 FALSE,data=id3)
 
 # O teste
 de qui-quadrado está guardado no objeto ct:
 print(ct$CST$p.value, digits = 16)
 print(ct$CST)
 format.pval(ct$CST$p.value)
 
 # FIM do código
 
 Vou corrigir a função print.CrossTable. 
 
 -- 
 Jakson
 Alves de Aquino
 www.lepem.ufc.br/aquino.php
 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
 forneça código mínimo
 reproduzível.
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


Re: [R-br] Regressão logística ordinal e uso de pesos amostrais | CROSSTAB

2014-12-18 Por tôpico Luciane Maria Pilotto
4993117762048 616 294   19727
 25.3 59.710.4 3.1 1.5
==

Estatísticas para todos os fatores da tabela

Pearson's Chi-squared test 

Qui² = 210.3717  g.l. = 12  p = 2.343732e-38 

Frequência esperada mínima: 4.873422 
Células com frequências esperada  5: 1 de 20 (5%)


Atenciosamente,
Luciane Pilotto

Em sáb, 13/12/14, Jakson Alves de Aquino jalve...@gmail.com escreveu:

 Assunto: Re: [R-br] Regressão logística  ordinal e uso de pesos amostrais | 
CROSSTAB
 Para: r-br@listas.c3sl.ufpr.br
 Data: Sábado, 13 de Dezembro de 2014, 12:51
 
 On Fri, Dec 12, 2014 at
 06:21:08PM -0800, Luciane Maria Pilotto wrote:
  antes de rodar as regressões preciso
 fazer as tabelas de
  contingencia
 utilizando os pesos amostrais com a função
  crosstab e não está dando
 certo. O pvalor está aparecendo como
 
 0.
 
 [...]
 
 Acho que o valor é zero
 mesmo. Olhei o código da função
 print.htest() e descobri que o problema é que
 nela é valor é
 impresso por format.pval()
 enquanto a função print.CrossTable() usa
 cat(). Confira:
 
 # Início do código
 
 library(foreign)
 library(descr)
 
 ##Banco id3 - banco parcial para testes
 load(id3.rda)
 
 id3$q11 - as.factor(id3$q11)
 id3$q13 - as.factor(id3$q13)
 
 # attach() deve ficar depois
 de finalizada a manipulação dos dados
 attach(id3)
 
 table(q11,q13, useNA=always)
 
 # valor p é informado como
 0
 ct - crosstab(q11, q13, weight =
 bwgr_et, digits = 1, expected = TRUE,
    
            prop.r=TRUE, prop.c=TRUE, chisq =
 TRUE, format = SPSS,
        
        dnn = c(local
 atend,satisfação), plot =
 FALSE,data=id3)
 
 # O teste
 de qui-quadrado está guardado no objeto ct:
 print(ct$CST$p.value, digits = 16)
 print(ct$CST)
 format.pval(ct$CST$p.value)
 
 # FIM do código
 
 Vou corrigir a função print.CrossTable. 
 
 -- 
 Jakson
 Alves de Aquino
 www.lepem.ufc.br/aquino.php
 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
 forneça código mínimo
 reproduzível.
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


Re: [R-br] Regressão logística ordinal e uso de pesos amostrais | CROSSTAB

2014-12-18 Por tôpico Jakson Alves de Aquino
2014-12-18 19:52 GMT-05:00 Luciane Maria Pilotto lutipilo...@yahoo.com.br:
 Obrigada pela ajuda! Com estes comandos é possível verificar o pvalue, pois o 
 valor não é zero.

 O estranho é que o pvalor só aparece como zero ao usar os pesos amostrais na 
 função crosstab!

Talvez o p-valor seja diferente nos dois casos porque o código usado
para exibi-lo na tela é o mesmo nos dois casos. A sequência é a
seguinte:

  1. A função crosstab usa a função xtabs() para fazer uma tabela de X
 Y considerando os pesos.
  2. A tabela é repassada para a função CrossTable(), que cria um
objeto com a tabela, valores esperados, teste de qui-quadrado, etc.
  3. A função print.CrossTable() formata o objeto para exibição.

Ou seja, tanto faz usar crosstab() (com ou sem pesos) como usar
CrossTable() diretamente porque quem exibe o p-valor é
print.CrossTable().

Eu mantenho o pacote descr e já fiz a correção no github
(https://github.com/jalvesaq/descr), mas ainda não enviei para o CRAN.
Se você não estiver usando Windows, será fácil compilar o pacote a
partir do código fonte.

-- 
Jakson
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


Re: [R-br] Regressão logística ordinal e uso de pesos amostrais | CROSSTAB

2014-12-13 Por tôpico Jakson Alves de Aquino
On Fri, Dec 12, 2014 at 06:21:08PM -0800, Luciane Maria Pilotto wrote:
 antes de rodar as regressões preciso fazer as tabelas de
 contingencia utilizando os pesos amostrais com a função
 crosstab e não está dando certo. O pvalor está aparecendo como
 0.

[...]

Acho que o valor é zero mesmo. Olhei o código da função
print.htest() e descobri que o problema é que nela é valor é
impresso por format.pval() enquanto a função print.CrossTable() usa
cat(). Confira:

# Início do código

library(foreign)
library(descr)

##Banco id3 - banco parcial para testes
load(id3.rda)

id3$q11 - as.factor(id3$q11)
id3$q13 - as.factor(id3$q13)

# attach() deve ficar depois de finalizada a manipulação dos dados
attach(id3)

table(q11,q13, useNA=always)

# valor p é informado como 0
ct - crosstab(q11, q13, weight = bwgr_et, digits = 1, expected = TRUE,
   prop.r=TRUE, prop.c=TRUE, chisq = TRUE, format = SPSS,
   dnn = c(local atend,satisfação), plot = FALSE,data=id3)

# O teste de qui-quadrado está guardado no objeto ct:
print(ct$CST$p.value, digits = 16)
print(ct$CST)
format.pval(ct$CST$p.value)

# FIM do código

Vou corrigir a função print.CrossTable. 

-- 
Jakson Alves de Aquino
www.lepem.ufc.br/aquino.php
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


Re: [R-br] Regressão logística ordinal e uso de pesos amostrais | CROSSTAB

2014-12-12 Por tôpico Luciane Maria Pilotto
Boa noite,

antes de rodar as regressões preciso fazer as tabelas de contingencia 
utilizando os pesos amostrais com a função crosstab e não está dando certo. O 
pvalor está aparecendo como 0.

A função polr tb permite usar os pesos amostrais, porém, não consigo 
identificar o erro que está acusando. A função svyolr pode ser uma alternativa, 
mas gostaria de decifrar este este problema para uso em outras situações.

Segue abaixo o script e uma parte do banco para testes. 

Ajudas são bem vindas!

##Banco id3 - banco parcial para testes

load(id3.rda)
attach(id3)

id3$q11 - as.factor(id3$q11)
id3$q13 - as.factor(id3$q13)

table(q11,q13, useNA=always)

#Não está informando o pvalor ao usar os pesos amostrais! - variável para 
peso=bwgr_et ou peso 
crosstab(q11, q13, weight = bwgr_et, digits = 1, expected = TRUE, prop.r=TRUE, 
prop.c=TRUE, chisq = TRUE, 
  format = SPSS, dnn = c(local atend,satisfação), plot = 
FALSE,data=id3)


###

#reportando erro em optim(s0, fmin, gmin, method = BFGS, ...) :   valor 
inicial em vmmin não é finito
m1 - polr(q13 ~ q11 , method=logistic, data=id3, weights=peso, Hess=TRUE)
summary(m1)
ordinal.or.display(m1)




__
Luciane Maria Pilotto
Mestre e Doutoranda em Saúde Bucal Coletiva - FO/UFRGS 



Em sáb, 29/11/14, Leonardo Ferreira Fontenelle leonar...@leonardof.med.br 
escreveu:

 Assunto: Re: [R-br] Regressão logística ordinal e uso de pesos amostrais
 Para: r-br@listas.c3sl.ufpr.br
 Data: Sábado, 29 de Novembro de 2014, 22:25
 
 Se você quer usar pesos
 de amostragem, o pacote survey é a única forma
 que conheço no R. Se você quer usar as
 variáveis do data frame id,
 precisa passá-lo como argumento para a
 função svydesign. Por favor,
 forneça um
 código mínimo reprodutível, incluindo acesso a dados e
 os
 dois comandos (svyolr e svydesign com
 dados).
 
 -- 
 Leonardo Ferreira Fontenelle
 http://lattes.cnpq.br/9234772336296638
 
 Em Sex 28 nov. 2014, às
 16:27, Luciane Maria Pilotto escreveu:
 
 Ah, não Leonardo, já havia alterado e dá o mesmo
 erro!!
  
  
  
  
  Enviado do Windows
 
 
 
 
  Em qui, 27/11/14, Leonardo Ferreira
 Fontenelle
  leonar...@leonardof.med.br
 escreveu:
  
  
 Assunto: Re: [R-br] Regressão logística ordinal e uso de
 pesos amostrais
   Para: r-br@listas.c3sl.ufpr.br
   Data: Quinta-feira, 27 de Novembro de
 2014, 21:11
   
  
 No comando abaixo:
   
   dstrat-svydesign(ids=~1,
   probs=NULL, strata = NULL, variable =
 NULL,
   fpc=NULL, data = NULL, nest =
 FALSE,
   weights=~peso,pps=FALSE)
   
   Você
 provavelmente quer passar o argumento
  
 data = id, em vez de data
   = NULL.
   
   -- 
   Leonardo
 Ferreira
   Fontenelle
   http://lattes.cnpq.br/9234772336296638
   
   Em Qui 27 nov.
 2014, às
   14:58, Luciane Maria
 Pilotto escreveu:
   
   Não consegui usar o comando svyolr,
 está dando os erros
   abaixo.
    
    #
   Utilizando as variáveis criadas q11 e
 q13 que foram
   transformadas em
    fator:
   
 
     id$q11 -
   as.factor(id$q11)
  
   id$q13 -
  
 as.factor(id$q13)
    
   
   
    
 dstrat-svydesign(ids=~1,
  
 probs=NULL, strata = NULL, variable = NULL, fpc=NULL,
    + data = NULL, nest = FALSE,
   weights=~peso,pps=FALSE)
     dstrat
  
  Independent Sampling design (with
   replacement)
   
 svydesign(ids = ~1, probs
   = NULL,
 strata = NULL, variable = NULL, 
  
      fpc = NULL, data = NULL,
  
 nest = FALSE, weights = ~peso, pps = FALSE)
    
   
 
   svyolr(q13~q11,design=dstrat,
   method=logistic)
    Erro em
  
 svyolr.survey.design2(q13 ~ q11, design = dstrat, method
   =
   
 logistic) : 
  
    response must be a factor
  
  
    
  
  # Utilizando as variáveis quest_11 e
   quest_13 que são fatores no banco:
   
   
 svyolr(quest_13~quest_11,design=dstrat,
   method=logistic)
    Erro em
  
 tapply(1:NROW(x), list(factor(strata)), function(index) {
 :
   
  
    arguments must have same
  
 length
    
  
 
  
 ==
    
    Eu tb
 poderia usar
   os pesos amostrais nas
 tabelas de contingencia, no
   
 entanto, tb não consigo usar os pesos
   nestas. Utilizei o comando crosstab
   
  
 (crosstab(q11, q13, peso, expected = TRUE,chisq = TRUE,
 plot
   = FALSE)).
    
   
 Dicas
   com outros comandos que
 utilizam os pesos amostrais são
  
 bem
    vindas!!!
    
   
  
 __
    Luciane Maria Pilotto
   
   Mestre
 e Doutoranda em Saúde Bucal Coletiva -
   FO/UFRGS 
   
 
    
   
  
 
    Em ter, 25/11/14, Leonardo
 Ferreira
   Fontenelle
    leonar...@leonardof.med.br
   escreveu:
   
 
    
  
 Assunto: Re: [R-br] Regressão logística ordinal e uso
 de
   pesos

Re: [R-br] Regressão logística ordinal e uso de pesos amostrais

2014-11-29 Por tôpico Leonardo Ferreira Fontenelle
Se você quer usar pesos de amostragem, o pacote survey é a única forma
que conheço no R. Se você quer usar as variáveis do data frame id,
precisa passá-lo como argumento para a função svydesign. Por favor,
forneça um código mínimo reprodutível, incluindo acesso a dados e os
dois comandos (svyolr e svydesign com dados).

-- 
Leonardo Ferreira Fontenelle
http://lattes.cnpq.br/9234772336296638

Em Sex 28 nov. 2014, às 16:27, Luciane Maria Pilotto escreveu:
 Ah, não Leonardo, já havia alterado e dá o mesmo erro!!
 
 
 
 
 Enviado do Windows
 
 
 Em qui, 27/11/14, Leonardo Ferreira Fontenelle
 leonar...@leonardof.med.br escreveu:
 
  Assunto: Re: [R-br] Regressão logística ordinal e uso de pesos amostrais
  Para: r-br@listas.c3sl.ufpr.br
  Data: Quinta-feira, 27 de Novembro de 2014, 21:11
  
  No comando abaixo:
  
  dstrat-svydesign(ids=~1,
  probs=NULL, strata = NULL, variable = NULL,
  fpc=NULL, data = NULL, nest = FALSE,
  weights=~peso,pps=FALSE)
  
  Você provavelmente quer passar o argumento
  data = id, em vez de data
  = NULL.
  
  -- 
  Leonardo Ferreira
  Fontenelle
  http://lattes.cnpq.br/9234772336296638
  
  Em Qui 27 nov. 2014, às
  14:58, Luciane Maria Pilotto escreveu:
  
  Não consegui usar o comando svyolr, está dando os erros
  abaixo.
   
   #
  Utilizando as variáveis criadas q11 e q13 que foram
  transformadas em
   fator:
   
id$q11 -
  as.factor(id$q11)
id$q13 -
  as.factor(id$q13)
   
  
  
dstrat-svydesign(ids=~1,
  probs=NULL, strata = NULL, variable = NULL, fpc=NULL,
   + data = NULL, nest = FALSE,
  weights=~peso,pps=FALSE)
dstrat
   Independent Sampling design (with
  replacement)
   svydesign(ids = ~1, probs
  = NULL, strata = NULL, variable = NULL, 
       fpc = NULL, data = NULL,
  nest = FALSE, weights = ~peso, pps = FALSE)
   
   
  svyolr(q13~q11,design=dstrat,
  method=logistic)
   Erro em
  svyolr.survey.design2(q13 ~ q11, design = dstrat, method
  =
   logistic) : 
     response must be a factor
   
   
   # Utilizando as variáveis quest_11 e
  quest_13 que são fatores no banco:
  
   svyolr(quest_13~quest_11,design=dstrat,
  method=logistic)
   Erro em
  tapply(1:NROW(x), list(factor(strata)), function(index) { :
  
     arguments must have same
  length
   
  
  ==
   
   Eu tb poderia usar
  os pesos amostrais nas tabelas de contingencia, no
   entanto, tb não consigo usar os pesos
  nestas. Utilizei o comando crosstab
  
  (crosstab(q11, q13, peso, expected = TRUE,chisq = TRUE, plot
  = FALSE)).
   
   Dicas
  com outros comandos que utilizam os pesos amostrais são
  bem
   vindas!!!
   
  
  __
   Luciane Maria Pilotto
  
  Mestre e Doutoranda em Saúde Bucal Coletiva -
  FO/UFRGS 
   
   
  
  
   Em ter, 25/11/14, Leonardo Ferreira
  Fontenelle
   leonar...@leonardof.med.br
  escreveu:
   
   
  Assunto: Re: [R-br] Regressão logística ordinal e uso de
  pesos amostrais
    Para: r-br@listas.c3sl.ufpr.br
    Data: Terça-feira, 25 de Novembro de
  2014, 17:09
    
   
  
    
    
    
    
    Não serve a
   
  http://r-survey.r-forge.r-project.org/survey/html/svyolr.html?
    
     
    Leonardo Ferreira
   
  Fontenelle
    
   
  
     
     
    Em Ter 25 nov. 2014, às 15:36, lutipilo...@yahoo.com.br
    escreveu:
    
    Olá,
    
     
    estou tentando
  rodar regressão logística ordinal e
   
  não estou conseguindo usar os pesos amostrais, está
  dando
    o seguinte erro:
    
     
     m11 - polr(q13 ~ q11 ,
    method=logistic, weights =
  peso, data=id,
    Hess=TRUE)
    
    Aviso: glm.fit:
  fitted probabilities numerically 0 or 1
    occurred
    
    Erro em optim(s0, fmin, gmin, method
  =
    BFGS, ...) : 
    
      valor inicial
  em vmmin não é finito
    
     
    *A variável
  q13 possui 5 ctegorias (1,2,3,4,5) e a
    variável q11 possui 4 categorias
  (1,2,3,4).
    
   
   
    Tem como solicitar o qui-quadrado,
  o número de
    observações e o pseudo
  R2 no mesmo comando utilizado para
   
  reg. log. ord.?
    
     
    Como utilizar
  o peso amostral nas tabelas de
   
  contingência? Estou usando os seguintes comandos:
    
   
  table(q11,q13)
    
    rowPercents(table(q11,q13))
    
    ou
    
    CrossTable(q11,
  q13, digits=2,
    expected=TRUE,
  prop.r=TRUE, prop.c=TRUE,
    
      
    prop.t=FALSE,prop.chisq=FALSE, chisq =
  FALSE, 
    
   
    
   
  format=c(SPSS), dnn = c(local
   
  atend,satisfação))
    
     
     
   
   Atenciosamente,
   
  Luciane M. Pilotto
    Doutoranda em
  Saúde Bucal Coletiva/UFRGS
     
    Enviado do Email do Windows
    
     
     
    
    
   
  ___
    
    R-br mailing
  list
    
    R-br@listas.c3sl.ufpr.br
    
    https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
    
    Leia o guia de
  postagem

Re: [R-br] Regressão logística ordinal e uso de pesos amostrais

2014-11-28 Por tôpico Luciane Maria Pilotto
Ah, não Leonardo, já havia alterado e dá o mesmo erro!!




Enviado do Windows


Em qui, 27/11/14, Leonardo Ferreira Fontenelle leonar...@leonardof.med.br 
escreveu:

 Assunto: Re: [R-br] Regressão logística ordinal e uso de pesos amostrais
 Para: r-br@listas.c3sl.ufpr.br
 Data: Quinta-feira, 27 de Novembro de 2014, 21:11
 
 No comando abaixo:
 
 dstrat-svydesign(ids=~1,
 probs=NULL, strata = NULL, variable = NULL,
 fpc=NULL, data = NULL, nest = FALSE,
 weights=~peso,pps=FALSE)
 
 Você provavelmente quer passar o argumento
 data = id, em vez de data
 = NULL.
 
 -- 
 Leonardo Ferreira
 Fontenelle
 http://lattes.cnpq.br/9234772336296638
 
 Em Qui 27 nov. 2014, às
 14:58, Luciane Maria Pilotto escreveu:
 
 Não consegui usar o comando svyolr, está dando os erros
 abaixo.
  
  #
 Utilizando as variáveis criadas q11 e q13 que foram
 transformadas em
  fator:
  
   id$q11 -
 as.factor(id$q11)
   id$q13 -
 as.factor(id$q13)
  
 
 
   dstrat-svydesign(ids=~1,
 probs=NULL, strata = NULL, variable = NULL, fpc=NULL,
  + data = NULL, nest = FALSE,
 weights=~peso,pps=FALSE)
   dstrat
  Independent Sampling design (with
 replacement)
  svydesign(ids = ~1, probs
 = NULL, strata = NULL, variable = NULL, 
      fpc = NULL, data = NULL,
 nest = FALSE, weights = ~peso, pps = FALSE)
  
  
 svyolr(q13~q11,design=dstrat,
 method=logistic)
  Erro em
 svyolr.survey.design2(q13 ~ q11, design = dstrat, method
 =
  logistic) : 
    response must be a factor
  
  
  # Utilizando as variáveis quest_11 e
 quest_13 que são fatores no banco:
 
  svyolr(quest_13~quest_11,design=dstrat,
 method=logistic)
  Erro em
 tapply(1:NROW(x), list(factor(strata)), function(index) { :
 
    arguments must have same
 length
  
 
 ==
  
  Eu tb poderia usar
 os pesos amostrais nas tabelas de contingencia, no
  entanto, tb não consigo usar os pesos
 nestas. Utilizei o comando crosstab
 
 (crosstab(q11, q13, peso, expected = TRUE,chisq = TRUE, plot
 = FALSE)).
  
  Dicas
 com outros comandos que utilizam os pesos amostrais são
 bem
  vindas!!!
  
 
 __
  Luciane Maria Pilotto
 
 Mestre e Doutoranda em Saúde Bucal Coletiva -
 FO/UFRGS 
  
  
 
 
  Em ter, 25/11/14, Leonardo Ferreira
 Fontenelle
  leonar...@leonardof.med.br
 escreveu:
  
  
 Assunto: Re: [R-br] Regressão logística ordinal e uso de
 pesos amostrais
   Para: r-br@listas.c3sl.ufpr.br
   Data: Terça-feira, 25 de Novembro de
 2014, 17:09
   
  
 
   
   
   
   
   Não serve a
  
 http://r-survey.r-forge.r-project.org/survey/html/svyolr.html?
   
    
   Leonardo Ferreira
  
 Fontenelle
   
  
 
    
    
   Em Ter 25 nov. 2014, às 15:36, lutipilo...@yahoo.com.br
   escreveu:
   
   Olá,
   
    
   estou tentando
 rodar regressão logística ordinal e
  
 não estou conseguindo usar os pesos amostrais, está
 dando
   o seguinte erro:
   
    
    m11 - polr(q13 ~ q11 ,
   method=logistic, weights =
 peso, data=id,
   Hess=TRUE)
   
   Aviso: glm.fit:
 fitted probabilities numerically 0 or 1
   occurred
   
   Erro em optim(s0, fmin, gmin, method
 =
   BFGS, ...) : 
   
     valor inicial
 em vmmin não é finito
   
    
   *A variável
 q13 possui 5 ctegorias (1,2,3,4,5) e a
   variável q11 possui 4 categorias
 (1,2,3,4).
   
  
  
   Tem como solicitar o qui-quadrado,
 o número de
   observações e o pseudo
 R2 no mesmo comando utilizado para
  
 reg. log. ord.?
   
    
   Como utilizar
 o peso amostral nas tabelas de
  
 contingência? Estou usando os seguintes comandos:
   
  
 table(q11,q13)
   
   rowPercents(table(q11,q13))
   
   ou
   
   CrossTable(q11,
 q13, digits=2,
   expected=TRUE,
 prop.r=TRUE, prop.c=TRUE,
   
     
   prop.t=FALSE,prop.chisq=FALSE, chisq =
 FALSE, 
   
  
   
  
 format=c(SPSS), dnn = c(local
  
 atend,satisfação))
   
    
    
  
  Atenciosamente,
  
 Luciane M. Pilotto
   Doutoranda em
 Saúde Bucal Coletiva/UFRGS
    
   Enviado do Email do Windows
   
    
    
   
   
  
 ___
   
   R-br mailing
 list
   
   R-br@listas.c3sl.ufpr.br
   
   https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
   
   Leia o guia de
 postagem (http://www.leg.ufpr.br/r-br-guia)
   e forneça código mínimo
 reproduzível.
   
    
   
   
   -Anexo
 incorporado-
   
  
 ___
   R-br mailing list
  
 R-br@listas.c3sl.ufpr.br
   https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
   Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
 forneça
   código
   mínimo reproduzível.
 
 ___
  R-br mailing list
  R-br@listas.c3sl.ufpr.br
  https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
  Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
 forneça
  código mínimo
 reproduzível

Re: [R-br] Regressão logística ordinal e uso de pesos amostrais

2014-11-27 Por tôpico Luciane Maria Pilotto
Não consegui usar o comando svyolr, está dando os erros abaixo.

# Utilizando as variáveis criadas q11 e q13 que foram transformadas em fator:

 id$q11 - as.factor(id$q11)
 id$q13 - as.factor(id$q13)


 dstrat-svydesign(ids=~1, probs=NULL, strata = NULL, variable = NULL, 
 fpc=NULL,
+ data = NULL, nest = FALSE, weights=~peso,pps=FALSE)
 dstrat
Independent Sampling design (with replacement)
svydesign(ids = ~1, probs = NULL, strata = NULL, variable = NULL, 
fpc = NULL, data = NULL, nest = FALSE, weights = ~peso, pps = FALSE)

 svyolr(q13~q11,design=dstrat, method=logistic)
Erro em svyolr.survey.design2(q13 ~ q11, design = dstrat, method = logistic) 
: 
  response must be a factor


# Utilizando as variáveis quest_11 e quest_13 que são fatores no banco:
 svyolr(quest_13~quest_11,design=dstrat, method=logistic)
Erro em tapply(1:NROW(x), list(factor(strata)), function(index) { : 
  arguments must have same length

==

Eu tb poderia usar os pesos amostrais nas tabelas de contingencia, no entanto, 
tb não consigo usar os pesos nestas. Utilizei o comando crosstab (crosstab(q11, 
q13, peso, expected = TRUE,chisq = TRUE, plot = FALSE)).

Dicas com outros comandos que utilizam os pesos amostrais são bem vindas!!!

__
Luciane Maria Pilotto
Mestre e Doutoranda em Saúde Bucal Coletiva - FO/UFRGS 



Em ter, 25/11/14, Leonardo Ferreira Fontenelle leonar...@leonardof.med.br 
escreveu:

 Assunto: Re: [R-br] Regressão logística ordinal e uso de pesos amostrais
 Para: r-br@listas.c3sl.ufpr.br
 Data: Terça-feira, 25 de Novembro de 2014, 17:09
 
 
 
 
 
 
 Não serve a http://r-survey.r-forge.r-project.org/survey/html/svyolr.html?
 
  
 Leonardo Ferreira
 Fontenelle
 
 
  
  
 Em Ter 25 nov. 2014, às 15:36, lutipilo...@yahoo.com.br
 escreveu:
 
 Olá,
 
  
 estou tentando rodar regressão logística ordinal e
 não estou conseguindo usar os pesos amostrais, está dando
 o seguinte erro:
 
  
  m11 - polr(q13 ~ q11 ,
 method=logistic, weights = peso, data=id,
 Hess=TRUE)
 
 Aviso: glm.fit: fitted probabilities numerically 0 or 1
 occurred
 
 Erro em optim(s0, fmin, gmin, method =
 BFGS, ...) : 
 
   valor inicial em vmmin não é finito
 
  
 *A variável q13 possui 5 ctegorias (1,2,3,4,5) e a
 variável q11 possui 4 categorias (1,2,3,4).
 
  
 Tem como solicitar o qui-quadrado, o número de
 observações e o pseudo R2 no mesmo comando utilizado para
 reg. log. ord.?
 
  
 Como utilizar o peso amostral nas tabelas de
 contingência? Estou usando os seguintes comandos:
 
 table(q11,q13)
 
 rowPercents(table(q11,q13))
 
 ou
 
 CrossTable(q11, q13, digits=2,
 expected=TRUE, prop.r=TRUE, prop.c=TRUE,
 
   
 prop.t=FALSE,prop.chisq=FALSE, chisq = FALSE, 
 
   
 format=c(SPSS), dnn = c(local
 atend,satisfação))
 
  
  
  Atenciosamente,
 Luciane M. Pilotto
 Doutoranda em Saúde Bucal Coletiva/UFRGS
  
 Enviado do Email do Windows
 
  
  
 
 
 ___
 
 R-br mailing list
 
 R-br@listas.c3sl.ufpr.br
 
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia)
 e forneça código mínimo reproduzível.
 
  
 
 
 -Anexo incorporado-
 
 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
 mínimo reproduzível.
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


Re: [R-br] Regressão logística ordinal e uso de pesos amostrais

2014-11-27 Por tôpico Leonardo Ferreira Fontenelle
No comando abaixo:

dstrat-svydesign(ids=~1, probs=NULL, strata = NULL, variable = NULL,
fpc=NULL, data = NULL, nest = FALSE, weights=~peso,pps=FALSE)

Você provavelmente quer passar o argumento data = id, em vez de data
= NULL.

-- 
Leonardo Ferreira Fontenelle
http://lattes.cnpq.br/9234772336296638

Em Qui 27 nov. 2014, às 14:58, Luciane Maria Pilotto escreveu:
 Não consegui usar o comando svyolr, está dando os erros abaixo.
 
 # Utilizando as variáveis criadas q11 e q13 que foram transformadas em
 fator:
 
  id$q11 - as.factor(id$q11)
  id$q13 - as.factor(id$q13)
 
 
  dstrat-svydesign(ids=~1, probs=NULL, strata = NULL, variable = NULL, 
  fpc=NULL,
 + data = NULL, nest = FALSE, weights=~peso,pps=FALSE)
  dstrat
 Independent Sampling design (with replacement)
 svydesign(ids = ~1, probs = NULL, strata = NULL, variable = NULL, 
 fpc = NULL, data = NULL, nest = FALSE, weights = ~peso, pps = FALSE)
 
  svyolr(q13~q11,design=dstrat, method=logistic)
 Erro em svyolr.survey.design2(q13 ~ q11, design = dstrat, method =
 logistic) : 
   response must be a factor
 
 
 # Utilizando as variáveis quest_11 e quest_13 que são fatores no banco:
  svyolr(quest_13~quest_11,design=dstrat, method=logistic)
 Erro em tapply(1:NROW(x), list(factor(strata)), function(index) { : 
   arguments must have same length
 
 ==
 
 Eu tb poderia usar os pesos amostrais nas tabelas de contingencia, no
 entanto, tb não consigo usar os pesos nestas. Utilizei o comando crosstab
 (crosstab(q11, q13, peso, expected = TRUE,chisq = TRUE, plot = FALSE)).
 
 Dicas com outros comandos que utilizam os pesos amostrais são bem
 vindas!!!
 
 __
 Luciane Maria Pilotto
 Mestre e Doutoranda em Saúde Bucal Coletiva - FO/UFRGS 
 
 
 
 Em ter, 25/11/14, Leonardo Ferreira Fontenelle
 leonar...@leonardof.med.br escreveu:
 
  Assunto: Re: [R-br] Regressão logística ordinal e uso de pesos amostrais
  Para: r-br@listas.c3sl.ufpr.br
  Data: Terça-feira, 25 de Novembro de 2014, 17:09
  
  
  
  
  
  
  Não serve a
  http://r-survey.r-forge.r-project.org/survey/html/svyolr.html?
  
   
  Leonardo Ferreira
  Fontenelle
  
  
   
   
  Em Ter 25 nov. 2014, às 15:36, lutipilo...@yahoo.com.br
  escreveu:
  
  Olá,
  
   
  estou tentando rodar regressão logística ordinal e
  não estou conseguindo usar os pesos amostrais, está dando
  o seguinte erro:
  
   
   m11 - polr(q13 ~ q11 ,
  method=logistic, weights = peso, data=id,
  Hess=TRUE)
  
  Aviso: glm.fit: fitted probabilities numerically 0 or 1
  occurred
  
  Erro em optim(s0, fmin, gmin, method =
  BFGS, ...) : 
  
    valor inicial em vmmin não é finito
  
   
  *A variável q13 possui 5 ctegorias (1,2,3,4,5) e a
  variável q11 possui 4 categorias (1,2,3,4).
  
   
  Tem como solicitar o qui-quadrado, o número de
  observações e o pseudo R2 no mesmo comando utilizado para
  reg. log. ord.?
  
   
  Como utilizar o peso amostral nas tabelas de
  contingência? Estou usando os seguintes comandos:
  
  table(q11,q13)
  
  rowPercents(table(q11,q13))
  
  ou
  
  CrossTable(q11, q13, digits=2,
  expected=TRUE, prop.r=TRUE, prop.c=TRUE,
  
    
  prop.t=FALSE,prop.chisq=FALSE, chisq = FALSE, 
  
    
  format=c(SPSS), dnn = c(local
  atend,satisfação))
  
   
   
   Atenciosamente,
  Luciane M. Pilotto
  Doutoranda em Saúde Bucal Coletiva/UFRGS
   
  Enviado do Email do Windows
  
   
   
  
  
  ___
  
  R-br mailing list
  
  R-br@listas.c3sl.ufpr.br
  
  https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
  
  Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia)
  e forneça código mínimo reproduzível.
  
   
  
  
  -Anexo incorporado-
  
  ___
  R-br mailing list
  R-br@listas.c3sl.ufpr.br
  https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
  Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
  código
  mínimo reproduzível.
 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


[R-br] Regressão logística ordinal e uso de pesos amostrais

2014-11-25 Por tôpico lutipilotto
Olá,


estou tentando rodar regressão logística ordinal e não estou conseguindo usar 
os pesos amostrais, está dando o seguinte erro:


 m11 - polr(q13 ~ q11 , method=logistic, weights = peso, data=id, Hess=TRUE)
Aviso: glm.fit: fitted probabilities numerically 0 or 1 occurred
Erro em optim(s0, fmin, gmin, method = BFGS, ...) : 
  valor inicial em vmmin não é finito



*A variável q13 possui 5 ctegorias (1,2,3,4,5) e a variável q11 possui 4 
categorias (1,2,3,4).


Tem como solicitar o qui-quadrado, o número de observações e o pseudo R2 no 
mesmo comando utilizado para reg. log. ord.?


Como utilizar o peso amostral nas tabelas de contingência? Estou usando os 
seguintes comandos:

table(q11,q13)
rowPercents(table(q11,q13))


ou

CrossTable(q11, q13, digits=2, expected=TRUE, prop.r=TRUE, prop.c=TRUE,
   prop.t=FALSE,prop.chisq=FALSE, chisq = FALSE, 
   format=c(SPSS), dnn = c(local atend,satisfação))





 Atenciosamente,

Luciane M. Pilotto

Doutoranda em Saúde Bucal Coletiva/UFRGS





Enviado do Email do Windows___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão logística ordinal e uso de pesos amostrais

2014-11-25 Por tôpico Leonardo Ferreira Fontenelle

Não serve a
http://r-survey.r-forge.r-project.org/survey/html/svyolr.html?

Leonardo Ferreira Fontenelle[1]


Em Ter 25 nov. 2014, às 15:36, lutipilo...@yahoo.com.br escreveu:
 Olá,

 estou tentando rodar regressão logística ordinal e não estou
 conseguindo usar os pesos amostrais, está dando o seguinte erro:

  m11 - polr(q13 ~ q11 , method=logistic, weights = peso, data=id,
  Hess=TRUE)
 Aviso: glm.fit: fitted probabilities numerically 0 or 1 occurred Erro
 em optim(s0, fmin, gmin, method = BFGS, ...) : valor inicial em
 vmmin não é finito

 *A variável q13 possui 5 ctegorias (1,2,3,4,5) e a variável q11 possui
 4 categorias (1,2,3,4).

 Tem como solicitar o qui-quadrado, o número de observações e o pseudo
 R2 no mesmo comando utilizado para reg. log. ord.?

 Como utilizar o peso amostral nas tabelas de contingência? Estou
 usando os seguintes comandos:
  * table(q11,q13) rowPercents(table(q11,q13)) ou
  * CrossTable(q11, q13, digits=2, expected=TRUE, prop.r=TRUE,
prop.c=TRUE, prop.t=FALSE,prop.chisq=FALSE, chisq = FALSE,
format=c(SPSS), dnn = c(local atend,satisfação))


 Atenciosamente,


 Luciane M. Pilotto


 Doutoranda em Saúde Bucal Coletiva/UFRGS



 Enviado do Email do Windows


 _
 R-br mailing list R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia
 de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo
 reproduzível.



Links:

  1. http://lattes.cnpq.br/9234772336296638
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

[R-br] Regressão por mínimos quadrados parciais para dados categóricos

2014-07-10 Por tôpico ASANTOS

Boa tarde pessoal,

Estou estudando o ajuste de regressões por mínimos quadrados 
parciais (PLSR) para dados categóricos, usando o pacote psl. Me deparei 
com um problema de predição, se tenho os níveis de infestado, 
representado por 1 e sadio representado por 0, como os valores de 
predição não são inteiros, posso utilizar round para saber a qual nível 
pertente um novo conjunto de variáveis resposta testados?


Segue CRM:

require(pls)

#Dados artificiais

T-as.factor(sort(rep(c(infestado, sadio), 100)))

y1 - c(rnorm(100,1,0.1),rnorm(100,1,0.1))
y2 - c(rnorm(100,10,0.3),rnorm(100,10,0.6))
y3 - c(rnorm(100,10,2.3),rnorm(100,11,2.6))
y4 - c(rnorm(100,5,0.5),rnorm(100,7,0.5))
y5 - c(rnorm(100,0,0.1),rnorm(100,0,0.1))

#Cria o data frame
avaliacao - as.numeric(T)
espectro - cbind(y1,y2,y3,y4,y5)
dados - data.frame(avaliacao = I(as.matrix(avaliacao)), bands = 
I(as.matrix(espectro)))


#Ajuste da regressão
taumato - plsr(avaliacao ~ bands, ncomp = 5, validation = LOO, 
data=dados)

summary(taumato)

#Gráfico de componentes
plot(taumato, plottype = scores, comps = 1:5)


#Vaidação cruzada
taumato.cv - crossval(taumato, segments = 10)
plot(MSEP(taumato.cv), legendpos = topright)
summary(taumato.cv, what = validation)
plot(taumato, xlab =medição, ylab=predição, ncomp = 3, asp = 1, 
main= , line = TRUE)



#Predição para 3 componentes principais
T-as.factor(sort(rep(c(infestado, sadio), 50)))

y1 - c(rnorm(100,1,0.1),rnorm(100,1,0.1))
y2 - c(rnorm(100,10,0.3),rnorm(100,10,0.6))
y3 - c(rnorm(100,10,2.3),rnorm(100,11,2.6))
y4 - c(rnorm(100,5,0.5),rnorm(100,7,0.5))
y5 - c(rnorm(100,0,0.1),rnorm(100,0,0.1))

espectro2 - cbind(y1,y2,y3,y4,y5)
new.dados - data.frame(bands = I(as.matrix(espectro2)))
round(predict(taumato, ncomp = 3, newdata = new.dados))##Arredondando 
para ver a qual nível pertence



Obrigado,



--
==
Alexandre dos Santos
Proteção Florestal
IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso
Campus Cáceres
Caixa Postal 244
Avenida dos Ramires, s/n
Bairro: Distrito Industrial
Cáceres - MT  CEP: 78.200-000
Fone: (+55) 65 8132-8112 (TIM)   (+55) 65 9686-6970 (VIVO)
e-mails:alexandresanto...@yahoo.com.br
alexandre.san...@cas.ifmt.edu.br
Lattes: http://lattes.cnpq.br/1360403201088680
==

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


[R-br] Regressão por quadrados mínimos parciais (PLS)

2014-01-03 Por tôpico ASANTOS

Bom dia Pessoal,

Gostaria de saber que materiais os membros dos grupos teriam 
para indicar de Regressão por quadrados mínimos parciais (PLS) em 
ambiente R, pois estou migrando da abordagem de Regressão linear 
múltipla para PLS,


Obrigado,

--
==
Alexandre dos Santos
Proteção Florestal
IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso
Campus Cáceres
Caixa Postal 244
Avenida dos Ramires, s/n
Bairro: Distrito Industrial
Cáceres - MT  CEP: 78.200-000
Fone: (+55) 65 8132-8112 (TIM)   (+55) 65 9686-6970 (VIVO)
e-mails:alexandresanto...@yahoo.com.br
alexandre.san...@cas.ifmt.edu.br
Lattes: http://lattes.cnpq.br/1360403201088680
==

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


Re: [R-br] Regressão por quadrados mínimos parciais (PLS)

2014-01-03 Por tôpico walmes .
Me recordo que esse livro tem conteúdo sobre PLS

http://books.google.com.br/books/about/Introduction_to_Multivariate_Statistical.html?id=S4btpoIgGP0Credir_esc=y

Talvez você possa encontrá-lo em

http://avaxsearch.com/?q=multivariate%20%20%20with%20R

À disposição.
Walmes.

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão por quadrados mínimos parciais (PLS)

2014-01-03 Por tôpico Cleber N.Borges

pls é muito utilizado em quimica/quimiometria (chemomectrics),

provavel que todo livro de quimiometria, vc vai encontrar explicação
sobre PLS.

no  Chemometrics Task View há informações sobre pls e bibliografia
me lembro de 2 livros (mas há mais)

1 - Chemomectrics with R (Use R! da Springer), bem básico
2 - livro da Varmuza


cleber


Em 03/01/2014 09:53, ASANTOS escreveu:

Bom dia Pessoal,

Gostaria de saber que materiais os membros dos grupos teriam 
para indicar de Regressão por quadrados mínimos parciais (PLS) em 
ambiente R, pois estou migrando da abordagem de Regressão linear 
múltipla para PLS,


Obrigado,



___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


Re: [R-br] Regressão por quadrados mínimos parciais (PLS)

2014-01-03 Por tôpico Luiz Roberto Martins Pinto
Walmes,

Estes arquivos para download são executáveis?

Luiz Roberto

Luiz Roberto Martins Pinto
Prof. Pleno/DCET/UESC
Laboratório de Estatística Computacional
Universidade Estadual de Santa Cruz
Ilhéus-Bahia

luizroberto.u...@gmail.com
skype: lrmpinto
http://lattes.cnpq.br/2732314327604831




Em 3 de janeiro de 2014 10:47, walmes . walmeszevi...@gmail.com escreveu:

 Me recordo que esse livro tem conteúdo sobre PLS


 http://books.google.com.br/books/about/Introduction_to_Multivariate_Statistical.html?id=S4btpoIgGP0Credir_esc=y

 Talvez você possa encontrá-lo em

 http://avaxsearch.com/?q=multivariate%20%20%20with%20R

 À disposição.
 Walmes.

 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão por quadrados mínimos parciais (PLS)

2014-01-03 Por tôpico ASANTOS

Luiz,

A pagina que o Walmes passou não tem mais o livro, vá em 
http://ishare.iask.sina.com.cn/f/35148665.html e selecione o botão verde 
em chinês que abaixa o livro,


Abraço,

--
==
Alexandre dos Santos
Proteção Florestal
IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso
Campus Cáceres
Caixa Postal 244
Avenida dos Ramires, s/n
Bairro: Distrito Industrial
Cáceres - MT  CEP: 78.200-000
Fone: (+55) 65 8132-8112 (TIM)   (+55) 65 9686-6970 (VIVO)
e-mails:alexandresanto...@yahoo.com.br
alexandre.san...@cas.ifmt.edu.br
Lattes: http://lattes.cnpq.br/1360403201088680
==



Em 03/01/2014 10:50, Luiz Roberto Martins Pinto escreveu:

Walmes,

Estes arquivos para download são executáveis?

Luiz Roberto

Luiz Roberto Martins Pinto
Prof. Pleno/DCET/UESC
Laboratório de Estatística Computacional
Universidade Estadual de Santa Cruz
Ilhéus-Bahia

luizroberto.u...@gmail.com mailto:luizroberto.u...@gmail.com
skype: lrmpinto
http://lattes.cnpq.br/2732314327604831




Em 3 de janeiro de 2014 10:47, walmes . walmeszevi...@gmail.com 
mailto:walmeszevi...@gmail.com escreveu:


Me recordo que esse livro tem conteúdo sobre PLS


http://books.google.com.br/books/about/Introduction_to_Multivariate_Statistical.html?id=S4btpoIgGP0Credir_esc=y

Talvez você possa encontrá-lo em

http://avaxsearch.com/?q=multivariate%20%20%20with%20R

À disposição.
Walmes.

___
R-br mailing list
R-br@listas.c3sl.ufpr.br mailto:R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
forneça código mínimo reproduzível.




___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão por quadrados mínimos parciais (PLS)

2014-01-03 Por tôpico Luiz Roberto Martins Pinto
Alexandre.
Agradeço.
Luiz Roberto

Luiz Roberto Martins Pinto
Prof. Pleno/DCET/UESC
Laboratório de Estatística Computacional
Universidade Estadual de Santa Cruz
Ilhéus-Bahia

luizroberto.u...@gmail.com
skype: lrmpinto
http://lattes.cnpq.br/2732314327604831




2014/1/3 ASANTOS alexandresanto...@yahoo.com.br

  Luiz,

 A pagina que o Walmes passou não tem mais o livro, vá em
 http://ishare.iask.sina.com.cn/f/35148665.html e selecione o botão verde
 em chinês que abaixa o livro,

 Abraço,


 --
 ==
 Alexandre dos Santos
 Proteção Florestal
 IFMT - Instituto Federal de Educação, Ciência e Tecnologia de Mato Grosso
 Campus Cáceres
 Caixa Postal 244
 Avenida dos Ramires, s/n
 Bairro: Distrito Industrial
 Cáceres - MT  CEP: 78.200-000
 Fone: (+55) 65 8132-8112 (TIM)   (+55) 65 9686-6970 
 (VIVO)e-mails:alexandresanto...@yahoo.com.br
 alexandre.san...@cas.ifmt.edu.br
 Lattes: http://lattes.cnpq.br/1360403201088680
 ==



 Em 03/01/2014 10:50, Luiz Roberto Martins Pinto escreveu:

 Walmes,

  Estes arquivos para download são executáveis?

  Luiz Roberto

  Luiz Roberto Martins Pinto
 Prof. Pleno/DCET/UESC
 Laboratório de Estatística Computacional
 Universidade Estadual de Santa Cruz
 Ilhéus-Bahia

 luizroberto.u...@gmail.com
 skype: lrmpinto
 http://lattes.cnpq.br/2732314327604831




 Em 3 de janeiro de 2014 10:47, walmes . walmeszevi...@gmail.comescreveu:

  Me recordo que esse livro tem conteúdo sobre PLS


 http://books.google.com.br/books/about/Introduction_to_Multivariate_Statistical.html?id=S4btpoIgGP0Credir_esc=y

  Talvez você possa encontrá-lo em

  http://avaxsearch.com/?q=multivariate%20%20%20with%20R

  À disposição.
  Walmes.

 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.




 ___
 R-br mailing 
 listr...@listas.c3sl.ufpr.brhttps://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
 mínimo reproduzível.



 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão por quadrados mínimos parciais (PLS)

2014-01-03 Por tôpico Cleber N.Borges


agora me veio à cabeça sobre a biblia de PLS

Multivariate Calibration, do Naes... (mas com precinho salgado)

http://www.amazon.com/Multivariate-Calibration-Harald-Martens/dp/0471930474

mas para quem tem acesso a uma boa biblioteca, fica a referencia final 
sobre o assunto!


cleber



Em 03/01/2014 09:53, ASANTOS escreveu:

Bom dia Pessoal,

Gostaria de saber que materiais os membros dos grupos teriam 
para indicar de Regressão por quadrados mínimos parciais (PLS) em 
ambiente R, pois estou migrando da abordagem de Regressão linear 
múltipla para PLS,


Obrigado,



___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


Re: [R-br] regressão linear polinomial: classificar em simples ou múltipla (dúvida conceitual)

2013-12-12 Por tôpico Jose Claudio Faria
Agradeço a todos as opiniões emitidas assim como a coragem de as emitir.
(se calar em assuntois polêmicos é sempre mais fácil).

No meu ponto de vista a discussão foi no mínimo salutar!

Quanto ao ensino de regressão, dado ao público de graduação
(Agronomia), inicio a parte conceitual com a abordagem de ajustamento
via transladação do eixo da variável de resposta para a média da
proditora (baseado em WonnacottWonnacott). Considero ser o método
mais didático para introdução ao estudo de regressão linear simples
pois pressupõe apenas conhecimento de derivada parcial. A solução do
sistema linear fica extremamente facilitada e compreensível com esta
abordagem conceitual.

Posteriormente generalizo para a solução de mínimo quadrado via
álgebra de matrizes e uso o R como ferramenta didática.

Quem tiver interesse dê uma olhada neses links:
- http://nbcgib.uesc.br/lec/professores/jcfaria/disciplinas/cet076
- 
http://nbcgib.uesc.br/lec/download/faria/cet076/r/scripts/08_regressao_linear.r

A apostila é a de CET076.

Ab,

2013/12/11 Elias T Krainski eliaskrain...@yahoo.com.br:
 Se seus alunos tiverem bom conhecimento de álgebra linear, pode ser mais
 fácil entrar direto na múltipla. Enfim é uma questão didática.


 Plenamente de acordo. O metodo dos minimos quadrados tem quase 220 anos. GLM
 como familia mais de 30 anos. Li num livro de matematica que atualmente nao
 faz sentido fazer um curso de integral de Riemann e outro de integral de
 Lebesgue. Ninguem tem tempo para isso hoje em dia. Assim, na estatistica
 acho que DEVEMOS INICIAR com GLM. Na meu bacharelado fiz um semestre de
 correlacao, um de LM e outro de GLM... Nessa perda de tempo que eu
 vivenciei, a minha geracao JA PERDEU para o pessoal de Machine Learning.

 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
 mínimo reproduzível.



-- 
///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\
Jose Claudio Faria
Estatistica
UESC/DCET/Brasil
joseclaudio.faria at gmail.com
Telefones:
55(73)3680.5545 - UESC
55(73)9100.7351 - TIM
55(73)8817.6159 - OI
///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


Re: [R-br] regressão linear polinomial: classificar em simples ou múltipla (dúvida conceitual)

2013-12-11 Por tôpico walmes .
Na minha humilde opinião, regressão linear simples remete à f(x) =
b_0+b_1*x. Todo preditor linear com mais termos do que esse do lado direito
seria regressão linear múltipla. Um caso particular é quando os termos a
mais são potências naturais da mesma variável x, ou seja, o polinômio {x⁰,
x¹, x², x³, ..., x^n}. Quanto à representação do R², se r² ou R², eu nunca
prestei muita atenção. Acredito que r² (minúsculo) seja acidental nas
publicações nacionais pois em livros em inglês, artigos internacionais, e
saídas dos aplicativos que conheço soltam R².

À disposição.
Walmes.
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] regressão linear polinomial: classificar em simples ou múltipla (dúvida conceitual)

2013-12-11 Por tôpico Jose Claudio Faria
Na Universidade Federal de Viçosa - UFV (onde iniciei meus sentimentos
de amor e ódio pela estatística) o pensamento predominante (na verdade
consensual) era considerar os modelos polinomiais como um caso
particular das múltiplas. Assim como o Walmes o fez.

Em minha dissertação de mestrado trabalhei com regressão linear
(séries de Fourier) para estimar umidade e temperatura do solo
amostrado quinzenalmente por um período de 6 meses. Ou seja, Umidade
ou Temperatura em função do tempo (apenas uma variável preditora).
Alguns modelos chegavam a ter 9 parâmetros ou mais para serem
estimados. Acho bem difícil classificar esses modelos como regressão
linear simples!

Na UFV era obrigatório nas dissertações, teses e publicações o uso do
R2 (maiúsculo) nos casos das polinomiais (grau =2) . O que acho certo
pois no caso da regressão linear simples existe a relação funcional:

r = sqrt(r^2)

Ou seja, a raiz quadrada do coef. de determinação é o próprio
coeficiente de correlação (r), e para este existe consenso de usar
sempre o r (minúsculo).

O motivo da minha consulta é que estou finalizando meu semestre letivo
para o curso de Agronomia com esse assunto. Ao mostrar o material
didático preparado em R a um professor da área surgiu a dúvida: ele
pensa diferente e classifica as polinomiais na família das simples.

Como não encontrei nada na literatura que disponho no momento, e no
curto tempo disponível, apelei para a lista.

Obrigado por se manifestar Walmes, gostaria de conhecer mais opiniões
(pois ainda estou em sala de aula).

Ab,


2013/12/11 walmes . walmeszevi...@gmail.com:
 Na minha humilde opinião, regressão linear simples remete à f(x) =
 b_0+b_1*x. Todo preditor linear com mais termos do que esse do lado direito
 seria regressão linear múltipla. Um caso particular é quando os termos a
 mais são potências naturais da mesma variável x, ou seja, o polinômio {x⁰,
 x¹, x², x³, ..., x^n}. Quanto à representação do R², se r² ou R², eu nunca
 prestei muita atenção. Acredito que r² (minúsculo) seja acidental nas
 publicações nacionais pois em livros em inglês, artigos internacionais, e
 saídas dos aplicativos que conheço soltam R².

 À disposição.
 Walmes.

 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
 mínimo reproduzível.



-- 
///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\
Jose Claudio Faria
Estatistica
UESC/DCET/Brasil
joseclaudio.faria at gmail.com
Telefones:
55(73)3680.5545 - UESC
55(73)9100.7351 - TIM
55(73)8817.6159 - OI
///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] regressão linear polinomial: classificar em simples ou múltipla (dúvida conceitual)

2013-12-11 Por tôpico walmes .
Prezado Faria,

Essas discussões são bem úteis. Eu acredito que repensar o simples é muito
útil, ou melhor, repensar aquilo que é considerado trivial é muito útil.
Existe ainda muito equívoco nesses conceitos fundamentais.

Bem, seja y a resposta e x a explicativa. Do meu ponto de vista, o fato da
correlação ao quadrado entre y e x ser igual ao R² é decorrente de um
resultado mais geral, de o R² ser o quadrado da correlação entre valor
ajustado (f) e observado (y). Na regressão linear simples, em particular, o
predito é uma função linear de uma única variável (x), f = b0+b1*x, e
sabemos que a correlação entre duas variáveis não se altera para
transformações lineares aplicadas nestas. Seja qual for o modelo (gaussiano
fixo) o R² é o quadrado da correlação entre predito e observado. Este é
inclusive o que uso para calcular R² em modelos não lineares (que não tem
R² na saída default do R) e é o que tem sido usado na literatura para
modelos mistos e lineares generalizados. No entanto, nesses modelos o R²
não  interpretado da mesma forma geométrica que é em modelo lineares
gaussianos, porque não representa de fato a razão entre comprimento de
vetores no espaço.

Walmes.

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] regressão linear polinomial: classificar em simples ou múltipla (dúvida conceitual)

2013-12-11 Por tôpico Lucas Petri Damiani
Boa tarde, José.

Eu concordo com o Walmes. Regressão linear *simples *me remete ao ajuste de
reta. E apenas nesse caso específico o coeficiente de determinação é o
quadrado do coeficiente de correlação. Portanto, acho que o coeficiente de
determinação deva ser escrito R², sempre.

Já quanto a classificação de polinomial e múltipla. Eu não acho que eles
sejam excludentes. Uma regressão linear simples (reta) não deixa de ser uma
regressão polinomial, não é verdade? É um polinômio de ordem 1. hehehe E se
vc tem 2 ou mais parâmetros (sejam x e y ou x e x^2) a regressão é múltipla
(múltiplos parâmetros). Portanto y = x + x^2 + x^3, na minha opinião, é uma
regressão polinomial *e* múltipla. Mas é só minha opinião, sem nenhuma
referência no momento!

Abraços,
Lucas Petri Damiani








2013/12/11 Jose Claudio Faria joseclaudio.fa...@gmail.com

 Na Universidade Federal de Viçosa - UFV (onde iniciei meus sentimentos
 de amor e ódio pela estatística) o pensamento predominante (na verdade
 consensual) era considerar os modelos polinomiais como um caso
 particular das múltiplas. Assim como o Walmes o fez.

 Em minha dissertação de mestrado trabalhei com regressão linear
 (séries de Fourier) para estimar umidade e temperatura do solo
 amostrado quinzenalmente por um período de 6 meses. Ou seja, Umidade
 ou Temperatura em função do tempo (apenas uma variável preditora).
 Alguns modelos chegavam a ter 9 parâmetros ou mais para serem
 estimados. Acho bem difícil classificar esses modelos como regressão
 linear simples!

 Na UFV era obrigatório nas dissertações, teses e publicações o uso do
 R2 (maiúsculo) nos casos das polinomiais (grau =2) . O que acho certo
 pois no caso da regressão linear simples existe a relação funcional:

 r = sqrt(r^2)

 Ou seja, a raiz quadrada do coef. de determinação é o próprio
 coeficiente de correlação (r), e para este existe consenso de usar
 sempre o r (minúsculo).

 O motivo da minha consulta é que estou finalizando meu semestre letivo
 para o curso de Agronomia com esse assunto. Ao mostrar o material
 didático preparado em R a um professor da área surgiu a dúvida: ele
 pensa diferente e classifica as polinomiais na família das simples.

 Como não encontrei nada na literatura que disponho no momento, e no
 curto tempo disponível, apelei para a lista.

 Obrigado por se manifestar Walmes, gostaria de conhecer mais opiniões
 (pois ainda estou em sala de aula).

 Ab,


 2013/12/11 walmes . walmeszevi...@gmail.com:
  Na minha humilde opinião, regressão linear simples remete à f(x) =
  b_0+b_1*x. Todo preditor linear com mais termos do que esse do lado
 direito
  seria regressão linear múltipla. Um caso particular é quando os termos a
  mais são potências naturais da mesma variável x, ou seja, o polinômio
 {x⁰,
  x¹, x², x³, ..., x^n}. Quanto à representação do R², se r² ou R², eu
 nunca
  prestei muita atenção. Acredito que r² (minúsculo) seja acidental nas
  publicações nacionais pois em livros em inglês, artigos internacionais, e
  saídas dos aplicativos que conheço soltam R².
 
  À disposição.
  Walmes.
 
  ___
  R-br mailing list
  R-br@listas.c3sl.ufpr.br
  https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
  Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código
  mínimo reproduzível.



 --
 ///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\
 Jose Claudio Faria
 Estatistica
 UESC/DCET/Brasil
 joseclaudio.faria at gmail.com
 Telefones:
 55(73)3680.5545 - UESC
 55(73)9100.7351 - TIM
 55(73)8817.6159 - OI
 ///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\
 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] regressão linear polinomial: classificar em simples ou múltipla (dúvida conceitual)

2013-12-11 Por tôpico Ivan Bezerra Allaman
Para mim é claro e evidente que a diferença entre uma regressão linear
simples e uma múltipla é o número de variáveis preditoras (ou
independentes) indiferentemente do grau do polinômio.

Vejamos a seguinte situação:
Y = a + bX
Y = a + bX + cZ

O que os diferencia?
 - Ambos são polinômios do primeiro grau? Sim
 - Ambos tem o mesmo número de variáveis preditoras? Não
   . Então isso os diferencia? Sim

Vejamos outra situação:
Y = a + bX + cX^2
Y = a + bX + cX^2 + dZ + dZ^2

O que os diferencia?
 - Ambos são polinômios do segundo grau? Sim
 - Ambos tem o mesmo número de variáveis preditoras? Não
  . Então isso os diferencia? Sim

Lembrando láaa da matemática básica, todo *monômio
*(comumente conhecido como regressão linear simples) é um *polinômio*.

Portanto, o que diferencia um polinômio simples de um múltiplo é o número
de variáveis preditoras.

(s,f,p)
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] regressão linear polinomial: classificar em simples ou múltipla (dúvida conceitual)

2013-12-11 Por tôpico Elias T Krainski

Existe ainda muito equívoco nesses conceitos fundamentais.

Ja vi considerarem 'regressao multipla' como 'regressao multivariada'...
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


Re: [R-br] regressão linear polinomial: classificar em simples ou múltipla (dúvida conceitual)

2013-12-11 Por tôpico Elias T Krainski

Se seus alunos tiverem bom conhecimento de álgebra linear, pode ser mais
fácil entrar direto na múltipla. Enfim é uma questão didática.


Plenamente de acordo. O metodo dos minimos quadrados tem quase 220 anos. 
GLM como familia mais de 30 anos. Li num livro de matematica que 
atualmente nao faz sentido fazer um curso de integral de Riemann e outro 
de integral de Lebesgue. Ninguem tem tempo para isso hoje em dia. Assim, 
na estatistica acho que DEVEMOS INICIAR com GLM. Na meu bacharelado fiz 
um semestre de correlacao, um de LM e outro de GLM... Nessa perda de 
tempo que eu vivenciei, a minha geracao JA PERDEU para o pessoal de 
Machine Learning.

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


[R-br] regressão linear polinomial: classificar em simples ou múltipla (dúvida conceitual)

2013-12-10 Por tôpico Jose Claudio Faria
Caros membros,

Vou usar da lista para possivelmente redimir uma dúvida conceitual,
pois não vejo melhor local para fazê-lo, dado ao perfil dos usuários.

Muitos autores classificam os modelos de regressão linear assim:
1- Simples (y = Bo + B1X)
2- Polinomial (y = Bo + B1X + B2X^2 + + B3X^3...)
3- Múltipla (y = Bo + B1X + B2Y + B3XY...)

Outros (dando ênfase na variável preditora) classificam as polinomiais
(dependentes de apenas uma variável fixa ou aleatória) como simples e
usam r² (minúsculo) para o coef. de determinação, independente do grau
do polinômio.

Já outros (dando ênfase no modelo) classificam as polinomiais
(dependentes de apenas uma variável fixa ou aleatória) como múltipla,
e usam R² (maiúsculo) para o coef. de determinação, desde que tenha
mais de um grau e independente do número de graus do polinômio.

Gostaria muito da opinião do pessoal mais especializado sobre esse assunto!

Não seria uma caso como o da a cerveja que desce redondo?

Ou seja se a ênfase está no substantivo (cerveja) deveria ser: desce redonda.
Outros pensam que redondo é um advérbio e se refere ao verbo
descer, portanto, que está correta a concordância no masculino.

http://salp-pmf.blogspot.com.br/2012/06/cerveja-que-desce-redondo-ou-redonda.html

Ab,
-- 
///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\
Jose Claudio Faria
Estatistica
UESC/DCET/Brasil
joseclaudio.faria at gmail.com
Telefones:
55(73)3680.5545 - UESC
55(73)9100.7351 - TIM
55(73)8817.6159 - OI
///\\\///\\\///\\\///\\\///\\\///\\\///\\\///\\\
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


[R-br] regressão com 3 categorias.

2013-07-08 Por tôpico geovane barbosa


Olá pessoal boa tarde.


Alguém poderia me passar um bom material ou pacote do R que trabalhe com 
regressão multinomial?
 

abraços___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] regressão com 3 categorias.

2013-07-08 Por tôpico walmes .
Para pacotes e funções relacionadas faça em um sessão R

RSiteSearch(multinomial regression)

À disposição.
Walmes.

==
Walmes Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573
VoIP: (3361 3600) 1053 1173
e-mail: wal...@ufpr.br
skype: walmeszeviani
twitter: @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmes
linux user number: 531218
==
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] regressão com 3 categorias.

2013-07-08 Por tôpico geovane barbosa


obrigado


 De: walmes . walmeszevi...@gmail.com
Para: r-br@listas.c3sl.ufpr.br; geovane barbosa geovan...@yahoo.com.br 
Enviadas: Segunda-feira, 8 de Julho de 2013 14:00
Assunto: Re: [R-br] regressão com 3 categorias.
 


Para pacotes e funções relacionadas faça em um sessão R

RSiteSearch(multinomial regression)

À disposição.
Walmes.


==
Walmes Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573
VoIP: (3361 3600) 1053 1173
e-mail: wal...@ufpr.br
skype: walmeszeviani
twitter: @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmes
linux user number: 531218
==___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

[R-br] regressão com mais de 2 categorias

2013-07-08 Por tôpico geovane barbosa



 
Poderia tirar uma dúvida em particular com vc.


Estou trabalhando com uma variável dependente categórica com 3 categorias, ela 
possui três possíveis respostas: baixo peso, eutrofia e excesso de peso. Bom 
criei uma variável de referência cujo valor é zero para baixo peso e 1: para 
eutrofia e 2 para excesso de peso.

Tenho mais uma variável categórica (variável explicativa) que é o imc da mãe 
porem o mesmo esta de forma categórica: magreza, eutrofia, sobrepeso e 
obesidade. A minha pergunta seria. Devo criar 3 variáveis dummy em cima dela e 
manter uma como referência (por exemplo magreza)  para depois aplicar no modelo 
de regressão? a minha idéia esta correta?

abraços


obrigado desde já



 De: Raphael Saldanha rfsalda...@outlook.com
Para: r-br@listas.c3sl.ufpr.br r-br@listas.c3sl.ufpr.br 
Enviadas: Terça-feira, 2 de Julho de 2013 14:52
Assunto: Re: [R-br] Pesos Censo 2010
 


 
Elias, muitíssimo obrigado!! Resolvido o problema.

---

Atenciosamente,
Raphael Saldanha

rfsalda...@outlook.com




Date: Tue, 2 Jul 2013 14:30:52 -0300
From: eliaskrain...@yahoo.com.br
To: r-br@listas.c3sl.ufpr.br
Subject: Re: [R-br] Pesos Censo 2010



Seja 'dat' seu data frame com a 1a coluna a indicadora de sexo e a
  segunda o peso. 
Estime o número total de pessoas por 
   sum(dat[,2])
Estime o número total de pessoas por sexo por 
   tapply(dat[,2], dat[,1], sum)

Veja outros exemplos em 
 http://leg.ufpr.br/~elias/ensino/ce225/aulaPME.R
usando funcao para ler microdados em 
 http://leg.ufpr.br/~elias/ensino/ce225/readwp-fun.R

Att.
Elias.

On 02/07/13 14:24, Raphael Saldanha wrote:

 
Prezados, 


Tenho uma dúvida mais conceitual sobre os microdados do censo 2010. Como devo 
trabalhar com os pesos dos registros?


Mais exatamente no meu caso, preciso fazer algumas tabulações de variáveis 
categóricas, por exemplo, sexo e cor, com os microdados. Como devo proceder?


--- 
Atenciosamente,
Raphael Saldanha


rfsalda...@outlook.com


___
R-br mailing list R-br@listas.c3sl.ufpr.br 
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de 
postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo 
reproduzível.

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] regressão com mais de 2 categorias

2013-07-08 Por tôpico Manoel Galdino
No, não é preciso criar as variáveis binárias. Basta definir a variável
como fator (as.factor). Depois, ao usar lm, o R automaticamente vai setar
uma como variável de referência. Isso vale pas duas variáveis categóricas.

Se quiser escolher a variável de referência,
use a função relevel.

abç
M


2013/7/8 geovane barbosa geovan...@yahoo.com.br




 Poderia tirar uma dúvida em particular com vc.


 Estou trabalhando com uma variável dependente categórica com 3 categorias,
 ela possui três possíveis respostas: baixo peso, eutrofia e excesso de
 peso. Bom criei uma variável de referência cujo valor é zero para baixo
 peso e 1: para eutrofia e 2 para excesso de peso.

 Tenho mais uma variável categórica (variável explicativa) que é o imc da
 mãe porem o mesmo esta de forma categórica: magreza, eutrofia, sobrepeso e
 obesidade. A minha pergunta seria. Devo criar 3 variáveis dummy em cima
 dela e manter uma como referência (por exemplo magreza)  para depois
 aplicar no modelo de regressão? a minha idéia esta correta?

 abraços


 obrigado desde já

   --
  *De:* Raphael Saldanha rfsalda...@outlook.com
 *Para:* r-br@listas.c3sl.ufpr.br r-br@listas.c3sl.ufpr.br
 *Enviadas:* Terça-feira, 2 de Julho de 2013 14:52
 *Assunto:* Re: [R-br] Pesos Censo 2010

 Elias, muitíssimo obrigado!! Resolvido o problema.

 ---

 Atenciosamente,
 Raphael Saldanha

 rfsalda...@outlook.com


 --
 Date: Tue, 2 Jul 2013 14:30:52 -0300
 From: eliaskrain...@yahoo.com.br
 To: r-br@listas.c3sl.ufpr.br
 Subject: Re: [R-br] Pesos Censo 2010


 Seja 'dat' seu data frame com a 1a coluna a indicadora de sexo e a segunda
 o peso.
 Estime o número total de pessoas por
sum(dat[,2])
 Estime o número total de pessoas por sexo por
tapply(dat[,2], dat[,1], sum)

 Veja outros exemplos em
  http://leg.ufpr.br/~elias/ensino/ce225/aulaPME.R
 usando funcao para ler microdados em
  http://leg.ufpr.br/~elias/ensino/ce225/readwp-fun.R

 Att.
 Elias.

 On 02/07/13 14:24, Raphael Saldanha wrote:

 Prezados,

  Tenho uma dúvida mais conceitual sobre os microdados do censo 2010. Como
 devo trabalhar com os pesos dos registros?

  Mais exatamente no meu caso, preciso fazer algumas tabulações de
 variáveis categóricas, por exemplo, sexo e cor, com os microdados. Como
 devo proceder?


 ---
 Atenciosamente,
 Raphael Saldanha

  rfsalda...@outlook.com


 ___
 R-br mailing 
 listr...@listas.c3sl.ufpr.brhttps://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
 mínimo reproduzível.



 ___ R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de
 postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo
 reproduz�vel.

 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.


 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.




-- 
Manoel Galdino
https://sites.google.com/site/galdinomcz/
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

[R-br] regressão logística

2013-06-15 Por tôpico Alan R Panosso
Caros amigos,

 

Venho por meio deste pedir boas referências para estudos sobre regressão
logística. Artigos, aplicação e livros.

Grato a todos

 

Alan

 

De: R-br [mailto:r-br-boun...@listas.c3sl.ufpr.br] Em nome de walmes .
Enviada em: terça-feira, 11 de junho de 2013 19:50
Para: r-br@listas.c3sl.ufpr.br
Assunto: Re: [R-br] [OFF-TOPIC] código R para plotar um coração com animação

 

Ok pessoal, valeu aí por disponibilizar. Ainda bem que a resposta veio a
tempo de eu terminar a aula (17:30-19:30) então deu para mostrar a função.
Os alunos gostaram. Vai fazer sucesso. Segue o script da referida aula.

http://www.leg.ufpr.br/~walmes/ensino/ce083-2013-01/ce083-2013-01-aula15i.R

Grato.
Walmes



==
Walmes Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573
VoIP: (3361 3600) 1053 1173
e-mail: wal...@ufpr.br
skype: walmeszeviani
twitter: @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmes http://www.leg.ufpr.br/%7Ewalmes 
linux user number: 531218
==

 

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] regressão logística

2013-06-15 Por tôpico Carlos Trucios Maza
Oi Alan.
Um livro classico de regressão logistica eh o Applied Logistic Regression de 
Hosmer and Lemeshow. Acredito que dar uma olhadinha nele sempre eh bom.


Applied Logistic Regression

Em 15/06/2013, às 09:33, Alan R Panosso arpano...@yahoo.com.br escreveu:

 Caros amigos,
  
 Venho por meio deste pedir boas referências para estudos sobre regressão 
 logística. Artigos, aplicação e livros.
 Grato a todos
  
 Alan
  
 De: R-br [mailto:r-br-boun...@listas.c3sl.ufpr.br] Em nome de walmes .
 Enviada em: terça-feira, 11 de junho de 2013 19:50
 Para: r-br@listas.c3sl.ufpr.br
 Assunto: Re: [R-br] [OFF-TOPIC] código R para plotar um coração com animação
  
 Ok pessoal, valeu aí por disponibilizar. Ainda bem que a resposta veio a 
 tempo de eu terminar a aula (17:30-19:30) então deu para mostrar a função. Os 
 alunos gostaram. Vai fazer sucesso. Segue o script da referida aula.
 
 http://www.leg.ufpr.br/~walmes/ensino/ce083-2013-01/ce083-2013-01-aula15i.R
 
 Grato.
 Walmes
 
 ==
 Walmes Marques Zeviani
 LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
 Departamento de Estatística - Universidade Federal do Paraná
 fone: (+55) 41 3361 3573
 VoIP: (3361 3600) 1053 1173
 e-mail: wal...@ufpr.br
 skype: walmeszeviani
 twitter: @walmeszeviani
 homepage: http://www.leg.ufpr.br/~walmes
 linux user number: 531218
 ==
  
 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
 mínimo reproduzível.

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

[R-br] regressão no R

2013-05-15 Por tôpico alanarocha

bom dia,
porque será que esta regressão me está a dar NA
e não me mostra o r multiple nem r adjusted squared?
não percebo o erro do gráfico tambem.
mando em anexo.
envio tambem o ficheiro excel dos dados originais...
obrigada
Ana



binc0Jqi2cXkY.bin
Description: application/vnd.openxmlformats-officedocument.wordprocessingml.document
setwd(G:/SIN/Users/Ana Rua/dados n�o Panakeia e Panakeia)
dados-read.table(DadosPanakeia2sem2011.txt,comment.char = %,dec=,,h=T)
dados

#objectivo �:
#verificar se h� diferen�as estatisticamente significativas entre os custos e 
os valores de hemoglobina para clinicas Panakeia no 2semestre de 2011.
reg-lm(as.numeric(dados[1,-1])~as.numeric(dados[2,-1]))
reg
summary(reg)

plot(as.numeric(dados[1,-1])~as.numeric(dados[2,-1]))
#Adicionar a reta da regress�o no gr�fico:
abline(reg)


resultados:
   X2sem2011   JUL   AGO   SET   OUT   NOV   DEZ
1 custosPanakeia 25,12 27,34 23,93 23,96 33,07 22,22
2hgbPanakeia  75.4  77.1  77.0  77.2  78.0  76.7

Call:
lm(formula = as.numeric(dados[1, -1]) ~ as.numeric(dados[2, -1]))

Coefficients:
 (Intercept)  as.numeric(dados[2, -1])  
   1NA  

Call:
lm(formula = as.numeric(dados[1, -1]) ~ as.numeric(dados[2, -1]))

Residuals:
 1  2  3  4  5  6 
-1.764e-16  3.528e-17  3.528e-17  3.528e-17  3.528e-17  3.528e-17 

Coefficients: (1 not defined because of singularities)
  Estimate Std. Error   t value Pr(|t|)
(Intercept)  1.000e+00  3.528e-17 2.835e+16   2e-16 ***
as.numeric(dados[2, -1])NA NANA   NA
---
Signif. codes:  0 �***� 0.001 �**� 0.01 �*� 0.05 �.� 0.1 � � 1 

Residual standard error: 8.641e-17 on 5 degrees of freedom

setwd(G:/SIN/Users/Ana Rua/dados n�o Panakeia e Panakeia)
dados-read.table(DadosPanakeia.txt,comment.char = %,dec=,,h=T)
dados

#objectivo �:
#verificar se h� diferen�as estatisticamente significativas entre os custos e 
os valores de hemoglobina para clinicas Panakeia no 2semestre de 2011.
reg-lm(as.numeric(dados[1,-1])~as.numeric(dados[2,-1]))
reg
summary(reg)

plot(as.numeric(dados[1,-1])~as.numeric(dados[2,-1]))
#Adicionar a reta da regress�o no gr�fico:
abline(reg)


resultados:
   X2012   JAN   FEV   MAR   ABR   MAI   JUN   JUL   AGO   SET   OUT
1 custosPanakeia 23,39 27,90 23,15 22,65 27,42 21,20 20,81 23,76 20,48 19,36
2hgbPanakeia  76.2  77.7  76.7  78.4  79.7  79.0  76.7  77.3  77.1  78.7
NOV   DEZ
1 28,21 16,41
2  79.0  78.3

 reg-lm(as.numeric(dados[1,-1])~as.numeric(dados[2,-1]))
 reg

Call:
lm(formula = as.numeric(dados[1, -1]) ~ as.numeric(dados[2, -1]))

Coefficients:
 (Intercept)  as.numeric(dados[2, -1])  
   1NA  

 summary(reg)

Call:
lm(formula = as.numeric(dados[1, -1]) ~ as.numeric(dados[2, -1]))

Residuals:
   Min 1Q Median 3QMax 
-3.680e-16  3.346e-17  3.346e-17  3.346e-17  3.346e-17 

Coefficients: (1 not defined because of singularities)
  Estimate Std. Error   t value Pr(|t|)
(Intercept)  1.000e+00  3.346e-17 2.989e+16   2e-16 ***
as.numeric(dados[2, -1])NA NANA   NA
---
Signif. codes:  0 �***� 0.001 �**� 0.01 �*� 0.05 �.� 0.1 � � 1 

Residual standard error: 1.159e-16 on 11 degrees of freedom

2sem2011JUL AGO SET OUT NOV DEZ
custosPanakeia  25,12   27,34   23,93   23,96   33,07   22,22
hgbPanakeia 75.477.177.077.278.076.7
2012JAN FEV MAR ABR MAI JUN JUL AGO SET 
OUT NOV DEZ
custosPanakeia  23,39   27,90   23,15   22,65   27,42   21,20   20,81   23,76   
20,48   19,36   28,21   16,41
hgbPanakeia 76.277.776.778.479.779.076.777.3
77.178.779.078.3


bina3Gr3rPKDp.bin
Description: application/vnd.openxmlformats-officedocument.spreadsheetml.sheet
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] regressão no R

2013-05-15 Por tôpico FHRB Toledo
Alana,

Leia o guia de postagens!

Não envie arquivos para o email da lista!

Produza um Código mínimo reproduzível!

Sobre o seu problema, note que seu arquivo DadosPanakeia.txt tem a linha
custosPanakeia com os valores numéricos separadas as casas decimais com
virgula ,, enquanto que a linha seguinte hgbPanakeia os valores estão
separados por ponto .!

Padronize, ou tudo com ponto, ou tudo com virgula... tome também o cuidado
de no seu script, na linha do read.table() coloque para o argumento dec o
que você usou como separador de decimal!

Feito isso a regressão é estimada sem problemas.

Valeu destacar que isso em momento algum envolveu um erro ou problema do
programa R, sendo apenas questão de observação, organização e conhecimento
dos próprios dados, atente-se a isso!

Á disposição,
FH


2013/5/15 alanaro...@sapo.pt

 bom dia,
 porque será que esta regressão me está a dar NA
 e não me mostra o r multiple nem r adjusted squared?
 não percebo o erro do gráfico tambem.
 mando em anexo.
 envio tambem o ficheiro excel dos dados originais...
 obrigada
 Ana


 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão linear

2012-11-22 Por tôpico Carlos pombo sonderblohm
No livro de Zuur, Ieno e Smith 'Analizing ecological data' no capitulo 5
esta tudo bem explicado sobre a regresssão linear, sua aplicação, analises
de residuos e selecção do modelo, acho que ate agora não encontrei nada
melhor, e melhor ainda, os scripts de todo o livro estão disponiveis online
no site de highstats.com, e so procurar...
espero ajude
carlos

2012/11/22 Narede Golaco naredegol...@hotmail.com

 Amigos gostaria de saber como se analisa uma regressão linear apartir do
 test T ? Agradeço a ajuda e qualquer exemplo, assim como a indicação de
 material, pois ja coloquei no google  teste T e regressão linear '' e não
 aparece nada de relevante que avalie a regressão com o teste T.

 Agradeço desde ja a ajuda.



 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.




-- 
Carlos A. Pombo Sonderblohm
PhD Student on Marine Science (Fisheries)
Faculdade de Ciências e Tecnología
Universidade do Algarve,
Campus de Gambelas
8005-139 Faro
Portugal
Tef. 289 800 905 ext. 7605
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão linear

2012-11-22 Por tôpico Narede Golaco
Mas como posso analisar os resultados de uma regressão a partir do test T ?
Tipo se as variaveis da regressão tem alguma correlação positiva ou
negativa, ou não há nenhuma correlação...

Agradeço, mais uma vez a ajuda.


Em 22 de novembro de 2012 00:06, tiago souza marçal 
tiagosouzamar...@hotmail.com escreveu:

  Quando você fala sobre o teste de T você está se referindo ao testador
 dos Betas da regressão?

 Caso positivo você pode usar o função lm()como no exemplo abaixo:

 y-c(21,35,37.6,46,48)

 x-c(0,5,10,15,20)

 reg-lm(y~x)

 summary(reg)

 Caso contrário desconsidere

 Att.

 Tiago.
 --
 From: naredegol...@hotmail.com
 To: r-br@listas.c3sl.ufpr.br
 Date: Thu, 22 Nov 2012 04:52:04 +0300
 Subject: [R-br] Regressão linear

 Amigos gostaria de saber como se analisa uma regressão linear apartir do
 test T ? Agradeço a ajuda e qualquer exemplo, assim como a indicação de
 material, pois ja coloquei no google  teste T e regressão linear '' e não
 aparece nada de relevante que avalie a regressão com o teste T.

 Agradeço desde ja a ajuda.



 ___ R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de
 postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo
 reproduz�vel.

 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão linear

2012-11-22 Por tôpico Carlos pombo sonderblohm
no livro aparece o teste T, acho que deves revisar esta referencia, vai te
ajudar muito!

2012/11/22 Narede Golaco naredegol...@hotmail.com


 Mas como posso analisar os resultados de uma regressão a partir do test T
 ? Tipo se as variaveis da regressão tem alguma correlação positiva ou
 negativa, ou não há nenhuma correlação...

 Agradeço, mais uma vez a ajuda.


 Em 22 de novembro de 2012 00:06, tiago souza marçal 
 tiagosouzamar...@hotmail.com escreveu:

  Quando você fala sobre o teste de T você está se referindo ao testador
 dos Betas da regressão?

 Caso positivo você pode usar o função lm()como no exemplo abaixo:

 y-c(21,35,37.6,46,48)

 x-c(0,5,10,15,20)

 reg-lm(y~x)

 summary(reg)

 Caso contrário desconsidere

 Att.

 Tiago.
 --
 From: naredegol...@hotmail.com
 To: r-br@listas.c3sl.ufpr.br
 Date: Thu, 22 Nov 2012 04:52:04 +0300
 Subject: [R-br] Regressão linear

 Amigos gostaria de saber como se analisa uma regressão linear apartir do
 test T ? Agradeço a ajuda e qualquer exemplo, assim como a indicação de
 material, pois ja coloquei no google  teste T e regressão linear '' e não
 aparece nada de relevante que avalie a regressão com o teste T.

 Agradeço desde ja a ajuda.



 ___ R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de
 postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo
 reproduz�vel.

 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.



 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.




-- 
Carlos A. Pombo Sonderblohm
PhD Student on Marine Science (Fisheries)
Faculdade de Ciências e Tecnología
Universidade do Algarve,
Campus de Gambelas
8005-139 Faro
Portugal
Tef. 289 800 905 ext. 7605
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

[R-br] Regressão linear

2012-11-21 Por tôpico Narede Golaco
Amigos gostaria de saber como se analisa uma regressão linear apartir do test T 
? Agradeço a ajuda e qualquer exemplo, assim como a indicação de material, pois 
ja coloquei no google  teste T e regressão linear '' e não aparece nada de 
relevante que avalie a regressão com o teste T.

Agradeço desde ja a ajuda.


  ___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão logistica (conceito)

2012-11-08 Por tôpico Fernando Colugnati
Na verdade eu não conheço muito sobre métodos de classificação, mas para
utilização dos modelos logísticos não há qualquer suposição deste tipo...
Abs


Em 7 de novembro de 2012 00:22, Vinicius Brito Rocha 
viniciusbri...@gmail.com escreveu:

 Fernando,

 sim. o modelo é para classificação.

 O problema é que minhas classes são extremamente desbalanceadas.

 Até onde sei recomenda-se ter classes balanceadas. E esse é exatamente o
 que estou trazendo a discussão.

 Você discorda disso?

 Abs.

 Vinicius Brito Rocha

 Em 6 de novembro de 2012 22:58, Fernando Colugnati 
 fcolugn...@gmail.comescreveu:

 Desde quando vc precisa ter 50% de 1 e 50% de zeros para fazer uma
 regressão logística? Não entendi bem seu problema! Vc fala em
 treinamento...este modelo será para classificação?



 Em 6 de novembro de 2012 23:37, viniciusbritor 
 viniciusbri...@gmail.comescreveu:

 amostrar com reposição toda a informação da classe alvo  , Y=1 para que
 tenha o mesmo tamanho da classe Y=0.
 apenas na amostra de treinamento


 Enviado por Samsung Mobile

 Leonard Mendonça de Assis assis.leon...@gmail.com escreveu:

 Vinícius

 o que você está chamando de reamostragem?

 []s
 Leonard de Assishttp://about.me/ldeassis

 Em 06/11/2012 19:14, Vinicius Brito Rocha escreveu:

 Pessoal,

  preciso tirar uma dúvida a respeito de regressão logistica.

  Tenho uma conjunto de dados, onde existe um grande desbalanceamento
 nas classes da variável resposta (meu evento Y=1 a ser modelado, possui
 poucas observações)

  O que fiz foi:

  separei 70% dos dados para amostra treino e 30% para teste.

  na amostra treino (70%):


- utilizei uma re-amostragem, apenas na classe do evento (Y=1) e fiz
com que as linhas desta  classe fossem re-amostradas até que a classe com
resposta Y=1 possui-se a mesma quantidade de linhas da classe (Y=0)
- Com minha base de amostra treino balanceada ajustei um modelo de
regressão logistica


  na amostra teste(30%):

- calculei minhas probabilidades de respostas a partir das variáveis
independentes da amostra teste.
- arbitrei um ponto de classificação de P_CHAP= 0,7 para
classificar meu evento como classe (Y_CHAP=1) e  P_CHAP0,7 classificar 
 meu
evento como Y_CHAP=0
- Construi uma tabela de confusão comparando os resultados Y_CHAP e
Y para comparar minha Sensitividade e 1-Especificidade.

 Dúvidas:

  A questão é que meus resultados estão muito ruins. Acredito que é a
 estrutura de dados.

- Estou sendo questionado a respeito da técnica de re-amostragem na
amostra treino para equilibrar as classes. Pois o demandante acredita 
 que é
necessário algum tipo de correção do modelo(feito a re-amostragem no 
 ajuste
da amostra treino) ao aplica-lo no  conjunto teste, que não sofreu 
 nenhuma
alteração.


   Alguém tem algum material que justifique o uso de re-amostragem nos
 dados da amostra treino?

  Abs.
 --
 *Vinicius Brito Rocha.*
 *Estatístico e Atuário (IM / UFRJ)**
 Mestre em Pesquisa Operacional (COPPE / UFRJ)*

 www.aplicademic.blogspot.com
 http://twitter.com/viniciusbritor

 Não se preocupe muito com as suas dificuldades em Matemática, posso
 assegurar-lhe que as minhas são ainda maiores. - Albert Einstein.




 ___
 R-br mailing 
 listr...@listas.c3sl.ufpr.brhttps://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
 mínimo reproduzível.



 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.




 --
 Fernando A.B. Colugnati





 --
 *Vinicius Brito Rocha.*
 *Estatístico e Atuário (IM / UFRJ)**
 Mestre em Pesquisa Operacional (COPPE / UFRJ)*

 www.aplicademic.blogspot.com
 http://twitter.com/viniciusbritor

 Não se preocupe muito com as suas dificuldades em Matemática, posso
 assegurar-lhe que as minhas são ainda maiores. - Albert Einstein.





-- 
Fernando A.B. Colugnati
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão logistica (conceito)

2012-11-08 Por tôpico Leonard Mendonça de Assis

Estou até agora tentando entender porque você precisa balancear.
Já mexi com isso e nunca precisei fazer tal manobra

[]s
Leonard de Assis
http://about.me/ldeassis

Em 08/11/2012 17:15, Fernando Colugnati escreveu:
Na verdade eu não conheço muito sobre métodos de classificação, mas 
para utilização dos modelos logísticos não há qualquer suposição deste 
tipo...

Abs


Em 7 de novembro de 2012 00:22, Vinicius Brito Rocha 
viniciusbri...@gmail.com mailto:viniciusbri...@gmail.com escreveu:


Fernando,

sim. o modelo é para classificação.

O problema é que minhas classes são extremamente desbalanceadas.

Até onde sei recomenda-se ter classes balanceadas. E esse é
exatamente o que estou trazendo a discussão.

Você discorda disso?

Abs.

Vinicius Brito Rocha

Em 6 de novembro de 2012 22:58, Fernando Colugnati
fcolugn...@gmail.com mailto:fcolugn...@gmail.com escreveu:

Desde quando vc precisa ter 50% de 1 e 50% de zeros para fazer
uma regressão logística? Não entendi bem seu problema! Vc fala
em treinamento...este modelo será para classificação?



Em 6 de novembro de 2012 23:37, viniciusbritor
viniciusbri...@gmail.com mailto:viniciusbri...@gmail.com
escreveu:

amostrar com reposição toda a informação da classe alvo  ,
Y=1 para que tenha o mesmo tamanho da classe Y=0.
apenas na amostra de treinamento


Enviado por Samsung Mobile

Leonard Mendonça de Assis assis.leon...@gmail.com
mailto:assis.leon...@gmail.com escreveu:

Vinícius

o que você está chamando de reamostragem?

[]s
Leonard de Assis
http://about.me/ldeassis

Em 06/11/2012 19:14, Vinicius Brito Rocha escreveu:

Pessoal,

preciso tirar uma dúvida a respeito de regressão logistica.

Tenho uma conjunto de dados, onde existe um grande
desbalanceamento nas classes da variável resposta (meu
evento Y=1 a ser modelado, possui poucas observações)

O que fiz foi:

separei 70% dos dados para amostra treino e 30% para teste.

na amostra treino (70%):

  * utilizei uma re-amostragem, apenas na classe do
evento (Y=1) e fiz com que as linhas desta  classe
fossem re-amostradas até que a classe com resposta
Y=1 possui-se a mesma quantidade de linhas da classe
(Y=0)
  * Com minha base de amostra treino balanceada ajustei
um modelo de regressão logistica


na amostra teste(30%):

  * calculei minhas probabilidades de respostas a partir
das variáveis independentes da amostra teste.
  * arbitrei um ponto de classificação de P_CHAP= 0,7
para classificar meu evento como classe (Y_CHAP=1) e
 P_CHAP0,7 classificar meu evento como Y_CHAP=0
  * Construi uma tabela de confusão comparando os
resultados Y_CHAP e Y para comparar minha
Sensitividade e 1-Especificidade.

Dúvidas:

A questão é que meus resultados estão muito ruins.
Acredito que é a estrutura de dados.

  * Estou sendo questionado a respeito da técnica de
re-amostragem na amostra treino para equilibrar as
classes. Pois o demandante acredita que é necessário
algum tipo de correção do modelo(feito a
re-amostragem no ajuste da amostra treino) ao
aplica-lo no  conjunto teste, que não sofreu nenhuma
alteração.


Alguém tem algum material que justifique o uso de
re-amostragem nos dados da amostra treino?

Abs.
-- 
/Vinicius Brito Rocha./

/Estatístico e Atuário (IM / UFRJ)//
Mestre em Pesquisa Operacional (COPPE / UFRJ)/

www.aplicademic.blogspot.com
http://www.aplicademic.blogspot.com
http://twitter.com/viniciusbritor

Não se preocupe muito com as suas dificuldades em
Matemática, posso assegurar-lhe que as minhas são ainda
maiores. - Albert Einstein.




___
R-br mailing list
R-br@listas.c3sl.ufpr.br  mailto:R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e 
forneça código mínimo reproduzível.



___
R-br mailing list
R-br@listas.c3sl.ufpr.br mailto:R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem 

Re: [R-br] Regressão logistica (conceito)

2012-11-08 Por tôpico Roney Fraga
Vinicius,

Se o problema for a quantidade de eventos desproporcionais acredito que os
capítulos 4, 5 e 6 dessa dissertação pode ajudar.
http://www.dca.fee.unicamp.br/~vonzuben/research/semolini_mest.html

Abraço
-- 
Roney
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

[R-br] Regressão logistica (conceito)

2012-11-06 Por tôpico Vinicius Brito Rocha
Pessoal,

preciso tirar uma dúvida a respeito de regressão logistica.

Tenho uma conjunto de dados, onde existe um grande desbalanceamento nas
classes da variável resposta (meu evento Y=1 a ser modelado, possui poucas
observações)

O que fiz foi:

separei 70% dos dados para amostra treino e 30% para teste.

na amostra treino (70%):


   - utilizei uma re-amostragem, apenas na classe do evento (Y=1) e fiz com
   que as linhas desta  classe fossem re-amostradas até que a classe com
   resposta Y=1 possui-se a mesma quantidade de linhas da classe (Y=0)
   - Com minha base de amostra treino balanceada ajustei um modelo de
   regressão logistica


na amostra teste(30%):

   - calculei minhas probabilidades de respostas a partir das variáveis
   independentes da amostra teste.
   - arbitrei um ponto de classificação de P_CHAP= 0,7 para classificar
   meu evento como classe (Y_CHAP=1) e  P_CHAP0,7 classificar meu evento como
   Y_CHAP=0
   - Construi uma tabela de confusão comparando os resultados Y_CHAP e Y
   para comparar minha Sensitividade e 1-Especificidade.

Dúvidas:

A questão é que meus resultados estão muito ruins. Acredito que é a
estrutura de dados.

   - Estou sendo questionado a respeito da técnica de re-amostragem na
   amostra treino para equilibrar as classes. Pois o demandante acredita que é
   necessário algum tipo de correção do modelo(feito a re-amostragem no ajuste
   da amostra treino) ao aplica-lo no  conjunto teste, que não sofreu nenhuma
   alteração.


Alguém tem algum material que justifique o uso de re-amostragem nos dados
da amostra treino?

Abs.
-- 
*Vinicius Brito Rocha.*
*Estatístico e Atuário (IM / UFRJ)**
Mestre em Pesquisa Operacional (COPPE / UFRJ)*

www.aplicademic.blogspot.com
http://twitter.com/viniciusbritor

Não se preocupe muito com as suas dificuldades em Matemática, posso
assegurar-lhe que as minhas são ainda maiores. - Albert Einstein.
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão logistica (conceito)

2012-11-06 Por tôpico Leonard Mendonça de Assis

Vinícius

o que você está chamando de reamostragem?

[]s
Leonard de Assis
http://about.me/ldeassis

Em 06/11/2012 19:14, Vinicius Brito Rocha escreveu:

Pessoal,

preciso tirar uma dúvida a respeito de regressão logistica.

Tenho uma conjunto de dados, onde existe um grande desbalanceamento 
nas classes da variável resposta (meu evento Y=1 a ser modelado, 
possui poucas observações)


O que fiz foi:

separei 70% dos dados para amostra treino e 30% para teste.

na amostra treino (70%):

  * utilizei uma re-amostragem, apenas na classe do evento (Y=1) e fiz
com que as linhas desta  classe fossem re-amostradas até que a
classe com resposta Y=1 possui-se a mesma quantidade de linhas da
classe (Y=0)
  * Com minha base de amostra treino balanceada ajustei um modelo de
regressão logistica


na amostra teste(30%):

  * calculei minhas probabilidades de respostas a partir das variáveis
independentes da amostra teste.
  * arbitrei um ponto de classificação de P_CHAP= 0,7 para
classificar meu evento como classe (Y_CHAP=1) e  P_CHAP0,7
classificar meu evento como Y_CHAP=0
  * Construi uma tabela de confusão comparando os resultados Y_CHAP e
Y para comparar minha Sensitividade e 1-Especificidade.

Dúvidas:

A questão é que meus resultados estão muito ruins. Acredito que é a 
estrutura de dados.


  * Estou sendo questionado a respeito da técnica de re-amostragem na
amostra treino para equilibrar as classes. Pois o demandante
acredita que é necessário algum tipo de correção do modelo(feito a
re-amostragem no ajuste da amostra treino) ao aplica-lo no
 conjunto teste, que não sofreu nenhuma alteração.


Alguém tem algum material que justifique o uso de re-amostragem nos 
dados da amostra treino?


Abs.
--
/Vinicius Brito Rocha./
/Estatístico e Atuário (IM / UFRJ)//
Mestre em Pesquisa Operacional (COPPE / UFRJ)/

www.aplicademic.blogspot.com http://www.aplicademic.blogspot.com
http://twitter.com/viniciusbritor

Não se preocupe muito com as suas dificuldades em Matemática, posso 
assegurar-lhe que as minhas são ainda maiores. - Albert Einstein.





___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.


___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão logistica (conceito)

2012-11-06 Por tôpico viniciusbritor
amostrar com reposição toda a informação da classe alvo  , Y=1 para que tenha o 
mesmo tamanho da classe Y=0. 
apenas na amostra de treinamento


Enviado por Samsung MobileLeonard Mendonça de Assis assis.leon...@gmail.com 
escreveu:Vinícius

o que você está chamando de reamostragem?
[]s
Leonard de Assis
http://about.me/ldeassis
Em 06/11/2012 19:14, Vinicius Brito Rocha escreveu:
Pessoal,

preciso tirar uma dúvida a respeito de regressão logistica.

Tenho uma conjunto de dados, onde existe um grande desbalanceamento nas classes 
da variável resposta (meu evento Y=1 a ser modelado, possui poucas 
observações)

O que fiz foi:

separei 70% dos dados para amostra treino e 30% para teste.

na amostra treino (70%):

utilizei uma re-amostragem, apenas na classe do evento (Y=1) e fiz com que as 
linhas desta  classe fossem re-amostradas até que a classe com resposta Y=1 
possui-se a mesma quantidade de linhas da classe (Y=0)
Com minha base de amostra treino balanceada ajustei um modelo de regressão 
logistica

na amostra teste(30%):
calculei minhas probabilidades de respostas a partir das variáveis 
independentes da amostra teste.
arbitrei um ponto de classificação de P_CHAP= 0,7   para 
classificar meu evento como classe (Y_CHAP=1) e  P_CHAP0,7 classificar meu 
evento como Y_CHAP=0
Construi uma tabela de confusão comparando os resultados Y_CHAP e Y para 
comparar minha Sensitividade e 1-Especificidade.
Dúvidas:

A questão é que meus resultados estão muito ruins. Acredito que é a estrutura 
de dados.
Estou sendo questionado a respeito da técnica de re-amostragem na amostra 
treino para equilibrar as classes. Pois o demandante acredita que é necessário 
algum tipo de correção do modelo(feito a re-amostragem no ajuste da amostra 
treino) ao aplica-lo no  conjunto teste, que não sofreu nenhuma alteração.

Alguém tem algum material que justifique o uso de re-amostragem nos dados da 
amostra treino?

Abs.
-- 
Vinicius Brito Rocha.
Estatístico e Atuário (IM / UFRJ)
Mestre em Pesquisa Operacional (COPPE / UFRJ)

www.aplicademic.blogspot.com
http://twitter.com/viniciusbritor

Não se preocupe muito com as suas dificuldades em Matemática, posso 
assegurar-lhe que as minhas são ainda maiores. - Albert Einstein.




___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão logistica (conceito)

2012-11-06 Por tôpico Fernando Colugnati
Desde quando vc precisa ter 50% de 1 e 50% de zeros para fazer uma
regressão logística? Não entendi bem seu problema! Vc fala em
treinamento...este modelo será para classificação?



Em 6 de novembro de 2012 23:37, viniciusbritor
viniciusbri...@gmail.comescreveu:

 amostrar com reposição toda a informação da classe alvo  , Y=1 para que
 tenha o mesmo tamanho da classe Y=0.
 apenas na amostra de treinamento


 Enviado por Samsung Mobile

 Leonard Mendonça de Assis assis.leon...@gmail.com escreveu:

 Vinícius

 o que você está chamando de reamostragem?

 []s
 Leonard de Assishttp://about.me/ldeassis

 Em 06/11/2012 19:14, Vinicius Brito Rocha escreveu:

 Pessoal,

  preciso tirar uma dúvida a respeito de regressão logistica.

  Tenho uma conjunto de dados, onde existe um grande desbalanceamento nas
 classes da variável resposta (meu evento Y=1 a ser modelado, possui poucas
 observações)

  O que fiz foi:

  separei 70% dos dados para amostra treino e 30% para teste.

  na amostra treino (70%):


- utilizei uma re-amostragem, apenas na classe do evento (Y=1) e fiz
com que as linhas desta  classe fossem re-amostradas até que a classe com
resposta Y=1 possui-se a mesma quantidade de linhas da classe (Y=0)
- Com minha base de amostra treino balanceada ajustei um modelo de
regressão logistica


  na amostra teste(30%):

- calculei minhas probabilidades de respostas a partir das variáveis
independentes da amostra teste.
- arbitrei um ponto de classificação de P_CHAP= 0,7 para classificar
meu evento como classe (Y_CHAP=1) e  P_CHAP0,7 classificar meu evento como
Y_CHAP=0
- Construi uma tabela de confusão comparando os resultados Y_CHAP e Y
para comparar minha Sensitividade e 1-Especificidade.

 Dúvidas:

  A questão é que meus resultados estão muito ruins. Acredito que é a
 estrutura de dados.

- Estou sendo questionado a respeito da técnica de re-amostragem na
amostra treino para equilibrar as classes. Pois o demandante acredita que é
necessário algum tipo de correção do modelo(feito a re-amostragem no ajuste
da amostra treino) ao aplica-lo no  conjunto teste, que não sofreu nenhuma
alteração.


   Alguém tem algum material que justifique o uso de re-amostragem nos
 dados da amostra treino?

  Abs.
 --
 *Vinicius Brito Rocha.*
 *Estatístico e Atuário (IM / UFRJ)**
 Mestre em Pesquisa Operacional (COPPE / UFRJ)*

 www.aplicademic.blogspot.com
 http://twitter.com/viniciusbritor

 Não se preocupe muito com as suas dificuldades em Matemática, posso
 assegurar-lhe que as minhas são ainda maiores. - Albert Einstein.




 ___
 R-br mailing 
 listr...@listas.c3sl.ufpr.brhttps://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
 mínimo reproduzível.



 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.




-- 
Fernando A.B. Colugnati
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

[R-br] Regressão Logística

2012-10-23 Por tôpico Edson Lira
Estou usando as rotinas abaixo,

PARA LER OS DADOS

h-read.csv2(C:\\Consulta\\CIESA\\bd.csv)
h[h==]-NA
names(h)
table(h$quem_elab)
str(h)
h$tempo-2012-h$ano_ini
h$melh_orig-h$niv_melhora[drop=T]
h$niv_melhora-h$niv_melhora[drop=T]
h$bsc-h$bsc[drop=T]


levels(h$niv_melhora)
levels(h$niv_melhora)[levels(h$niv_melhora)%in% c(elevado,muito elevado)] 
- Melhora
levels(h$niv_melhora)[levels(h$niv_melhora)%in% c(nenhum,pouco,
intermediário)] - Sem melhora
#levels(h$niv_melhora)[levels(h$niv_melhora)%in% c(intermediário)] -

levels(h$quem_elab)
h$part-h$quem_elab
levels(h$part)[levels(h$part)%in% c(alta direção)]- Direção
levels(h$part)[levels(h$part)%in% c(alta direção\ngerentes,
alta direção\ngerentes\nfuncionários,alta 
direção\ngerentes\noutros,gerentes,
funcionários)] - Gerentes
table(h$part)




#PARA SELECIONAR SOMENTE AS VARIÁVEIS QUE PENSO USAR NO MODELO

nb-data.frame(melhora=h$melh_orig,bsc=h$bsc,champion=h$champion,ap_dir=h$apoio_bsc,
niv_tre=h$niv_treina,cons_ext=h$cext_bsc,reu_f_est=h$reu_func_estr,
com_est=h$comu_estr,ajuste=h$ajustes,ind_apr=h$ind_aprop,ind_desemp=h$ind_desd_dep,
mapa_est=h$mapa_estr,tempo=h$tempo)



levels(nb$melhora)
levels(nb$melhora)[levels(nb$melhora)%in% c(elevado,muito elevado)] - 1
levels(nb$melhora)[levels(nb$melhora)%in% c(nenhum,pouco,
intermediário)] - 0


nb$desemp-as.numeric(as.character(nb$melhora))




#PARA ELIMINAR OS NA'S


cd - subset(nb, subset=!is.na(desemp)  
 !is.na(bsc) !is.na(champion) !is.na(ap_dir) !is.na(niv_tre) 
!is.na(cons_ext) 
 !is.na(reu_f_est) !is.na(com_est) !is.na(ajuste) !is.na(ind_apr) 
!is.na(ind_desemp)
 !is.na(mapa_est) !is.na(tempo) !is.na(desemp)) 
 dim(cd)


#MODELO DE REGRESSÃO
glm3-glm(desemp~bsc+champion+ap_dir+niv_tre+cons_ext+reu_f_est+com_est+
ajuste+ind_apr+ind_desemp+mapa_est+tempo+desemp,family=binomial,data=cd)    

modelstep - step(glm3, direction = both)
logistic.display(modelstep) 
summary(modelstep)



Estou tentando aplicar uma regressão logística,  quero estimar um modelo aonde 
a variável resposta é o desempenho de determinada empresa, aonde tenho os 
níveis melhora=1, sem melhora=0 com outras variáveis. No link abaixo tem uma 
amostra do banco de dados.

http://www.datafilehost.com/download-996309b6.html

Alguém poderia dar uma avaliada no que estou fazendo? 
[ ]'s.

 
Edson Lira
Estatístico
Manaus-Amazonas___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão Logística

2012-10-23 Por tôpico Gilbert Queiroz
Edson,
A quantidade de dados não é pequena
Abs.





 De: Edson Lira edinhoes...@yahoo.com.br
Para: R-br Lista r-br@listas.c3sl.ufpr.br 
Enviadas: Terça-feira, 23 de Outubro de 2012 12:54
Assunto: [R-br] Regressão Logística
 

Estou usando as rotinas abaixo,

PARA LER OS DADOS

h-read.csv2(C:\\Consulta\\CIESA\\bd.csv)
h[h==]-NA
names(h)
table(h$quem_elab)
str(h)
h$tempo-2012-h$ano_ini
h$melh_orig-h$niv_melhora[drop=T]
h$niv_melhora-h$niv_melhora[drop=T]
h$bsc-h$bsc[drop=T]


levels(h$niv_melhora)
levels(h$niv_melhora)[levels(h$niv_melhora)%in% c(elevado,muito elevado)] 
- Melhora
levels(h$niv_melhora)[levels(h$niv_melhora)%in% c(nenhum,pouco,
intermediário)] - Sem melhora
#levels(h$niv_melhora)[levels(h$niv_melhora)%in% c(intermediário)] -

levels(h$quem_elab)
h$part-h$quem_elab
levels(h$part)[levels(h$part)%in% c(alta direção)]- Direção
levels(h$part)[levels(h$part)%in% c(alta direção\ngerentes,
alta direção\ngerentes\nfuncionários,alta 
direção\ngerentes\noutros,gerentes,
funcionários)] - Gerentes
table(h$part)




#PARA SELECIONAR SOMENTE AS VARIÁVEIS QUE PENSO USAR NO MODELO

nb-data.frame(melhora=h$melh_orig,bsc=h$bsc,champion=h$champion,ap_dir=h$apoio_bsc,
niv_tre=h$niv_treina,cons_ext=h$cext_bsc,reu_f_est=h$reu_func_estr,
com_est=h$comu_estr,ajuste=h$ajustes,ind_apr=h$ind_aprop,ind_desemp=h$ind_desd_dep,
mapa_est=h$mapa_estr,tempo=h$tempo)



levels(nb$melhora)
levels(nb$melhora)[levels(nb$melhora)%in% c(elevado,muito elevado)] - 1
levels(nb$melhora)[levels(nb$melhora)%in% c(nenhum,pouco,
intermediário)] - 0


nb$desemp-as.numeric(as.character(nb$melhora))




#PARA ELIMINAR OS NA'S


cd - subset(nb, subset=!is.na(desemp)  
 !is.na(bsc) !is.na(champion) !is.na(ap_dir) !is.na(niv_tre) 
!is.na(cons_ext) 
 !is.na(reu_f_est) !is.na(com_est) !is.na(ajuste) !is.na(ind_apr)
 !is.na(ind_desemp)
 !is.na(mapa_est) !is.na(tempo) !is.na(desemp)) 
 dim(cd)


#MODELO DE REGRESSÃO
glm3-glm(desemp~bsc+champion+ap_dir+niv_tre+cons_ext+reu_f_est+com_est+
ajuste+ind_apr+ind_desemp+mapa_est+tempo+desemp,family=binomial,data=cd)    

modelstep - step(glm3, direction = both)
logistic.display(modelstep) 
summary(modelstep)



Estou tentando aplicar uma regressão logística,  quero estimar um modelo aonde 
a variável resposta é o desempenho de determinada empresa, aonde tenho os 
níveis melhora=1, sem melhora=0 com outras variáveis. No link abaixo tem uma 
amostra do banco de dados.

http://www.datafilehost.com/download-996309b6.html

Alguém poderia dar uma avaliada no que estou fazendo? 
[ ]'s.

 
Edson Lira
Estatístico
Manaus-Amazonas
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão Gama

2012-08-20 Por tôpico Luiz Henrique da Conceicao Leal
Muito obrigado.
Abraços
Luiz

Em 15 de agosto de 2012 13:31, Walmes Zeviani walmeszevi...@gmail.comescreveu:

 Além da sugestão do Ivan, como trata-se de um GLM, recomendo a leitura
 dessa matéria


 http://freakonometrics.blog.free.fr/index.php?post/2011/11/01/Fisher,-delta-method-and-confidence-interval

 À disposição.
 Walmes.

 ==
 Walmes Marques Zeviani
 LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
 Departamento de Estatística - Universidade Federal do Paraná
 fone: (+55) 41 3361 3573
 VoIP: (3361 3600) 1053 1173
 e-mail: wal...@ufpr.br
 twitter: @walmeszeviani
 homepage: http://www.leg.ufpr.br/~walmes
 linux user number: 531218
 ==

 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

[R-br] Regressão Gama

2012-08-15 Por tôpico Luiz Henrique da Conceicao Leal
Bom dia pessoal

Construi um regressão gama e gostaria de construir um intervalo de
confiança (no gráfico) para reta estimada. Alguém tem alguma sugestão?

modelo=glm(y~x,family=Gamma(link = identity))
plot(x,y,pch=20)
abline(modelo,col=blue,lwd=2)

Desde já agradeço
Luiz Henrique Leal
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão Gama

2012-08-15 Por tôpico Ivan Bezerra Allaman
Neste site existem n gráficos com intervalos de confiança. Provavelmente seja 
possível adaptar para o seu caso.

http://ridiculas.wordpress.com/

 

\begin{signature}
=
Prof. Dr. Ivan Bezerra Allaman
Universidade Estadual de Santa Cruz
Departamento de Ciências Exatas e Tecnológicas
Ilhéus/BA - Brasil
Fone: +55 73 3680-5596
E-mail: ivanala...@yahoo.com.br/ivanala...@gmail.com
@
\end{signature}___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão Gama

2012-08-15 Por tôpico Walmes Zeviani
Além da sugestão do Ivan, como trata-se de um GLM, recomendo a leitura
dessa matéria

http://freakonometrics.blog.free.fr/index.php?post/2011/11/01/Fisher,-delta-method-and-confidence-interval

À disposição.
Walmes.

==
Walmes Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573
VoIP: (3361 3600) 1053 1173
e-mail: wal...@ufpr.br
twitter: @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmes
linux user number: 531218
==
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão

2012-08-13 Por tôpico Edson Lira
Dê uma olhada nestes sistes.

http://www.leg.ufpr.br/doku.php/ridiculas

http://cran.r-project.org/doc/contrib/Faraway-PRA.pdf

 
Edson Lira
Estatístico
Manaus-Amazonas



 De: kaue veras kaueve...@gmail.com
Para: r-br@listas.c3sl.ufpr.br 
Enviadas: Quinta-feira, 9 de Agosto de 2012 8:57
Assunto: [R-br] Regressão
 

Bom dia caros colegas,
 
Poderiam me dar uma ajuda? Eu gostaria de realizar dois tipos de regressões, 
linear e múltipla, podem me orientar como posso realiza-las? Através de algum 
pacote ou função? Acredito que não seja muito complicado, até já realizei uma 
vez, mas não estou me lembrando como fiz.
 
Desde já agradeço.
 
Atenciosamente,

Kauê P. Veras da Cunha
Estatística / 8º Período - UERJ

MSN: kaueve...@hotmail.com
E-mail: kaueve...@gmail.com
Cel: 8254-9601

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão

2012-08-09 Por tôpico Walmes Zeviani
Kaue,

http://zoonek2.free.fr/UNIX/48_R/09.html

À disposição.
Walmes.

==
Walmes Marques Zeviani
LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
Departamento de Estatística - Universidade Federal do Paraná
fone: (+55) 41 3361 3573
VoIP: (3361 3600) 1053 1173
e-mail: wal...@ufpr.br
twitter: @walmeszeviani
homepage: http://www.leg.ufpr.br/~walmes
linux user number: 531218
==
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] Regressão

2012-08-09 Por tôpico kaue veras
Muito obrigado Walmes, muito útil.

Att,

Kauê P. Veras da Cunha
Estatística / 8º Período - UERJ
 MSN: kaueve...@hotmail.com
E-mail: kaueve...@gmail.com
Cel: 8254-9601

2012/8/9 Walmes Zeviani walmeszevi...@gmail.com

 Kaue,

 http://zoonek2.free.fr/UNIX/48_R/09.html

 À disposição.
 Walmes.

 ==
 Walmes Marques Zeviani
 LEG (Laboratório de Estatística e Geoinformação, 25.450418 S, 49.231759 W)
 Departamento de Estatística - Universidade Federal do Paraná
 fone: (+55) 41 3361 3573
 VoIP: (3361 3600) 1053 1173
 e-mail: wal...@ufpr.br
 twitter: @walmeszeviani
 homepage: http://www.leg.ufpr.br/~walmes
 linux user number: 531218
 ==

 ___
 R-br mailing list
 R-br@listas.c3sl.ufpr.br
 https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
 Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
 código mínimo reproduzível.

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] regressão polinomial

2012-07-26 Por tôpico Paulo Justiniano

se direitae esquerda se referem a residuaos posotivos e negativos
use os residuos do modelo ajustado

resid(OBJ do Modelo)



On Wed, 25 Jul 2012, Tito Conte wrote:



Paulo agora outra dúvida, tenho dez mil pontos, como comparar os que estão a 
direita e a esquerda dessa curva (como se fosse um dentro ou fora do
sistema), já que não consigo extrair o coeficiente de da função poly? Necessito 
dos dados numericamente pois estes pontos serão submetidos a novos
tratamentos posteriormente
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] regressão polinomial

2012-07-26 Por tôpico Paulo Justiniano

Voce parece estar complicando o fácil.
A sua logica de comparar o dado com o ajustao aplicando a equacao caso a 
caso pode ser alterada por algo mais simples


O objheto com modelo retorna residuos, valores preditos me portanto voce 
pode obter isto diretamente bastando tomar os residuos que sao positivos 
ou negativos.


alem disto o loop for é desnecessário

resid(r) ## mostra residuos

ifelse(resid(r)  0, fora, dentro)



On Wed, 25 Jul 2012, Tito Conte wrote:


Walmes vou criar um exemplo para facilitar o entendimento
o que eu preciso é comparar pontos amostrados com os resultados de um modelo de 
interpolação polinomial

por exemplo

#minhas amostras
y=seq(1:9)
x=seq(3:11)

#pontos do modelo
xm=seq(2,11)
ym=seq(0:8)

#tirando os valores do modelo da reta
r=lm(ym~poly(xm,1))

#extraindo coeficientes
a=r$coefficients[1]
b=r$coefficients[0]

validacao=vector()
#comparando cada ponto obtido pelo modelo ajustado com a amostra
for(i in c(1:length(y)){
# calculando valor do modelo
m=a*x[i]+b 
# comparando modelo com amostra
ifelse(my[i],a='fora',a='dentro')
validacao[i]=a
}

 é algo deste estilo porém com um polinomio de grau elevado, Quando ploto os 
resultados eles estão bonitos, mas quando calculo ele como o método
abaixo os valores extrapolam muito da realidade e não entendo o porque, veja o  
exemplo aqui



y=c(-26.,-25.9862,-25.9343,-25.8822,-25.8433,-25.8054,-25.7948,-25.7872,-25.7668,-25.7284,-25.7015,-25.6282,-25.4612,-25.3016,-25.

2564,-25.2412,-25.2412,-25.2232,-25.0869,-25.,-25.,-24.9856,-24.9397,-24.8976,-24.8533,-24.6587,-24.6373,-24.5740,-24.5406,-24

.4379,-24.3934,-24.3628,-24.3277,-24.3042,-24.2972,-24.2973,-24.3020,-24.3068,-24.3068,-24.2956,-24.2920)

 

x=c(-45.8529,-45.8302,-45.7575,-45.6680,-45.6107,-45.5050,-45.4574,-45.4058,-45.3538,-45.2913,-45.2634,-45.2264,-45.1667,-45.0719,-45.

0213,-45.,-45.,-44.9748,-44.8726,-44.8405,-44.8405,-44.8351,-44.8259,-44.7972,-44.7764,-44.6867,-44.6674,-44.5912,-44.5587,-44

.4927,-44.4515,-44.4115,-44.3314,-44.2664,-44.2171,-44.1729,-44.1288,-44.0820,-44.0509,-44.0118,-44.)
  


r=lm(y~poly(x,5)) 

b0=r$coefficient[1]
b1=r$coefficient[2]
b2=r$coefficient[3]
b3=r$coefficient[4]
b4=r$coefficient[5]
b5=r$coefficient[6]

modelo=b0+b1*x+b2*x^2+b3*x^3+b4*x^4+b5*x^5

modelo

veja que os resultados estão muito fora. mas deveriam ser os mesmos, como 
proceder?

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] regressão polinomial

2012-07-26 Por tôpico Tito Conte
Paulo mas o polinomio corresponde a uma borda por isso dentro fora

o trabalho que estou realizando corresponde a saber se as partículas
jogadas ao acaso em uma determinada área ultrapassam ou não as bordas. Os
dados que passei para vocês corresponde a uma dessas bordas,  Porém os
dados não são responsáveis pela construção de nenhuma dessas bordas
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] regressão polinomial

2012-07-26 Por tôpico Tito Conte
Paulo e Walmes,

encontrei a seguinte forma para resolver o problema, gostaria que dessem
uma olhada

#dados do limite da borda direitra
y=c(-26.,-25.9862,-25.9343,-25.8822,-25.8433,-25.8054,-25.7948,-25.7872,-25.7668,-25.7284,-25.7015,-25.6282,-25.4612,-25.3016,-25.2564,-25.2412,-25.2412,-25.2232,-25.0869,-25.,-25.,-24.9856,-24.9397,-24.8976,-24.8533,-24.6587,-24.6373,-24.5740,-24.5406,-24.4379,-24.3934,-24.3628,-24.3277,-24.3042,-24.2972,-24.2973,-24.3020,-24.3068,-24.3068,-24.2956,-24.2920)
x=c(-45.8529,-45.8302,-45.7575,-45.6680,-45.6107,-45.5050,-45.4574,-45.4058,-45.3538,-45.2913,-45.2634,-45.2264,-45.1667,-45.0719,-45.0213,-45.,-45.,-44.9748,-44.8726,-44.8405,-44.8405,-44.8351,-44.8259,-44.7972,-44.7764,-44.6867,-44.6674,-44.5912,-44.5587,-44.4927,-44.4515,-44.4115,-44.3314,-44.2664,-44.2171,-44.1729,-44.1288,-44.0820,-44.0509,-44.0118,-44.)

# partícula 1
amostra=c(x=-45.3,y=-25.111)

# inserir dados das amostras no limite
x[length(x)+1]=amostra['x']
y[length(y)+1]=amostra['y']

#criar polinomio
m=lm(y~poly(x,3))

xpred - data.frame(x = seq(min(x), max(x), len=250))

#plotar dados
plot(y,x)
lines(xpred$x, predict(m, newdata=xpred))

if(abs(resid(m[length(m)]))0.1 or  resid(m[length(m)]))0 )
i='dentro'
else i='fora'
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] regressão polinomial

2012-07-25 Por tôpico Paulo Justiniano

Sem testar código segue um comentário genérico:

Estes polinomios de alto grau podem gerar variáveis de valores muito 
elevados e com isto instabiliades numéricas nos calculos matriciais


tente usar polinomios ortonormalizados fazendo:
y ~ poly(x, 5)

Os coeficientes serão diferentes mas preicoes serão as mesmas

On Tue, 24 Jul 2012, Tito Conte wrote:





Segue o código 
# pontos

y=c(-26.,-25.9862,-25.9343,-25.8822,-25.8433,-25.8054,-25.7948,-25.7872,-25.7668,-25.7284,-25.7015,-25.6282,-25.4612,-25.3016,-25.

2564,-25.2412,-25.2412,-25.2232,-25.0869,-25.,-25.,-24.9856,-24.9397,-24.8976,-24.8533,-24.6587,-24.6373,-24.5740,-24.5406,-24

.4379,-24.3934,-24.3628,-24.3277,-24.3042,-24.2972,-24.2973,-24.3020,-24.3068,-24.3068,-24.2956,-24.2920)

 

x=c(-45.8529,-45.8302,-45.7575,-45.6680,-45.6107,-45.5050,-45.4574,-45.4058,-45.3538,-45.2913,-45.2634,-45.2264,-45.1667,-45.0719,-45.

0213,-45.,-45.,-44.9748,-44.8726,-44.8405,-44.8405,-44.8351,-44.8259,-44.7972,-44.7764,-44.6867,-44.6674,-44.5912,-44.5587,-44

.4927,-44.4515,-44.4115,-44.3314,-44.2664,-44.2171,-44.1729,-44.1288,-44.0820,-44.0509,-44.0118,-44.)
  


# regressão polinomial 
m=lm(y~x+I(x^2)+I(x^3)+I(x^4)+I(x^5)) # criar polinomio de ordem 5

# extraindo os coeficientes
b0=coefficient(m)[1]
b1=coefficient(m)[2]
b2=coefficient(m)[3]
b3=coefficient(m)[4]
b4=coefficient(m)[5]
b5=coefficient(m)[6]

# recalculando
m_teste=b0+b1*x+b2*x^2+b3*x^3+b4*x^4+b5*x^5



A idéia seria que os pontos de m_teste dessem semelhantes a y mas isso não 
acontece

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] regressão polinomial

2012-07-25 Por tôpico Paulo Justiniano

O problema que voce relata é pq
o polinomio nao foi ajustado com x, x^2 ... x^5 e sim pelo geado pelo 
poly()
POnrtanto seus coneficientes nao sao compatívies com as potencias de x na 
forma bruta


Obtenbha os falores ajustados por
fitted(r)
e prediçoes em outros pontos usando predict()



para fazer a predicão



On Wed, 25 Jul 2012, Tito Conte wrote:


  as dicas foram uteis e muito obrigado, muito embora quando eu dou o 
comando


r=lm(y~poly(x,5)) 

e depois dou a equação pelos coeficientes

b0=r$coefficient[1]
b1=r$coefficient[2]
b2=r$coefficient[3]
b3=r$coefficient[4]
b4=r$coefficient[5]
b5=r$coefficient[6]

m_teste=b0+b1*x+b2*x^2+b3*x^3+b4*x^4+b5*x^5

o m_teste extrapola de novo

será que estou extraindo os coeficientes de forma correta?
e aplicando a equação de forma correta?

vocês podem me dar outra luz?

obrigado

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] regressão polinomial

2012-07-25 Por tôpico Paulo Justiniano

Tito

seu exemplo ilustra um o problema numérico
que pode ocorrer em ajustes.
O perigo é que o resultado é prouzido e se não avaliao o erro pode passar 
desapercebido e a curva de ajuste erraa pode acabar sendo usada.


Veja o efeito no gráfico.
Teoricamente os ajustes deveriam ser iguais, entretanto
numericamente não são.

m=lm(y~x+I(x^2)+I(x^3)+I(x^4)+I(x^5)) # criar polinomio de ordem 5
coef(m)

m1 - lm(y ~ poly(x, 5)) ## polinomio e ordem 5 com variáveis ortonormalizadas
coef(m1)

xpred - data.frame(x = seq(min(x), max(x), len=200))

plot(x, y)
lines(xpred$x, predict(m, newdata=xpred)) ## ajuste/predicao com erro numérico
lines(xpred$x, predict(m1, newdata=xpred), col=2)  ## adequado




On Tue, 24 Jul 2012, Tito Conte wrote:





Segue o código 
# pontos

y=c(-26.,-25.9862,-25.9343,-25.8822,-25.8433,-25.8054,-25.7948,-25.7872,-25.7668,-25.7284,-25.7015,-25.6282,-25.4612,-25.3016,-25.

2564,-25.2412,-25.2412,-25.2232,-25.0869,-25.,-25.,-24.9856,-24.9397,-24.8976,-24.8533,-24.6587,-24.6373,-24.5740,-24.5406,-24

.4379,-24.3934,-24.3628,-24.3277,-24.3042,-24.2972,-24.2973,-24.3020,-24.3068,-24.3068,-24.2956,-24.2920)

 

x=c(-45.8529,-45.8302,-45.7575,-45.6680,-45.6107,-45.5050,-45.4574,-45.4058,-45.3538,-45.2913,-45.2634,-45.2264,-45.1667,-45.0719,-45.

0213,-45.,-45.,-44.9748,-44.8726,-44.8405,-44.8405,-44.8351,-44.8259,-44.7972,-44.7764,-44.6867,-44.6674,-44.5912,-44.5587,-44

.4927,-44.4515,-44.4115,-44.3314,-44.2664,-44.2171,-44.1729,-44.1288,-44.0820,-44.0509,-44.0118,-44.)
  


# regressão polinomial 
m=lm(y~x+I(x^2)+I(x^3)+I(x^4)+I(x^5)) # criar polinomio de ordem 5

# extraindo os coeficientes
b0=coefficient(m)[1]
b1=coefficient(m)[2]
b2=coefficient(m)[3]
b3=coefficient(m)[4]
b4=coefficient(m)[5]
b5=coefficient(m)[6]

# recalculando
m_teste=b0+b1*x+b2*x^2+b3*x^3+b4*x^4+b5*x^5



A idéia seria que os pontos de m_teste dessem semelhantes a y mas isso não 
acontece

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Re: [R-br] regressão polinomial

2012-07-25 Por tôpico Tito Conte


 Paulo agora outra dúvida, tenho dez mil pontos, como comparar os que estão
a direita e a esquerda dessa curva (como se fosse um dentro ou fora do
sistema), já que não consigo extrair o coeficiente de da função poly?
Necessito dos dados numericamente pois estes pontos serão submetidos a
novos tratamentos posteriormente
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

  1   2   >