Caros,

Gostaria de contribuir com 'alguns centavos' genericos.

1.a) A estimacao de parametros baseada em variograma (V) e' extremamente dependente do variograma (ja pontuado aqui que apenas 6 pontos pode nao ser razoavel). Esta abordagem e' chamada (por alguns poucos) de metodo dos momentos (http://www.jstor.org/stable/1400419)

1.b) abordagem de V comparada com a abordagem baseada em modelos (por exemplo maxima verosimilhanca ML) e' equivalente a ajustar uma distribuicao a um histograma em vez de ajusta-la aos dados propriamente dito. Exemplo: estimar a media de uma distribuicao normal
  n = 30
  x = rnorm(n)
  h = hist(x, plot=FALSE)
  c(v=sum(h$mids * h$counts/n), ml=mean(x))

1.c) Considerando 1.a) e 1.b), a escolha da abordagem a ser usada para estimar os parametros e' dependente da preferencia filosofica. Prefiro V ou assumir uma distribuicao aos dados?

2.a) Ja foi comentado sobre a distancia minima de 10m. Se 10m e' relativamente grande em relacao ao alcance, isso e' ruim.

2.b) Observando o 'design' dos pontos nota-se que e' um grid (extremamente regular). Me parece que o melhor design seria uma mescla entre regular (para cobrir bem toda a area) e aleatorio (para se ter um bom rol de distancias).

3.a) Geralmente caimos num dilema quando temos varias medidas de ajuste... No caso de geoestatistica, temos dois objetivos: O primeiro e' descrever o processo (qual funcao de correlacao, parametros). O segundo e' fazer predicao. Se o foco e' descricao, considere medidas baseadas no ajuste do modelo aos dados, AIC, por exemplo (para alguns e' dificil entender porque o tal BIC tem esse nome visto que nenhuma analise Bayesiana foi feita). Se foco e' predicao, esqueca considere medidas baseadas em predicao.

aT+,
Elias.

On 15/05/14 13:24, Hélio Gallo Rocha wrote:
Caros Hélder e Éder.

Vou dar minha opinião, mas como o Éder, é para tentar ajudar.

Como o Éder comentou no item (6), seis pontos parece ser uma quantidade pequena e como a distância minima é de 10 m, então teria de aumentar a distância máxima para uns 80%, teria de testar.

Hélder, vc. selecionou o modelo gaussiano por ML como o melhor, mas foi o que apresentou o mais alto valor de AIC. Se for seguir este indicativo, este seria o pior modelo.

Pelo que andei lendo, a seleção do modelo seria pela observação do mapa da variância da krigagem. O que apresenta a menor variância é o selecionado.

Observando a escala dos dois mapas da variância, o ajustado por OLS apresenta valores inferiores indicando menor variância, o que seria, melhor ajuste, mas como disse antes, o modelo gaussiano ajustado por ML, analisando pelo AIC, é o pior.

Abraço

Hélio


Em 14 de maio de 2014 16:39, Hélder [via R-br] <[email protected] <mailto:[email protected]>> escreveu:

    Gostaria de tirar algumas dúvidas, desde já peço desculpas se
    cometi algum deslize, tenho tentado evoluir na utilização do R me
    baseando apenas em tutoriais, e nas orientações que recebo aqui do
    grupo.

    A validação cruzada no pacote Geo R nos fornece como resultado: o
    Erro Médio (EM), Erro Médio Reduzido (ER), Desvio padrão do erro
    médio (SEM), Desvio padrão do erro reduzido (SER) e obtenho por
    cálculo o Erro Absoluto (EA), também consigo o AIC e BIC nos
    modelos por Máxima Verossimilhança, quando do ajuste do modelo.

    1) Todos estes parâmetros possuem igual nível de importância na
    análise, ou algum deles tem peso maior?
    2) Estou analisando cada um dos parâmetros e o modelo que "vence"
    na maior parte deles admito que é o melhor modelo, esta forma de
    analisar está correta?
    3) Analisando-se o melhor modelo (escolhido como na pergunta 2)
    com o Gráfico do Semivariograma Teórico ajustado, nem sempre este
    parece que é o melhor modelo ajustado, nestes casos, deve
    prevalecer a análise da validação cruzada ou a visual?
    4) Comparando os resultados da krigagem do modelo escolhido pela
    Validação Cruzada com o obtido pela análise visual, a krigagem
    utilizando como modelo o semivariograma "melhor" visualmente
    parece representar adequadamente o variação do fenômeno na área,
    nestes casos o que vocês sugerem?
    5) Em alguns casos a Validação cruzada retornou como resultado NAN
    e INF, trata-se de algum problema com os dados?

    Caso concreto:

    A tabela abaixo traz os resultados da validação cruzada da
    variável condutividade hidráulica Ks, por dois métodos (Mínimos
    Quadrados e Máxima Verossimilhança),  pela interpretação dos
    resultados, o modelo Gaussiano por Máxima Verossimilhança seria o
    melhor modelo a meu ver.

        
        
        
        
        
        
        
        
        
    *Variável*  *Método*        *Modelo*        *EM*    *ER*    *Sem*   *Ser*   
*EA*
    *AIC*       *BIC*
    *
    *   OLS     Esférico        -1,27E-16       -6,42E-16       0,19729         
*1,01442*       6,51815         
        

        OLS     Exponencial     *-0,00132*      *-0,00346*      *0,17911*       
0,95090
    5,99872     
        

        OLS     Gaussiano       -0,00097        -0,00259        0,18444         
0,98982         *5,87635*       
        
    *Ks*        ML      Esférico        -5,18E-16       -2,69E-015      0,19729 
        1,02439
    6,51815     -12,18  -5,233
    *
    *   ML      Exponencial     -0,00118        -0,00327        0,18002         
1,01035
    5,91153     -15,24  -8,29

        ML      Gaussiano       *-0,00134*      *-0,00372*      0,17934         
*1,00992*
    5,89874     *-15,35*        *-8,4*

        
        
        
        
        
        
        
        
        

    Seguem abaixo os Semivariogramas Teóricos Ajustados pelos dois
    métodos, o da esquerda é por OLS e o da direita é por ML, o modelo
    Gaussiano está em verde, analisando visualmente achei que o Modelo
    Gaussiano por OLS está melhor ajustado:
    Nas figuras abaixo estão os resultados da krigagem comparando os
    dois modelos, o primeiro Gaussiano por OLS:

    O segundo Gaussiano por ML:

    Desde já agradeço a toda ajuda,

    /*Hélder Gramacho */
    Recife-PE / /
    /[hidden email]
    <http://user/SendEmail.jtp?type=node&node=4662125&i=0>/
    /


    _______________________________________________
    R-br mailing list
    [hidden email] <http://user/SendEmail.jtp?type=node&node=4662125&i=1>
    https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
    Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
    forneça código mínimo reproduzível.

    ------------------------------------------------------------------------
    If you reply to this email, your message will be added to the
    discussion below:
    
http://r-br.2285057.n4.nabble.com/R-br-Validacao-Cruzada-e-Krigagem-tp4662125.html

    To unsubscribe from R-br, click here
    
<http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=unsubscribe_by_code&node=3357982&code=aGVsaW9nYWxsb3JvY2hhQGdtYWlsLmNvbXwzMzU3OTgyfC0xMzQ3NTkwMDY4>.
    NAML
    
<http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=macro_viewer&id=instant_html%21nabble%3Aemail.naml&base=nabble.naml.namespaces.BasicNamespace-nabble.view.web.template.NabbleNamespace-nabble.view.web.template.NodeNamespace&breadcrumbs=notify_subscribers%21nabble%3Aemail.naml-instant_emails%21nabble%3Aemail.naml-send_instant_email%21nabble%3Aemail.naml>





--
Hélio Gallo Rocha
IFSULDEMINAS - Câmpus Muzambinho


_______________________________________________
R-br mailing list
[email protected]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

_______________________________________________
R-br mailing list
[email protected]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Responder a