Caros,
Gostaria de contribuir com 'alguns centavos' genericos.
1.a) A estimacao de parametros baseada em variograma (V) e' extremamente
dependente do variograma (ja pontuado aqui que apenas 6 pontos pode nao
ser razoavel). Esta abordagem e' chamada (por alguns poucos) de metodo
dos momentos (http://www.jstor.org/stable/1400419)
1.b) abordagem de V comparada com a abordagem baseada em modelos (por
exemplo maxima verosimilhanca ML) e' equivalente a ajustar uma
distribuicao a um histograma em vez de ajusta-la aos dados propriamente
dito. Exemplo: estimar a media de uma distribuicao normal
n = 30
x = rnorm(n)
h = hist(x, plot=FALSE)
c(v=sum(h$mids * h$counts/n), ml=mean(x))
1.c) Considerando 1.a) e 1.b), a escolha da abordagem a ser usada para
estimar os parametros e' dependente da preferencia filosofica. Prefiro V
ou assumir uma distribuicao aos dados?
2.a) Ja foi comentado sobre a distancia minima de 10m. Se 10m e'
relativamente grande em relacao ao alcance, isso e' ruim.
2.b) Observando o 'design' dos pontos nota-se que e' um grid
(extremamente regular). Me parece que o melhor design seria uma mescla
entre regular (para cobrir bem toda a area) e aleatorio (para se ter um
bom rol de distancias).
3.a) Geralmente caimos num dilema quando temos varias medidas de
ajuste... No caso de geoestatistica, temos dois objetivos: O primeiro e'
descrever o processo (qual funcao de correlacao, parametros). O segundo
e' fazer predicao. Se o foco e' descricao, considere medidas baseadas no
ajuste do modelo aos dados, AIC, por exemplo (para alguns e' dificil
entender porque o tal BIC tem esse nome visto que nenhuma analise
Bayesiana foi feita). Se foco e' predicao, esqueca considere medidas
baseadas em predicao.
aT+,
Elias.
On 15/05/14 13:24, Hélio Gallo Rocha wrote:
Caros Hélder e Éder.
Vou dar minha opinião, mas como o Éder, é para tentar ajudar.
Como o Éder comentou no item (6), seis pontos parece ser uma
quantidade pequena e como a distância minima é de 10 m, então teria de
aumentar a distância máxima para uns 80%, teria de testar.
Hélder, vc. selecionou o modelo gaussiano por ML como o melhor, mas
foi o que apresentou o mais alto valor de AIC. Se for seguir este
indicativo, este seria o pior modelo.
Pelo que andei lendo, a seleção do modelo seria pela observação do
mapa da variância da krigagem. O que apresenta a menor variância é o
selecionado.
Observando a escala dos dois mapas da variância, o ajustado por OLS
apresenta valores inferiores indicando menor variância, o que seria,
melhor ajuste, mas como disse antes, o modelo gaussiano ajustado por
ML, analisando pelo AIC, é o pior.
Abraço
Hélio
Em 14 de maio de 2014 16:39, Hélder [via R-br]
<[email protected]
<mailto:[email protected]>> escreveu:
Gostaria de tirar algumas dúvidas, desde já peço desculpas se
cometi algum deslize, tenho tentado evoluir na utilização do R me
baseando apenas em tutoriais, e nas orientações que recebo aqui do
grupo.
A validação cruzada no pacote Geo R nos fornece como resultado: o
Erro Médio (EM), Erro Médio Reduzido (ER), Desvio padrão do erro
médio (SEM), Desvio padrão do erro reduzido (SER) e obtenho por
cálculo o Erro Absoluto (EA), também consigo o AIC e BIC nos
modelos por Máxima Verossimilhança, quando do ajuste do modelo.
1) Todos estes parâmetros possuem igual nível de importância na
análise, ou algum deles tem peso maior?
2) Estou analisando cada um dos parâmetros e o modelo que "vence"
na maior parte deles admito que é o melhor modelo, esta forma de
analisar está correta?
3) Analisando-se o melhor modelo (escolhido como na pergunta 2)
com o Gráfico do Semivariograma Teórico ajustado, nem sempre este
parece que é o melhor modelo ajustado, nestes casos, deve
prevalecer a análise da validação cruzada ou a visual?
4) Comparando os resultados da krigagem do modelo escolhido pela
Validação Cruzada com o obtido pela análise visual, a krigagem
utilizando como modelo o semivariograma "melhor" visualmente
parece representar adequadamente o variação do fenômeno na área,
nestes casos o que vocês sugerem?
5) Em alguns casos a Validação cruzada retornou como resultado NAN
e INF, trata-se de algum problema com os dados?
Caso concreto:
A tabela abaixo traz os resultados da validação cruzada da
variável condutividade hidráulica Ks, por dois métodos (Mínimos
Quadrados e Máxima Verossimilhança), pela interpretação dos
resultados, o modelo Gaussiano por Máxima Verossimilhança seria o
melhor modelo a meu ver.
*Variável* *Método* *Modelo* *EM* *ER* *Sem* *Ser*
*EA*
*AIC* *BIC*
*
* OLS Esférico -1,27E-16 -6,42E-16 0,19729
*1,01442* 6,51815
OLS Exponencial *-0,00132* *-0,00346* *0,17911*
0,95090
5,99872
OLS Gaussiano -0,00097 -0,00259 0,18444
0,98982 *5,87635*
*Ks* ML Esférico -5,18E-16 -2,69E-015 0,19729
1,02439
6,51815 -12,18 -5,233
*
* ML Exponencial -0,00118 -0,00327 0,18002
1,01035
5,91153 -15,24 -8,29
ML Gaussiano *-0,00134* *-0,00372* 0,17934
*1,00992*
5,89874 *-15,35* *-8,4*
Seguem abaixo os Semivariogramas Teóricos Ajustados pelos dois
métodos, o da esquerda é por OLS e o da direita é por ML, o modelo
Gaussiano está em verde, analisando visualmente achei que o Modelo
Gaussiano por OLS está melhor ajustado:
Nas figuras abaixo estão os resultados da krigagem comparando os
dois modelos, o primeiro Gaussiano por OLS:
O segundo Gaussiano por ML:
Desde já agradeço a toda ajuda,
/*Hélder Gramacho */
Recife-PE / /
/[hidden email]
<http://user/SendEmail.jtp?type=node&node=4662125&i=0>/
/
_______________________________________________
R-br mailing list
[hidden email] <http://user/SendEmail.jtp?type=node&node=4662125&i=1>
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e
forneça código mínimo reproduzível.
------------------------------------------------------------------------
If you reply to this email, your message will be added to the
discussion below:
http://r-br.2285057.n4.nabble.com/R-br-Validacao-Cruzada-e-Krigagem-tp4662125.html
To unsubscribe from R-br, click here
<http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=unsubscribe_by_code&node=3357982&code=aGVsaW9nYWxsb3JvY2hhQGdtYWlsLmNvbXwzMzU3OTgyfC0xMzQ3NTkwMDY4>.
NAML
<http://r-br.2285057.n4.nabble.com/template/NamlServlet.jtp?macro=macro_viewer&id=instant_html%21nabble%3Aemail.naml&base=nabble.naml.namespaces.BasicNamespace-nabble.view.web.template.NabbleNamespace-nabble.view.web.template.NodeNamespace&breadcrumbs=notify_subscribers%21nabble%3Aemail.naml-instant_emails%21nabble%3Aemail.naml-send_instant_email%21nabble%3Aemail.naml>
--
Hélio Gallo Rocha
IFSULDEMINAS - Câmpus Muzambinho
_______________________________________________
R-br mailing list
[email protected]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
mínimo reproduzível.
_______________________________________________
R-br mailing list
[email protected]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código
mínimo reproduzível.