Modelagem Geoestatística do Ambiente

Descrição Geral

Esse curso irá lhe expor a um conjunto de técnicas modernas para a modelagem de variáveis ambientais incertas. Ele também irá apresentá-lo a referências bibliográficas chave e ao processo inovador de aprendizagem/autoavaliação baseado na continuada reflexão sobre o conhecimento visitado e reconstrução do conhecimento próprio. Embora esse curso o introduzirá à uma série de ferramentas de análise de dados e desenvolvimento integrado, sistemas de gerenciamento de código fonte, aos fundamentos da programação letrada, e às plataformas de divulgação científica, o seu alicerce é a geoestatística: em resumo, estatística aplicada a dados com localização conhecida, sobre a qual será esperado que você demonstre maior domínio a cada tarefa cumprida.

Nós abordaremos muitos tópicos, dentre eles a caracterização dos dados espaciais e ferramentas para sua análise, o estudo de modelos clássicos e modernos de explicação da variação espacial, a descrição de técnicas robustas para estimativa de parâmetros e predição espacial, e a demonstração de procedimentos para avaliação de modelos geoestatísticos. Contudo, na maior parte do tempo, nós estaremos nos preparando para finalmente elaborar um delineamento experiental baseado em simulações geoestatísticas para um estudo de propagação de incerteza que será aplicado ao problema de pesquisa do seu projeto de mestrado/doutorado.

Identificação do Curso

Instituição: Universidade Federal de Santa Maria
Unidade: Programa de Pós-Graduação em Ciência do Solo
Código: SOL 843 (Tópicos em Ciência do Solo)
Créditos: 3 (2 - 1)
Carga horária: 45 horas
Nível: Mestrado/Doutorado
Instrutor: Alessandro Samuel-Rosa

Calendário de Encontros

Período: Primavera 2017
Horário: Quartas-feiras, 9:00-11:30/13:30-17:00
Local: Prédio 42, Sala 3302

Calendário resumido dos encontros. Veja o cronograma semanal para maiores detalhes sobre as atividades planejadas para cada encontro.
ID Data Carga Horária Tema
Semana 0 27-Setembro (não contabilizada) Nivelamento ferramental
Semana 1 04-Outubro 6 horas Variação espacial
Semana 2 11-Outubro 6 horas Propriedades dos dados espaciais
Semana 3 18-Outubro 6 horas Modelo linear misto de variação espacial
Semana 4 25-Outubro 6 horas Predição espacial e validação estatística
Semana 5 01-Novembro 6 horas Simulação espacial e propagação de incerteza
Semana 6 06-Dezembro 3 horas Conclusão do curso

Objetivos do Curso

Após a conclusão desse curso, você:

  • Conhecerá as propriedades dos dados espaciais e dos modelos geoestatísticos usados para descrever a estrutura da variação espacial e fazer predições espaciais.
  • Será capaz de usar modelos geoestatísticos para o estudo da propagação de erros em modelos que são alimentados com dados espaciais.

Estrutura do Curso

O curso será dividido em três partes. A primeira parte, de caráter teórico-prático, será conduzida de modo parcialmente concentrado, tendo duração de um mês e encontros semanais. Cada encontro semanal ocorrerá em dia único e terá duração de seis horas. Os encontros serão conduzidos pelo instrutor, que fará exposições acerca do conteúdo planejado usando como ferramentas quadro branco, projetor de multimídia e o livro digital Pedometria Feita Simples. Os participantes do curso farão leituras dirigidas antes de cada encontro. (Você terá que ler, pelo menos, dois-três artigos para cada aula) As leituras dirigidas servirão de base para as discussões a serem incitadas pelo instrutor durante o encontros e para desenvolver a primeira das duas tarefas obrigatórias do curso. Adicionalmente, serão desenvolvidas atividades práticas de resolução de exercícios durante os encontros, para as quais os participantes utilizarão o ambiente R de análise de dados em seus computadores pessoais.

A segunda parte do curso terá duração de um mês e será dedicada ao desenvolvimento da segunda tarefa obrigatória do curso. Essa tarefa será de aplicação dos conhecimentos visitados durante a primeira parte do curso. As atividades serão realizadas em modo não-presencial, sendo os participantes responsáveis pelos dados e infraestrutura computacional utilizados. Quaisquer dúvidas serão sanadas em reuniões presenciais individuais que serão agendadas conforme a disponibilidade do instrutor.

A terceira e última parte do curso será conduzida em modo presencial. Ela será dedicada à conclusão do curso, quando os resultados da segunda tarefa obrigatória do curso serão apresentados e discutidos pelos participantes.

Tarefas

O curso envolverá duas tarefas obrigatórias desenvolvidas em sequência. A primeira, de cunho mais teórico/reflexivo, abrangerá a primeira parte do curso. Já a segunda tarefa, de caráter mais prático/objetivo, será desenvolvida na segunda parte do curso.

Reflexão Iterativa

Descrição da Tarefa

Prazo: 03-Outubro, 10-Outubro, 17-Outubro, 24-Outubro, 31-Outubro

A tarefa de reflexão iterativa, guiada pelo tema gerador descrito abaixo e pelas leituras dirigidas, será realizada durante todas as cinco semanas que antecedem os encontros planejados para cada uma das cinco unidades descritas no programa do curso. O produto dessa reflexão será apresentado na forma de texto dissertativo publicado na plataforma Authorea até o dia anterior à cada encontro do curso. (Nós trataremos sobre o Authorea no encontro de nivelamento ferramental 😉) Assim que publicado, o texto dissertativo será divulgado aos colegas do seu campo de pesquisa, convidando-os para que façam comentários sobre suas reflexões. (Por exemplo, os fóruns de discussão da Comissão de Pedometria da Sociedade Brasileira de Ciência do Solo – – e de Levantamentos Pedológicos Detalhados – )

A partir da segunda semana, a tarefa de reflexão continuará sendo guiada pelo tema gerador e pelas leituras dirigidas, mas passará a ser operada de maneira recursiva, ou seja, levando em conta também o texto dissertativo publicado na semana anterior. Além disso, serão considerados os comentários feitos pelos colegas do seu campo de pesquisa e as discussões conduzidas durante o encontro anterior. Assim, um “novo” texto dissertativo será publicado a cada semana, o qual será uma versão reformulada, corrigida ou expandida do texto dissertativo anterior.

Tema Gerador

“[…] beware that uncertainty is not intrinsic to the phenomenon under study: rather it arises from our imperfect knowledge of that phenomenon, it is data-dependent and most importantly model-dependent, that model specifying our prior concept (decisions) about the phenomenon. No model, hence no uncertainty measure, can ever be objective: the point is to accept that limitation and document clearly all aspects of the model.”

Motivado pelo trecho acima extraído do livro Geostatistics for Natural Resources Evaluation, de Pierre Goovaerts (1997, p.442), reflita sobre os modelos usados para estudar os fenômenos espaciais de interesse em seu campo de pesquisa, considerando aspectos relacionados tanto ao surgimento como aos rumos tomados por esse campo ao longo da história. Concilie sua reflexão com os desenvolvimentos tecnológicos ocorridos desde o surgimento do seu campo de pesquisa e avalie, de maneira crítica, como esses desenvolvimentos tecnológicos o influenciaram, especialmente no que diz respeito à (re)construção das bases teóricas que o definem. O texto deve ser redigido na primeira pessoa do singular e usando voz ativa, seguindo as recomendações das revistas Nature e Science.

Propagação de Incerteza

Descrição da Tarefa

Prazo: 06-Dezembro

A tarefa de propagação de incerteza será desenvolvida usando, preferencialmente, dados provenientes do seu projeto de pesquisa (mestrado ou doutorado). Assim que iniciadas as atividades (a partir de 02-Novembro), informações sobre o projeto de pesquisa serão publicadas no mesmo website público usado para o desenvolvimento da primeira tarefa. O processamento e análise dos dados serão feitos usando o R e os pacotes geoestatísticos disponíveis. A documentação das atividades será feita usando um caderno de anotações do R. Os dados e código fonte serão organizados e publicados em repositório público com controle de versão (git) no GitHub (nós trataremos sobre o repositório no encontro de nivelamento). Esse repositório terá uma página própria onde versões atualizadas do caderno de anotações serão publicadas, no mínimo, semanalmente. (Tenha em mente que o prazo para desenvolvimento da tarefa é de apenas um mês, o que requer um planejamento rigoroso e metas realistas)

O produto dessa tarefa, a ser entregue até 06-Dezembro, será composto pelo repositório e seu conteúdo. Isso inclui (a) os dados utilizados, (b) o código fonte desenvolvido, e (c) o caderno de anotações com os resultados alcançados. Caso os dados já estejam publicados em repositório público, então basta incluir no repositório o código fonte usado para acesso aos dados.

Motivação

Os dados utilizados para a resolução do problema de pesquisa de seu projeto (mestrado ou doutorado) são contaminados com erros desconhecidos. Da mesma forma, as decisões tomadas durante seu processamento e modelagem são permeadas por incertezas. A magnitude ou importância das diferentes fontes de erro depende de situação para situação. O avanço na construção do conhecimento em seu campo de pesquisa depende do melhor entendimento dessas fontes de incerteza. Por fim, a aplicação desse conhecimento e utilização eficiente dos produtos gerados por seu campo de pesquisa requer a minimização das incertezas.

A partir do conhecimento visitado durante a primeira fase da disciplina, reavalie o problema de pesquisa de seu projeto e identifique qual é a principal fonte de incerteza. Em seguida, planeje e desenvolva um estudo sobre essa fonte de incerteza. Estabeleça um delineamento experimental baseado em simulações geoestatísticas para avaliar como a incerteza é propagada durante o processamento e análise dos dados. Aponte alternativas viáveis para reduzir a incerteza.

Programa do Curso

Título e Discriminação das Unidades

  1. Nivelamento ferramental
    1. Ambiente de análise de dados (R/RStudio)
    2. Controle de versão (git/GitHub)
    3. Programação letrada (R Markdown/R Notebook)
    4. Divulgação científica (blogdown/Hugo)
  2. Variação espacial
    1. Natureza da variação espacial
    2. Modelo discreto de variação espacial
    3. Modelo contínuo de variação espacial
    4. Semivariograma – análise e estimativa
  3. Propriedades dos dados espaciais
    1. Observações dependentes e preferenciais
    2. Resíduos espacialmente correlacionados
    3. Processos geradores não-estacionários
  4. Modelo linear misto de variação espacial
    1. Definição e propriedades
    2. Função de covariância Whittle-Matérn
    3. Método da máxima verossimilhança restrita
  5. Predição espacial e validação estatística
    1. Melhor preditor linear não enviesado empírico
    2. Amostragem para validação estatística
    3. Métricas de qualidade das predições
  6. Simulação espacial e propagação de incerteza
    1. Predição versus simulação estocástica
    2. Simulação sequencial gaussiana
    3. Visualização da incerteza e aplicações

Referências Bibliográficas

de Gruijter , J. J.; Brus, D.; Bierkens, M. & Knotters, M. Sampling for natural resource monitoring. Springer, 2006, 332. URL: http://www.springer.com/environment/environmental+toxicology/book/978-3-540-22486-0

Diggle, P. J. & Ribeiro Jr, P. J. Model-based Geostatistics. Springer, 2007, 228. URL: http://www.springer.com/earth+sciences+and+geography/book/978-0-387-32907-9

Goovaerts, P. Geostatistics for Natural Resources Evaluation. Oxford University Press, 1997, 483.

Webster, R. & Oliver, M. A. Geostatistics for Environmental Scientists. John Wiley & Sons, 2007, 315.

Zuur, A. F.; Ieno, E. N.; Walker, N.; Saveliev, A. A. & Smith, G. M. Mixed effects models and extensions in ecology with R. Springer, 2009, 574. doi:10.1007/978-0-387-87458-6

Cronograma Semanal

Semana 0, 27-Setembro: Nivelamento ferramental

Temas: Nivelamento ferramental necessários aos participantes para completar as duas tarefas obrigatórias do curso. Introdução ao ambiente R de análise de dados e ao ambiente RStudio de desenvolvimento integrado. (Você precisa ter instalada em seu computador a versão Preview do RStudio) Estudo do sistema git de gerenciamento de código fonte e controle de versão distribuído e da plataforma GitHub de hospedagem de código fonte. Apresentação de aspectos da programação letrada e uso da linguagem de marcação Markdown do R para produção de cadernos de anotações. Introdução à plataforma de divulgação científica Authorea. Apresentação da estrutura do curso.

O material do encontro está disponível em https://samuel-rosa.github.io/UFSM-SOL-843/uni-0.

Leituras para a próxima semana

Leia o seguinte artigo:

  • Webster, R. & Beckett, P. H. T. Quality and usefulness of soil maps. Nature, Nature Publishing Group, 1968, 219, 680-682. doi:10.1038/219680a0

Leia também, pelo menos, um dos artigos a seguir:

  • Kuilenburg, J. V.; Gruijter, J. J.; Marsman, B. A. & Bouma, J. Accuracy of spatial interpolation between point data on soil moisture supply capacity, compared with estimates from mapping units. Geoderma, 1982, 27, 311 - 325. doi:10.1016/0016-7061(82)90020-9
  • Bregt, A. K.; Bouma, J. & Jellinek, M. Comparison of thematic maps derived from a soil map and from kriging of point data. Geoderma, Elsevier BV, 1987, 39, 281-291. doi:10.1016/0016-7061(87)90048-6
  • Hudson, B. D. The soil survey as paradigm-based science. Soil Science Society of America Journal, 1992, 56, 836-841. doi:10.2136/sssaj1992.03615995005600030027x
  • Heuvelink, G. B. M. Identification of field attribute error under different models of spatial variation. International journal of geographical information systems, Informa UK Limited, 1996, 10, 921-935. doi:10.1080/02693799608902117

E também, pelo menos, um dos artigos abaixo:

  • Burgess, T. M. & Webster, R. Optimal interpolation and isarthmic mapping of soil properties. I. The semi-variogram and punctual kriging. Journal of Soil Science, Wiley-Blackwell, 1980, 31, 315-331. doi:10.1111/j.1365-2389.1980.tb02084.x
  • Mcbratney, A. B. & Webster, R. Choosing functions for semi-variograms of soil properties and fitting them to sampling estimates. Journal of Soil Science, 1986, 37, 617-639. doi:10.1111/j.1365-2389.1986.tb00392.x
  • Jian, X.; Olea, R. A. & Yu, Y.-S. Semivariogram modeling by weighted least squares. Computers & Geosciences, Elsevier BV, 1996, 22, 387-397. doi:10.1016/0098-3004(95)00095-x
  • Lark, R. M. & Beckett, P. H. T. A geostatistical descriptor of the spatial distribution of soil classes, and its use in predicting the purity of possible soil map units. Geoderma, 1998, 83, 243-267. doi:10.1016/S0016-7061(97)00144-4

Semana 1, 04-Outubro: Modelos de variação espacial

Temas: A variação espacial e os fatores que a determinam. Introdução à modelagem de dados espaciais. O modelo discreto de explicação da variação espacial. As visões determinística e estocástica do modelo discreto de variação espacial. O modelo contínuo de variação espacial. A visão determinística do modelo contínuo de variação espacial.

O material do encontro está disponível em https://samuel-rosa.github.io/UFSM-SOL-843/uni-1.

Leituras para a próxima semana

Leia o seguinte artigo:

Leia também, pelo menos, um dos artigos a seguir:

  • Mcbratney, A. B. & Webster, R. Choosing functions for semi-variograms of soil properties and fitting them to sampling estimates. Journal of Soil Science, 1986, 37, 617-639. doi:10.1111/j.1365-2389.1986.tb00392.x
  • Myers, D. E. To be or not to be… stationary? That is the question. Mathematical Geology, Springer Nature, 1989, 21, 347-362. doi:10.1007/bf00893695

Semana 2, 11-Outubro: Propriedades dos dados espaciais

Temas: Observações dependentes e preferenciais. Resíduos espacialmente correlacionados. A visão estocástica do modelo contínuo de variação espacial. O processo gerador aleatório e espacialmente autocorrelacionado. A estacionariedade de primeira e segunda ordem. A hipótese intrínseca. Semivariância e modelos matemáticos do semivariograma empírico.

O material do encontro está disponível em https://samuel-rosa.github.io/UFSM-SOL-843/uni-2.

Leituras para a próxima semana

Leia o seguinte artigo:

Leia também, pelo menos, um dos artigos a seguir:

  • Lark, R. M. Estimating variograms of soil properties by the method-of-moments and maximum likelihood. European Journal of Soil Science, 2000, 51, 717-728. doi:10.1046/j.1365-2389.2000.00345.x
  • Hengl, T.; Heuvelink, G. B. M. & Rossiter, D. G. About regression-kriging: from equations to case studies. Computers & Geosciences, 2007, 33, 1301-1315. doi:10.1016/j.cageo.2007.05.001

Semana 3, 18-Outubro: Modelo linear misto de variação espacial

Temas: Definição de dado geoestatístico. Especificação do modelo linear misto de variação espacial. O modelo Gaussiano e seus parâmetros. Modelos do variograma experimental e funções de covariância. A função de covariância Whittle-Matérn. O método dos momentos e a estimativa de parâmetros do modelos do variograma. O método da máxima verossimilhança (MV) e da máxima verossimilhança restrita (MVR), e a estimativa de parâmetros de funções de covariância.

O material do encontro está disponível em https://samuel-rosa.github.io/UFSM-SOL-843/uni-3.

Leituras para a próxima semana

Leia o seguinte artigo:

Leia também, pelo menos, um dos artigos a seguir:

  • Lark, R. M.; Cullis, B. R. & Welham, S. J. On spatial prediction of soil properties in the presence of a spatial trend: the empirical best linear unbiased predictor (E-BLUP) with REML. European Journal of Soil Science, Wiley-Blackwell, 2006, 57, 787-799. doi:10.1111/j.1365-2389.2005.00768.x
  • Brus, D. J.; Kempen, B. & Heuvelink, G. B. M. Sampling for validation of digital soil maps. European Journal of Soil Science, 2011, 62, 394-407. doi:10.1111/j.1365-2389.2011.01364.x
  • Kempen, B.; Brus, D. J. & Heuvelink, G. B. M. Soil type mapping using the generalised linear geostatistical model: a case study in a Dutch cultivated peatland. Geoderma, Elsevier BV, 2012, 189–190, 540-553. doi:10.1016/j.geoderma.2012.05.028

Semana 4, 25-Outubro: Predição espacial e validação estatística

Temas: O melhor preditor linear não enviesado empírico. Krigagem simples, ordinária e universal. Funções de covariância e os pesos da krigagem. Variância do erro de predição. Suporte de predição. Validação estatística de predições espaciais. Validação cruzada.

O material do encontro está disponível em https://samuel-rosa.github.io/UFSM-SOL-843/uni-4.

Leituras para a próxima semana

Leia os dois artigos abaixo:

  • Heuvelink, G. B. M.; Brown, J. D. & van Loon, E. E. A probabilistic framework for representing and simulating uncertain environmental variables. International Journal of Geographical Information Science, 2007, 21, 497-513. doi:10.1080/13658810601063951

Semana 5, 01-Novembro: Simulação espacial e propagação de incerteza

Temas: A Simulação versus predição. Modelo de incerteza local. Modelo de incerteza espacial. Simulação não-condicional. Simulação condicional. Simulação sequencial Gaussiana. Propagação de incerteza.

Tarefas para o próximo encontro

Repositório com os dados, código fonte, e caderno de anotações com os resultados da segunda tarefa.

Leituras sugeridas

Semana 6, 06-Dezembro: Conclusão do curso

Temas: Apresentação dos resultados da tarefa de propagação de incerteza. Avaliação do curso.

Avaliação dos Participantes

Critérios

Os participantes serão avaliados quanto à participação durante os encontros e cumprimento das duas atividades obrigatórias do curso dentro do prazo.

Para receber conceito “A” nesse curso, além da entrega dos produtos de cada tarefa dentro do prazo, será necessário:

  • Ler dois-três dos artigos recomendados para cada encontro, engajar-se nas discussões incitadas pelo instrutor e demais participantes durante os encontros, e respeitar o ritmo de aprendizado dos participantes do curso que demonstrarem maior dificuldade de compreensão de algum conceito.

  • Ter flexibilidade e responsabilidade ao responder os comentários feitos pelos colegas do campo de pesquisa sobre as diferentes versões do texto dissertativo da primeira tarefa e demonstrar aprimoramento da capacidade de reflexão/abstração ao longo do curso.

  • Organizar o repositório no GitHub e o código fonte usado na segunda tarefa de maneira a garantir a inteira reprodutibilidade da tarefa.

comments powered by Disqus