Capítulo 8 Amostragem Probabilística

Atenção! Este capítulo está em fase de desenvolvimento. Visite a página do projeto se tiver alguma sugestão, dúvida ou estiver disposto a colaborar. Sua opinião/ajuda é muito importante!

8.1 Introdução

A característica fundamental da amostragem probabilística é que a chance de um determinado local ser amostrado (probabilidade de inclusão) é conhecida e maior do que zero. Em outras palavras, todo e qualquer local possui alguma chance de ser amostrado, mesmo que alguns tenham maior chance do que outros. Um local que não pode ser amostrado tem probabilidade de inclusão igual a zero.

A amostragem probabilística é muito utilizada em experimentos controlados, como aqueles desenvolvidos em campos experimentais, casas de vegetação e laboratórios. No caso da modelagem espacial do solo, a amostragem probabilística costuma ser usada para a validação das predições espaciais. Entretanto, ela também pode ser usada para obter observações para a calibração dos modelos preditivos.

8.2 Amostragem aleatória simples

Outros nomes:
Português: …
Inglês: simple random sampling.

A principal característica da amostragem aleatória simples (AAS) é que todos os locais amostrais são selecionados com exatamente a mesma probabilidade de inclusão e de maneira completamente independente uns dos outros. Assim sendo, o único atributo desse tipo de delineamento amostral que precisa ser definido de antemão é o tamanho da amostra \(n\).

A figura abaixo mostra uma realização de AAS na área adjascente ao Rio Meuse. Três características são marcantes:

  1. A irregularidade na distribuição espacial dos locais amostrais;
  2. O forte agrupamento de alguns locais amostrais;
  3. A presença de amplos espaços vazios entre locais amostrais.

Essas três características são muito comuns na AAS. Isso significa que a AAS não se presta à obtenção de amostras espacialmente representativas de uma área de estudo. Portanto, não use ASS se uma cobertura geográfica homogênea for seu objetivo.

main <- "Amostra aleatória simples"
plot(
  meuse.grid@coords, type = "n", asp = 1, main = main,
  xlab = "Longitude (m)", ylab = "Latitude (m)")
polygon(meuse.riv, col = "lightblue", border = "lightgray")
image(
  meuse.grid, "soil", col = terrain.colors(3), axes = TRUE, add = TRUE)
legend(
  "topleft", title = "Tipo de solo", fill = terrain.colors(3),
  legend = c("Solo calcário", "Solo não-calcário", "Solo vermelho"),
  border = terrain.colors(3), bty = "n")
text(179050, 331200, "Rio Meuse", srt = 50, cex = 0.7)
set.seed(2001)
pts <- meuse.grid[sampling::srswr(15, length(meuse.grid)) == 1, ]
set.seed(2001)
pts@coords <- 
  pts@coords + matrix(runif(prod(dim(pts@coords)), min = -0.5, max = 0.5), ncol = 2) * 
  meuse.grid@grid@cellsize
points(pts, pch = 21, cex = 0.75)
leg <- paste("Amostras (n = ", length(pts), ")", sep = "")
legend(176100, 332750, legend = leg, pch = 21, bty = "n")

8.3 Amostragem aleatória estratificada simples

Outros nomes:
Português: …
Inglês: stratified simple random sampling.

main <- "Amostra aleatória estratificada simples"
plot(
  meuse.grid@coords, type = "n", asp = 1, main = main,
  xlab = "Longitude (m)", ylab = "Latitude (m)")
polygon(meuse.riv, col = "lightblue", border = "lightgray")
image(
  meuse.grid, "soil", col = terrain.colors(3), axes = TRUE, add = TRUE)
legend(
  "topleft", title = "Tipo de solo", fill = terrain.colors(3),
  legend = c("Solo calcário", "Solo não-calcário", "Solo vermelho"),
  border = terrain.colors(3), bty = "n")
text(179050, 331200, "Rio Meuse", srt = 50, cex = 0.7)
n <- round(15 * summary(meuse.grid$soil) / length(meuse.grid))
set.seed(2001)
pts <- sampling::strata(
  meuse.grid[order(meuse.grid$soil), ], stratanames = "soil", size = n, 
  method = "srswr")$ID_unit
pts <- meuse.grid[order(meuse.grid$soil), ][pts, ]
set.seed(2001)
pts@coords <- pts@coords + 
  matrix(runif(prod(dim(pts@coords)), min = -0.5, max = 0.5), ncol = 2) * 
  meuse.grid@grid@cellsize
points(pts, pch = 21, cex = 0.75)
leg <- paste("Amostras (n = ", length(pts), ")", sep = "")
legend(176100, 332750, legend = leg, pch = 21, bty = "n")

8.4 Amostragem aleatória sistemática

Outros nomes:
Português: …
Inglês: systematic random sampling, centric systematic random sampling, aligned systematic random sampling, nonaligned systematic random sampling.

main <- "Amostra aleatória sistemática (malha quadrada)"
plot(
  meuse.grid@coords, type = "n", asp = 1, main = main,
  xlab = "Longitude (m)", ylab = "Latitude (m)")
polygon(meuse.riv, col = "lightblue", border = "lightgray")
image(
  meuse.grid, "soil", col = terrain.colors(3), axes = TRUE, add = TRUE)
legend(
  "topleft", title = "Tipo de solo", fill = terrain.colors(3),
  legend = c("Solo calcário", "Solo não-calcário", "Solo vermelho"),
  border = terrain.colors(3), bty = "n")
text(179050, 331200, "Rio Meuse", srt = 50, cex = 0.7)
set.seed(2001)
pts <- sp::spsample(meuse.grid, n = 15, type = "regular")
points(pts, pch = 21, cex = 0.75)
set.seed(1984)
points(sp::spsample(meuse.grid, n = 15, type = "regular"), pch = 20, cex = 0.75)
polygon(pts@coords[c(4, 5, 7, 6, 4), ])
legend(176100, 332750, legend = "Amostras (2001)", pch = 21, bty = "n")
legend(176100, 332400, legend = "Amostras (1984)", pch = 20, bty = "n")

main <- "Amostra aleatória sistemática (malha desalinhada)"
plot(
  meuse.grid@coords, type = "n", asp = 1, main = main,
  xlab = "Longitude (m)", ylab = "Latitude (m)")
polygon(meuse.riv, col = "lightblue", border = "lightgray")
image(
  meuse.grid, "soil", col = terrain.colors(3), axes = TRUE, add = TRUE)
legend(
  "topleft", title = "Tipo de solo", fill = terrain.colors(3),
  legend = c("Solo calcário", "Solo não-calcário", "Solo vermelho"),
  border = terrain.colors(3), bty = "n")
text(179050, 331200, "Rio Meuse", srt = 50, cex = 0.7)
set.seed(2001)
pts <- sp::spsample(meuse.grid, n = 15, type = "nonaligned")
points(pts, pch = 21, cex = 0.75)
polygon(pts@coords[c(4, 5, 7, 6, 4), ])
leg <- paste("Amostras (n = ", length(pts), ")", sep = "")
legend(176100, 332750, legend = leg, pch = 21, bty = "n")

8.5 Amostragem aleatória em conglomerados

Outros nomes:
Português: …
Inglês: cluster random sampling, two-stage random sampling, multistage random sampling.

main <- "Amostra aleatória em conglomerados (dois estágios)"
plot(
  meuse.grid@coords, type = "n", asp = 1, main = main,
  xlab = "Longitude (m)", ylab = "Latitude (m)")
polygon(meuse.riv, col = "lightblue", border = "lightgray")
image(
  meuse.grid, "soil", col = terrain.colors(3), axes = TRUE, add = TRUE)
legend(
  "topleft", title = "Tipo de solo", fill = terrain.colors(3),
  legend = c("Solo calcário", "Solo não-calcário", "Solo vermelho"),
  border = terrain.colors(3), bty = "n")
text(179050, 331200, "Rio Meuse", srt = 50, cex = 0.7)
set.seed(2001)
pts <- sp::spsample(meuse.grid, n = 15, type = "clustered", nclusters = 6)
points(pts, pch = 21, cex = 0.75)
leg <- paste("Amostras (n = ", length(pts), ")", sep = "")
legend(176100, 332750, legend = leg, pch = 21, bty = "n")