Justino 2014
Justino 2014
Justino 2014
Alfenas/MG
2014
1
Alfenas/MG
2014
2
3
AGRADECIMENTOS
RESUMO
O objetivo deste estudo foi realizar uma classificação do uso da terra e cobertura
vegetal na sub-bacia do rio São Tomé, no sul do Estado de Minas Gerais, utilizando
imagens multiespectrais geradas pelo sensor LISS III (Linear Imaging Self-Scanner)
a bordo do satélite IRS (Indian Resource Satellite ) e técnicas de mineração de
dados. A área de estudo localiza-se em uma região de grande tradição de cultivo de
café cujas propriedades são predominantemente de pequeno e médio portes. Para
realizar a classificação das imagens, foi utilizado o aplicativo GeoDMA (Geographic
Data Mining Analyst) que possui algoritmos para segmentação, extração de
atributos, seleção de feições e classificação. Os resultados mostraram o grande
potencial das técnicas de mineração de dados na classificação de imagens de
satélite. Algumas das vantagens da utilização de mineração de dados incluem: a
possibilidade de incorporar no processo de classificação um grande número de
variáveis, sejam espectrais, espaciais e atributos do terreno; a geração de
classificações consistentes e a simplicidade para interpretar a suas estruturas de
classificação.
ABSTRACT
The objective of this study was to perform a classification of land use and land cover
of the São Tomé river watershed located in the south of the Minas Gerais State by
using multispectral imagery collected by the Linear Imaging Self-Scanner onboard
the Indian Resource Satellite and data mining techniques. The study area lies in a
region with great tradition of coffee cultivation whose properties are predominantly of
small and medium sizes. To carry out the image classification, we used the
Geographic Data Mining Analyst (GeoDMA), a toolbox that has algorithms for
segmentation, feature extraction, feature selection and classification. The results
showed the great potential of the data mining techniques for remote sensing imagery
classification. Some advantages encompass the possibility of incorporate in the
classification process a great variety of informations that includes spectral, spatial
and topographic attributes, the generation of high classification accuracy, and the
simplicity to interpret their classification structure.
LISTA DE QUADROS
LISTA DE TABELAS
LISTA DE FIGURAS
SUMÁRIO
RESUMO.................................................................................................... 11
ABSTRACT................................................................................................ 12
1 INTRODUÇÃO........................................................................................... 13
2 OBJETIVOS............................................................................................... 16
3 JUSTIFICATIVA......................................................................................... 16
4 MATERIAL E MÉTODOS.......................................................................... 17
4.1 ÁREA DE ESTUDO................................................................................... 17
4.2 ESTRUTURAÇÃO DA BASE CARTOGRÁFICA E
CRIAÇÃO DE UM PROJETO EM SIG...................................................... 21
4.3 DERIVAÇÕES DE INFORMAÇÕES DO TERRENO................................. 23
4.4 PROCESSAMENTO DAS IMAGENS........................................................ 31
4.4.1 IMAGENS LISS III...................................................................................... 31
4.4.2 CORREÇÃO GEOMÉTRICA..................................................................... 31
4.5 SEGMENTAÇÃO E CLASSIFICAÇÃO...................................................... 33
4.5.1 SEGMENTAÇÃO....................................................................................... 33
4.5.2 CLASSIFICAÇÃO POR MINERAÇÃO DE DADOS................................... 37
4.5.3 ALGORITMO C4.5..................................................................................... 39
4.5.4 ANÁLISE DE EXATIDÃO........................................................................... 40
5 RESULTADOS........................................................................................... 43
6 DISCUSSÃO.............................................................................................. 50
7 CONCLUSÃO............................................................................................ 53
AGRADECIMENTOS................................................................................. 54
REFERÊNCIAS BIBLIOGRÁFICAS.......................................................... 54
APÊNDICE A – ARTIGO SUBMETIDO..................................................... 61
11
¹[email protected], ²[email protected]
RESUMO
O objetivo deste estudo foi realizar uma classificação do uso da terra e cobertura
vegetal na sub-bacia do rio São Tomé, no sul do Estado de Minas Gerais, utilizando
imagens multiespectrais geradas pelo sensor LISS III (Linear Imaging Self-Scanner)
a bordo do satélite IRS (Indian Resource Satellite ) e técnicas de mineração de
dados. A área de estudo localiza-se em uma região de grande tradição de cultivo de
café cujas propriedades são predominantemente de pequeno e médio portes. Para
realizar a classificação das imagens, foi utilizado o aplicativo GeoDMA (Geographic
Data Mining Analyst) que possui algoritmos para segmentação, extração de
atributos, seleção de feições e classificação. Os resultados mostraram o grande
potencial das técnicas de mineração de dados na classificação de imagens de
satélite. Algumas das vantagens da utilização de mineração de dados incluem: a
possibilidade de incorporar no processo de classificação um grande número de
variáveis, sejam espectrais, espaciais e atributos do terreno; a geração de
classificações consistentes e a simplicidade para interpretar a suas estruturas de
classificação.
ABSTRACT
The objective of this study was to perform a classification of land use and land cover
of the São Tomé river watershed located in the south of the Minas Gerais State by
using multispectral imagery collected by the Linear Imaging Self-Scanner onboard
the Indian Resource Satellite and data mining techniques. The study area lies in a
region with great tradition of coffee cultivation whose properties are predominantly of
small and medium sizes. To carry out the image classification, we used the
Geographic Data Mining Analyst (GeoDMA), a toolbox that has algorithms for
segmentation, feature extraction, feature selection and classification. The results
showed the great potential of the data mining techniques for remote sensing imagery
classification. Some advantages encompass the possibility of incorporate in the
classification process a great variety of informations that includes spectral, spatial
and topographic attributes, the generation of high classification accuracy, and the
simplicity to interpret their classification structure.
1. INTRODUÇÃO
imagens geradas pelos satélites da série CBERS (China Brazil Earth Resources
Satellite) e mais recentemente do IRS (Indian Resources Satellite).
Até há poucos anos, a interpretação das imagens de satélite para o
mapeamento do uso da terra e cobertura vegetal era feita de maneira analógica,
utilizando como recurso os elementos de reconhecimento da fotointerpretação
herdados das fotografias aéreas (CERON; DINIZ, 1966).
Já as técnicas de processamento de imagens voltadas para o reconhecimento
de padrões, por sua vez, adotam critérios objetivos no reconhecimento das classes.
Apesar de muitas vezes as classificações digitais não atingirem os níveis de
exatidão exigidos, o método permite economia de tempo na execução do
mapeamento e os produtos gerados podem ser facilmente integrados a uma base de
informações gerenciada por um Sistema de Informação Geográfica (SIG).
Vários trabalhos têm sido desenvolvidos no território nacional, fazendo uso
dos recursos do SR e das técnicas de processamento digital de imagens (PDI) para
analisar e mapear o uso da terra e cobertura vegetal em diversos níveis de enfoque
que variam da escala regional (CARREIRAS et al., 2002; BERNARDES et al., 2012)
à dimensão local (EPIPHANIO et al., 1994; KAWAKUBO et al., 2013).
Atualmente, com a disponibilidade de imagens de alta resolução espacial em
níveis de detalhamento de poucos metros ou submétricos (por exemplo, Ikonos-2,
QuickBird, GeoEye, WordView-2, etc.), é possível extrair com bastante precisão
informações do uso da terra antes negligenciadas pelas escalas mais generalizadas,
já que esses dados orbitais de resolução submétrica são comparáveis aos de uma
fotografia aérea (OLIVEIRA et al., 2009). Todavia, estas imagens ainda são pouco
utilizadas, pois esses satélites de alta resolução não coletam imagens repetidamente
de toda sua área de cobertura, mas adquirem suas imagens seletivamente,
dependendo da solicitação do cliente (MACHADO; QUINTANILHA, 2008). Sendo
que essa restrição se dá, principalmente, pelo elevado custo de aquisição.
Portanto, o aprimoramento de métodos destinados à extração de informações
utilizando produtos com um nível de detalhamento no terreno entre 10-30 metros
(sistemas Landsat-TM, ETM+; SPOT-HRV, HRVIR, HRG; CBERS-CCD; IRS-
P6/LISS III etc.) é crucial para suprir a demanda de mapeamento ainda existente e
que não foi suprida com as imagens de alta resolução. Tal questão é válida
especialmente em aplicações de uso da terra e cobertura vegetal.
16
2. OBJETIVOS
Geral:
Contribuir com os estudos de aplicação das técnicas de sensoriamento
remoto para a classificação de uso da terra e de cobertura vegetal.
Específicos:
Demonstrar o potencial e a limitação da técnica de classificação de imagens
de satélite por meio de mineração de dados com o propósito de auxiliar na
extração de informação temática relacionada ao uso da terra e cobertura
vegetal.
Verificar a possibilidade de se melhorar o desempenho da classificação,
utilizando além das variáveis espectrais, atributos espaciais (como por
exemplo, forma, tamanho, perímetro etc.) e topográficos (sub-bacias,
altimetria, declividade, orientação das vertentes).
Aplicar a metodologia de mineração de dados na sub-bacia do rio São Tomé
como o propósito de colaborar com os estudos regionais de uso da terra e de
cobertura vegetal no sul de Minas Gerais.
3. JUSTIFICATIVA
4. MATERIAIS E MÉTODOS
Figura 1. Mapa de localização da sub-bacia do rio São Tomé, sul de Minas Gerais. A
imagem corresponde a uma composição colorida do sensor LISS III utilizando as bandas do
infravermelho médio (b5), infravermelho próximo (b4) e vermelho (b3), combinadas em
RGB.
subtropical, classificado como Cwa segundo Köppen, com verão úmido e inverno
seco (PEEL et al., 2007).
Com relação ao histórico de ocupação, os municípios que compõem a região
da sub-bacia do rio São Tomé tiveram um início de ocupação bastante parecido, já
que, a princípio, eram apenas áreas de descanso para faiscadores, tropeiros e
boiadeiros. Somente nos séculos XVIII e XIX é que ocorre a fixação da população na
região (IBGE, 2012).
O Brasil é o maior produtor de café do mundo (EMBRAPA, 2013) e Minas
Gerais se destaca como o maior estado produtor, com 50% da produção nacional
(RUFINO et al., 2010), colocando assim a região do sul de Minas como a maior
produtora de café do país (SINDICAFÉ-MG, 2013). Nos três municípios pertencentes
à sub-bacia contabilizou-se para o café um total de 26.597 ha de área plantada em
2010 e 27.057 ha em 2012. No campo da pecuária, o censo agropecuário (2006)
contabilizou um total de 84.156 cabeças de gado para aquele ano; já em 2012 foram
contabilizadas 78.525 (IBGE, 2013). Estes números colocam estas duas atividades
como as mais importantes da região. Entretanto, mais recentemente, observa-se um
avanço significativo do plantio da cana-de-açúcar, que alcançou em 2012, um total
de 2.868 ha nos municípios da área de estudo (IBGE, 2013).
A Figura 2 abaixo demonstra quais foram os principais passos aplicados nas
cartas topográficas e na imagem de satélite dentro da metodologia aplicada neste
trabalho, para a confecção do mapa final de uso da terra e cobertura vegetal da área
de estudo.
20
Figura 3. Área de delimitação da sub-bacia composta pelo mosaico dos PI’s de curvas de
nível, drenagem e estradas usados no SIG ILWIS.
nível e pontos cotados como tipo valor. Os erros de topologia também foram
corrigidos nesta etapa por meio de análise visual, na tela do computador com o
algoritmo Check Segment disponível no ILWIS.
Datum Datum
Retângulo Envolvente Projeção Zona
Horizontal Vertical
Xmin.= 384306/ Xmax.= 404097
Córrego Ibitura,
UTM 23 S
Alegre SC.
Ymin.= 7596072/ Ymax.= 7627504
Foram geradas informações do terreno com base nas informações das cartas
topográficas implementadas no SIG ILWIS. Inicialmente foi gerado um modelo
matemático contínuo do terreno e, em seguida, foram geradas também informações
hipsométricas, clinográficas, de orientação das vertentes, de hierarquia de drenagem
e de sub-bacias.
O Modelo Digital do Terreno (MDT) consiste numa representação matemática
computacional da distribuição de um fenômeno espacial que ocorre dentro de uma
região da superfície terrestre, sendo que dados de relevo são um dos fenômenos
representados por esse modelo (FELGUEIRAS, 2001). As variações dadas pelo
MDT e relacionadas à altitude do terreno (Figura 4) são descritas por três eixos: x, y
que fornecem a posição espacial da superfície modelada (normalmente em unidades
métricas como aquelas fornecidas pela projeção Universal Transversa de Mercator -
UTM) e pelo z (atributo) que descreve a altitude do terreno.
declividade com os
Clinográfica Slope=Slope_porcentage*bacia_rec
contornos da área de
estudo.
Gerou o mapa de
Orientação de orientação de
Vertentes Aspect_bacia= Aspect*bacia_rec vertentes com os
contornos da área de
estudo.
Figura 9. Mapa da ordem hierárquica dos cursos d’água na sub-bacia, mostrando que os
cursos d´água atingiram a 6 ordem.
31
A imagem obtida junto ao INPE e usada neste trabalho foi gerada pelo sensor
LISS III (Linear Imaging Self-Scanner) que é um sensor do tipo Pushbroom e que
possui quatro faixas espectrais (SILVA et al., 2013) que operam nos intervalos do
verde (0.52-0.59 µm), vermelho (0.62-0.68 µm), infravermelho próximo (0.77-0.86
µm) e infravermelho médio (1.55-1.70 µm), com resolução espacial de 23,5 metros
no terreno quantificado em 7 bits e com tempo de revisita de 24 dias (EMBRAPA,
2013). O sensor LISS IIII está a bordo do satélite IRS-P6 ou RESOURCESAT-1 que
foi lançado em 2003 pela ISRO - Indian Space Research Organisation (Tabela 2).
Tabela 2. Características das bandas da imagem IRS-P6/ LISS III utilizada no trabalho.
Satel./ Data Az. Elev. Orb./ Bandas Range Res. Res.
Sensor Solar Solar Ponto Espec. Esp. Rad.
(µm) (m) (Bits)
B2 0.52 – 0.59 23.5 7
para permitir a integração das imagens com outras fontes cartográficas em SIG,
inclusive possibilitar a comparação das imagens ao longo dos anos.
A forma mais comum de realizar a correção geométrica é por meio de
georreferenciamento, que é feito identificando pontos de controle na imagem
(ROQUE et al., 2006), utilizando como referência dados obtidos em um mapa, como
no caso deste trabalho, que realizou o georreferenciamento utilizando como
referência a base cartográfica estruturada ou por meio de um sistema de GNSS –
Global Navigation Satellite System (SEGANTINE, 2001). Foram selecionados 15
pontos de controle distribuídos na imagem e que foram coletados nos cruzamentos
de estradas, rios e feições geométricas visíveis na imagem.
Em seguida, foi aplicada uma relação de ajuste entre as coordenadas da
imagem (expressas em linhas e colunas) com as coordenadas cartográficas,
normalmente em unidades métricas e em projeção UTM. O ajustamento dos pontos
foi feito utilizando a transformação afim, buscando no ajuste um erro inferior a 1
pixel. Essa transformação é um modelo matemático que consiste em corrigir uma
imagem em relação à outra fonte de dados já corrigida, sendo que no caso deste
trabalho foram as cartas topográficas. A imagem foi ajustada em um polinômio de 2ª
ordem. A transformação afim é útil quando se deseja investigar deformações de
escala ao longo de direções perpendiculares (D’ALGE, 2001).
Após o georreferencimento, as imagens tiveram que ser reamostradas
utilizando algum interpolador espacial. Os interpoladores espaciais têm como
objetivo calcular o valor do nível de cinza da imagem corrigida. O ILWIS possuiu três
interpoladores disponíveis: o vizinho mais próximo, o bilinear e o de convolução
cúbica (Figura 10). O vizinho mais próximo tem a vantagem de não alterar o valor do
pixel da imagem original, considerando no processo de interpolação o valor do pixel
mais próximo. O interpolador bilinear e o de convolução cúbica consideram na
interpolação os valores da vizinhança, abrangendo os quatro e dezesseis vizinhos,
respectivamente. Apesar de alterar o valor da imagem original, estes dois
interpoladores resultam em imagens com qualidade estética bem superior ao vizinho
mais próximo.
33
Figura 10. Os três interpoladores presentes no ILWIS, adaptado de Gonzalez & Woods
(1992).
4.5.1. SEGMENTAÇÃO
Figura 12. Interação do GeoDMA como plugin do TerraView, onde BD é o banco de dados
trabalhado no programa. Adaptado de Korting et al. (2009).
objetos; e a cor, que tem relação com os valores espectrais das bandas da imagem
(BAATZ, et al., 2004). Cada um deles tem influência no processo de segmentação,
sendo que esses parâmetros recebem valores aleatórios definidos pelo intérprete
para a geração da segmentação.
Foram realizados vários testes de segmentação com o objetivo de adquirir
uma adequada ao conteúdo da imagem. Ou seja, buscou-se um resultado de
segmentação que não fosse nem muito densa (over-segmentation), pois subdivide a
imagem em regiões menores criando uma divisão excessiva da paisagem; e nem
com falta de segmentos (under-segmentation), visto que resulta em uma
classificação demasiadamente generalizada (BAATZ et al., 2004). Uma das
consequências que pode ser observada de um excesso de segmentos é a perda de
informações importantes relacionadas aos atributos espaciais do cultivo, como
forma, área, perímetro etc. Por outro lado, quando ocorre uma falta de segmentos,
classes distintas ou semelhantes podem ser agregadas e tratadas como sendo
objetos comuns.
A análise dos resultados foi visual, verificando se os segmentos foram bem
delimitados e ajustados ao conteúdo da informação presente na imagem
(KAWAKUBO et al., 2013). Após a segmentação, foi iniciada a etapa de extração
dos atributos. Além das bandas multiespectrais do sensor LISS-III (bandas do verde
(b2), vermelho (b3), infravermelho próximo (b4) e infravermelho médio (b5)), foram
também incluídas as informações derivadas do MDT, como a hipsometria,
declividade, orientação das vertentes e ordem de sub-bacias hidrográficas. As
informações topográficas foram incluídas porque o relevo exerce um forte controle
no ordenamento territorial da bacia.
Estudos realizados por do Prado et al. (2013), na região de Muzambinho e
Cabo Verde, nas proximidades de Alfenas-MG, também mostraram uma forte
influência do relevo na distribuição espacial do plantio do café. Os autores
observaram que o plantio do café distribui-se entre 800-1250 metros de altitude com
predomínio na cota de 1000 metros. A declividade também exerce grande influência,
sendo o café plantado normalmente da meia vertente em direção aos topos,
evitando-se os fundos de vale em função dos maiores riscos de geadas.
Além das propriedades espectrais e topográficas, também foram extraídas
propriedades texturais e espaciais de cada objeto delimitado pela segmentação. As
propriedades texturais são importantes porque incorporam os conceitos de
37
Figura 13. Na primeira classificação vê-se a presença do atributo amplitude. Esse atributo já
não aparece na classificação seguinte, pois foi excluido do processo de mineração.
Figura 14. Exemplo da estrutura e aparência de uma árvore de decisão. Adaptado de Silva
et al., 2008.
Foi realizado neste trabalho também uma análise de exatidão. Vale ressaltar
aqui que exatidão se difere de precisão (Figura 15). Cabral (2004) descreve que
exatidão é a maior ou a menor aproximação entre o resultado obtido e o valor real.
Já a precisão está associada à dispersão dos valores resultantes da repetição das
medições. O mesmo autor ainda compara exatidão e precisão como sendo um
projétil disparado contra um alvo, onde a exatidão é o acerto próximo ou no centro
do alvo, enquanto a precisão seria os disparos acertarem em pontos muito próximos
entre si. Veiga et al. (2012) também explica essa diferença ao citar como exemplo
um jogador de futebol que, cobrando dez pênaltis, acerta todos na trave direita,
41
sendo assim, o jogador foi preciso, mas não exato, já que não conseguiu acertar o
gol que era o “verdadeiro valor”.
Figura 15. Precisão e exatidão. Em (a) preciso e inexato, (b) preciso e exato e (c) impreciso
e inexato. Adaptado de Veiga et al. (2012).
5. RESULTADOS
Figura 18. Árvore de decisão para a classificação por mineração de dados gerada no
GeoDMA utilizando o algoritmo C4.5.
objetos com valores iguais ou abaixo de 1668 foram classificados como corpo
d’água e os objetos com valores acima foram subdivididos.
Na divisão seguinte, objetos com valores de moda na banda 4 (infravermelho
próximo) iguais ou abaixo de 51 e com valores de moda na banda 3, iguais ou
inferiores a 178, foram classificados como café formação. Os objetos com valores
acima de 178 e com valores iguais ou inferiores a 17 na banda 4 foram classificados
como mata. Os valores maiores que 17 foram então classificados como café
produção.
Os objetos com valores acima de 51 na banda 4 foram subdivididos,
utilizando a média de seus valores. Objetos com valores iguais ou inferiores a 131 e
que apresentaram, ao mesmo tempo, valores iguais ou inferiores a 110 na moda da
banda 3, foram rotulados como pastagem. Já os objetos com valores acima de 110 e
com valores de moda da banda 2 (canal do verde) iguais ou inferiores a 110 foram
classificados como cana-de-açúcar. Os valores acima de 110 foram novamente
classificados como café produção.
Objetos com valores acima de 131 na média da banda 4 e com moda na
banda 2, iguais ou inferiores a 187, foram classificados como solo exposto. Os
objetos com valores acima de 187 e com valores iguais ou inferiores a 212 na moda
da banda 5 (infravermelho médio) foram rotulados como pastagem e os valores
acima de 212 como solo exposto.
Conforme pode ser observado, as classes pastagem, solo exposto e café
produção foram classificadas em dois momentos distintos nas subdivisões da árvore
de decisão. Isto aconteceu, provavelmente, em virtude da heterogeneidade destas
classes. A classe pastagem inclui tanto a vegetação rasteira com baixa atividade
fotossintética (pastos secos) quanto os pastos sujos e banhados. A classe solo
exposto também apresenta grande diversidade espectral, pois inclui os solos secos
e os solos preparados para o cultivo. Já a classe café produção engloba tanto o café
em plena atividade produtiva (caracterizada por índices mais altos de área foliar e de
sombra de dossel) quanto o café velho ou podado (caracterizado pela maior
presença de galhos secos e menor abundância de folhas verdes e de sombra).
O resultado da classificação pode ser visto na Figura 19, que ilustra a
distribuição do uso do solo e da cobertura vegetal. Observa-se no mapa que, ao
longo de toda a área de estudo, o uso do solo é bastante particionado e a cobertura
vegetal é bastante fragmentada e espalhada ao longo da sub-bacia. Dentro da
46
escala de análise utilizada neste trabalho (resolução espacial de 20m), nota-se que
não só ao longo do rio São Tomé, mas também em todos os outros cursos d’água
que compõem a sub-bacia uma grande ausência de mata ciliar, estando a mesma
presente em poucos lugares. O café dividido em formação e produção é a principal
cultura agrícola da bacia. Essa cultura ocupa principalmente as cotas mais altas do
relevo, sendo cultivada em vertentes e topos de morro. O café produção
visivelmente é o mais presente na área mapeada.
As outras classes que se fazem presentes de modo significativo na bacia são
o solo exposto e a pastagem. Essas duas classes ocupam áreas às margens dos
cursos d’água, tomando o lugar, como já citado, da mata ciliar. A pastagem é usada
principalmente para a criação de bovinos, sendo esta outra atividade que se destaca
na área da sub-bacia. O cultivo de cana-de-açúcar, apesar de ter mostrado
crescimento na região, ainda tem impacto pouco significativo, ocupando de modo
mais intenso uma área a nordeste do rio São Tomé.
47
Figura 19. Mapa final de uso da terra e cobertura vegetal confeccionado para a área da sub-
bacia hidrográfica do rio São Tomé utilizando como base a imagem gerada pelo sensor LISS
III a bordo do satélite IRS-P6.
Com exceção das classes corpo d’água e cana-de-açúcar, todas as classes foram
contempladas com mais de 50 pontos. Tal fato ocorreu em decorrência da classe
corpo d’água ter pouca expressão de área e a cana-de-açúcar ocupar, de modo
mais intenso, apenas uma dada área dentro da sub-bacia, o que reduziu a
probabilidade de receber um número mais expressivo de pontos aleatórios.
Observou-se também um desequilíbrio bastante grande na distribuição dos pontos
em virtude da grande diferença de área ocupada pelas classes mapeadas. A classe
que recebeu o maior número de pontos foi café produção (354), seguida pela classe
solo exposto (220) e pastagem (152). Em virtude da classe corpo d’água ter pouca
expressão espacial, considerou-se que o número de pontos de referência (19) foi
suficientemente grande para expressar a variabilidade da classificação.
Tabela 5. Valores do índice Kappa e o seu grau de concordância, baseado nesses valores.
6. DISCUSSÃO
apenas confirmar a importância que essa cultura agrícola tem na região, pois o sul
de Minas é o maior produtor de café do país, como já citado; (b) pelas
características da região do sul de Minas (mar de morros), o novo Código Florestal
(Lei nº 12.651/ 2012) prevê a manutenção de atividades agrossilvipastoris já
consolidadas em vertentes e topos de morro nos imóveis rurais antes de 22 de julho
de 2008. No entanto, a nova lei proíbe que novas áreas sejam ocupadas por
edificações e atividades agrossilvipastoris; e (c) sendo o objetivo deste trabalho
testar a classificação por mineração de dados, não fazendo aqui uma análise
multitemporal do uso do solo e da cobertura vegetal na área de estudo, houve então
excesso aparente de solo exposto. Isso se explica possivelmente pela
compatibilidade da imagem com a época de colheita, tanto e principalmente da
cana-de-açúcar que pouco aparece na área de estudo, quanto do café. Outra razão
deste excesso também está relacionada, mesmo que com um efeito menor, a
afloramentos rochosos ao longo da área da sub-bacia.
Após vários testes para se produzir a matriz de confusão da mineração de
dados, os valores resultantes na matriz da Tabela 4 exposta acima foram os
melhores valores alcançados. Isso se justifica principalmente pela grande
heterogeneidade da área de estudo, como observado no mapa de localização
(Figura 1) e também no mapa final de uso da terra e de cobertura vegetal (Figura
13), não havendo aqui, como já ressaltado, ação da homogeneidade gerada pela
multirresolução do método de segmentação baseado em Baatz et al. (2000). Então,
esta alta heterogeneidade e a mistura de classes limitaram os valores de acurácia
dentro da matriz.
Desse modo, fica clara a necessidade de mais estudos para se melhorar a
acurácia nestes casos específicos de alta heterogeneidade e de mistura de classes.
O próprio Korting et al. (2009) aponta a necessidade de otimizar os algoritmos
inclusos no sistema do GeoDMA, além da inclusão de ferramentas para a seleção
de atributos e manipulação de dados temporais para a análise da evolução dos
padrões.
O valor alcançado de 0,66 (muito bom) pelo índice Kappa para a classificação
por mineração de dados foi considerado um resultado bom já que na tabela de
valores que vai de 0 a 1, seu resultado ficou entre 0,60 – 0,80, ou seja, mais próximo
do grau de concordância “excelente”, que vai de 0,80 – 1,00.
53
7. CONCLUSÃO
pouco mais de contato com o programa, a sua utilização se deu de forma fácil e
rápida.
Áreas muito heterogêneas ainda pode ser um problema, pois, o grande
parcelamento do solo e a mistura de classes parecem que ainda não permitem
índices da acurácia maiores. Sendo assim, apesar das vantagens mostradas aqui,
ainda há de se fazer mais estudos e testes para se aproveitar todo o potencial que
essa técnica permite alcançar.
Os resultados alcançados neste trabalho só reforçam ainda mais que o
sensoriamento remoto aplicado ao uso da terra e cobertura vegetal, ao utilizar as
técnicas de classificação de imagens como a mineração de dados, pode e deve ser
auxílio e ponto de partida para um bom planejamento ambiental e agrícola.
AGRADECIMENTOS
REFERÊNCIAS BIBLIOGRÁFICAS
BINS, L. S. et al. Satellite Imagery Segmentation: a region growing approach. In: VIII
SIMPÓSIO BRASILEIRO DE SENSORIAMENTO REMOTO, 1996, Salvador, Brasil.
55
CÂMARA, G. et al. Análise Espacial de Áreas. In: Druck, S.; Carvalho, M. S.;
Câmara, G.; Monteiro, A. V. M. (eds.) "Análise Espacial de Dados Geográficos”.
Brasília, EMBRAPA, 2004.
IBGE. Histórico de ocupação dos municípios que compõem a bacia do rio São
Tomé. Disponível em:
<http://cidades.ibge.gov.br/xtras/uf.php?lang=&coduf=31&search=minas-gerais>.
Acesso em: 20 ago. 2012.
IBGE. Produção agropecuária dos municípios que compõem a bacia do rio São
Tomé. Disponível em:
<http://www.cidades.ibge.gov.br/xtras/uf.php?lang=&coduf=31&search=minas-
gerais>. Acesso em: 08 out. 2013.
NIJMEIJER et al. ILWIS 3.0 Academic user’s guide. Unit Geo Software
Development. International Institute for Geo-Information Science and Eath
Observation (ITC). Enschede, 2001. 520 p.
ROSS, J. S. L. (org.) Geografia do Brasil. 5 ed. rev. e ampl. – São Paulo: Editora da
Universidade de São Paulo, 2005.
VIEIRA, M. A. et al. Object Based Image Analysis and Data Mining applied to a
remotely sensed Landsat time-series to map sugarcane over large areas. Remote
Sensing of Environment, 123, p. 553-562, 2012.
Land-use and land-cover classification using data mining: example in southern Minas Gerais
[email protected]; [email protected]
RESUMO
O objetivo deste estudo é realizar a classificação do uso da terra e cobertura vegetal na bacia do Rio São Tomé no sul do estado
de Minas Gerais utilizando imagens multiespectrais geradas pelo sensor LISS III (Linear Imaging Self-Scanner) a bordo do
satélite IRS (Indian Resource Satellite ) e técnicas de mineração de dados. A área de estudo localiza-se em uma região de
grande tradição de cultivo de café cujas propriedades são predominantemente de pequeno e médio portes. Para realizar a
classificação das imagens, foi utilizado o aplicativo GeoDMA (Geographic Data Mining Analyst) que possui algoritmos para
segmentação, extração de atributos, seleção de feições e classificação. Os resultados mostraram o grande potencial das técnicas
de mineração de dados na classificação de imagens de satélite. Algumas das vantagens da utilização de mineração de dados
incluem: a possibilidade de incorporar no processo de classificação um grande número de variáveis, sejam espectrais, espaciais
e atributos do terreno; a geração de classificações consistentes; e a simplicidade para interpretar a suas estruturas de
classificação.
Palavras-chave: mineração de dados, sensoriamento remoto, GeoDMA, segmentação, árvore de decisão, exatidão.
ABSTRACT
The objective of this study is to classify the land use and land cover of the São Tomé river watershed located in the south of the
Minas Gerais state by using multispectral imagery collected by the Linear Imaging Self-Scanner onboard the Indian Resource
Satellite and data mining techniques. The study area lies in a region with great tradition of coffee cultivation whose properties
are predominantly of small and medium sizes. To carry out the image classification, we used the Geographic Data Mining
Analyst (GeoDMA), a toolbox that has algorithms for segmentation, feature extraction, feature selection and classification. The
results showed the great potential of the data mining techniques for remote sensing imagery classification. Some advantages
encompass the possibility of incorporate in the classification process a great variety of informations that includes spectral,
spatial and topographic attributes, the generation of high classification accuracy, and the simplicity to interpret their
classification structure.
Keywords: data mining, remote sensing, GeoDMA, segmentation, decision tree, accuracy.
1. INTRODUÇÃO:
A tecnologia do sensoriamento remoto (SR) constitui em uma das principais fontes de informações de apoio aos estudos
destinados ao planejamento agrícola e ambiental. Além de fornecer uma visão panorâmica da paisagem, o SR permite a coleta
de dados em intervalos de tempos regulares (devido à periodicidade de revisita do satélite), em regiões do espectro
eletromagnético inacessíveis à visão humana (em razão do caráter multiespectral dos sensores), com confiabilidade e com baixo
custo relativo.
Uma das principais aplicações do SR voltadas para o planejamento agrícola e ambiental é o mapeamento do uso da terra e
cobertura vegetal. Tradicionalmente, este tipo de mapeamento é feito utilizando os elementos de reconhecimento da
fotogrametria interpretativa (CERON; DINIZ, 1966). Todavia, tal metodologia adota critérios bastante subjetivos no processo
de decisão, além de exigir bastante tempo na sua execução, o que encarece o custo do mapeamento.
As técnicas de classificação digital de imagens de satélite têm se sofisticado ao longo dos anos com significativas melhorias
no processo de reconhecimento de padrões de uso da terra e cobertura vegetal. Uma das abordagens mais promissoras é a
classificação de imagens orientada a objeto. A classificação orientada a objeto tem como unidade de análise grupos de pixels
delimitados por segmentos - ao invés de pixels isolados como feita na classificação tradicional. Esses segmentos geralmente
incorporam um amplo conjunto de informações que inclui atributos espectrais, texturais e espaciais (BLASCHKE, 2010) que
são usados para treinar ou construir uma base de conhecimento para a classificação de imagens (KAWAKUBO et al., 2013).
A classificação baseada no conhecimento simula o processo de fotointerpretação. Assim, critérios espectrais, texturais e de
contexto são considerados no processo de decisão. De acordo com Vieira et al. (2012), uma etapa importante desta abordagem é
a construção do modelo de interpretação de imagem (conhecimento). Neste modelo, o analista deve ter uma exata noção dos
62
melhores atributos a serem utilizados na classificação. Condição esta, muitas vezes não atendida em virtude da dificuldade em
gerenciar a grande quantidade de informações disponíveis e do nível de detalhamento exigido.
Como forma de superar tais limitações, a adoção de técnicas de mineração de dados surge como uma alternativa viável para
geração automática de uma estrutura de conhecimento (SILVA et al., 2008; VIEIRA et al., 2012). A adoção de técnicas de
mineração de dados em classificação de imagens de satélite ainda é pouco disseminada e necessita de estudos mais
aprofundados como forma de avaliar o potencial e a limitação da técnica. Em vista dessas demandas existentes, o presente
trabalho tem como objetivo utilizar a técnica de mineração de dados aplicada ao mapeamento do uso da terra e cobertura vegetal
no sul de Minas Gerais. Atributos espectrais, texturas, espaciais e topográficos são explorados no processo de classificação.
2. ÁREA DE ESTUDO:
A área de estudo corresponde à bacia do rio São Tomé localizado no sul de Minas Gerais (Figura 1). O rio São Tomé
constitui um importante afluente do reservatório de Furnas, drenando uma área de aproximadamente 34 mil hectares
compreende parte dos municípios de Machado, Serrania e Alfenas (SILVA et al., 2011). A nascente do rio São Tomé localiza-
se no município de Machado a cerca de 1200 metros de altitude. A geomorfologia da região está incluída na unidade
morfoclimática do domínio das regiões serranas de morros mamelonares caracterizadas por morros arredondados em formato de
“meia-laranja” (AB’ SABER, 1963).
O clima é subtropical classificado como Cwa segundo Köppen (PEEL et al., 2007), com verão úmido e inverno seco. A
vegetação típica da região é formada por floresta estacional semidecidual ombrófila mista e cerrado (RADAMBRASIL, 1983).
Com relação ao uso da terra, a região destaca-se pelo plantio do café e atividade pecuária. Mais recentemente, observa-se
também o avanço crescente na região do plantio da cana-de-açúcar.
Figura 1 - Mapa de localização da bacia do rio São Tomé, sul de Minas Gerais. A imagem corresponde a uma composição
colorida do sensor IRS-P6 utilizando as bandas do infravermelho médio (b5), infravermelho próximo (b4) e vermelho (b3)
combinadas em RGB. A imagem foi adquirida em 31 de julho de 2010 correspondente a órbita/ponto 331/93.
3. MATERIAIS E MÉTODO
valores indefinidos. Na segunda etapa é realizada a interpolação linear feita entre os pixels com valores de altitude para obter as
elevações dos pixels com valores indefinidos. A partir do MDT foram derivados os seguintes produtos: informações de
hipsometria, declividade, orientação das vertentes e hierarquia de sub-bacias hidrográficas seguindo a metodologia de Strahler
(1952).
Após a extração de atributos, iniciou-se a fase de amostragem. Foram selecionadas amostras de 7 classes de uso da terra e
cobertura vegetal: Corpo d’água, Café formação, Café produção, Cana-de-açúcar, Mata, Pastagem e Solo exposto (esta classe
também inclui os afloramentos rochosos). O Café formação corresponde aos plantios de café em sua fase mais jovem, enquanto
o Café produção inclui os plantios em estágio de produção de grãos ou os plantios que foram podados.
Para a classificação, utilizou-se o algoritmo C4.5 desenvolvido por Quinlan (1993) para a geração da árvore de decisão. A
escolha dos atributos é baseada em uma métrica de entropia denominada de ganho de informação. Os atributos com maiores
ganhos de informação são selecionados na construção da árvore de decisão. A utilização de árvores de decisão em classificação
de imagens de satélite possui várias vantagens quando comparada com outros classificadores tradicionais, como por exemplo, o
da máxima verossimilhança (Maxver). Além de não requerer suposições com relação à distribuição das amostras, a árvore de
decisão é de fácil interpretação, possibilita considerar variáveis categóricas e numéricas e permite incorporar relações não
lineares entre classes (FRIEDL; BRODLEY, 1997).
No presente estudo, a classificação por árvore de decisão foi realizada de maneira interativa selecionando os atributos de
entrada e analisando os acertos e erros contidos na classificação. Foram realizados vários testes de classificação utilizando
diferentes atributos. Os atributos indicados na árvore de decisão que causavam erros nas classificações (analisados de maneira
qualitativa) foram sendo excluídos em cada teste até que o resultado da classificação atingisse um nível considerado satisfatório.
4. RESULTADOS E DISCUSSÃO
Após vários testes de segmentação, adotaram-se como parâmetro de segmentação os seguintes valores: 40 (compacidade),
30 (escala) e 70 (cor), gerando no total 2499 objetos. Como regra geral, os melhores valores são aqueles que conseguem
delimitar com eficiência os objetos contidos na imagem sem que haja falta ou excesso de segmentos. A Figura 2 ilustram alguns
exemplos de resultados utilizando diferentes valores de entrada.
Figura 2 - Resultados da segmentação utilizando diferentes parâmetros de compacidade/ escala/ cor. Observa-se em (A) excesso
de segmentos, em (B) falta de segmentos e em (C) um particionamento da paisagem mais equilibrado.
65
Com relação à etapa de mineração de dados, a árvore que apresentou o melhor resultado é ilustrada na Figura 3. Conforme
pode ser observado, os atributos utilizados na classificação foram a soma, a média e principalmente a moda das propriedades
espectrais. Nenhum atributo espacial ou topográfico foi selecionado na construção da árvore de decisão apresentada, o que
sugere pouca influência destes atributos no processo de classificação.
A primeira divisão separou a classe água das demais utilizando a soma da banda 3 (comprimento de onda do verde). Os
objetos com valores iguais ou abaixo de 1668 foram classificados como Corpo d’água e os objetos com valores acima foram
subdivididos.
Na divisão seguinte, objetos com valores de moda na banda 4 (canal vermelho) iguais ou abaixo de 51 e com valores de
moda na banda 3 iguais ou inferiores a 178 foram classificados como Café formação. Os objetos com valores acima de 178 e
com valores iguais ou inferiores a 17 na moda da banda 4 (infravermelho próximo) foram classificados como Mata. Já os
valores maiores que 17 foram então classificados como Café Produção.
Os objetos com valores acima de 51 na moda banda 4 foram subdivididos utilizando a média de seus valores. Objetos com
valores iguais ou inferiores a 131 e que apresentaram ao mesmo tempo valores iguais ou inferiores a 110 na moda da banda 3
foram rotulados como Pastagem. Já os objetos com valores acima de 110 e com valores de moda da banda 2 iguais ou inferiores
a 110 foram classificados como Cana-de-açúcar. Os valores acima de 110 foram novamente classificados como Café produção.
Objetos com valores acima de 131 na média da banda 4 e com moda na banda 2 iguais ou inferiores a 187 foram
classificados como Solo exposto. Os objetos com valores acima de 187 e com valores iguais ou inferiores a 212 na moda da
banda 5 (infravermelho médio) foram rotulados como Pastagem e os valores acima de 212 como Solo exposto.
Conforme pode ser observado, as classes Pastagem, Solo exposto e Café produção foram classificados em nós distintos da
árvore de decisão. Isto aconteceu provavelmente em virtude da heterogeneidade destas classes. A classe Pastagem inclui tanto a
vegetação rasteira com baixa atividade fotossintética (pastos secos) quanto os pastos sujos e banhados. A classe Solo exposto
também apresenta grande diversidade espectral, pois inclui os solos secos e os solos preparados para o cultivo, além dos
afloramentos rochosos. Já a classe Café produção engloba tanto o café em plena atividade produtiva (caracterizado por índices
mais altos de área foliar e de sombra de dossel) quanto o café velho ou podado (caracterizado pela maior presença de galhos
secos e menor abundância de folhas verdes e de sombra).
Durante os vários testes realizados, algumas árvores selecionaram atributos espaciais. Foram selecionados o perímetro,
área, área-caixa, largura e comprimento, todavia, nenhuma delas selecionou atributos topográficos. As classes Solo exposto e
Pastagem foram as que mais frequentemente selecionaram os atributos espaciais mencionados, porém, em todas as
classificações observou-se superestimava das classes mencionadas.
O resultado da classificação (Figura 4) ilustra a diversidade de uso e fragmentação espacial da cobertura vegetal presente na
bacia. As matas ciliares são praticamente inexistentes e as pequenas manchas localizam-se principalmente nas áreas de encostas.
A matriz da bacia é composta por Pastagem, todavia, observa-se uma grande quantidade de Solo exposto em razão da classe
também englobar os afloramentos rochosos e haver confusão com os pastos secos. Os plantios de Cana-de-açúcar concentram-
se na porção nordeste da bacia por se tratar de uma área mais plana que favorece o cultivo mecanizado. O café, classificado em
Formação e Produção é a principal cultura agrícola da bacia. Essa cultura ocupa principalmente as cotas mais altas do relevo,
sendo cultivada em vertentes mais íngremes adjacentes às manchas de mata e em topos de morro.
66
Figura 4 - Mapa de uso da terra e cobertura vegetal gerado a partir de classificação por Mineração de Dados.
Analisando a matriz de confusão (Tabela 1) observa-se que mesmo com uma grande variabilidade de uso existente, os
resultados de exatidão (proporção de acertos contidos ao longo da linha) e de confiabilidade (proporção de acertos contidos ao
longo da coluna) alcançaram resultados expressivos. A média da exatidão foi de 75% e a média da confiabilidade foi de 68%. A
exatidão global que expressa à proporção de pontos corretamente classificados com relação ao total de pontos amostrados
alcançou um valor de 73%. Outro índice utilizado como referência para a avaliação da classificação foi o índice Kappa, que
alcançou o valor de 0,66, sendo classificada na categoria de desempenho bom (0,61-0,80) (LANDIS; KOCH, 1977).
67
Tabela 1 - Matriz de confusão gerada para a classificação por mineração de dados no GeoDMA. A média da acurácia (ACC%) foi de 75%.
Já a média da confiabilidade em porcentagem foi de 68% e a média global da diagonal principal (exatidão global) foi de 73%.
Solo exposto
Pastagem
formação
produção
Cana-de-
Classificação →
ACC%
d’água
açúcar
Corpo
Mata
Total
Café
Café
Referências ↓
Café formação
57 13 2 0 0 7 0 79 72%
Café produção
8 219 48 37 7 35 0 354 61%
Cana-de-açúcar
0 0 34 2 1 0 0 37 91%
Pastagem
0 5 1 106 38 2 0 152 69%
Solo exposto
0 1 2 29 188 0 0 220 85%
Mata
2 13 1 2 0 108 0 126 85%
Corpo d’água
0 3 0 1 0 3 12 19 63%
Total
67 254 88 177 234 155 12 987
Confiabilidade %
85% 86% 38% 59% 80% 69% 100%
As classes que tiveram as maiores exatidões individuais foram a Cana-de-açúcar (91%) seguida pelo Solo exposto (85%) e
Mata (85%). No caso do café, vários estudos já realizados mostram a dificuldade em separar cultivos de café de outros usos em
decorrência de sua alta diversidade espectral (MOREIRA et al. 2004, 2008; PRADO et al., 2013). Dependendo do estágio
fenológico do cultivo, idade, manejo e condições topográficas, o comportamento espectral do café pode ser semelhante à mata
(café produção), ao pasto verde ou cana-de-açúcar (café formação ou café produção em terrenos declivosos) ou pastagem (café
velho ou podado). A exatidão da classe Pastagem (69%) foi comprometida pela grande confusão com o Solo exposto. Por fim, a
classe Corpo d’água (63%) foi confundida com as áreas de mata e de café produção em virtude provavelmente do
sombreamento existentes nestas classes. Com relação à confiabilidade individual, a classe Corpo d´água foi a que apresentou a
maior confiabilidade (100%), seguido pelo Café produção (86%) e Café formação (85%). A classe de menor confiabilidade foi
a Cana-de-açúcar (38%) em decorrência principalmente da confusão com o Café produção.
5. CONCLUSÃO
A técnica de mineração de dados mostrou-se eficiente no mapeamento do uso da terra e cobertura vegetal em área com
grande diversidade de uso como no sul de Minas Gerais. A exatidão global alcançada foi de 73% com índice kappa de 0,66, o
que a enquadra na categoria de desempenho bom. Apesar de considerar na mineração de dados atributos espectrais, espaciais e
topográficos, apenas informações espectrais foram selecionados na classificação, o que sugere pouca relevância de outros
atributos no processo de decisão. Todas as bandas do sensor LISS III (bandas do verde, vermelho, infravermelho próximo e
infravermelho médio) foram selecionadas no processo de mineração de dados. Tal resultado reforça o potencial das imagens
LISS-III na identificação e classificação do uso da terra e cobertura vegetal.
AGRADECIMENTOS
Os autores expressam os seus agradecimentos a CAPES pelo apoio financeiro concedido. Agradecimentos especiais ao Dr.
Thales Korting pelos esclarecimentos com relação ao uso do aplicativo GeoDMA.
REFERÊNCIAS BIBLIOGRÁFICAS
AB'SÁBER, A. N. Os domínios de natureza no Brasil: potencialidades paisagísticas. 2ª ed. São Paulo: Ateliê Editorial, 2003.
BAATZ, M. et al. USER GUIDE 4 (eCognition). Definiens Imaging. Copyright © 2000 - 2004. Germany, 2004.
BAATZ, M.; SCHÄPE, A. Multiresolution Segmentation: an optimization approach for high quality multi-scale image
segmentation. Journal of Photogrammetry and Remote Sensing, Heidelberg, v. 58, n. 3-4, p. 12-23, 2000.
BINS, L. S. et al. Satellite Imagery Segmentation: a region growing approach. In:
Anais VIII Simpósio Brasileiro de Sensoriamento Remoto, Salvador, Brasil, 14-19, abril, 1996, INPE, p. 677- 680.
BLASCHKE, T. Object based image analysis for remote sensing. ISPRS Journal of Photogrammetry and Remote Sensing,
65(1), 2–16, 2010.
CERON, A. O.; DINIZ, J. A. F. O uso de fotografias aéreas na identificação das formas de utilização agrícola da terra.
Revista Brasileira de Geografia. n. 2, p.161-173, 1966.
CHUBEY, M. S. FRANKLIN S. E.; WULDER M. A. Object-based Analysis of Ikonos-2 Imagery for Extraction of Forest
Inventory Parameters. Photogrammetric Engineering & Remote Sensing. Vol. 72, No. 4, April 2006, pp. 383–394.
CONGALTON, R. G. A Review of Assessing the Accuracy of Classifications of Remotely Sensed Data. REMOTE SENS.
ENVIRON. 37:35-46 (1991).
CONGALTON, R. G.; GREEN, K. A Practical Look at the Sources of Confusion in Error Matrix Generation.
68
Photogrammetric Engineering & Remote Sensing, Vol. 59, No. 5, May 1993, pp. 641-644.
CRÓSTA, A. P. Processamento Digital de Imagens de Sensoriamento Remoto. Ed. rev. 4ª Reimpressão. Campinas,
SP: IG/UNICAMP, 2002. 170 p.
DPI/INPE. GeoDMA-Geographic Data Mining Analyst. Disponível em: <http://www.dpi.inpe.br/menu/Projetos/geodma.php>.
Acesso em: 20 de jul. de 2013.
DO PRADO, D. F. C. et al. Mapeamento do cultivo de café no sul de Minas Gerais utilizando imagens Landsat-5 TM. Anais
XVI Simpósio Brasileiro de Sensoriamento Remoto, Foz do Iguaçu, Brasil, 13-18 de abril 2013, INPE, p. 186-192.
EMBRAPA – Monitoramento por Satélite. IRS - Indian Remote Sensing Satellite. Disponível em:
<http://www.sat.cnpm.embrapa.br/conteudo/missao_irs.php>. Acesso em: 05 de fev. de 2013.
FRIEDL, M. A.; BRODLEY, C. E. Decision tree classification of land cover from remotely sensed data. Remote Sensing of
Environment, 61(3), 399–408, 1997.
KAWAKUBO, F. S. et al. Land-use and vegetation-cover mapping of an indigenous land area in the state of Mato Grosso
(Brazil) based on spectral linear mixing model, segmentation and region classification. In: Geocarto International.
Vol. 24, nº 2, p. 165–175, 2009.
KAWAKUBO, F. S.; MORATO, R. G.; LUCHIARI, A. Use of fraction imagery, segmentation and masking techniques to
classify land-use and land-cover types in the Brazilian Amazon. In: International Journal of Remote Sensing.
Vol. 34, nº 15, p. 5452–5467, 2013.
KORTING, T. S. et al. GeoDMA – Um sistema para mineração de dados de sensoriamento remoto. Anais XIV Simpósio
Brasileiro de Sensoriamento Remoto, Natal, Brasil, 25-30 abril 2009, INPE, p. 7813-7820.
KORTING, T. S.; FONSECA, L. M. G.; CÂMARA, G. GeoDMA – Geographic Data Mining Analyst. In: Computers
& Geosciences, 57 (2013), 133-145.
LANDIS, J. R.; KOCH G. G. The Measurement of Observer Agreement for Categorical Data.” Biometrics 33: 159–174, 1977.
MOREIRA, M. A.; ADAMI, M.; RUDORFF, B. F. T. Análise espectral e temporal da cultura do café em imagens Landsat-5.
Pesquisa Agropecuária Brasileira, Brasília, v.39. n.3, p.223-231. 2004.
MOREIRA, M. A. et al. Geotecnologias no mapeamento da Cultura do Café em Escala Municipal. Sociedade & Natureza,
Uberlândia, 20 (1): 101-110, jun. 2008.
PEEL, M. C.; FINLAYSON, B. L.; MCMAHON, T. A.. Updated world map of the Köppen-Geiger climate classification.
Hydrology and Earth System Sciences 11, 1633–1644, 2007.
QUINLAN, J. R. C4. 5: Programs for Machine Learning. [S.l.]: Morgan kaufmann, 1993.
RADAMBRASIL, Levantamento dos recursos naturais: geologia, geomorfologia, pedologia, vegetação e uso potencial da terra.
Folhas SF. 23 / 24, Rio de Janeiro/Vitória. Rio de Janeiro: Ministério das Minas e Energia, 1983. 780p.
SILVA, A. C. et al. Desenvolvimento sustentável da bacia hidrográfica do rio São Tomé. Gestão de Extensão e Estudos
Independentes: Revista do I Fórum de Extensão Universitária. 2011. 9p.
SILVA, M. P. S. et al. Remote-sensing image mining: Detecting agents of land-use change in tropical forest areas. International
Journal of Remote Sensing, 29(16), 4803–4822, 2008.
STRAHLER, A. N. Hypsometric (area-altitude) – analysis of erosion al topography. Geological Society of America Bulletin,
v.63, n.10, p.1117-1142, 1952.
TIAN, J.; CHEN, D. M. Optimization in multi-scale segmentation of high resolution satellite images for artificial feature
recognition. International Journal of Remote Sensing, Vol. 28, Nº 20, p. 4625–4644, 2007.
VIEIRA, M. A. et al. Object Based Image Analysis and Data Mining applied to a remotely sensed Landsat time-series to map
sugarcane over large areas. Remote Sensing of Environment 123 (2012) 553-562.