sexta-feira, 23 de novembro de 2012

Relações Hipsométricas


Estudo das relações dendrométricas

João Flávio Costa dos Santos

1 Relação Hipsométrica

A relação hipsométrica reflete a tentativa de explicar o comportamento da Altura (chamaremos de 'H') das arvores em função do diâmetro (chamaremos de 'D'). H= f(D). A relação hipsométrica é o modelo dendrométrico de construção mais simples e, geralmente, produz excelentes estimativas da altura das árvores, particularmente no caso de povoamentos plantados. Observações no campo nos levam a compreender que até uma determinada idade, existe uma relação direta entre estas duas variáveis. Isto é, quanto maior o diâmetro, maior a altura.

Esta relação pode ser comprovada traçando-se um gráfico de dispersão, a partir de um banco de dados.Vejamos o exemplo que segue:

Árvore 
DAP(cm)
H t (m)
1
7,1
11,3
2
15
19,5
3
19,2
21,3
4
18,7
20,8
5
13,1
18,3
6
9,6
12,2
7
21,8
22,8
8
19,7
23
9
20,3
23,5
10
14,6
19,7
11
14,2
19,4
12
9,4
14,4
13
21,3
24,1
14
18,9
22,7
15
16
20

Com os dados acima, podemos montar o seguinte gráfico de dispersão:

Gráfico 1. Relação entre Diâmetro (medido à Altura do Peito - DAP i.e. a aproximadamente 1,30 m da superfície do solo) e Altura total (HT).

A relação entre estas variáveis apresenta-se de forma linear (pode-se traçar uma reta para explicar o comportamento da altura em função do Diâmetro a Altura do Peito- DAP). E desta forma o gráfico ficaria assim:


Gráfico 2.
                                                                                                                            
A equação que explica este comportamento é a equação de primeiro grau, ou seja, a equação da reta. Y= aX + b
No caso acima, podemos estabelecer os coeficientes apenas observando o gráfico (método empírico):
b= 5 (ponto onde a reta intercepta o eixo Y)
a = 0,9 (Coeficiente angular da reta)*

*O Coeficiente angular é obtido pelo cálculo da tangente do ângulo formado entre a reta e uma paralela ao eixo X. Tg= Variação Y/ variação X = 12,8/14,7 .

Portanto, a equação que descreve a reta em análise é Y= 0,9X + 5 que no nosso caso ficará: H= 0,9 DAP+ 5. Esta fórmula nos dará a altura estimada de cada árvore  em função de  seu Diâmetro. È  importante observar que as alturas estimadas estarão sob a reta traçada ( gráfico 2) e portanto não correspondem a Altura real da árvore , há um erro ( ou desvio).

Arvore número
DAP (cm)
H t (m)
H estimada
Erro ou desvio
Quadrado do erro
1
7,1
11,3
11,39
-0,09
0,0081
2
15
19,5
18,5
1
1
3
19,2
21,3
22,28
-0,98
0,9604
4
18,7
20,8
21,83
-1,03
1,0609
5
13,1
18,3
16,79
1,51
2,2801
6
9,6
12,2
13,64
-1,44
2,0736
7
21,8
22,8
24,62
-1,82
3,3124
8
19,7
23
22,73
0,27
0,0729
9
20,3
23,5
23,27
0,23
0,0529
10
14,6
19,7
18,14
1,56
2,4336
11
14,2
19,4
17,78
1,62
2,6244
12
9,4
14,4
13,46
0,94
0,8836
13
21,3
24,1
24,17
-0,07
0,0049
14
18,9
22,7
22,01
0,69
0,4761
15
16
20
19,4
0,6
0,36


TOTAIS


17,6039







Tabela 02.

O erro ou desvio é calculado por: H real- H estimada.

Vamos considerar agora a árvore de número 10 na Tabela 2. Sua altura dada pela equação da reta seria:
H = 5+ 0,9(14,6) = 18,14 m
No entanto, sabemos que o valor real da altura é de 19,7 m. Pode-se concluir que há um erro de 1,56m. É possível estabelecer, portanto, uma fórmula para chegarmos á altura real (Hreal) desta árvore: 19,7= 5+ 0,9(14,6) + 1,56, ou seja: Hreal = 5+ 0,9(DAP) + Erro. E, desta forma, e equação se adéqua à todas as árvores da amostra.

Valor Real= Valor estimado + Erro.

O valor Real é a variável dependente (Altura), enquanto que o valor estimado depende da variável independente (DAP).

Seguindo o raciocínio, o Erro pode ser determinado:
 Erro= Valor real – Valor estimado;
Erro= H- (aX+b) e quanto menor este erro, a reta descreverá com maior precisão a função tornando-se mais adequada.

Para diminuir o erro, utilizamos o método dos mínimos quadrados. E desse modo, queremos estabelecer os valores dos coeficientes a e b que conferem o menor erro possível à equação.

MÉTODO DOS MÍNIMOS QUADRADOS

Se certo número de medidas é realizado para a  mesma variável e se estas medidas estão sujeitas a erros aleatórios apenas, então a teoria dos mínimos quadrados estabelece que o valor mais provável da quantidade medida é aquele que faz a soma dos quadrados dos erros, um mínimo.

Nossa equação é a seguinte: Hreal= H estimada + Erro
Logo o erro pode ser encontrado: Erro= H real – H estimada
Elevando ao quadrado: Erro² = ( H real – H estimada )²
Substituindo: Erro² = ( y – (aX + b))²  
Fazendo o somatório: ∑ Erro² = ∑ (y– (aX + b))²  
Onde o ∑ Erro² é a soma dos quadrados dos desvios, o que na Regressão Linear corresponde a Soma Quadrática dos Resíduos (SQR).

Agora vamos achar os valores para a e b os quais tornam o erro o menor possível.

Sabemos que:
 Y = a + bx + Erro; e ∑ Erro² = S = 0
Erro =  Y real-Y estimado
Erro = Y real – (bx+a)
Logo S= Σ (Yi – (a+bXi))²

O passo seguinte é derivar esta expressão para a e b da seguinte maneira:
S/δa = 2 Σ ( Yi – (a+b Xi) (-1)
S/δb = 2 Σ ( Yi – (a + b Xi) (-1Xi)
Como a e b tem que ser mínimo , vamos igualar a zero:
-2 Σ ( Yi – a – b Xi) = 0
-2 Σ Xi ( Yi – a – b Xi) = 0
Dividindo por -2 e completando as expressões algébricas:
Σ Yi – Σa –  bΣXi = 0
Σ Xi Yi – a ΣXi – b Σ Xi² = 0
e, finalmente, temos as seguintes equações normais:
1: a n + b Σ Xi = Σ Yi
2: a Σ Xi + b Σ Xi = Σ XiYi
Isolando o a na equação 1 encontramos:
a= (Σ Yi -b Σ Xi)/n
Agora substituindo a na equação 2:
((Σ Yi -b Σ Xi)/n) Σ Xi + b Σ Xi = Σ XiYi
(ΣYi ΣXi)/n – (b ΣXi²)/n + b Σ Xi = Σ XiYi
– (b ΣXi²)/n + b Σ Xi = Σ XiYi-(ΣYi ΣXi)/n
b Σ Xi ((-Σ Xi/n)+ 1))= Σ XiYi-(ΣYi ΣXi)/n
b Σ Xi = (Σ XiYi-(ΣYi ΣXi)/n)/(-Σ Xi/n)+ 1)
b=((Σ( XiYi)-(ΣYi ΣXi)/n)/(-Σ Xi/n)+ 1))/ Σ Xi
b=(Σ (XiYi)-(ΣYi ΣXi)/n)/(-Σ Xi/n)+ 1) * (1/ Σ Xi)
b= (∑(Yi.Xi)- (∑ Yi.∑Xi/n))/(∑Xi²-((∑Xi)²/n)).

A tabela 03 nos auxilia neste cálculo. Basta substituir os valores dos somatórios, obtidos pela tabela, e n que é 15 (número de árvores), para achar os valores dos coeficientes a e b.
Árvore Número
DAP(cm)
H t (m)
Xi
Yi
(Xi)²
(Yi)²
(Xi . Y.i)
Y estimado
Erro
Erro²
1
7,1
11,3
50,41
127,69
80,23
12,161
-0,861
0,740758
2
15
19,5
225
380,25
292,5
18,759
0,741
0,549096
3
19,2
21,3
368,64
453,69
408,96
22,267
-0,967
0,935004
4
18,7
20,8
349,69
432,64
388,96
21,849
-1,049
1,101117
5
13,1
18,3
171,61
334,89
239,73
17,172
1,128
1,272264
6
9,6
12,2
92,16
148,84
117,12
14,249
-2,049
4,197368
7
21,8
22,8
475,24
519,84
497,04
24,439
-1,639
2,684859
8
19,7
23
388,09
529
453,1
22,685
0,315
0,099495
9
20,3
23,5
412,09
552,25
477,05
23,186
0,314
0,098779
10
14,6
19,7
213,16
388,09
287,62
18,425
1,275
1,625885
11
14,2
19,4
201,64
376,36
275,48
18,091
1,309
1,713989
12
9,4
14,4
88,36
207,36
135,36
14,082
0,318
0,101314
13
21,3
24,1
453,69
580,81
513,33
24,021
0,079
0,006251
14
18,9
22,7
357,21
515,29
429,03
22,016
0,684
0,467327
15
16
20
256
400
320
19,594
0,406
0,164657
Somatórios
238,9
293
4102,99
5947
4915,51
292,99455
0,005453
15,75816
∑ Xi
∑ Yi
∑ (Xi)²
∑ (Yi)²
∑ (Xi.Yi)
SQR

Tabela 03.
Y estimado foi calculado com os valores de a e b obtidos pelo método dos mínimos quadrados. (a=0,8353 e b=6,22978).
Já é possível perceber a diferença entre os dois métodos descritos para encontrarmos a equação da reta ideal. No método empírico, utilizando apenas a observação a SQR foi de 17,60 (Tabela 02), enquanto que no método dos mínimos quadrados este valor cai para 15,75 (Tabela 03). Pode-se verificar portanto, a eficácia do método.No entanto, para provar que o erro da regressão é pequeno, deve-se proceder a Analise de Variância. Para isso é importante relembrar alguns conceitos



Figura 01.
Na figura 01 a distância que vai do ponto até a média aritmética da variável dependente Y (d1) é a variação total; a distância d2 que vai do ponto até o seu valor estimado pela reta é o erro ou resíduo; por fim, a distância entre a média e o valor estimado pela reta (d3) é a variação devido á regressão.
Árvore
Yi
Y estimado
(Yi-Ymed)²
(Yest-Ymed)²
(Yi- Yest)²
Y med
1
11,3
12,16
67,7878
54,3561
0,74076
19,53333
2
19,5
18,76
0,0011
0,5996
0,54910
3
21,3
22,27
3,1211
7,4729
0,93500
4
20,8
21,85
1,6045
5,3640
1,10112
5
18,3
17,17
1,5211
5,5755
1,27226
6
12,2
14,25
53,7773
27,9265
4,19737
7
22,8
24,44
10,6713
24,0615
2,68486
8
23
22,68
12,0180
9,9305
0,09950
9
23,5
23,19
15,7347
13,3401
0,09878
10
19,7
18,42
0,0278
1,2286
1,62589
11
19,4
18,09
0,0178
2,0808
1,71399
12
14,4
14,08
26,3508
29,7199
0,10131
13
24,1
24,02
20,8547
20,1389
0,00625
14
22,7
22,02
10,0280
6,1657
0,46733
15
20
19,59
0,2178
0,0037
0,16466
293
223,7338
207,9642926
15,75816301
SQTotal
SQRegressão
SQResíduo
Tabela 04.

E agora podemos proceder a análise de Variância.

Fonte de Variação
Graus de Liberdade
Soma de Quadrados
Quadrado médio
Valor de F
Regressão
1
207,9642
207,9642
171,56
Resíduo
13
15,7581
1,2121
Total
14
223,722455



Tabela 05. Análise da Variância.

Coeficiente de Determinação: R² = SQ Regressão/SQ total.= 0,9296
Quanto mais próximo de 1 for R² significa que o resíduo é baixo e portanto, o valor é estimado com maior precisão.
Obs: Para relações hipsométricas, exclusivamente, considerar valores de R² acima de 0,8 como satisfatórios.

Quadrado Médio do Resíduo = QMResíduo = SQResíduo/Graus de Liberdade.= 1,2121
Esta é dita a verdadeira variância, a variável mais importante da regressão, pois expressa a precisão da regressão.

Erro ou Desvio Padrão = √QMResíduo. = 1,1010

Outros Coeficientes
Rmúltiplo Coeficientes de correlação entre os valores reais e valores estimados.
R²Ajustado  Servirá para comparar diferentes modelos.

Regressão Linear
Todo este processo que acabamos de ver são procedimentos da regressão linear simples. O objetivo da regressão é obter uma expressão da dependência de uma variável Y sobre uma ou mais variáveis independentes X. Tal expressão é, matematicamente, conhecida como função, logo, Y é uma função de X. Função é um relacionamento matemático que nos capacita predizer quais valores de uma variável Y, para dados valores de uma variável X. Resumindo: Y = f (X). Se a regressão tem mais de 2 coeficientes (B0; B1e B2) por exemplo ela passa ser uma regressão linear múltipla. Para obter os seus coeficientes agora, lançamos mão do sistema de matrizes.

Análise da Variância para Regressão Linear.
ANOVA
Fonte de variação 
Graus de liberdade
Soma Quadrática
Quadrado Médio
Valor de
F

Regressão
p-1
SQReg
SQreg/p-1
QMreg/QMres

Resíduo
n-p
SQRes
SQres/n-2

Total
n-1
SQTotal

Obs. Quando a regressão linear for simples (RLS), o Grau de Liberdade (GL) da regressão sempre será 1 pois nesta situação existem apenas 2 parâmetros (p) ou coeficientes (Lembre-se do a e b vistos anteriormente) por conseqüência, na RLS o valor do Quadrado Médio (QM) sempre será igual á SQRegressão, e ainda o GL para o resíduo será sempre n-2. Já quando for RL múltipla,  o valor de p será maior que dois e a situação descrita para RLS não mais se aplicará.

No entanto, o software Excel já disponibiliza a opção que calcular automaticamente a regressão,(o que diminui bastante nosso trabalho!) conforme mostra a figura 02. No anexo 1 segue um passo a passo de como trabalhar com esta função, e obter  regressão linear.

RESUMO DOS RESULTADOS
Estatística de regressão

R múltiplo
0,964140663
R-Quadrado
0,929567219
R-quadrado ajustado
0,924149313
Erro padrão
1,100984206
Observações
15
ANOVA

gl
SQ
MQ
F
Regressão
1
207,9751725
207,9751725
171,5731463
Resíduo
13
15,75816088
1,212166221
Total
14
223,7333333



Coeficientes
Erro padrão
Stat t
valor-P
Inferior 95,0%
Superior 95,0%
Interseção*
6,230539802
1,054624611
5,907827049
5,16924E-05
3,952161853
8,508917751
3,952161853
8,508917751
Variável X 1*
0,835252838
0,063766606
13,0985933
7,25856E-09
0,697493461
0,973012215
0,697493461
0,973012215

Tabela 06. Regressão Linear Simples obtida através do Excel.

*Os valores de Interseção e variável X1 correspondem, respectivamente, aos coeficientes b0 e b1.

Outros modelos

Na literatura são encontrados outros modelos que tentam explicar a relação existente entre ao Diâmetro e a Altura. Por exemplo, o modelo parabólico: Y= ax² + bx + c, que aplicado ao nosso caso ficaria assim: H = aDap²+ bDap+C. Existem 2 variáveis (o Diâmetro ao quadrado, e o Diâmetro). Obs: Existem as variáveis medidas no campo e as variáveis do modelo. Não necessariamente a quantidade de variáveis mensuradas no campo é a mesma da quantidade de variáveis do modelo. Neste modelo, por exemplo, as variáveis de campo são altura e DAP, e no modelo existem 3 variáveis: a altura é a variável dependente, enquanto que Dap² e Dap são as variáveis independentes.

Admitindo-se que há o erro, já mencionado anteriormente, a fórmula será:

Modelo Parabólico.
H = aDap²+ bDap+C +Erro

 Modelo genérico: Y = b0+ b1X1 + b2X2

Y= H; X1=Dap; X2=Dap² (b0, b1 e b2 são os coeficientes, obtidos através do sistema matricial) .

RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo
0,978474
R-Quadrado
0,957411
R-quadrado ajustado
0,950313
Erro padrão
0,891096
Observações
15
ANOVA

gl
SQ
MQ
F
F de significação
Regressão
2
214,2047
107,1024
134,8808
5,97E-09
Resíduo
12
9,528624
0,794052
Total
14
223,7333




Coeficientes
Erro padrão
Stat t
valor-P
95% inferiores
95% superiores
Inferior 95,0%
Superior 95,0%
Interseção
-0,77664
2,643335
-0,29381
0,773923
-6,53597
4,982695
-6,53597
4,982695
Variável X 1
1,88338
0,377748
4,98581
0,000317
1,060337
2,706422
1,060337
2,706422
Variável X 2
-0,03541
0,012642
-2,80094
0,016016
-0,06296
-0,00787
-0,06296
-0,00787

Tabela 07. Regressão Linear Múltipla para Modelo Parabólico obtida através do Excel

Modelo de Prodan.
H-1,30= D²/(aD²+bD+c)+ Erro
A fórmula pode ser reorganizada:
H- 1,30/ D² = 1/aD²+ bD +c
D²/ H-1,30 = aD²+ bD +c
Modelo genérico:
Y= bo + b1X1 + b2X2, onde
Y= D²/ H-1,30; X1= Dap; X2 = Dap²
B0, B1 e B2 são os coeficientes, obtidos através do sistema matricial, pois esta é uma regressão linear Múltipla.

RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo
0,992433
R-Quadrado
0,984923
R-quadrado ajustado
0,98241
Erro padrão
0,685848
Observações
15
ANOVA

gl
SQ
MQ
F
F de significação
Regressão
2
368,7485
184,3742
391,9629
1,17E-11
Resíduo
12
5,644643
0,470387
Total
14
374,3931




Coeficientes
Erro padrão
Stat t
valor-P
95% inferiores
95% superiores
Inferior 95,0%
Superior 95,0%
Interseção
2,414158
2,034489
1,186616
0,258341
-2,01861
6,846929
-2,01861
6,846929
Variável X 1
0,211291
0,29074
0,726734
0,481326
-0,42218
0,84476
-0,42218
0,84476
Variável X 2
0,030205
0,00973
3,104149
0,009119
0,009004
0,051406
0,009004
0,051406

Tabela 08. Regressão Linear Múltipla para Prodan através do Excel.

É importante mencionar que o Y estimado não refere-se a altura da árvore como nos modelos anteriores. (Yestimado = D²/H-1,30). Logo vamos encontrar para a árvore 10, por exemplo, um valor Y=11,58. É necessário estimar um segundo Y, que expresse somente o valor relativo a altura H, o que de fato queremos estimar fazendo: Yestimado2=(D²/Yestimado)+1,30, e agora Yestimado 2 representa somente H e vale 19,16 para a árvore 10. A regressão serviu para acharmos os valores dos coeficientes b0, b1 e b2. Mas o R² ainda deverá ser calculado, a partir do Yestimado2.

SQRegressão
206,9670158
0,955256633
QMResíduo
0,745703851
Erro padrão
0,863541459
R² Ajustado

0,947799



Para saber qual modelo é o mais adequado para estimar a altura em função do diâmetro da floresta em questão, deve-se compará-los através do R²-Ajustado


Modelo 1
Modelo 2
Modelo 3
0,929
0,957
0,955
R² Ajustado
0,924
0,950
0,947

Comparação entre modelos. Destaque para o modelo 2, o modelo parabólico que apresentou valor de R² e R²Ajustado mais próximo de 1, indicando baixo valor da SQR. Visto que R²=SQRegressão/SQTotal.



Anexo I.
Executando a Regressão no Excel 2007.
Primeiramente você deverá carregar as ferramentas de análise de dados.
A Ferramenta de Análise é um programa de suplemento (suplemento: um programa suplementar que adiciona comandos ou recursos personalizados ao Microsoft Office.) do Microsoft Office Excel, disponível quando você instala o Microsoft Office ou o Excel. Entretanto, para usá-la no Excel, é necessário carregá-la primeiro.
1 Clique no Botão do Microsoft Office e, em seguida, clique em Opções do Excel.
2 Clique em Suplementos e, na caixa Gerenciar, selecione Suplementos do Excel.
3 Clique em Ir para.
4 Na caixa Suplementos disponíveis, selecione a caixa Ferramentas de Análise e clique em OK.
5 Dica  se as Ferramentas de Análise não estiverem listadas na caixa Suplementos disponíveis, clique em Procurar para localizá-la.
6 Se você for avisado de que as Ferramentas de Análise não estão atualmente instalada no computador, clique em Sim para instalá-la.
7 Depois de carregar as Ferramentas de Análise, o comando Análise de Dados torna-se disponível no grupo Análise, na guia Dados.

Agora que o comando análise de dados já se encontra habilitado, é hora de proceder a regressão.
Clique em dados;
Vá em análise de dados;
Escolha a Opção regressão;
Insira os valores correspondentes nos intervalos de X (DAP) e Y(altura);
Marque a opção abrir em nova planilha, nomeie se quiser, vá em Ok.



Questões

1 O que significa linearizar um modelo dendrométrico e quando esta técnica deve ser aplicada?

2 Qual a diferença básica entre uma regressão linear simples e uma múltipla? Escreva o modelo genérico de ambas.

3 Se na ANOVA de um determinado modelo dendrométrico o há 4 Graus de Liberdade para a Regressão e 489 para o Resíduo, quantas árvores estão sendo avaliadas neste modelo? Faça o modelo genérico.

4 Explique como a idade pode influenciar  no comportamento de uma relação hipsométrica, sabendo que a mesma é oriunda de um povoamento plantado.

A relação hipsométrica explica bem a relação entre diâmetro e altura nos primeiros anos do povoamento. Com o passar do tempo as árvores dominantes diminuem seu crescimento em altura, e será alcançada pelas árvores codominantes e médias deste povoamento comprometendo esta relação. Fazendo-se dois levantamentos do mesmo povoamento em duas idades diferentes, a curva do segundo levantamento não é a continuidade da curva do primeiro, mas a segunda curva fica mais alta do que a primeira. Na idade do primeiro levantamento, uma árvore com um determinado diâmetro pertence à classe das codominantes, enquanto que na idade do segundo levantamento outra árvore com o mesmo diâmetro pode pertencer à classe das dominantes. Uma floresta equiânea (arvores com mesma idade) apresentara diferentes relações diâmetro altura ao longo da sua existência porque a prioridade entre crescimento primário e secundário muda com a idade das arvores. Em florestas jovens o crescimento primário tem prioridade sobre o secundário resultando em relações com inclinação mais acentuada que em florestas mais velhas onde o crescimento em altura está próximo a estagnação, mas o crescimento em diâmetro continua.


Um comentário: