[Probabilidade Conjunta]   [Análise de Regressão]   [Análise Regional]   [Questões]   [Problemas]   [Referências]     

CAPÍTULO 7: 
ANÁLISE REGIONAL 

"In most natural systems, drainage from the uplands finds its way into rivers and then into the ocean.
Ocean disposal is nature's way of moving dissolved salts out of the landscape."

"Na maioria dos sistemas naturais, a drenagem das terras altas chega aos rios e depois ao oceano. A disposição do oceano é a maneira da natureza de tirar sais dissolvidos da paisagem ".
Jan van Schilfgaarde (1990)


This chapter is divided into three sections. Section 7.1 describes joint probability distributions, including marginal distributions and conditional probability. Section 7.2 describes the techniques of regression analysis. Section 7.3 presents selected techniques for regional analysis of flood and rainfall characteristics.

Este capítulo está dividido em três seções. A Seção 7.1 descreve distribuições conjuntas de probabilidade, incluindo distribuições marginais e probabilidade condicional. A seção 7.2 descreve as técnicas de análise de regressão. A Seção 7.3 apresenta técnicas selecionadas para análise regional das características de inundações e chuvas.


7.1  PROBABILIDADE CONJUNTA

[Análise de Regressão]   [Análise Regional]   [Questões]   [Problemas]   [Referências]      [Topo]  

In engineering hydrology, regional analysis encompasses the study of hydrologic phenomena with the aim of developing mathematical relations to be used in a regional context. Generally, mathematical relations are developed so that information from gaged or long-record catchments can be readily transferred to neighboring ungaged or short-record catchments of similar hydrologic characteristics. Other applications of regional analysis include regression techniques used to develop empirical (i.e., parametric) equations applicable within a broad geographical region. Regional analysis makes use of statistics and probability, including frequency analysis (Chapter 6) and joint probability distributions.

Na hidrologia de engenharia, a análise regional engloba o estudo de fenômenos hidrológicos com o objetivo de desenvolver relações matemáticas a serem usadas em um contexto regional. Geralmente, as relações matemáticas são desenvolvidas para que as informações das captações calibradas ou de registros longos possam ser prontamente transferidas para as capturas vizinhas, não calibradas ou de registros curtos, com características hidrológicas semelhantes. Outras aplicações da análise regional incluem técnicas de regressão usadas para desenvolver equações empíricas (isto é, paramétricas) aplicáveis %G​​%@dentro de uma ampla região geográfica. A análise regional faz uso de estatística e probabilidade, incluindo análise de frequência (Capítulo 6) e distribuições conjuntas de probabilidade.

Joint Probability Distributions

Distribuições conjuntas de probabilidades

Probability distributions possessing one random variable (X) were discussed in Chapter 6. These are called univariate distributions. Probability distributions with two random variables, X and Y, are called bivariate or joint distributions. A joint distribution expresses in mathematical terms the probability of occurrence of an outcome consisting of a pair of values of X and Y. In statistical notation, P(X = xi, Y = yj) is the probability P that the random variables X and Y will take on the outcomes xi and yj simultaneously. A shorter notation is P(xi, yj).

As distribuições de probabilidade que possuem uma variável aleatória (X) foram discutidas no Capítulo 6. Elas são chamadas de distribuições univariadas. As distribuições de probabilidade com duas variáveis %G​​%@aleatórias, X e Y, são chamadas de distribuições bivariadas ou conjuntas. Uma distribuição conjunta expressa em termos matemáticos a probabilidade de ocorrência de um resultado que consiste em um par de valores de X e Y. Em notação estatística, P (X = xi, Y = yj) é a probabilidade P de que as variáveis %G​​%@aleatórias X e Y assumirá os resultados xi e yj simultaneamente. Uma notação mais curta é P (xi, yj).

For xi (1, 2, ... , n), and yj (1, 2, ... , m), the sum of the probabilities of all possible outcomes is equal to unity:

Para xi (1, 2, ..., n) e yj (1, 2, ..., m), a soma das probabilidades de todos os resultados possíveis é igual à unidade:

 n         m
Σ      Σ  P(xi, yj) = 1
i = 1    j = 1
(7-1)

A classical example of joint probability is that of the outcome of the cast of two dice, say A and B. Intuitively, the probability of getting a 1 for A and a 1 for B is P(A = 1, B = 1) = 1/36; see Fig. 7-1. In total, there are 6 × 6 = 36 possible outcomes, and each one of them has the same probability: 1/36 (assuming, of course, that the dice are not loaded). This distribution is referred to as the bivariate uniform distribution because each outcome has a uniform and equal probability of occurrence. The sum of the probabilities of all possible outcomes is confirmed to be equal to 1.

Um exemplo clássico de probabilidade conjunta é o resultado do lançamento de dois dados, digamos A e B. Intuitivamente, a probabilidade de obter 1 para A e 1 para B é P (A = 1, B = 1) = 1/36; veja a Fig. 7-1. No total, existem 6 × 6 = 36 resultados possíveis, e cada um deles tem a mesma probabilidade: 1/36 (assumindo, é claro, que os dados não estão carregados). Essa distribuição é denominada distribuição uniforme bivariada porque cada resultado tem uma probabilidade uniforme e igual de ocorrência. Confirma-se que a soma das probabilidades de todos os resultados possíveis é igual a 1.

Joint probability:  The outcome of two dice

Figure 7-1  Joint probability:  The outcome of two dice.

Joint cumulative probabilities are defined in a similar way as for univariate probabilities:

Probabilidades cumulativas conjuntas são definidas de maneira semelhante à das probabilidades univariadas:

                 k           l
F(xk, yl) = Σ      Σ  P(xi, yj)
                i = 1     j = 1
(7-2)

in which F(xk, yl) is the joint cumulative probability. Continuing with the example of the two dice, the probability of A being ≤ 3 and B being ≤ 3 is the sum of all the individual probabilities, for all combinations of i and j, as i varies from 1 to 3, and as j varies from 1 to 3; i.e., 3 × 3 = 9 possible combinations, resulting in a probability equal to 9 × (1/36) = 1/4.

em que F (xk, yl) é a probabilidade cumulativa conjunta. Continuando com o exemplo dos dois dados, a probabilidade de A ser ~ 3 e B ser ~ 3 é a soma de todas as probabilidades individuais, para todas as combinações de iej, pois i varia de 1 a 3 e j varia de 1 a 3; ou seja, 3 × 3 = 9 combinações possíveis, resultando em uma probabilidade igual a 9 × (1/36) = 1/4.

Marginal Probability Distributions

Distribuições de probabilidade marginal

Marginal probability distributions are obtained by summing up P(xi, yj) over all values of one of the variables, for instance, X. The resulting (marginal) distribution is the probability distribution of the other variable, in this case Y without regard to X. Marginal distributions are univariate distributions obtained from bivariate distributions. In statistical notation, the marginal probability distribution of X is:

As distribuições de probabilidade marginal são obtidas pela soma de P (xi, yj) sobre todos os valores de uma das variáveis, por exemplo, X. A distribuição (marginal) resultante é a distribuição de probabilidade da outra variável, neste caso Y, sem considerar a X. Distribuições marginais são distribuições univariadas obtidas de distribuições bivariadas. Na notação estatística, a distribuição marginal de probabilidade de X é:

              m
P(xi) =   Σ  P(xi, yj)
             j = 1
(7-3)

Likewise, the marginal distribution of Y is:

Da mesma forma, a distribuição marginal de Y é:

              n
P(yj) =   Σ  P(xi, yj)
             i = 1
(7-4)

The example of the two dice A and B may be used to illustrate the concept of marginal probability. Intuitively, the probability of A being equal to 1, regardless of the value of B, is 6 × (1/36) = 1/6. Likewise, the probability of B being equal to 4, regardless of the value of A, is also 1/6. Notice that the joint probabilities (1/36) of each one of all 6 possible outcomes have been summed in order to calculate the marginal probability.

O exemplo dos dois dados A e B pode ser usado para ilustrar o conceito de probabilidade marginal. Intuitivamente, a probabilidade de A ser igual a 1, independentemente do valor de B, é 6 × (1/36) = 1/6. Da mesma forma, a probabilidade de B ser igual a 4, independentemente do valor de A, também é 1/6. Observe que as probabilidades conjuntas (1/36) de cada um dos 6 resultados possíveis foram somadas para calcular a probabilidade marginal.

Marginal cumulative probability distributions are obtained by combining the concepts of marginal and cumulative distributions. In statistical notation, the marginal cumulative probability distribution of X is:

As distribuições de probabilidade cumulativa marginal são obtidas combinando os conceitos de distribuições marginais e cumulativas. Na notação estatística, a distribuição de probabilidade cumulativa marginal de X é:

             k         m
F(xk) = Σ      Σ  P(xi, yj)
           i = 1     j = 1
(7-5)

Likewise, the marginal distribution of Y is:

Da mesma forma, a distribuição marginal de Y é:

            n          l
F(yl) = Σ      Σ  P(xi, yj)
          i = 1     j = 1
(7-6)

The example of the two dice A and B is again used to illustrate the concept of marginal cumulative probability. The probability of A ≤ 2, regardless of the value of B, is: 2 × 6 × (1/36) = 1/3. Likewise, the probability of B ≤ 5, regardless of the value of A, is: 5 × 6 × (1/36) = 5/6. To calculate the marginal cumulative probabilities, the concepts of marginal and cumulative distributions have been combined.

O exemplo dos dois dados A e B é novamente usado para ilustrar o conceito de probabilidade cumulativa marginal. A probabilidade de A ~ 2, independentemente do valor de B, é: 2 × 6 × (1/36) = 1/3. Da mesma forma, a probabilidade de B ~ 5, independentemente do valor de A, é: 5 × 6 × (1/36) = 5/6. Para calcular as probabilidades cumulativas marginais, os conceitos de distribuições marginais e cumulativas foram combinados.

Conditional Probability

Probabilidade Condicional

The concept of conditional probability is useful in regression analysis and other hydrologic applications. The conditional probability is the ratio of joint and marginal probabilities. In statistical notation:

O conceito de probabilidade condicional é útil na análise de regressão e outras aplicações hidrológicas. A probabilidade condicional é a razão de probabilidades conjuntas e marginais. Em notação estatística:

                P(x,y)
P(x |y) = ________
                 P(y)
(7-7)

in which P(x |y) is the conditional probability of x, given y. Likewise, the conditional probability of y, given x, is:

em que P (x | y) é a probabilidade condicional de x, dado y. Da mesma forma, a probabilidade condicional de y, dado x, é:

                P(x,y)
P(y |x) = ________
                 P(x)
(7-8)

From Eqs. 7-7 and 7-8, it follows that joint probability is the product of conditional and marginal probabilities.

Das Eqs. 7-7 e 7-8, segue-se que a probabilidade conjunta é o produto de probabilidades condicionais e marginais.

Joint probability distributions can be expressed as continuous functions. In this case they are called joint density functions, with the notation f(x,y). For the conditional density function, the notation is f(x |y), or alternatively, f(y |x).

As distribuições de probabilidade conjunta podem ser expressas como funções contínuas. Nesse caso, eles são chamados de funções de densidade articular, com a notação f (x, y). Para a função de densidade condicional, a notação é f (x | y) ou, alternativamente, f (y | x).

As with univariate distributions, the moments provide descriptions of the properties of joint distributions. For continuous functions, the joint moment of order r and s about the origin (indicated with ') is defined as follows:

Assim como nas distribuições univariadas, os momentos fornecem descrições das propriedades das distribuições conjuntas. Para funções contínuas, o momento conjunto da ordem r e s sobre a origem (indicado com ') é definido da seguinte forma:

             ∞   ∞
μ'r,s =        x ry s f (x,y ) dy dx
           -∞  -∞
(7-9)

With r = 1 and s = 0, Eq. 7-9 reduces to the mean of x :

Com r = 1 es = 0, Eq. 7-9 reduz à média de x:

             ∞           ∞
μ'1,0 =    x  [     x ry s f (x,y ) dy ] dx
           -∞          -∞
(7-10)

with the expression between brackets being the marginal PDF of x, or f(x). Therefore, the expression for the mean of x is:

com a expressão entre parênteses sendo o PDF marginal de x, ou f (x). Portanto, a expressão para a média de x é:

                     ∞
μ'1,0 = μx =  ∫  x f (x ) dx
                  -∞
(7-11)

Similar equations hold for y.

Equações similares são válidas para y.

The second moments are usually written about the mean:

Os segundos momentos são geralmente escritos sobre a média:

             ∞    ∞
μ'r,s =       ( x - μx )r ( y - μy )s f (x,y ) dy dx
           -∞  -∞
(7-12)

For r = 2 and s = 0, Eq. 7-12 reduces to the variance of x. Likewise, for r = 0 and s = 2, Eq. 7-12 reduces to the variance of y. A third type of second moment, i.e., the covariance, arises for r = 1 and s = 1:

Para r = 2 es = 0, Eq. 7-12 reduz à variação de x. Da mesma forma, para r = 0 es = 2, Eq. 7-12 reduz à variação de y. Um terceiro tipo de segundo momento, isto é, a covariância, surge para r = 1 e s = 1:

             ∞    ∞
σx,y =       ( x - μx ) ( y - μy ) f (x, y ) dy dx
           -∞  -∞
(7-13)

in which σx,y  is the covariance.

em que ~x, y é a covariância.

The correlation coefficient is a dimensionless value relating the covariance σx,y and standard deviations σx and σy :

O coeficiente de correlação é um valor adimensional que relaciona a covariância ~x, y e os desvios padrão ~x e ~y:

              σx,y
ρx,y = _________
             σx σy
(7-14)

in which ρx,y  is the correlation coefficient based on population data. The sample correlation coefficient is:

em que ~x, y é o coeficiente de correlação baseado em dados da população. O coeficiente de correlação da amostra é:

             sx,y
rx,y = ________
            sx sy
(7-15)

The calculation of sample correlation coefficient rx,y including the sample covariance sx,y is illustrated by Example 7-1. The correlation coefficient is a measure of the linear dependence between x and y. It varies in the range of -1 to + 1. A value of ρ (or r ) close to or equal to 1 indicates a strong linear dependence between the variables, with large values of x associated with large values of y, and small values of x with small values of y. A value of ρ (or r ) close to or equal to -1 indicates a correlation such that large values of x are associated with small values of y and vice versa. A value of ρ = 0 (or r = 0), i.e., a zero covariance, indicates the lack of linear dependence between x and y.

O cálculo do coeficiente de correlação da amostra rx, y incluindo a covariância da amostra sx, y é ilustrado pelo Exemplo 7-1. O coeficiente de correlação é uma medida da dependência linear entre x e y. Varia no intervalo de -1 a + 1. Um valor de ~ (ou r) próximo ou igual a 1 indica uma forte dependência linear entre as variáveis, com grandes valores de x associados a grandes valores de y e pequenos valores de x com pequenos valores de y. Um valor de ~ (ou r) próximo ou igual a -1 indica uma correlação tal que grandes valores de x são associados a pequenos valores de y e vice-versa. Um valor de ~ = 0 (ou r = 0), isto é, uma covariância zero, indica a falta de dependência linear entre x e y.

 Example 7-1.

The monthly flows of the North Fork and South Fork tributaries of a certain stream (see, for example, Fig. 7-2) have the following joint probability distribution f (x, y) (expressed as mean value in each class) (Note that 1 hm3 = 1 million cubic meters):

Os fluxos mensais dos tributários North Fork e South Fork de um determinado fluxo (ver, por exemplo, Fig. 7-2) têm a seguinte distribuição de probabilidade conjunta f (x, y) (expressa como valor médio em cada classe) (Nota 1 hm3 = 1 milhão de metros cúbicos):

North fork, x (hm3) 100 200 300 400
South fork, y (hm3)  
100 0.14 0.03 0.00 0.00
200 0.02 0.18 0.11 0.00
300 0.00 0.09 0.23 0.02
400 0.00 0.00 0.03 0.15

Calculate the marginal distributions, means, variances, standard deviations, covariance, and correlation coefficient for this joint distribution.

Calcule as distribuições marginais, médias, variações, desvios padrão, covariância e coeficiente de correlação para esta distribuição conjunta.


The North Fork marginal distribution, f(x), is obtained by summing up the joint probabilities across y. Therefore:

A distribuição marginal de North Fork, f (x), é obtida pela soma das probabilidades conjuntas em y. Portanto:


x (hm3) 100 200 300 400
f (x) 0.16 0.30 0.37 0.17

Likewise, the South Fork marginal distribution, f(y), is obtained by summing up the joint probabilities across x:

Da mesma forma, a distribuição marginal de South Fork, f (y), é obtida pela soma das probabilidades conjuntas em x:


y (hm3) 100 200 300 400
f (y) 0.17 0.31 0.34 0.18

The means are the first moments of the marginal distributions with respect to the origin:

Os meios são os primeiros momentos das distribuições marginais em relação à origem:

x̄ = (100 × 0.16)  +  (200 × 0.30)  +  (300 × 0.37)  +  (400 × 0.17) = 255 hm3

ȳ = (100 × 0.17)  +  (200 × 0.31)  +  (300 × 0.34)  +  (400 × 0.18) = 253 hm3

The variances are the second moments of the marginal distributions with respect to the means:

As variações são os segundos momentos das distribuições marginais em relação aos meios:

sx2 = Σ ( x - x̄ )2 f (x)
sx2 = ( 100 - 255 )2 × 0.16  +  ( 200 - 255 )2 × 0.30  +  ( 300 - 255)2 × 0.37  +  ( 400 - 255 )2 × 0.17
sx2 = 9075 hm6

Therefore:

Portanto: sx = 95.26 hm3

Likewise, for y:

Da mesma forma, para y:

sy2 = 9491 hm6

sy = 97.42 hm3

The covariance is the second moment of the joint distribution:

A covariância é o segundo momento da distribuição conjunta:

sx,y = Σ (x - x̄) (y - ȳ) f (x, y) =
 +  [(100 - 255) × (100 - 253) × 0.14]
 +  [(200 - 255) × (100 - 253) × 0.03]
 +  [(100 - 255) × (200 - 253) × 0.02]
 +  [(200 - 255) × (200 - 253) × 0.18]
 +  [(300 - 255) × (200 - 253) × 0.11]
 +  [(200 - 255) × (300 - 253) × 0.09]
 +  [(300 - 255) × (300 - 253) × 0.23]
 +  [(400 - 255) × (300 - 253) × 0.02]
 +  [(300 - 255) × (400 - 253) × 0.03]
 +  [(400 - 255) × (400 - 253) × 0.15] = 7785 hm6

The correlation coefficient is rx,y = sx,y / (sx sy) = 7785 / (95.26 × 97.42) = 0.839.

O coeficiente de correlação é rx, y = sx, y / (sx sy) = 7785 / (95,26 × 97,42) = 0,839.


calculator image 

ONLINE CALCULATION. Using ONLINE TWOD CORRELATION, the answer is: Correlation coefficient rx,y = 0.839, confirming the hand calculation.


Figure 7-2  North Fork and South Fork, Little Butte Creek, Oregon.

Bivariate Normal Distribution

Distribuição Normal Bivariada

Among the many joint probability distributions, the bivariate normal distribution is important in hydrology because it is the foundation of regression theory. The bivariate normal probability distribution is [12]:

Entre as muitas distribuições de probabilidade conjunta, a distribuição normal bivariada é importante em hidrologia, porque é o fundamento da teoria da regressão. A distribuição de probabilidade normal bivariada é [12]:

f (x , y)  =  K e M (7-16)

in which x and y are the random variables, and K and M are coefficient and exponent. respectively, defined as follows:

em que x e y são as variáveis %G​​%@aleatórias e K e M são coeficientes e expoentes. respectivamente, definidos da seguinte forma:

                           1
K  =  _________________________
             2 π σx σy (1 - ρ2)1/2
(7-17)

                   1
M  =  - ___________   [ A ]
             2 (1 - ρ2)
(7-18a)

in which:

              x - μx                     x - μx           y - μy              y - μy
A  =  ( _________ )2 - 2 ρ ( _________ ) ( _________ ) + ( _________ )2
                σx                          σx                σy                   σy
(7-18b)

The distribution has five parameters:  the means μx and μy, the standard deviations σx and σy, and the correlation coefficient ρ.

A distribuição possui cinco parâmetros: as médias ~x e ~y, os desvios padrão ~x e ~y e o coeficiente de correlação ~.

Following Eq. 7-8, the conditional distribution is obtained by dividing the bivariate normal (Eq. 7-16) by the univariate normal (Eq. 6-7), to yield

Após a Eq. 7-8, a distribuição condicional é obtida dividindo o normal bivariado (Eq. 7-16) pelo normal univariado (Eq. 6-7), para produzir

           f (x, y)
K  =  _________  =  K' eM'
             f (x)
(7-19)

in which K' and M' are coefficient and exponent, respectively, defined as follows:

em que K 'e M' são coeficientes e expoentes, respectivamente, definidos da seguinte forma:

                        1
K'  =  _____________________
            σy [2 π (1 - ρ2)]1/2
(7-20)

                      1                                         σy
M'  =  - ________________   [ (y - μy)  -  ρ ______ (x - μx) ]2
              2 σy2 (1 - ρ2)                              σx
(7-21)

By inspection of Eqs. 7-20 and 7-21, and comparison with Eq. 6-7, it is concluded that the conditional distribution is also normal, with mean and variance:

Por inspeção das Eqs. 7-20 e 7-21 e comparação com a Eq. 6-7, conclui-se que a distribuição condicional também é normal, com média e variância:
                          σy
μy|x  =  μy  -  ρ _____ (x - μx)
                          σx
(7-22)

σe2  =  σy2 (1 - ρ2) (7-23)

Equations 7-22 and 7-23 are useful in regression analysis. Equation 7-22 expresses the linear dependence between x and y. The slope of the regression line is  [ρ σyx]. Likewise, ρ is the fraction of the original variance explained or removed by the regression. In other words, the variance of the conditional distribution is less than or equal to the variance of y without regard to x, and it depends on the value of the correlation coefficient ρ. For ρ = 1, all the variance is removed, and the error of the predictive equation (i.e., the error of the regression) is reduced to zero. For ρ = 0, none of the original variance is removed, and σe remains equal to σy.

As equações 7-22 e 7-23 são úteis na análise de regressão. A equação 7-22 expressa a dependência linear entre x e y. A inclinação da linha de regressão é [~ ~y / ~x]. Da mesma forma, ~ é a fração da variância original explicada ou removida pela regressão. Em outras palavras, a variação da distribuição condicional é menor ou igual à variação de y sem considerar x, e depende do valor do coeficiente de correlação ~. Para ~ = 1, toda a variância é removida e o erro da equação preditiva (isto é, o erro da regressão) é reduzido a zero. Para ~ = 0, nenhuma variação original é removida e ~e permanece igual a ~y.


7.2  ANÁLISE DE REGRESSÃO

[Análise Regional]   [Questões]   [Problemas]   [Referências]      [Topo]   [Probabilidade Conjunta]  

A fundamental tool of regional analysis is the equation relating two or more hydrologic variables. The variable for which values are given is called the predictor variable. The variable for which values must be estimated is called the criterion variable [7]. The equation relating criterion variable to one or more predictor variables is called the prediction equation.

Uma ferramenta fundamental da análise regional é a equação que relaciona duas ou mais variáveis %G​​%@hidrológicas. A variável para a qual os valores são fornecidos é chamada de variável preditora. A variável para a qual os valores devem ser estimados é chamada de variável critério [7]. A equação que relaciona a variável critério a uma ou mais variáveis %G​​%@preditoras é denominada equação de previsão.

The objective of regression analysis is to evaluate the parameters of the prediction equation relating the criterion variable to one or more predictor variables. The predictor variables are those whose variation is believed to cause or agree with variation in the criterion variable.

O objetivo da análise de regressão é avaliar os parâmetros da equação de predição relacionando a variável critério a uma ou mais variáveis %G​​%@preditoras. As variáveis %G​​%@preditoras são aquelas cuja variação é acreditada para causar ou concordar com a variação na variável critério.

Correlation provides a measure of the goodness of fit of the regression. Therefore, while regression provides the parameters of the prediction equation, correlation describes its quality. The distinction between correlation and regression is necessary because the predictor and criterion variables cannot be switched unless the correlation coefficient is equal to 1. Stated in other terms, if a criterion variable Y is regressed on a predictor variable X, the regression parameters cannot be used to express X as a function of Y, unless the correlation coefficient is 1. In hydrologic modeling, regression analysis is useful in model calibration; correlation is useful in model formulation and verification.

A correlação fornece uma medida da qualidade do ajuste da regressão. Portanto, enquanto a regressão fornece os parâmetros da equação de predição, a correlação descreve sua qualidade. A distinção entre correlação e regressão é necessária porque as variáveis %G​​%@preditora e critério não podem ser alteradas, a menos que o coeficiente de correlação seja igual a 1. Afirmado em outros termos, se uma variável critério Y for regredida em uma variável preditora X, os parâmetros de regressão não poderão ser utilizados. expressar X como uma função de Y, a menos que o coeficiente de correlação seja 1. Na modelagem hidrológica, a análise de regressão é útil na calibração do modelo; correlação é útil na formulação e verificação de modelos.

The principle of least squares is used in regression analysis as a means of obtaining the best estimates of the parameters of the prediction equation. The principle is based on the minimization of the sum of the squares of the differences between observed and predicted values. The procedure can be used to regress one criterion variable on one or more predictor variables.

O princípio dos mínimos quadrados é usado na análise de regressão como forma de obter as melhores estimativas dos parâmetros da equação de predição. O princípio baseia-se na minimização da soma dos quadrados das diferenças entre os valores observados e os previstos. O procedimento pode ser usado para regredir uma variável de critério em uma ou mais variáveis %G​​%@preditoras.

One-Predictor-Variable Regression

Regressão variável de um preditor

Assume a predictor variable x, a criterion variable y, and a set on n paired observations of x and y. In the simplest linear case, the line to be fitted has the following form:

Suponha uma variável preditora x, uma variável critério y, e um conjunto em n observações emparelhadas de x e y. No caso linear mais simples, a linha a ser ajustada tem a seguinte forma:

y' = α + βx (7-24)

in which y' is an estimate of y, and α and β are parameters to be determined by regression.

em que y 'é uma estimativa de y, e ~ e ~ são parâmetros a serem determinados por regressão.

In the least squares procedure, values of the intercept α and slope β are sought such that y' is the best estimate of y. For this purpose, the sum of the squares of the differences between y and y'  are minimized as follows:

No procedimento dos mínimos quadrados, os valores da interceptação ~ e da inclinação ~ são procurados de modo que y 'seja a melhor estimativa de y. Para esse fim, a soma dos quadrados das diferenças entre y e y 'é minimizada da seguinte forma:

Σ ( y - y' )2 = Σ  [ y - ( α + βx ) ] 2 (7-25)

in which the symbol Σ indicates the sum of all values from i = 1 to i = n.

em que o símbolo ~ indica a soma de todos os valores de i = 1 a i = n.

Setting the partial derivatives equal to zero:

Definir as derivadas parciais iguais a zero:

  ∂
____  { Σ [ y - ( α + βx ) ] 2 } = 0
  ∂α
(7-26)

  ∂
____  { Σ [ y - ( α + βx ) ] 2 } = 0
  ∂β
(7-27)

This leads to the normal equations:

Isso leva às equações normais:

Σ y  -  nα  -  β Σ x = 0 (7-28)

Σ xy  -  α Σ x  -  β Σ x2 = 0 (7-29)

Solving Eqs. 7-28 and 7-29 simultaneously gives:

Resolvendo Eqs. 7-28 e 7-29 fornecem simultaneamente:

         Σ xy  -  ( Σ x Σ y ) / n        
β  =  ________________________
            Σ x2  -  ( Σ x )2 / n        
(7-30)

            Σ y  -  β Σ x
α  =  __________________
                     n
(7-31)

Since the slope of the regression line is: β = ρ σyx, the estimate from sample data is: β = r sy /sx. Therefore, the correlation coefficient is

Como a inclinação da linha de regressão é: ~ = ~ ~y / ~x, a estimativa dos dados da amostra é: ~ = r sy / sx. Portanto, o coeficiente de correlação é

          sx
r = β ____
          sy
(7-32)

The standard error of estimate of the correlation is the square root of the variance of the conditional distribution:

O erro padrão de estimativa da correlação é a raiz quadrada da variância da distribuição condicional:

                1            
se  =  [ ______ Σ (y - y' )2 ] 1/2
             n - 2           
(7-33)

in which n - 2 is the number of degrees of freedom, i.e., the sample size minus the number of unknowns.

em que n - 2 é o número de graus de liberdade, isto é, o tamanho da amostra menos o número de incógnitas.

Alternatively, the standard error of estimate can be estimated from the variance of the conditional distribution, Eq. 7-23. For calculations based on sample data, the standard error of estimate is:

Como alternativa, o erro padrão de estimativa pode ser estimado a partir da variação da distribuição condicional, Eq. 7-23. Para cálculos baseados em dados de amostra, o erro padrão de estimativa é:

                 n - 1            
se  =  sy [ ______ (1 - r 2) ] 1/2
                 n - 2           
(7-34)

Nonlinear Equations. Equations 7-30 and 7-31 can also be used to fit power functions of the type y = a xb. First, this equation is linearized by taking the logarithms: log y = log a + b log x. With u = log x, and v = log y, this equation is: v = log a + bu. The variables u and v are used in Eqs. 7-30 and 7-31 instead of x and y, respectively. Then α = log a, and β = b, and the regression equation is: y = 10αx β.

Equações não lineares. As equações 7-30 e 7-31 também podem ser usadas para ajustar funções de potência do tipo y = a xb. Primeiro, essa equação é linearizada usando os logaritmos: log y = log a + b log x. Com u = log x e v = log y, esta equação é: v = log a + bu. As variáveis e v são usadas nas Eqs. 7-30 e 7-31 em vez de x e y, respectivamente. Então ~ = log a, e ~ = b, e a equação de regressão é: y = 10~x ~.

 Example 7-2.

Find the regression equation linking the low flows (annual minima series) of streams X and Y shown in Cols. 2 and 3 of Table 7-1. Calculate the linear regression parameters α and β, the correlation coefficient, and the standard error of estimate.

Encontre a equação de regressão ligando os baixos fluxos (séries mínimas anuais) das correntes X e Y mostradas em Cols. 2 e 3 da Tabela 7-1. Calcule os parâmetros de regressão linear ~ e ~, o coeficiente de correlação e o erro padrão de estimativa.


  • Summing up the values of Cols. 2 and 3, and dividing by n = 15, the means are obtained: x̄ = 72 m3/s and ȳ = 77 m3/s.

    Resumindo os valores de Cols. 2 e 3 e, dividindo por n = 15, são obtidas as médias: x: = 72 m3 / se = 77 m3 / s.

  • Columns 4 and 5 show the square of the deviations from the means. Summing up Cols. 4 and 5, dividing the sums by (n - 1) = 14, and taking the square roots, the standard deviations sx = 29.568 m3/s and sy = 26.589 m3/s are obtained.

    As colunas 4 e 5 mostram o quadrado dos desvios das médias. Resumindo Cols. 4 e 5, dividindo as somas por (n - 1) = 14 e obtendo as raízes quadradas, obtêm-se os desvios padrão sx = 29,568 m3 / se sy = 26,589 m3 / s.

  • Column 6 shows the x2 values, and Col. 7, the xy values. The sum of these values is: Σ x2 = 90,000 and Σ xy = 93,056.

    A coluna 6 mostra os valores de x2 e a coluna 7, os valores de xy. A soma desses valores é: x2 = 90.000 e xy = 93.056.

  • Using Eq. 7-30: β = [93,056 - (1,080 × 1,155)/ 15 ] / [ 90,000 - (1,080 × 1,080)/ 15] = 0.80849.

    Usando a Eq. 7-30: ~ = [93.056 - (1.080 × 1.155) / 15] / [90.000 - (1.080 × 1.080) / 15] = 0,80849.

  • Using Eq. 7-31:  α = [1155 - (0.8085 × 1080)] / 15 = 18.7882.

    Usando a Eq. 7-31: ~ = [1155 - (0,8085 × 1080)] / 15 = 18,7882.

  • Using Eq. 7-32, the correlation coefficient is:  r = 0.80849 × 29.568 / 26.589 = 0.899.

    Usando a Eq. 7-32, o coeficiente de correlação é: r = 0,80849 × 29,568 / 26,589 = 0,899.

  • Using Eq. 7-34, the standard error of estimate is:  se = 26.589 × [(14/13) (1 - 0.8992)] 1/2 = 12.08 m3/s.

    Usando a Eq. 7-34, o erro padrão da estimativa é: se = 26,589 × [(14/13) (1 - 0,8992)] 1/2 = 12,08 m3 / s.

  • The data and regression line are plotted in Fig. 7-3.

    Os dados e a linha de regressão são plotados na Fig. 7-3.


Table 7-1  One-Predictor-Variable Regression:  Example 7-2.
(1) (2) (3) (4) (5) (6) (7)
Year x
(m3/s)
y
(m3/s)
( x - x̄ )2 ( y - ȳ )2 x2 xy
1973 110 89 1,444 144 12,100 9,790
1974 42 51 900 676 1,764 2,142
1975 75 72 9 25 5,625 5,400
1976 120 112 2,304 1,225 14,400 13,440
1977 89 70 289 49 7,921 6,230
1978 32 45 1,600 1,024 1,024 1,440
1979 37 42 1,225 1,225 1,369 1,554
1980 56 59 256 324 3,136 3,304
1981 82 100 100 529 6,724 8,200
1982 90 92 324 225 8,100 8,280
1983 50 70 484 49 2,500 3,500
1984 30 42 1,764 1,225 900 1,260
1985 81 92 81 225 6,561 7,452
1986 110 130 1,444 2,809 12,100 14,300
1987 76 89 16 144 5,776 6,764
Sum 1,080 1,155 12,240 9,898 90,000 93,056


calculator image 

ONLINE CALCULATION. Using ONLINEREGRESSION11, the answer is: α = 18.7882; β = 0.80849; standard deviation sx = 29.568; standard deviation sy = 26.589; correlation coefficient rx,y = 0.899; standard error of estimate se = 12.08. The results of the online calculation confirm the hand calculations.

CÁLCULO ONLINE. Usando ONLINEREGRESSION11, a resposta é: ~ = 18.7882; p = 0,80849; desvio padrão sx = 29,568; desvio padrão sy = 26.589; coeficiente de correlação rx, y = 0,899; erro padrão da estimativa se = 12,08. Os resultados do cálculo on-line confirmam os cálculos manuais.


<i>X</i>-<i>Y</i> ( One-predictor-variable) regression

Figure 7-3  X-Y ( One-predictor-variable) regression:  Example 7-2.

Multiple Regression

Regressão múltipla

The extension of the least squares technique to more than one predictor variable is referred to as multiple regression. In the case of two predictor variables, x1 and x2, with criterion variable y and a set of n observations of y, x1 and x2, the line to be fitted is:

A extensão da técnica dos mínimos quadrados para mais de uma variável preditora é denominada regressão múltipla. No caso de duas variáveis preditoras, x1 e x2, com a variável critério y e um conjunto de n observações de y, x1 e x2, a linha a ser ajustada é:

y' = α + β1x1 + β2x2 (7-35)

in which x1 and x2 are measured values and y'  is an estimate of y.

em que x1 e x2 são valores medidos e y 'é uma estimativa de y.

As with the two variable case, values of the intercept α and slopes β1 and β2 are sought such that y' is the best estimate of y. For this purpose, the sum of the squares of the differences between y and y' are minimized.

Como no caso de duas variáveis, os valores da interceptação ~ e dos declives ~1 e ~2 são procurados de modo que y 'seja a melhor estimativa de y. Para esse propósito, a soma dos quadrados das diferenças entre y e y 'é minimizada.

Σ ( y - y' )2 = Σ [ y - (α + β1x1 + β2x2) ] 2 (7-36)

Setting the partial derivatives with respect to α, β1 and β2 equal to zero leads to the normal equations:

Definir as derivadas parciais em relação a ~, ~1 e ~2 iguais a zero leva às equações normais:

Σ y - nα - β1 Σx1 - β2 Σx2 = 0 (7-37)

                                 
Σ yx1 - αΣ x1 - β1 Σ x12 - β2 Σ x1x2 = 0
(7-38)

                                 
Σ yx2 - αΣ x2 - β2 Σ x22 - β1 Σ x1x2 = 0
(7-39)

Solving Eqs. 7-37 to 7-39 simultaneously:

Resolvendo Eqs. 7-37 a 7-39 simultaneamente:

            ( nΣyx2 - Σy Σx2 )( nΣx1x2 - Σx1 Σx2 ) - [ nΣx22 - (Σx2 )2] [ nΣyx1 - ΣyΣx1]
β1 = ___________________________________________________________________________________
                         (nΣx1x2 - Σx1Σx2)2 - [nΣx12 - (Σx1)2] [nΣx22 - (Σx2)2]
(7-40)

            ( nΣyx1 - Σy Σx1 ) - β1 [nΣx12 - (Σx1)2]
β2 = ______________________________________________
                             nΣx1x2 - Σx1 Σx2
(7-41)

            Σy - β1Σx1 - β2Σx2
α = ___________________________
                          n
(7-42)

As in the case of the one-predictor-variable regression, the standard error of estimate of the correlation is the square root of the variance of the conditional distribution:

Como no caso da regressão de um preditor-variável, o erro padrão da estimativa da correlação é a raiz quadrada da variação da distribuição condicional:

              1
se = [ _______ Σ (y - y' )2 ] 1/2
            n - 3
(7-43)

in which n - 3 is the number of degrees of freedom.

em que n - 3 é o número de graus de liberdade.

Alternatively, the standard error of estimate can be estimated from the variance of the conditional distribution. For calculations based on sample data, the standard error of estimate is:

Como alternativa, o erro padrão de estimativa pode ser estimado a partir da variação da distribuição condicional. Para cálculos baseados em dados de amostra, o erro padrão de estimativa é:

                n - 1
se = sy [ _______ ( 1 - R 2 ) ] 1/2
                n - 3
(7-44)

in which R = multiple regression coefficient, or coefficient of multiple determination, calculated as follows [8]:

em que R = coeficiente de regressão múltipla ou coeficiente de determinação múltipla calculado da seguinte forma [8]:

R 2 = 1 - (SSE / SSTO ) (7-45)

in which SSE = error sum of squares, defined as

em que SSE = soma dos quadrados dos erros, definida como

SSE = Σ ( y - y' )2 (7-46)

and SSTO = total sum of squares, defined as

e SSTO = soma total de quadrados, definida como

SSTO = Σ ( y - ȳ )2 (7-47)

Nonlinear Multiple Regression

Regressão múltipla não linear

Equations 7-40 to 7-42 can also be used to fit equations of the type:

As equações 7-40 a 7-42 também podem ser usadas para ajustar equações do tipo:

y = a x1b1 x2b2 (7-48)

First, this equation is linearized by taking the logarithms:

Primeiro, essa equação é linearizada tomando os logaritmos:

log y = log a + b1 log x1 + b2 log x2 (7-49)

With u = log x1 v = log x2, and w = log y, this equation is: w = log a + bu + cv. The variables u, v, and w are used in Eqs. 7-40 to 7-42 instead of x1, x2, and y, respectively. Then α = log a, β1 = b1, β2 = b2, and the regression equation is:

Com u = log x1 v = log x2 e w = log y, esta equação é: w = log a + bu + cv. As variáveis u, v e w são usadas nas Eqs. 7-40 a 7-42 em vez de x1, x2 e y, respectivamente. Então ~ = log a, ~1 = b1, ~2 = b2 e a equação de regressão é:

y = 10α x1β1 x2β2 (7-50)

Multiple regression analysis involving more than two predictor variables is based on the same least squares principle as in the cases shown here. Library programs are usually available to perform the large amount of computations involved.

A análise de regressão múltipla envolvendo mais de duas variáveis preditoras é baseada no mesmo princípio dos mínimos quadrados, como nos casos mostrados aqui. Geralmente, os programas de bibliotecas estão disponíveis para realizar a grande quantidade de cálculos envolvidos.


7.3  ANÁLISE REGIONAL

[Questões]   [Problemas]   [Referências]      [Topo]   [Probabilidade Conjunta]   [Análise de Regressão]  

Peak Flow Based on Catchment Area

Pico de vazão com base na área de captação

The earliest approach to regionalization of hydrologic properties was to assume that peak flow is related to catchment area and to perform a regression to determine the parameters. The equation is of the following form:

A abordagem mais antiga para a regionalização das propriedades hidrológicas foi assumir que o pico de fluxo está relacionado à área de captação e realizar uma regressão para determinar os parâmetros. A equação tem a seguinte forma:

Qp = c A m (7-51)

in which Qp = peak flow; A = catchment area; and c and m are regression parameters. In nature, as catchment area increases, the spatially averaged rainfall intensity decreases, and consequently peak flow does not increase as fast as catchment area. Therefore, the exponent m in Eq. 7-51 always less than 1, usually in the range 0.4 to 0.9 [5, 10] . Practical examples of the use of this method are given in Section 14.6.

em que Qp = pico de fluxo; A = área de captação; e c são parâmetros de regressão. Na natureza, à medida que a área de captação aumenta, a intensidade da precipitação média espacialmente diminui e, consequentemente, o fluxo máximo não aumenta tão rápido quanto a área de captação. Portanto, o expoente m na Eq. 7-51 sempre menor que 1, geralmente na faixa de 0,4 a 0,9 [5, 10]. Exemplos práticos do uso deste método são fornecidos na Seção 14.6.

Other formulas relating peak flow to catchment area are the following:

Outras fórmulas relacionadas ao fluxo de pico da área de captação são as seguintes:

Qp = c A nA-m (7-52)

Qp = c A a - b log A (7-53)

                 cA
Qp = ______________  +  dA
           (a + bA ) m
(7-54)

in which a, b, c, d, m, and n are parameters determined from statistical analysis of measured data and are applicable on a regional basis, i.e., for neighboring watersheds of similar physiographic, vegetative, and land use patterns.

em que a, b, c, d, me são parâmetros determinados a partir da análise estatística dos dados medidos e são aplicáveis %G​​%@em uma base regional, isto é, para bacias hidrográficas vizinhas de padrões fisiográficos, vegetativos e de uso da terra semelhantes.

The Creager curves (Fig. 2-73) are an example of Eq. 7-52 [3]. Equation 7-53 been used in regional flood studies in the Southwest [2, 6, 9], whereas Eq. 7-54 appears to be typical of European practice [5]. In principle, none of these equations accounts explicitly for flood frequency, being limited to providing a maximum flow. The effect of flood frequency, however, can be accounted for by varying the parameters (Section 14.6).

As curvas Creager (Fig. 2-73) são um exemplo da Eq. 7-52 [3]. A equação 7-53 foi usada em estudos regionais de inundação no sudoeste [2, 6, 9], enquanto a Eq. 7-54 parece ser típico da prática européia [5]. Em princípio, nenhuma dessas equações explica explicitamente a frequência de inundação, limitando-se a fornecer um fluxo máximo. O efeito da frequência de inundação, no entanto, pode ser explicado pela variação dos parâmetros (Seção 14.6).

Index-Flood Method

Método de inundação de índice

The index-flood method is used to determine the magnitude and frequency of peak flows for catchments of any size, whether gaged or ungaged, located within a hydrologically homogeneous region, i.e. , a region with similar hydrologic characteristics [1, 4].

O método de índice de inundação é usado para determinar a magnitude e a frequência dos picos de vazão para bacias hidrográficas de qualquer tamanho, calibradas ou não, localizadas dentro de uma região hidrologicamente homogênea, isto é, uma região com características hidrológicas semelhantes [1, 4].

The application of the index-flood method consists of developing two curves. The first curve depicts the mean annual flood (i.e., that corresponding to the 2.33-y frequency) versus catchment area. The second curve shows peak flow ratio versus frequency. The peak flow ratio is the ratio of peak flow for a given frequency to the mean annual flood. Using these two curves, a flood-frequency curve may be developed for any catchment in the region.

A aplicação do método index-flood consiste no desenvolvimento de duas curvas. A primeira curva representa a inundação média anual (isto é, a correspondente à frequência de 2,33-y) versus a área de influência. A segunda curva mostra a razão de pico de fluxo versus frequência. A taxa de pico de fluxo é a taxa de pico de fluxo de uma determinada frequência para a inundação média anual. Usando essas duas curvas, uma curva de frequência de inundação pode ser desenvolvida para qualquer bacia hidrográfica da região.

The procedure consists of the following steps:

O procedimento consiste nas seguintes etapas:

  1. Measuring the catchment area,

    Medindo a área de captação,

  2. Using the first curve to obtain the mean annual flood,

    Usando a primeira curva para obter a inundação média anual,

  3. Using the second curve to obtain peak flow ratios for selected frequencies,

    Usando a segunda curva para obter taxas de pico de fluxo para frequências selecionadas,

  4. Calculating the peak flows for each frequency, and

    Cálculo dos fluxos de pico para cada frequência e

  5. Plotting peak flows versus frequencies.

    Traçando fluxos de pico versus frequências.

Mean Annual Flood

Inundação média anual

The magnitude of the mean annual flood is a function of several physiographic and meteorologic factors. The physiographic factors that may influence the mean annual flood are the following:

A magnitude da inundação média anual é uma função de vários fatores fisiográficos e meteorológicos. Os fatores fisiográficos que podem influenciar a inundação média anual são os seguintes:

  1. Drainage area,

    Área de drenagem,

  2. Channel storage,

    Armazenamento de canal,

  3. Artificial or natural storage in lakes and ponds,

    Armazenamento artificial ou natural em lagos e lagoas,

  4. Catchment slope,

    Declive de captação,

  5. Land slope,

    Declive de terra,

  6. Stream density and pattern,

    Densidade e padrão do fluxo,

  7. Mean elevation,

    Elevação média,

  8. Catchment shape,

    Forma de captação,

  9. Orographic position,

    Posição orográfica,

  10. Underlying geology,

    Geologia subjacente,

  11. Soil cover, and

    Cobertura do solo e

  12. Vegetative and land use patterns.

    Padrões vegetativos e de uso da terra.

The meteorologic factors include:

Os fatores meteorológicos incluem:

  1. Regional climatic characteristics,

    Características climáticas regionais,

  2. Rainfall intensities,

    Intensidades das chuvas,

  3. Storm direction, pattern and volume,

    Direção da tempestade, padrão e volume,

  4. Effect of snowmelt.

    Efeito do degelo.

Of the above factors, drainage area is the most important and the one most readily available. Measuring the other factors is usually more difficult. For instance, channel storage has an important effect but cannot be measured directly. For practical use, a regression of mean annual flood on catchment area is usually sufficient. Alternatively, equations relating mean annual flood to catchment characteristics other than area can be determined by using multiple regression techniques.

Dentre os fatores acima, a área de drenagem é a mais importante e a mais prontamente disponível. Medir os outros fatores é geralmente mais difícil. Por exemplo, o armazenamento do canal tem um efeito importante, mas não pode ser medido diretamente. Para uso prático, geralmente é suficiente uma regressão da inundação média anual na área de captação. Alternativamente, as equações que relacionam a inundação média anual a outras características da bacia hidrográfica podem ser determinadas usando técnicas de regressão múltipla.

Regional Frequency Curve. The procedure to develop a regional frequency curve by the index-flood method consists of the following steps:

Curva de Frequência Regional. O procedimento para desenvolver uma curva de frequência regional pelo método index-flood consiste nas seguintes etapas:

  1. Assemble the records (annual exceedence or annual maxima series) of several stations (usually 10 to 15), each having more than 5 y of record.

    Monte os registros (excedência anual ou série anual máxima) de várias estações (geralmente 10 a 15), cada uma com mais de 5 anos de registro.

  2. Select a time base common to all the stations (common base period of analysis) in order to eliminate the effect of variability with time.

    Selecione uma base de tempo comum a todas as estações (período base de análise comum) para eliminar o efeito da variabilidade com o tempo.

  3. For each i th station, rank the records in descending order and compute return periods using a plotting position formula such as Weibull's (Eq. 6-26).

    Para cada iésima estação, classifique os registros em ordem decrescente e calcule os períodos de retorno usando uma fórmula de posição de plotagem como a de Weibull (Eq. 6-26).

  4. For each i th station, plot the annual flows versus return periods on extreme value probability paper and fit a line visually to determine the frequency curve.

    Para cada iésima estação, plote os fluxos anuais versus períodos de retorno no papel de probabilidade de valor extremo e ajuste uma linha visualmente para determinar a curva de frequência.

  5. For each i th station, determine the mean annual flood, that is, the peak flow corresponding to the 2.33-y frequency.

    Para cada iésima estação, determine a inundação média anual, ou seja, o pico de fluxo correspondente à frequência de 2,33-y.

  6. Choose several frequencies, and for each i th station and j th frequency calculate the peak flow ratio, i.e., the ratio of peak flow for the j th frequency to the mean annual flood.

    Escolha várias frequências e, para cada iésima estação e j-ésima frequência, calcule a razão de pico de fluxo, isto é, a razão de pico de fluxo para a j-ésima frequência e a inundação média anual.

  7. For each j th frequency, determine the median value of peak flow ratios for all stations, that is, the median peak flow ratio.

    Para cada j-ésima frequência, determine o valor mediano das taxas de pico de fluxo para todas as estações, ou seja, a taxa média de pico de fluxo.

  8. Plot median peak flow ratios versus frequencies on extreme value probability paper and draw a line of best fit to obtain a regional flood frequency curve for the given data.

    Plote relações médias de pico de fluxo versus frequências em papel de probabilidade de valor extremo e desenhe uma linha de melhor ajuste para obter uma curva de frequência de inundação regional para os dados fornecidos.

Test of Hydrologic Homogeneity. The index-flood method includes a test of regional hydrologic homogeneity. Any station not passing this test should be excluded from the set. The test procedure consists of the following steps [4]:

Teste de homogeneidade hidrológica. O método de índice de inundação inclui um teste de homogeneidade hidrológica regional. Qualquer estação que não passar neste teste deve ser excluída do aparelho. O procedimento de teste consiste nas seguintes etapas [4]:

  1. For each i th station, use its frequency curve to determine the 2.33-y and the 10-y floods.

    Para cada iésima estação, use sua curva de frequência para determinar as inundações de 2,33-y e 10-y.

  2. For each i th station, calculate the 10-y peak flow ratio, i.e., the ratio of the 10-y flood to the 2.33-y flood.

    Para cada iésima estação, calcule a taxa de fluxo de pico de 10 anos, ou seja, a proporção da inundação de 10 anos para a inundação de 2,33 anos.

  3. Calculate the average of the 10-y peak flow ratios for all stations.

    Calcule a média das taxas de fluxo de pico de 10 anos para todas as estações.

  4. For each i th station, multiply the 2.33-y flood by the average 10-y peak flow ratio to obtain an adjusted 10-y peak flow.

    Para cada iésima estação, multiplique a inundação de 2,33-y pela taxa média de vazão de 10 anos para obter um fluxo de pico de 10 anos ajustado.

  5. For each i th station, use its frequency curve to determine the return period Ti for the adjusted 10-y peak flow.

    Para cada iésima estação, use sua curva de frequência para determinar o período de retorno Ti para o fluxo de pico ajustado de 10 anos.

  6. For each i th station, plot the return period Ti versus the length of record n, in years, in Fig. 7-4. Points located within the confidence limits (solid lines) are considered to be hydrologically homogeneous. Points lying outside of the solid lines should not be used in the calculation of the median peak flow ratio (step 7 of the index-flood method).

    Para cada iésima estação, plote o período de retorno Ti versus o comprimento do registro n, em anos, na Fig. 7-4. Pontos localizados dentro dos limites de confiança (linhas sólidas) são considerados hidrologicamente homogêneos. Os pontos situados fora das linhas sólidas não devem ser usados no cálculo da razão mediana do pico de fluxo (etapa 7 do método de índice de inundação).

Homogeneity test chart for index-flood method

Figure 7-4  Homogeneity test chart for index-flood method [4].

Limitations of the Index-Flood Method. Benson [1] has noted the following limitations of the index-flood method:

Limitações do método Index-Flood. Benson [1] observou as seguintes limitações do método de index-flood:

  1. The mean annual flood for stations with short periods of record may not be typical, which means that the peak flow ratios of different return periods may vary widely among stations.

    A inundação média anual para estações com curtos períodos de registro pode não ser típica, o que significa que as taxas de pico de fluxo de diferentes períodos de retorno podem variar amplamente entre as estações.

  2. The homogeneity test is used to determine whether the differences in the frequency curves are greater than those that could be attributed to chance alone. The index-flood test uses the 10-y flow ratio because of the lack of sufficient data to define the frequency curve adequately at longer return periods. Studies have shown that although homogeneity may be assumed on the basis of the 10-y peak flow ratio, the individual frequency curves may show wide and sometimes systematic differences at longer return periods.

    O teste de homogeneidade é usado para determinar se as diferenças nas curvas de frequência são maiores do que aquelas que poderiam ser atribuídas apenas ao acaso. O teste de índice de inundação usa a taxa de fluxo de 10 anos devido à falta de dados suficientes para definir adequadamente a curva de frequência em períodos de retorno mais longos. Estudos demonstraram que, embora a homogeneidade possa ser assumida com base na taxa de pico de fluxo de 10 anos, as curvas de frequência individuais podem mostrar diferenças amplas e às vezes sistemáticas em períodos de retorno mais longos.

  3. The method combines frequency curves for all catchment sizes, excluding only the largest. At the 10-y peak flow ratio level, the effect of catchment size is small and can be neglected. Studies have shown that the peak flow ratios tend to vary inversely with catchment size. In general, the larger the catchment, the flatter the frequency curve and the lower the peak flow ratios. The effect of catchment size is particularly marked for floods of long return period.

    O método combina curvas de frequência para todos os tamanhos de captação, excluindo apenas as maiores. No nível da razão de vazão máxima de 10 anos, o efeito do tamanho da bacia é pequeno e pode ser negligenciado. Estudos mostraram que as taxas de pico de fluxo tendem a variar inversamente com o tamanho da bacia. Em geral, quanto maior a captação, mais plana a curva de frequência e menores as taxas de pico de fluxo. O efeito do tamanho da bacia é particularmente acentuado para inundações de longo período de retorno.

 Example 7-3.

Use the Qi/Q2.33 data for the five stations shown in Table 7-2 to develop a regional flood frequency curve by the index-flood method. Assuming Q2.33 = 2.5A0.6, in which Q2.33 is in cubic meters per second and catchment area A is in square kilometers, calculate the 50-y flood for a 150-km2 catchment based on the regionally developed curve.

Use os dados Qi / Q2.33 para as cinco estações mostradas na Tabela 7-2 para desenvolver uma curva de frequência de inundação regional pelo método de índice de inundação. Supondo Q2.33 = 2.5A0.6, em que Q2.33 está em metros cúbicos por segundo e a área de captação A está em quilômetros quadrados, calcule a inundação de 50 anos para uma captação de 150 km2 com base na curva desenvolvida regionalmente.


The median values are shown at the bottom of each column. These values are plotted against the return period, as shown in Fig. 7-5. The fitted line is the regional flood-frequency curve. For a 150-km2 catchment, the mean annual flood is: 50.5 m3/s. From Fig. 7-5, the peak flood ratio for the 50-y return period is 2.62. Therefore, the 50-y flood for this catchment is 132 m3/s.

Os valores medianos são mostrados na parte inferior de cada coluna. Esses valores são plotados contra o período de retorno, como mostra a Figura 7-5. A linha ajustada é a curva regional de frequência de inundação. Para uma bacia hidrográfica de 150 km2, a inundação média anual é de 50,5 m3 / s. Na Figura 7-5, a taxa de pico de inundação para o período de retorno de 50 anos é 2,62. Portanto, a inundação de 50 anos para esta bacia é de 132 m3 / s.


Table 7-2  Index-Flood Method:  Example 7-3.
(1) (2) (3) (4) (5) (6) (7) (8)
Station
i
Qi /Q 2.33 for the j th Return Period (years)
1.11 1.25 2 5 10 25 50
1 0.32 0.49 0.90 1.45 1.82 2.28 2.62
2 0.35 0.51 0.92 1.44 1.79 2.23 2.56
3 0.39 0.55 0.92 1.40 1.73 2.14 2.44
4 0.27 0.45 0.90 1.50 1.88 2.38 2.74
5 0.31 0.50 0.91 1.46 1.84 2.32 2.68
Median 0.32 0.50 0.91 1.45 1.82 2.28 2.62

Index-flood method: Example

Figure 7-5  Index-flood method: Example 7-3.


Rainfall Intensity-Duration-Frequency

Intensidade de chuvas - duração - frequência

Curves showing the relationship between intensity, duration, and frequency of rainfall (IDF curves) are required for peak flow computations in small catchments (see rational method, Chapter 4). These curves can be developed using either: (a) depth-duration-frequency data provided by the National Weather Service, or (b) regional or local rainfall intensity-duration data. The latter procedure is illustrated by the following example.

Curvas que mostram a relação entre intensidade, duração e frequência de precipitação (curvas IDF) são necessárias para cálculos de pico de vazão em pequenas bacias hidrográficas (ver método racional, capítulo 4). Essas curvas podem ser desenvolvidas usando: (a) dados de profundidade-duração-frequência fornecidos pelo Serviço Nacional de Meteorologia, ou (b) dados regionais ou locais de intensidade-duração das chuvas. O último procedimento é ilustrado pelo exemplo a seguir.

 Example 7-4.

Determine the equation relating rainfall intensity and duration for the following 10-y frequency rainfall data.

Determine a equação que relaciona a intensidade e a duração das chuvas para os seguintes dados de chuvas com frequência de 10 anos.

Rainfall duration tr (min) 5 10 15 30 60 120 180
Rainfall intensity i (cm/h) 8 5 4 2.5 1.5 1.0 0.8


The data suggest that the relation is of hyperbolic type, with greater intensities associated with shorter durations. Therefore, an equation of the type of Eq. 2-6 is applicable:

Os dados sugerem que a relação é do tipo hiperbólica, com maiores intensidades associadas a durações mais curtas. Portanto, uma equação do tipo de Eq. 2-6 é aplicável:

              a
i =  ___________
         tr  +  b
(7-55)

in which a and b are constants to be determined by regression analysis. This equation can be linearized in the following way:

em que aeb são constantes a serem determinadas por análise de regressão. Essa equação pode ser linearizada da seguinte maneira:

  1         tr          b
___  =  ____  +  ____
  i          a          a
(7-56)

With y = 1/i, x = tr, α = b/a, and β = 1/a, the application of the regression formulas (Eqs. 7-30 and 7-31) to the data leads to: 1/i = 0.006422 tr, + 0.1706, in which α = 0.1706 and β = 0.006422. Therefore: a = 155.7 and b = 26.56. The regression equation is: i = 155.7 / (tr  + 26.56). The data and regression line are shown in Fig. 7-6.

Com y = 1 / i, x = tr, ~ = b / a e ~ = 1 / a, a aplicação das fórmulas de regressão (Eqs. 7-30 e 7-31) aos dados leva a: 1 / i = 0,006422 tr, + 0,1706, em que ~ = 0,1706 e ~ = 0,006422. Portanto: a = 155,7 eb = 26,56. A equação de regressão é: i = 155,7 / (tr + 26,56). Os dados e a linha de regressão são mostrados na Fig. 7-6.


calculator image 

ONLINE CALCULATION. Using ONLINEREGRESSION15, the answer is: a = 155.702; b = 26.5632, which confirms the hand calculations.

Fitting intensity-duration-frequency curve

Figure 7-6  Fitting intensity-duration-frequency curve:  Example 7-4.


State Equations for Regional Flood Frequency

Equações estaduais para frequência regional de inundação

The U.S. Geological Survey has developed a comprehensive methodology for regional analysis of flood frequency [11]. Details of this method are given in Section 14.6.

O U.S. Geological Survey desenvolveu uma metodologia abrangente para análise regional da frequência de inundações [11]. Detalhes deste método são fornecidos na Seção 14.6.


QUESTÕES

[Problemas]   [Referências]      [Topo]   [Probabilidade Conjunta]   [Análise de Regressão]   [Análise Regional]  

  1. What is a joint probability? What is a marginal probability?

    O que é uma probabilidade conjunta? O que é uma probabilidade marginal?

  2. What is a joint density function? Give an example.

    O que é uma função de densidade articular? Dê um exemplo.

  3. What is a conditional probability? How is it used in regression analysis?

    O que é uma probabilidade condicional? Como é usado na análise de regressão?

  4. Define covariance.

    Definir covariância.

  5. What is a correlation coefficient?

    O que é um coeficiente de correlação?

  6. What is the difference between correlation and regression?

    Qual é a diferença entre correlação e regressão?

  7. Describe briefly the index-flood method for regional analysis of flood frequency.

    Descreva brevemente o método de índice de inundação para análise regional da frequência de inundação.


PROBLEMAS

[Referências]      [Topo]   [Probabilidade Conjunta]   [Análise de Regressão]   [Análise Regional]   [Questões]  

  1. Using ONLINE TWOD CORRELATION, calculate the correlation coefficient of the following joint distribution of quarterly flows (expressed as mean values in each class) in streams A and B:

    Usando ONLINE TWOD CORRELATION, calcule o coeficiente de correlação da seguinte distribuição conjunta dos fluxos trimestrais (expressos como valores médios em cada classe) nos fluxos A e B:


    Stream A
    (ac-ft)
    1000 2000 3000 4000 5000
    Stream B
    (ac-ft)
    1000 0.07 0.03 0.02 0.00 0.00
    2000 0.03 0.08 0.04 0.03 0.00
    3000 0.02 0.04 0.08 0.05 0.02
    4000 0.00 0.04 0.08 0.11 0.06
    5000 0.00 0.00 0.03 0.08 0.09

  2. Develop a spreadsheet to calculate the regression constants, correlation coefficient, and standard error of estimate of a series of paired flow values X and Y. Test your program using the data of Example 7-2 in the text.

    Desenvolva uma planilha para calcular as constantes de regressão, coeficiente de correlação e erro padrão de estimativa de uma série de valores de fluxo emparelhados X e Y. Teste seu programa usando os dados do Exemplo 7-2 no texto.

  3. Using the spreadsheet developed in Problem 7-2, calculate the regression constants, correlation coefficient, and standard error of estimate for the following paired low-flow series (annual minima):

    Usando a planilha desenvolvida no Problema 7-2, calcule as constantes de regressão, o coeficiente de correlação e o erro padrão de estimativa para as seguintes séries de baixo fluxo emparelhadas (mínimos anuais):


    Stream X
    (m3/s)
    Stream Y
    (m3/s)
    50 65
    66 76
    32 45
    78 95
    12 18
    34 50
    23 31
    50 64
    43 67
    89 99
    76 89
    22 33

    Verify with ONLINE REGRESSION11.

    Verifique com REGRESSION ONLINE11.

  4. Modify the spreadsheet developed in Problem 7-2 to calculate the regression constants to fit a power function of the following form (Eq. 7-51):

    Modifique a planilha desenvolvida no Problema 7-2 para calcular as constantes de regressão para ajustar uma função de potência do seguinte formato (Eq. 7-51)

    Qp = cAn

    in which Qp = peak discharge; A = drainage area; c and m are coefficient and exponent, respectively. Using the spreadsheet, fit a power function to the following data:

    em que Qp = pico de descarga; A = área de drenagem; c e m são coeficientes e expoentes, respectivamente. Usando a planilha, ajuste uma função de energia aos seguintes dados:


    Peak Discharge
    (m3/s)
    Drainage Area
    (km2)
    124 25
    254 46
    378 78
    101 22
    678 99
    540 89
    490 83
    267 52
    350 73

    Verify with ONLINE REGRESSION12.

    Verifique com REGRESSION ONLINE12.

  5. ONLINE REGRESSION13 solves the two-predictor-variable linear regression problem (Eq. 7-35). Use this program to determine the regression constants for the following data set:

    REGRESSÃO ONLINE13 resolve o problema de regressão linear de duas variáveis preditoras (Eq. 7-35). Use este programa para determinar as constantes de regressão para o seguinte conjunto de dados:


    Y
    Time of Concentration
    (min)
    X1
    Hydraulic Length
    (m)
    X2
    Catchment Slope
    (m/m)
    89 3245 0.008
    75 2567 0.011
    57 2783 0.009
    34 1234 0.015
    101 5345 0.006
    121 5329 0.007
    68 3002 0.008
    79 2976 0.010
    25 1034 0.018
    59 2984 0.010
    96 3892 0.007
    12 534 0.020

  6. Use ONLINE REGRESSION14 to solve the two-predictor-variable nonlinear regression problem of Eq. 7-48, for the data of Problem 7-5.

    Use ONLINE REGRESSION14 para resolver o problema de regressão não linear de duas variáveis preditoras da Eq. 7-48, para os dados do Problema 7-5.

  7. The median Qi/Q2.33 ratios (i = frequency) for 10 stations have been found to be 1.95 for the 10-y frequency and 2.45 for the 50-y frequency. Use the index-flood method to calculate the 25-y flood for a point in a stream having a 340-km2 catchment and a mean annual flood given by the following formula:

    Verificou-se que as razões medianas de Qi / Q2.33 (i = frequência) para 10 estações são 1,95 para a frequência de 10 anos e 2,45 para a frequência de 50 anos. Use o método index-flood para calcular a inundação de 25 anos para um ponto em um riacho com uma bacia hidrográfica de 340 km2 e uma inundação média anual dada pela seguinte fórmula:

    Q 2.33 = 3.93 A 0.75

    in which Q = flood discharge in cubic meters per second, and A = drainage area in square kilometers.

    em que Q = vazão em metros cúbicos por segundo e A = área de drenagem em quilômetros quadrados.

  8. Modify the spread sheet developed in Problem 7-2 to calculate the regression constants and correlation coefficient to fit intensity-duration-frequency rainfall data. Test your spread sheet using the data of Example 7-4 in the text.

    Modifique a planilha desenvolvida no Problema 7-2 para calcular as constantes de regressão e o coeficiente de correlação para ajustar os dados de precipitação intensidade-duração-frequência. Teste sua planilha usando os dados do Exemplo 7-4 no texto.

  9. Using ONLINE REGRESSION15 for a hyperbolic regression, calculate the regression constants a and b (Eq. 7-55) for the following 25-y frequency rainfall data:

    Usando ONLINE REGRESSION15 para uma regressão hiperbólica, calcule as constantes de regressão aeb (Eq. 7-55) para os seguintes dados de precipitação com frequência de 25 anos:


    Duration (min) 5 10 15 30 60 120 180
    Intensity (mm/h) 15.5 7.5 6.5 4.5 3.5 2.5 1.5


REFERÊNCIAS

   [Topo]   [Probabilidade Conjunta]   [Análise de Regressão]   [Análise Regional]   [Questões]   [Problemas]  

  1. Benson, M. A. (1962). "Evolution of Methods for Evaluating the Occurrence of Floods," U.S. Geological Survey Water Supply Paper No. 1580-A.

  2. Boughton, W. C., and K. G. Renard. (1984). "Flood Frequency Characteristics of Some Arizona Watersheds," Water Resources Bulletin, Vol. 20, No. 5, October, pp. 761- 769.

  3. Creager, W. P., J. D. Justin, and 1. Hinds. (1945). Engineering for Dams. Vol. 1. New York: John Wiley.

  4. Dalrymple, T. (1960). "Flood Frequency Analyses," U.S. Geological Survey Water Supply Paper No. 1543A.

  5. Hall, M. J. (1984). Urban Hydrology. London: Elsevier Applied Science Publishers.

  6. Malvick, A. J. (1980). "A Magnitude-Frequency-Area Relation for Floods in Arizona," Research Report No. 2, College of Engineering, University of Arizona, Tucson.

  7. McCuen, R. H. (1985). Statistical Methods for Engineers. Englewood Cliffs, N.J.: Prentice-Hall.

  8. Neter, J., W. Wasserman, and M. H. Kutner. (1989). Applied Linear Regression Models, Second Edition, Irwin, Homewood, illinois.

  9. Reich. B. M., H. B. Osborn. and M. C. Baker. (1979). "Tests on Arizona New Flood Estimates," in Hydrology and Water Resources in Arizona and the Southwest, University of Arizona, Tucson, Vol. 9.

  10. Roeske, R. H. (1978). "Methods for Estimating the Magn!tude and Frequency of Floods in Arizona," Final Report, ADOT-RS-lS-121, U.S. Geological Survey, Tucson, Arizona.

  11. U.S. Geological Survey. (1994). "Nationwide Summary of U.S. Geological Survey Regional Regression Equations for Estimating Magnitude and Frequency of Floods for Ungaged Sites, 1993" Compiled by M. E. Jennings, W. O. Thomas, and H. C. Riggs, Water-Resources Investigations Report 94-4002, Reston, Virginia.

  12. Viessman, W. Jr., J. W. Knapp, G. L. Lewis, and T. E. Harbaugh, Introduction to Hydrology, 2d. ed, New York: Harper & Row.


http://ponce.sdsu.edu/hidrologia_engenharia/index.html
200630

Documents in Portable Document Format (PDF) require Adobe Acrobat Reader 5.0 or higher to view; download Adobe Acrobat Reader.