nextuppreviouscontents
Next:ExemplosUp:Condição Suficiente Para QuePrevious:Teste do Hessiano: Caso

Teste do Hessiano: Caso Geral

Antes de enunciarmos o caso geral, relembremos o seguinte fato de Álgebra Linear:Proposição 1   Seja $A=(a_{ij})_{n\times n}$ uma matriz com coeficientes reais simétrica. Então A possui n autovalores reais (contados conforme a sua multiplicidade). Além do mais, podemos escolher os n autovetores de modo que formem uma base ortonormal de $\mathbb R^n.$ Em suma, existem números reais $\lambda_1,\dots,\lambda_n$ e vetores $\vec{v_1},\dots,\vec{v_n}$ tais que $A\vec{v_j}=\lambda_j\vec{v_j},$$\vec{v_i}\cdot\vec{v_j}=\begin{cases}1 \text{ se } i=j\\ 0\text{ se } i\neq j,\end{cases}$$1\leq j\leq n,$ onde $A\vec{v_j}$ deve ser entendido como o produto da matriz A pelo vetor coluna $\vec{v_j}^t.$

Teorema 5 (Caso geral)   Seja $f:A\rightarrow\mathbb R$ uma função de classe C2 definida num aberto $A\subset \mathbb R^n.$ Suponha que $P_0\in A$ seja um ponto crítico de f. Sejam $\lambda_1,\dots,\lambda_n$ os autovalores da matriz hessiana de f em P0 e H(P0) o hessiano de f em P0. Temos

1.
se $\lambda_j>0$ para todo $1\leq j\leq n$ então P0 é um ponto de mínimo local de f;
2.
se $\lambda_j<0$ para todo $1\leq j\leq n$ então P0 é um ponto de máximo local de f;
3.
se existirem dois autovalores $\lambda_i$$\lambda_j$ com sinais opostos então P0 é um ponto de sela de f;
4.
nos demais casos, isto é,
(a)
$\lambda_j\geq 0,$ para todo $1\leq j\leq n$ e existe um autovalor $\lambda_i=0$ ou
(b)
$\lambda_j\leq 0,$ para todo $1\leq j\leq n$ e existe um autovalor $\lambda_i=0$
não podemos afirmar nada sobre a natureza do ponto crítico P0.
Esboço da prova Ao invés de usarmos a base canônica de $\mathbb R^n$ usaremos a base ortonormal $\{\vec{v_1},\dots,\vec{v_n}\}$ formada pelos autovetores da matriz hessiana de f em P0. Considere a função $g(t)=f(P_0+t\vec{u}),$ onde $0\leq t\leq 1,$$\vec{u}$ é um vetor com norma suficientemente pequena. Use a regra da cadeia e confira que $g'(0)=\nabla(P_0)\cdot \vec{u}=0$$g''(0)=({\mathrm{ Hess}}(P_0)\vec{u})\cdot\vec{u}.$ O ponto a ser observado é que quando $\vec{u}$ é pequeno o bastante, o valor de f(P), onde $P=P_0+\vec{u},$ fica próximo a $f(P_0)+\frac{1}{2}({\mathrm{ Hess}}(P_0)\vec{u})\cdot\vec{u}$ (pense como ficaria a fórmula de Taylor para várias variáveis). Com relação à base adotada, escrevemos $\vec{u}=h_1\vec{v_1}+\cdots +h_n\vec{v_n}$ e, deste modo,
\begin{displaymath}2[f(P)-f(P_0)]\approx ({\mathrm{ Hess}}(P_0)\vec{u})\cdot\vec......cdots+h_n\vec{v_n}))\cdot(h_1\vec{v_1}+\cdots +h_n\vec{v_n}) \end{displaymath}
\begin{displaymath}=(h_1{\mathrm{ Hess}}(P_0)\vec{v_1}+\cdots +h_n{\mathrm{Hess}}(P_0)\vec{v_n})\cdot(h_1\vec{v_1}+\cdots +h_n\vec{v_n})\end{displaymath}
\begin{displaymath}= (h_1\lambda_1\vec{v_1}+\cdots+h_n\lambda_n\vec{v_n})\cdot(h_1\vec{v_1}+\cdots +h_n\vec{v_n})\end{displaymath}
\begin{displaymath}=\sum_{i,j=1}^n\lambda_ih_ih_j\vec{v_i}\cdot\vec{v_j}=\sum_{i=1}^n\lambda_ih_i^2=\lambda_1h^2_1+\cdots+\lambda_nh^2_n,\end{displaymath}


pelo fato dos vetores serem ortonormais. Agora, se $\lambda_j>0,$ para todo $1\leq j\leq n$ temos que $\lambda_1h^2_1 +\cdots+\lambda_nh^2_n> 0$ se $\vec{u}=h_1\vec{v_1}+\cdots +h_n\vec{v_n}\neq \vec{0}.$ Se $\lambda_j<0,$ para todo $1\leq j\leq n$ temos que $\lambda_1h^2_1 +\cdots+\lambda_nh^2_n< 0$ se $\vec{u}=h_1\vec{v_1}+\cdots +h_n\vec{v_n}\neq \vec{0}.$ Isto leva às conclusões 1 e 2. Suponha agora que existam $\lambda_i<0$$\lambda_j>0.$ Tome $P_1=P_0+h_i\vec{v_i},$$h_i\neq 0$$P_2=P_0+h_j\vec{v_2},$$h_j\neq 0.$ Temos

\begin{displaymath}2[ f(P_1)-f(P_0)]\approx ({\mathrm{Hess}}(P_0) {h_1\vec{v_i}})\cdot (h_1\vec{v_i})=\lambda_ih_1^2<0\end{displaymath}


e

\begin{displaymath}2[f(P_2)-f(P_0)]\approx ({\mathrm{ Hess}}(P_0){h_2\vec{v_j}})\cdot (h_2\vec{v_j})=\lambda_jh_2 ^2>0.\end{displaymath}


A partir daí, segue-se 3.

4 segue dos seguintes exemplos como no teorema do caso bidimensional. Basta considerar as funções $f(x_1,\cdots,x_n)=x_1^4+x_2^4,$$g(x_1,\cdots,x_n)=-x_1^4-x_2^4$$h(x_1,\cdots,x_n)=x_1^4-x_2^4$ que têm a origem como ponto de mínimo, máximo e sela, respectivamente. Note que nos três casos, os autovalores são todos nulos. O teorema a seguir, que é um resultado de Álgebra Linear, fornece uma condição necessária e suficiente para decidir se uma matriz simétrica apresenta todos os autovalores positivos ou todos negativos.Definição 1   Seja A=(aij) uma matriz de ordem n. O menor principal de ordem $1\leq k\leq n$ da matriz é definido como o determinante da sub-matriz $A_k=(a_{ij})_{\substack{1\leq i\leq k\\ 1\leq j\leqk}}$ e denotado por mk(A).Teorema 6   Seja A=(aij) uma matriz simétrica de ordem n.

 
1.
A fim de que todos os autovalores de A sejam positivos é necessário e suficiente que mk(A)>0 para todo $1\leqk\leq n.$
2.
A fim de que todos os autovalores de A sejam negativos é necessário e suficiente que mk(A)<0 para todo k ímpar, $1\leq k\leq n$ e mk(A)>0 para todo k par, $1\leqk\leq n.$
Obs. A parte $\it 2.$ segue de $\it 1.$ notando que mk(-A)=(-1)kmk(A).
nextuppreviouscontents
Next:ExemplosUp:Condição Suficiente Para QuePrevious:Teste do Hessiano: Caso
Alexandre Nolasco de Carvalho

2000-03-28