User Tools

Site Tools


otimizacao

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
otimizacao [2023/09/25 13:03] 143.107.183.174otimizacao [2023/12/15 09:46] (current) – external edit 127.0.0.1
Line 1: Line 1:
-Suponhamos $  f: S \subset \mathbb{R}^n \rightarrow \mathbb{R}$ e objetivo é achar máximo ou mínimo absoluto (globalda função (no conjunto $  S $).+====== Extremos absolutos (globais======
  
-Como já discutimos, se o ponto máximo ou mínimo estiver no interior do conjunto $  necessariamente este ponto tem que ser um ponto crítico (se a função for diferenciável). Porémprecisamos verificar os pontos da fronteira (em S) e os pontos onde a função não é diferenciável para achar máximo/mínimo global.+Vimos que podemos localizar e identificar os tipos dos extremos locais de uma função em pontos no interior do seu domínio. Agora queremos saber como identificar no domínio inteiro. 
 + 
 +**Definição:** Um conjunto $D\subset \mathbb{R}^2é compacto se é fechado e limitado.  
 + 
 +Temos que:  
 + 
 +$(a,b)$ é um <color #ed1c24>máximo absoluto</color> de $f(x,y)$ em $D$ se $f(x,y)\leq f(a,b)$ para todo $(x,y)$ em $D$. 
 + 
 +$(a,b)$ é um <color #ed1c24>mínimo absoluto</color> de $f(x,y)$ em $D$ se $f(x,y)\geq f(a,b)$ para todo $(x,y)$ em $D$. 
 + 
 +$(a,b)$ é um <color #ed1c24>extremo absoluto</color> de $f(x,y)$ em $D$ se é máximo ou mínimo absoluto de $f$ em $D$. 
 + 
 +**Teorema (Weierstrass):** Seja $f$ uma função contínua em um compacto $D\subset\mathbb{R}^n$. Então existem pontos $p_1$ e $p_2$ em $D$ tais que  
 + 
 +
 +f(p_1)\leq f(x) \leq f(p_2) 
 +
 + 
 +para todo $x$ em $D$. 
 + 
 +Dada $f$ uma função contínua em uma região compacta $D$ de $\mathbb{R}^2$, o teorema de Weierstrass nos diz que $f$ possui um máximo e um mínimo absoluto em $D$. 
 + 
 +Suponhamos que $f$ e suas derivadas parciais de primeira e segunda ordem existem e são contínuas no interior de $D$ e na fronteira de $D$. 
 +Para acharmos os extremos absolutos de $f$ em $D$: 
 + 
 +**1)** Listamos os pontos interiores de $D$ onde $f$ tem máximos ou mínimos locais calculamos $f$ nesses pontos. 
 + 
 +**2)** Listamos os pontos da fronteira de $D$ onde $f$ tem máximos ou mínimos locais e calculamos $f$ nesses pontos. 
 + 
 +**3)** Comparamos todos e achamos os valores máximo mínimo absolutos de $f$ em $D$.
  
 Observação:  Observação: 
Line 9: Line 38:
   * Se $  S  $ não for limitado ou não contem alguns de seus pontos de fronteira, é possível que $  f $ não tenha máximo ou mínimo global. Nestes casos, precisamos analisar o comportamento da função quando $  \|x\| \rightarrow \infty$ ou quando $  x $ converge a fronteira do conjunto $  S. $   * Se $  S  $ não for limitado ou não contem alguns de seus pontos de fronteira, é possível que $  f $ não tenha máximo ou mínimo global. Nestes casos, precisamos analisar o comportamento da função quando $  \|x\| \rightarrow \infty$ ou quando $  x $ converge a fronteira do conjunto $  S. $
  
-<color #ed1c24>Exemplos:</color>+<color #ed1c24>**Exemplos:**</color>
  
-Ache o máximo/mínimo da fução dada por $  f(x, y)=x^2+y^2+x $ na região $  x^2 + y^2 \leq 1. $+Ache o máximo/mínimo da função dada por $  f(x, y)=x^2+y^2+x $ na região $  x^2 + y^2 \leq 1. $
  
-A região dada é disco fechado de raio um que é fechada e limitada.  Os pontos crítico:+A região dada é disco fechado de raio um que é fechada e limitada.  Os pontos críticos são:
  
 $  \nabla f(x, y) = (2x+1, 2y) = (0, 0) $ e portanto $  (x, y)= (-\frac{1}{2}, 0). $ Neste ponto $  f(-\frac{1}{2},0)=-\frac{1}{4}. $ $  \nabla f(x, y) = (2x+1, 2y) = (0, 0) $ e portanto $  (x, y)= (-\frac{1}{2}, 0). $ Neste ponto $  f(-\frac{1}{2},0)=-\frac{1}{4}. $
  
-Agora anlisamos pontos da fronteira: $  x^2+y^2=1 $ e portanto $  f(x, y)= 1+x $. já que na fronteira $  -1 \leq x \leq 1 $ concluímos que o máximo na fronteira é $  2 $ e mínimo é obtido no ponto $  (-1,0) $ com valor $  0. $ Considerando estes tries valores temos que máximo global é $  2 $ e obtido na fronteira, enquanto o mínimo global é alcançado no interior e o valor é $  -\frac{1}{4}. $+Agora analisamos pontos da fronteira: $  x^2+y^2=1 $ e portanto $  f(x, y)= 1+x $. já que na fronteira $  -1 \leq x \leq 1 $ concluímos que o máximo na fronteira é $  2 $ e mínimo é obtido no ponto $  (-1,0) $ com valor $  0. $ Considerando estes três valorestemos que o valor máximo global é $  2 $ e obtido na fronteira, enquanto o valor mínimo global é alcançado no interior e o valor é $  -\frac{1}{4}. $
  
-<color #ed1c24>Exemplo:</color> Ache máximo e mínimo da função $  f(x, y )= \frac{|xy|}{x^2+y^2+1}$ em $  \mathbb{R}^2. $+Ache máximo e mínimo da função $  f(x, y )= \frac{|xy|}{x^2+y^2+1}$ em $  \mathbb{R}^2. $
  
 A existência de valor absoluto mostra que provavelmente a função não é diferenciável quando $  xy=0. $ Porém neste conjunto (união de duas retas) o valor da função é zero e certamente mínimo. A existência de valor absoluto mostra que provavelmente a função não é diferenciável quando $  xy=0. $ Porém neste conjunto (união de duas retas) o valor da função é zero e certamente mínimo.
Line 25: Line 54:
 Então vamos analisar apenas quando $  x> 0, y>0 $ (por simetria). Então vamos analisar apenas quando $  x> 0, y>0 $ (por simetria).
  
-$  \nabla f(x,y)=(\frac{y(y^2 +1 - x^2)}{(x^2+y^2+1)^2}, \frac{x(x^2+1-y^2)}{(x^2+y^2+1)^2})$+$  \nabla f(x,y)=\left(\frac{y(y^2 +1 - x^2)}{(x^2+y^2+1)^2}, \frac{x(x^2+1-y^2)}{(x^2+y^2+1)^2}\right)$
  
-Verifique que não existe nenhum ponto crítico em $  x > 0, y > 0 $ pois as curvas $  x^1+1=y^2, y^2+1=x^2 $ não se cruzam.+Verifique que não existe nenhum ponto crítico em $  x > 0, y > 0 $ pois as curvas $  x^2+1=y^2, y^2+1=x^2 $ não se cruzam.
  
-Observe também que $  \frac{|xy|}{x^2+y^2+1} < \frac{1}{2} $ e o limite ao longo da reta $  y=x $ uando $  x\rightarrow \infty $ é $  \frac{1}{2} $ e portanto não temos máximo.+Observe também que $  \frac{|xy|}{x^2+y^2+1} < \frac{1}{2} $ e o limite ao longo da reta $  y=x $ quando $  x\rightarrow \infty $ é $  \frac{1}{2} $ e portanto não temos máximo.
  
-Em geral parece difícil achar máximo/mínimo ao longo de uma curva fronteira. O método de Lagrange é poderoso para tratar este problema!+<color #22b14c>Em geral parece difícil achar máximo/mínimo ao longo da fronteira de uma curva. O **método de Lagrange** é poderoso para tratar este problema!</color>
  
 ====== Método de Lagrange ====== ====== Método de Lagrange ======
Line 39: Line 68:
 $  M = \{x \in U | g(x)=c\}. $ $  M = \{x \in U | g(x)=c\}. $
  
-Queremos achar máximo de uma função $  f: U \rightarrow \mathbb{R} $ restrita ao conjunto $  M. $+Queremos achar máximo de uma função $  f: U \rightarrow \mathbb{R} $ restrita ao conjunto $  M. $
  
-Seuponhamos que $  a $ um máximo ou mínimo local de restrição da $  f $ a $  M $ e que $  a $ não seja um ponto crítico de $  g $ então $  \nabla f(a) $ é ortogonal a $  M$ no ponto $  a. $ Portanto já que $  a $ não é crítico para $  g $ temos:+Suponhamos que $  a $ é um máximo ou mínimo local da restrição de $  f $ a $  M $ e que $  a $ não seja um ponto crítico de $  g $. Então $  \nabla f(a) $ é ortogonal a $  M$ no ponto $  a. $ Portantojá que $  a $ não é crítico para $  g $temos:
  
 $  \nabla f(a) = \lambda \nabla g(a). $  $  \nabla f(a) = \lambda \nabla g(a). $ 
  
-De fato $  \nabla g(a) \neq 0 $ implica que $  M $ tem vetor normal no ponto $  a $ e existe um plano tangente a $  M. $ Seja $  v $ um vetor no plano tangente e $  \gamma: I \rightarrow \mathbb{R}^n $ tal que +De fato$  \nabla g(a) \neq 0 $ implica que $  M $ tem vetor normal no ponto $  a $ e existe um plano tangente a $  M. $ Seja $  v $ um vetor no plano tangente e $  \gamma: I \rightarrow \mathbb{R}^n $ tal que 
  
-$  \gamma (0)=a, \gamma^{'}(0)=v. $ Já que ponto $  a $ é máximo/mínimo em $  M $ então restrito a curva também é máximo/mínimo: $  \frac{d}{dt} (f \circ \gamma)(t)|_{t=0} = 0. $+$  \gamma (0)=a, \gamma^{'}(0)=v. $ Já que ponto $  a $ é máximo/mínimo em $  M $ então restrito a curva também é máximo/mínimo: $  \frac{d}{dt} (f \circ \gamma)(t)|_{t=0} = 0. $
  
-Pela regra da cadeia: +Pela **regra da cadeia**
  
-$  0 = \nabla f(\gamma(0)) \gamma^{'}(0) = \nabla f (a) v = 0. $+$  0 = \nabla f(\gamma(0)) \cdot \gamma^{'}(0) = \nabla f (a) \cdot v = 0. $
  
-Portanto o vetor gradiente $  \nabla f (a) $ é ortogonal a $  M $ e lembre que $  \nabla g (a) $ também é ortognal a $  M $ e consequentemente, os dois vetores gradientes são paralelos:+Portanto o vetor gradiente $  \nabla f (a) $ é ortogonal a $  M $ e lembre que $  \nabla g (a) $ também é ortogonal a $  M $ e consequentemente, os dois vetores gradientes são paralelos:
  
 $  \nabla f (a) = \lambda \nabla g (a). $   $  \nabla f (a) = \lambda \nabla g (a). $  
  
-Teorema: Seja $  a $ um ponto max/min da função $  f $ restrita ao conjunto $  M= \{g=0\} $ e suponhamos que $  a $ não seja um ponto crítico da $  g. $ Então $  \nabla f (a) $ é ortogonal a $  M $ no ponto $  a. $  Já que $  \nabla g (a) \neq 0 $ portanto existe $  \lambda \in \mathbb{R} $ tal que $  \nabla f (a) = \lambda \nabla g (a). $+**Teorema:** Seja $  a $ um ponto de máximo ou mínimo da função $  f $ restrita ao conjunto $  M= \{g=0\} $ e suponhamos que $  a $ não seja um ponto crítico de $  g. $ Então $  \nabla f (a) $ é ortogonal a $  M $ no ponto $  a. $  Já que $  \nabla g (a) \neq 0 $existe $  \lambda \in \mathbb{R} $ tal que $  \nabla f (a) = \lambda \nabla g (a). $
  
-**Duas interpretação super intuitivas e honestas:**+<color #ff7f27>**Duas interpretações super intuitivas e honestas:**</color>
  
-Para achar máximo/mínimo de $  f $ no conjunto $  M $ vamos imaginar individuos morando no conjunto $  M. $ Estes indivíduos não tem noção do mundo externo $  \mathbb{R}^n $ e já que $  \nabla g (a)\neq 0 $ o mundo deles localmente parece com $  \mathbb{R}^{n-1}. $ Se o ponto $  a $ é máx/minpara eles deve ser um ponto crítico. Porém o que é o gradiente da função restrita ao mundo deles?????+Para achar máximo/mínimo de $  f $ no conjunto $  M $ vamos imaginar indivíduos morando no conjunto $  M. $ Estes indivíduos não tem noção do mundo externo $  \mathbb{R}^n $ e já que $  \nabla g (a)\neq 0 $o mundo deles localmente parece com $  \mathbb{R}^{n-1}. $ Se o ponto $  a $ é máx/min para elesdeve ser um ponto crítico. Porém o que é o gradiente da função restrita ao mundo deles?????
  
-Aha, deve ser a sombra do gradiente $  \nabla f (a) $ no mundo deles! Portanto a projeção de $  \nabla f(a) $ sobre $  M $ no ponto $  a $ deve ser zero que isto implica ortogonalidade a $  M $ e também paralelismo de $  \nabla f (a) $ e $  \nabla g (a).$+Aha, deve ser a sombra do gradiente $  \nabla f (a) $ no mundo deles! Portanto a projeção de $  \nabla f(a) $ sobre $  M $ no ponto $  a $ deve ser zero isto implica ortogonalidade a $  M $ e também paralelismo de $  \nabla f (a) $ e $  \nabla g (a).$
  
-Agora vamos abordar de outra forma, usando um exemplo explícito: Considere superfície dada por $  M:=\{g=c\} $ $  p=(p_1, \cdots, p_n) $ um ponto fora do conjunto $  M. $ Ache os pontos no conjunto $  M $ que minimizam (ou pelo menos localmente minimizam) a distância até o ponto $  p. $+Agora vamos abordar de outra forma, usando um exemplo explícito: 
  
-Imagine um balão ocm centro $  p $ sendo enchido até tocar pela primeira vez o conjunto $  M. $ A ideia intuitiva é que sob certas hipôtese de regularidade, no ponto $  (x_1, \cdots x_n) $ em que a esfera toca $  M $ o vetor gradiente $  \nabla g (x_1,\cdots, x_n) $ é paralelo ao vetor $  (x_1-p_1, \cdots x_n-p_n)$. Por outro lado a função que estamos interessados a minimizar é a função quadrada de distância:+Considere a superfície dada por $  M:=\{g=c\} $ e $  p=(p_1, \cdots, p_n) $ um ponto fora do conjunto $  M. $ Ache os pontos no conjunto $  M $ que minimizam (ou pelo menos localmente minimizam) a distância até o ponto $  p. $ 
 + 
 +Imagine um balão com centro $  p $ sendo enchido até tocar pela primeira vez o conjunto $  M. $ A ideia intuitiva é que sob certas hipóteses de regularidade, no ponto $  (x_1, \cdots x_n) $ em que a esfera toca $  M $ o vetor gradiente $  \nabla g (x_1,\cdots, x_n) $ é paralelo ao vetor $  (x_1-p_1, \cdots x_n-p_n)$. Por outro lado a função que estamos interessados a minimizar é a função quadrada de distância:
  
 $  f(x)= \|x-p\|^2 = \sum_{i=1}^{n} |x_i-p_i|^2 $ e  $  f(x)= \|x-p\|^2 = \sum_{i=1}^{n} |x_i-p_i|^2 $ e 
Line 75: Line 106:
 e isto verifica o resultado de Lagrange para este caso especial da função distância. e isto verifica o resultado de Lagrange para este caso especial da função distância.
  
-Exercícios:+<color #ed1c24>**Exercícios:**</color>
  
-Curva de Whatsapp+**Curva de Whatsapp**
  
 $  f(x, y) = y^2 -x^3 -x^2 -x$. Usando multiplicadores de Lagrange achamos os pontos no círculo $  x^2+y^2=1$ que maximizam/minimizam a função $  f.$  $  f(x, y) = y^2 -x^3 -x^2 -x$. Usando multiplicadores de Lagrange achamos os pontos no círculo $  x^2+y^2=1$ que maximizam/minimizam a função $  f.$ 
  
-<color #22b14c>Essa função foi inspirada por curva elíptica usada pelo Whatsapp ($  y^2=x^3 + 486662x^2 +x$)  sobre o número primo $  2^{255}-19.$</color>+<color #22b14c>Essa função foi inspirada pela curva elíptica usada pelo Whatsapp ($  y^2=x^3 + 486662x^2 +x$)  sobre o número primo $  2^{255}-19.$</color>
  
-Entropia+**Entropia**
  
 A entropia de um vetor de probabilidade $  P=(p_1, \cdots, p_n), \sum_{i=1}^{n} p_i=1 $ é dada por  A entropia de um vetor de probabilidade $  P=(p_1, \cdots, p_n), \sum_{i=1}^{n} p_i=1 $ é dada por 
Line 91: Line 122:
 Mostre que a entropia é máxima quando $  p_i= \frac{1}{n} $ e o valor máximo da entropia é $  ln(n). $ Mostre que a entropia é máxima quando $  p_i= \frac{1}{n} $ e o valor máximo da entropia é $  ln(n). $
  
-Exemplo: Queremos construir caixa retangular sem tampa com área total 12. Quais devem ser as dimensões para que o volume seja máximo?+<color #ed1c24>Exemplo:</color> Queremos construir caixa retangular sem tampa com área total 12. Quais devem ser as dimensões para que o volume seja máximo?
  
-$  A= xy + 2xz + 2yz =12$ é a área da caixa sem tampa. Queremos maximizar $  V(x, y,z)=xyz $. +$  A= xy + 2xz + 2yz =12$ é a área da caixa sem tampa. Queremos maximizar $  V(x,y,z)=xyz $. 
  
 **Mais de um vínculo** **Mais de um vínculo**
  
-Agora vamos considerar mais de uma restrição, i.e queremos achar máx/min da função $  f $ restrita aos conjuntos $  \{g_1=0\} $ e $  \{g_2=0\} $, \cdots.+Agora vamos considerar mais de uma restrição, i.e queremos achar máx/min da função $  f $ restrita aos conjuntos $  \{g_1=0\} $ e $  \{g_2=0\} , \cdots$.
  
 Vamos enunciar com 2 restrições: Vamos enunciar com 2 restrições:
  
-Teorema: Seja $  (x_0, y_0, z_0) $ um ponto extremo de $  f $ uma função $  C^1 $ sujeito restrições  $  g(x, y, z)=0 $ e $  h(x, y,z)=0 $ onde $  h, g $ são funções $  C^1 $ e $  \nabla g (x_0,y_0, z_0) , \nabla h (x_0, y_0, z_0) $ são vetores linearmente independentes então existem $  \lambda, \mu \in \mathbb{R} $ tais que +**Teorema:** Seja $  (x_0, y_0, z_0) $ um ponto extremo de $  f $ que é uma função $  C^1 $ sujeita às restrições  $  g(x, y, z)=0 $ e $  h(x, y,z)=0 $ onde $  h, g $ são funções $  C^1 $ e $  \nabla g (x_0,y_0, z_0) , \nabla h (x_0, y_0, z_0) $ são vetores linearmente independentes. Então existem $  \lambda, \mu \in \mathbb{R} $ tais que 
  
 $  \nabla f (x_0, y_0, z_0) = \lambda \nabla g (x_0, y_0, z_0) + \mu \nabla h (x_0, y_0, z_0). $ $  \nabla f (x_0, y_0, z_0) = \lambda \nabla g (x_0, y_0, z_0) + \mu \nabla h (x_0, y_0, z_0). $
Line 113: Line 144:
 $  \nabla f (x, y) =(1, 0) $ e portanto não existe $  \lambda \in \mathbb{R} $ tal que $  \nabla f (0, 0) = \lambda \nabla g (0, 0). $  $  \nabla f (x, y) =(1, 0) $ e portanto não existe $  \lambda \in \mathbb{R} $ tal que $  \nabla f (0, 0) = \lambda \nabla g (0, 0). $ 
  
-<color #ed1c24>Exemplo:</color> Considere seguintes restrições +<color #ed1c24>Exemplo:</color> Considere as seguintes restrições
 + 
 +$  g(x, y, z) = x^6 - z =0, h(x, y, z) = y^3 - z=0. $ Observe que a interseção destes dois conjuntos de nível é uma curva com a seguinte parametrização:
  
-$  g(x, yz) = x^6 - z =0h(x, y, z) = y^3 - z=0. $ Observe que a interseção destes dois conjuntos de nível é uma curva com seguinte parametrzação:+$  S: x \rightarrow  (x, x^2, x^6), x \in \mathbb{R}. $ 
  
-$  S: x \rightarrow  (x, x^2, x^6), x \in \mathbb{R}. $ Agora considere $  f: \mathbb{R}^3 \rightarrow \mathbb{R}, f(x, y, z) =y. $ Observe que o ponto $  (0, 0, 0) $ é mínimo e vamos verificar se satisfaz conclusão do teorema de Lagrange:+Agora considere $  f: \mathbb{R}^3 \rightarrow \mathbb{R}, f(x, y, z) =y. $ Observe que o ponto $  (0, 0, 0) $ é mínimo e vamos verificar se satisfaz conclusão do teorema de Lagrange:
  
 $  \nabla f (0, 0, 0) = (0, 1, 0), \nabla g(0, 0 ,0)= (0,0,-1) = \nabla h(0,0,0) $ e portanto $  \lambda \nabla g + \mu \nabla h(0, 0, 0) = (0,0,-\lambda -\mu) $ que não pode ser igual ao vetor $  (0, 1, 0) $. $  \nabla f (0, 0, 0) = (0, 1, 0), \nabla g(0, 0 ,0)= (0,0,-1) = \nabla h(0,0,0) $ e portanto $  \lambda \nabla g + \mu \nabla h(0, 0, 0) = (0,0,-\lambda -\mu) $ que não pode ser igual ao vetor $  (0, 1, 0) $.
otimizacao.1695657805.txt.gz · Last modified: 2023/09/25 13:03 by 143.107.183.174