Desigualdade de Cauchy-Schwarz
No Principles of Mathematical Analysis, de Walter Rudin, encontramos uma demonstração dessa desigualdade que, a princípio, parece passe de mágica. Com um olhar mais cuidadoso, porém, percebemos que é uma ligeira variação de uma demonstração clássica. Após algumas horas dissecando essa demonstração e finalmente entender sua motivação, resolvi escrever esse texto para nunca mais esquecer.
Forma vetorial
Seja \(V\) um espaço vetorial sobre um corpo \(\mathbb{K}\), munido de um produto interno \(\left< \cdot, \cdot \right> : V^2 \rightarrow \mathbb{K}\). A desigualdade de Cauchy-Schwarz afirma, para quaisquer \(x,y\in V\), que
Prova
A prova vem da observação que, para qualquer escalar \(t \in \mathbb{K}\), vale \(|x-ty|^2 \geq 0\), afinal, estamos falando sobre a norma de um vetor. Uma escolha esperta para \(t\) permite deduzir a desigualdade.
Antes, porém, vamos eliminar o caso trivial em que \(y=0\). Nesse caso, a desigualdade dirá que \(0\leq 0\), o que obviamente é válido. Dessa forma, considere daqui em diante que \(y\neq 0\), de modo que \(\left<y,y\right> > 0\).
Agora observe que, para todo \(t \in \mathbb{K}\), vale
Em particular, isso vale para \(t = \frac{\left<x,y\right>}{\left<y,y\right>}\) que, quando substituído na última expressão, resulta em
Forma analítica
Se \(a_1,\dotsc,a_n\) e \(b_1,\dotsc,b_n\) são números complexos, então
Note que, no caso anterior, se \(V = \mathbb{C}^n\), \(x=(a_1,\dotsc,a_n)^T\), \(y=(b_1,\dotsc,b_n)^T\) e \(\left<x,y\right>:=\sum_{j=1}^{n}a_j\overline{b_j}\), então o resultado já estaria provado como um corolário. Entretanto, gostaria de apresentar uma prova similar, que encontrei no livro do Rudin.
Prova
Denote \(A = \sum_{j=1}^{n}|a_j|^2\), \(B = \sum_{j=1}^{n}|b_j|^2\), \(C = \sum_{j=1}^{n}a_j\overline{b_j}\). Se \(B=0\), isso significa que \(b_1=\dotsb=b_n=0\), e a conclusão é trivial. Assuma portanto que \(B>0\).
A partir daqui, se continuarmos seguindo o mesmo caminho da prova anterior, vamos observar que, para qualquer \(t\in\mathbb{C}\) vale
Então escolheremos \(t=\frac{\left<x,y\right>}{\left<y,y\right>}=\frac{\sum a_j \overline{b_j}}{\sum |b_j|^2}=\frac{C}{B}\) para finalizar. Mas é possível fazer de uma forma ligeiramente diferente.
Observe que, para quaisquer \(s,t\in\mathbb{C}\), vale
Em particular, isso vale para \(s=B\) e \(t=C\), de modo que teremos
Mas como \(B > 0\), a última desigualdade implica que \(AB - |C|^2 \geq 0\), donde \(|C|^2 \leq AB\) é a desigualdade desejada.\(\;\;_\blacksquare\)
Talvez a motivação de Rudin foi evitar denominadores da expressão \(x - \frac{C}{B}y\), escalando por um fator de \(B\) para obter \(Bx-Cy\) e, consequentemente, expressões mais elegantes.