Notas de Aula Algebra Linear

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 107

NOTAS DE AULA DE ÁLGEBRA LINEAR

GUILHERME CHAUD TIZZIOTTI

email: [email protected]

Bibliografia básica:

[1] LIMA, E. L. Álgebra Linear. Rio de Janeiro: Sociedade Brasileira de Matemática,


1998.

[2] LIESEN, J. ; MEHRMANN, V. Linear Algebra. Springer, 2015.

[3] COELHO, F. U.; LOURENÇO, M. L. Um curso de álgebra linear. 2nd ed. São Paulo:
EDUSP, 2010.

[4] CALLIOLI, C. A.; DOMINGUES, H. H.; COSTA, R. C. F., Álgebra linear e aplicações.
6. ed. São Paulo: Atual Editora, 1990.

[5] BOLDRINI, J. L.; COSTA, S. I. R.; FIGUEIREDO, V. L.; WETZLER, H. G. Álgebra


Linear. 3. ed. São Paulo: Harbra, 1986.

[6] ANTON, H. A.; RORRES, C. Álgebra linear com aplicações. 8. ed. Porto Alegre:
Bookman, 2001.

Datas das provas:

Primeira prova (P1) - 03 de novembro - 35 pontos.

Segunda prova (P2) - 01 de dezembro - 35 pontos.

Terceira prova (P3) - 19 de janeiro - 30 pontos.

Prova substitutiva - 26 de janeiro

Atendimento: sexta-feira das 9h às 10:30h sala 1F 102

1
2 GUILHERME CHAUD TIZZIOTTI

1. Matrizes

Nesta primeira aula, veremos como representar uma matriz e como são definidas certas
matrizes especiais.

Quando falamos em matrizes, o que lhe vem à mente? Certamente a resposta é um


quadro, ou tabela, formados por números. Bem, a definição de matriz passa por isso
mesmo, como veremos a seguir.

Definição 1 (Matriz ). Chamamos de matriz de ordem m por n um quadro com m linhas


e n colunas cujos elementos, que podem ser números, funções, etc., estão dispostos em m
linhas e n colunas, como abaixo
 
a11 a12 a13 . . . a1n
 a21 a22 a23 . . . a2n 
 
 a a a . . . a3n  .

 31 32 33
 .. .. .. .. .. 
 . . . . . 
am1 am2 am3 . . . amn

Em geral, denotamos uma matriz por uma letra maiúscula, por exemplo A, M ou I. E
escrevemos “A é uma matriz m × n”, para dizer que A tem ordem m por n, lembrando
que m denota o número de linhas e n o número de colunas da matriz. Para efeito de
simplificação, usa-se também a notação A(m,n) ou Am×n , para dizer que A é uma matriz
de ordem m por n.

Outra notação importante é a representação dos elementos de uma matriz, que também
são chamados de entradas. Se A é uma matriz m × n, denotam-se os elementos, ou
entradas, de A por aij , onde o primeiro ı́ndice, i, indica a linha, e o segundo ı́ndice, j,
a coluna a que o elemento aij pertence. Usando esta notação, pode-se representar uma
matriz por A = (aij ), ou ainda, A = [aij ], onde i varia de 1 a m (isto é, i = 1, 2, . . . , m),
e j varia de 1 a n (isto é, j = 1, 2, . . . , n).

• De agora em diante, representaremos uma matriz B por (bij ), uma X por (xij ) e assim
por diante.

Denota-se o conjunto das matrizes Am×n com entradas reais por Mm×n (R). Já o conjunto
das matrizes Am×n cujas entradas são números inteiros, é denotado por Mm×n (Z), etc.
• Nesta disciplina, vamos trabalhar com matrizes em Mm×n (R).
3

A seguir, veremos como chamamos algumas matrizes com caracterı́sticas especiais.

Matriz coluna: Uma matriz de ordem m por 1 é chamada de matriz coluna.


1
 0 
Por exemplo, a matriz 
 2  é uma matriz coluna.

−1

Matriz linha: Uma matriz de ordem 1 por n é chamada de matriz linha.


A matriz 3 1 −2 é um exemplo de matriz linha.

Matriz retangular: É uma matriz de ordem m por n com m 6= n.

 
1 −1 0 cos θ
A matriz é uma matriz retangular.
cos θ 3 0 senθ

Matriz quadrada: É uma matriz na qual o número de linhas é igual ao número de


colunas, ou seja, é uma matriz de ordem n por n.

 
1 0 1
A matriz  9 2 −2  é uma matriz quadrada.
4 3 7

Observação 2. Quando nos referirmos à ordem de uma matriz quadrada n × n, diremos


simplesmente que ela tem ordem n.

Duas definições importantes no estudo de matrizes relacionada a matrizes quadradas são


as seguintes.
4 GUILHERME CHAUD TIZZIOTTI

Definição 3. Seja A = (aij ) uma matriz quadrada de ordem n. Os elementos aij , com
i = j, ou seja, a11 , a22 , . . . , ann , são chamados de elementos principais e constituem a
diagonal principal da matriz A.

−1
 
8 3 0
 4 3 2 1 
Por exemplo, a diagonal principal da matriz   é formada por −1, 3, 0
 7 2 0 −4 
0 2 1 −7
e −7.

Definição 4. Seja A = (aij ) uma matriz quadrada de ordem n. O traço de A, denotado


por tr(A), é a soma dos elementos da diagonal principal de A, ou seja,
n
X
tr(A) = aii .
i=1

 
−1 8 0
Por exemplo, o traço da matriz  4 3 2  é dado por: tr(A) = −1 + 3 + 1 = 3.
0 2 1

Matriz diagonal: Uma matriz quadrada A = (aij ), de ordem n, é chamada de matriz


diagonal se os elementos aij são iguais a zero quando i 6= j.

 
1 0 0
A matriz  0 5 0  é um exemplo de matriz diagonal.
0 0 −1

 
0 0 0
A matriz  0 0 0  também é um exemplo de matriz diagonal.
0 0 2

Matriz triangular: Uma matriz quadrada A = (aij ), de ordem n, é chamada de matriz


triangular superior se os elementos aij são iguais a zero quando i > j. No caso em que os
elementos aij são iguais a zero quando j > i, dizemos que a matriz quadrada A = (aij ) é
uma matriz triangular inferior.
5
 
  1 0 0 0
6 1 3  7 0 0 0 
A matriz A =  0 −2 7  é triangular superior. Já a matriz B =  
 9 2 −3 0 
0 0 8
10 0 8 2
é triangular inferior.

Matriz nula: Uma matriz A = (aij ) é chamada de matriz nula se todos os seus elementos
aij são iguais a zero. Em geral, denota-se uma matriz nula simplesmente por 0.

 
0 0
Um exemplo de matriz nula é a matriz .
0 0

Além das matrizes que definimos até o momento, uma em particular é muito importante
tanto no estudo de matrizes quanto para todo o decorrer deste curso. A matriz a que
estamos nos referindo é a matriz identidade que é definida da seguinte maneira.

Matriz identidade: Uma matriz diagonal que possui todos os elementos de sua diagonal
iguais a 1 é chamada de matriz identidade. Se esta matriz tem ordem n a denotamos In .
Ainda pode-se denotá-la por Id , ou simplesmente por I.
 
1 0 0 0
 
1 0  0 1 0 0 
Exemplos de matrizes identidade são I2 =  0 0 1 0 .
e I4 =  
0 1
0 0 0 1

Observação 5. Note que, para uma matriz ser uma matriz identidade ela antes tem que
ser uma matriz diagonal, que por sua vez tem que ser uma matriz quadrada. Portanto,
uma matriz identidade é antes de tudo uma matriz quadrada!

• Dizemos que duas matrizes A = (aij ) e B = (bij ), ambas de ordem m por n, são iguais
se aij = bij , para quaisquer i e j.

   
7 2 0 −3 7 2 0 −3
Por exemplo, as matrizes A = eB= são iguais, isto
1 8 3 1 1 8 3 1
   
7 2 0 −3 7 2 0 −3
é, = .
1 8 3 1 1 8 3 1
6 GUILHERME CHAUD TIZZIOTTI

É perfeitamente possı́vel definirmos operações que envolvam matrizes. Nesta seção, vamos
definir a adição, e como consequência a subtração, de matrizes. Na próxima seção veremos
como definir o produto de uma matriz por um escalar e o produto de duas matrizes.

Adição e subtração de matrizes: Sejam A = (aij ) e B = (bij ) duas matrizes m × n.


A soma de A e B é uma matriz C = (cij ) de ordem m × n, tal que cij = aij + bij , para
quaisquer i e j. E a diferença A − B será a matriz C = (cij ) também m × n, tal que
cij = aij − bij , para quaisquer i e j.

Observação 6. Note que a adição e a subtração de duas matrizes só podem ser feitas se
ambas as matrizes possuem a mesma ordem.

A seguir, vemos alguns exemplos de adição e subtração de matrizes.

Exemplo 7.
−2 1 −2
       
0 2 0 + (−2) 2+1 3
 1 −1   1 1   1+1 −1 + 1   2
  0 
 + = = 
 3 0   −1 2   3 + (−1) 0+2   2 2 
−5 7 3 −4 −5 + 3 7 + (−4) −2 3

Exemplo 8.
       
1 −1 0 2 0 4 1−2 −1 − 0 0 − 4 −1 −1 −4
− = =
3 6 2 −5 3 1 3 − (−5) 6 − 3 2 − 1 8 3 1

Finalizamos esta seção introduzindo propriedades fundamentais a respeito da adição de


matrizes. Antes, observamos que dada uma matriz A = (aij ), utilizamos a notação −A
para denotar a matriz (−aij ).

Propriedades da adição de matrizes: Sejam A = (aij ), B = (bij ) e C = (cij ) matrizes


m × n quaisquer, e 0 a matriz nula de ordem m × n. Então são válidas as seguintes
propriedades:

1) A + (B + C) = (A + B) + C, ou seja, a adição de matrizes é associativa.

2) A + B = B + A, isto é, a adição de matrizes é comutativa.


7

3) A + 0 = A, a matriz nula 0 é o elemento neutro com respeito à adição de matrizes.

4) −A + A = A − A = 0, isto é, a matriz −A é a matriz inversa da matriz A com respeito


à adição.

Utilizando as definições de adição a subtração de matrizes não é difı́cil mostrar a veraci-


dade das quatro propriedades acima. (Exercı́cio!)
8 GUILHERME CHAUD TIZZIOTTI

2. Produto de Matrizes

Começaremos esta seção definindo o produto de uma matriz A por um número real α.
Na linguagem de matrizes, como na de vetores que veremos mais à frente, o número real
α será chamado de escalar.

Produto de uma matriz por um escalar: Sejam α um escalar e A = (aij ) uma matriz
m × n. O produto de A por α é uma matriz B = (bij ) também m × n tal que bij = αaij
para quaisquer i e j. Costuma-se denotar por αA = (αaij ) a matriz que é o produto do
escalar α pela matriz A.

Por exemplo,
     
2 −1 0 3 4.2 4.(−1) 4.0 4.3 8 −4 0 12
4. = =
1 0 −2 1 4.1 4.0 4.(−2) 4.1 4 0 −8 4

O produto de uma matriz por um escalar satisfaz as seguintes propriedades.

Propriedades do produto de uma matriz por um escalar: Sejam α e β escalares,


e A e B matrizes m × n quaisquer. Então, são válidas as seguintes propriedades:

1) (αβ)A = α(βA)

2) (α + β)A = αA + βA

3) α(A + B) = αA + αB

4) 1.A = A

Vamos mostrar somente a segunda propriedade. As demais podem ser mostradas de forma
análoga e serão deixadas como exercı́cio.

Vejamos que dados dois escalares α e β, e uma matriz A = (aij ), de ordem m × n,


quaisquer, então (α + β)A = αA + βA.

De fato, (α + β)A é, por definição, uma matriz B = (bij ), onde bij = (α + β)aij .
9

Agora, (α + β)aij = αaij + βaij . Assim, bij = αaij + βaij . Sendo αA = (αaij ) e
βA = (βaij ), então, por definição de soma de matrizes, segue que B = αA+βA. Portanto,
(α + β)A = αA + βA.

Dadas duas matrizes A e B será que sempre é possı́vel fazer o produto de A por B? Será
que o produto de A por B é igual ao produto de B por A? A partir de agora vejamos
como responder estas e outras questões relacionadas ao produto de matrizes cuja definição
é dada abaixo.

Produto de matrizes: Sejam A = (aij ) uma matriz m × n e B = (bij ) uma matriz r × s.


Definimos o produto de A por B, e denotamos A.B, ou simplesmente AB, da seguinte
maneira: primeiramente, temos que ter n = r, esta condição é necessária para se definir
o produto de duas matrizes; sendo n = r, o produto A.B será a matriz C = (cij ), de
ordem m × s, tal que cij = ai1 b1j + ai2 b2j + ai3 b3j + . . . + ain bnj , com i = 1, 2, . . . , m e
j = 1, 2, . . . , s.

       
1 2 5 1.5 + 2.6 17
Exemplo 9. . = =
3 4 6 3.5 + 4.6 39

1 1 −1
 
 
0 2 −1 0  5 2 0 
Exemplo 10. . 
3 −2 4 1  3 −4 7 
9 1 0

 
0.1 + 2.5 + (−1).3 + 0.9 0.1 + 2.2 + (−1).(−4) + 0.1 0.(−1) + 2.0 + (−1).7 + 0.0
=
3.1 + (−2).5 + 4.3 + 1.9 3.1 + (−2).2 + 4.(−4) + 1.1 3.(−1) + (−2).0 + 4.7 + 1.0

 
7 8 −7
=
14 −16 25

Observação 11. Note que em geral, não temos a igualdade AB = BA. Primeiro que
para ambos os produtos existam é necessário, pela definição de produto de matrizes, que
A seja uma matriz m × n e que B seja uma matriz n × m. Segundo, mesmo que isso
ocorra, podemos não ter AB = BA, como veremos nos exemplos a seguir.
10 GUILHERME CHAUD TIZZIOTTI
 
  1 0 −2
0 2 1
Exemplo 12. Sejam A = e B =  0 −1 4 . Então,
3 0 −1
3 5 2

 
  1 0 −2
0 2 1
AB = .  0 −1 4 
3 0 −1
3 5 2
   
0.1 + 2.0 + 1.3 0.0 + 2.(−1) + 1.5 0.(−2) + 2.4 + 1.2 3 3 8
= =
3.1 + 0.0 + (−1).3 3.0 + 0.(−1) + (−1).5 3.(−2) + 0.4 + (−1).2 0 −5 −8
.

Agora, o produto BA não existe, já que B é uma matriz 3 × 3 e A é uma matriz 2 × 3.

 
1 
Exemplo 13. Sejam A =  2  e B = −3 0 5 . Assim,
4

    
1  1.(−3) 1.0 1.5 −3 0 5
AB =  2  . −3 0 5 =  2.(−3) 2.0 2.5  =  −6 0 10  que é uma
4 4.(−3) 4.0 4.5 −12 0 20
matriz 3 × 3.

 
 1  
BA = −3 0 5 . 2  = (−3).1 + 0.2 + 5.4 = 17 que é uma matriz 1 × 1.
4

Note que, tanto AB quanto BA existem, mas claramente AB é diferente de BA.

   
0 1 1 −1
Exemplo 14. Sejam A = eB= . Então,
1 −1 0 2

       
0 1 1 −1 0.1 + 1.0 0.(−1) + 1.2 0 2
AB = . = =
1 −1 0 2 1.1 + (−1).0 1.(−1) + (−1).2 1 −3

       
1 −1 0 1 1.0 + (−1).1 1.1 + (−1).(−1) −1 2
BA = . = =
0 2 1 −1 0.0 + 2.1 0.1 + 2.(−1) 2 −2
11

E temos mais um exemplo em que AB 6= BA.

Portanto, podemos dizer que a multiplicação de matrizes não é comutativa.

Mas existem matrizes A e B tais que AB = BA. Um exemplo óbvio é quando B = A.


Outro exemplo é quando A é uma matriz quadrada de ordem n e B = In , neste caso
tem-se AIn = In A. Além disso, usando a definição de produto de matrizes, mostra-se que
AIn = In A = A.

   
3 −1 0 1
Considere as matrizes A = eB= .
1 0 −1 3
       
3 −1 0 1 3.0 + (−1).(−1) 3.1 + (−1).3 1 0
Então, AB = . = = .
1 0 −1 3 1.0 + 0.(−1) 1.1 + 0.3 0 1

       
0 1 3 −1 0.3 + 1.1 0.(−1) + 1.0 1 0
E BA = . = = .
−1 3 1 0 (−1).3 + 3.1 (−1).(−1) + 3.0 0 1

Ou seja, temos que AB = BA = I2 .

Matriz inversa: Dada uma matriz quadrada de A de ordem n. A matriz B (quando


existir) tal que AB = BA = In é chamada de matriz inversa de A. Veremos que se uma
matriz A possui inversa esta será única. Diante disso denotamos a inversa da matriz A
por A−1 .

Falaremos mais sobre matriz inversa nas aulas seguintes, onde veremos suas propriedades
e como encontrá-la. Mas adiantamos que nem todas matrizes possuem uma inversa.
Observe que na definição acima que uma condição necessária para uma matriz A ter
uma inversa é que A seja uma matriz quadrada. Porém, veremos mais adiante que esta
condição não é suficiente, isto é, existem matrizes quadradas que não possuem inversa.

Apesar de não ser comutativo o produto de matrizes satisfaz algumas importantes pro-
priedades que vemos a seguir.

Propriedades do produto de matrizes:


12 GUILHERME CHAUD TIZZIOTTI

1) Sejam A, B e C matrizes de ordem m × n, n × p e p × r, respectivamente. Então,


(AB)C = A(BC);

2) Sejam A, B e C matrizes de ordem m × n, m × n e n × p, respectivamente. Então,


(A + B)C = AC + BC;

3) Sejam A, B e C matrizes de ordem m × n, m × n e p × m, respectivamente. Então,


C(A + B) = CA + CB;

4) Se A é uma matrizes de ordem m × n, então Im A = AIn = A;

5) Sejam A e B matrizes de ordem m × n, n × p, respectivamente. Então, para todo


número α tem-se: (αA)B = A(αB) = α(AB).
13

3. Matrizes Transposta, Simétrica e Ortogonal

Vamos começar esta seção definindo a transposta de uma matriz.

Matriz transposta: Seja A = (aij ) uma matriz m × n. A matriz transposta de A,


denotada por AT , ou At , é uma matriz n × m obtida, a partir de A, trocando as linhas
pelas colunas de mesmo ı́ndice. Ou seja, se A = (aij ), então a matriz transposta de A é
definida por AT = (aji ).

−1 9
 
 
−1 2 0 3  2 17 
Exemplo 15. a) Seja A = . Então, AT = 
 0 11 .

9 17 11 8
3 8

 
a11 a12 a13  
 a21 a11 a21 a31 a41
a22 a23 

b) Se A = 
 a31 , então AT =  a12 a22 a32 a42 .
a32 a33 
a13 a23 a33 a43
a41 a42 a43

 
1
 2  T

c) Se B = 
 3 , então B =
 1 2 3 4 .
4
Temos algumas propriedades que podem ser úteis quando tratamos de matrizes transpos-
tas. Tais propriedades são as seguintes.

Propriedades da matriz transposta:

1) (A + B)T = AT + B T , onde A e B são matrizes m × n.

2) (αA)T = αAT , sendo A uma matriz qualquer.

3) (AT )T = A, sendo A uma matriz qualquer.

4) (AB)T = B T AT , onde A é uma matriz m × n e B é uma matriz n × m.


14 GUILHERME CHAUD TIZZIOTTI

Primeiramente, vejamos a validade de 1), isto é, (A + B)T = AT + B T . De fato, sejam


A = (aij ) e B = (bij ) matrizes m × n. Então, pela definição de soma de matrizes,
A+B = C = (cij ), onde cij = aij +bij , para quaisquer i e j. Agora, (A+B)T = C T = (cji ),
com cji = aji + bji , ou seja, C T = AT + B T . Logo, (A + B)T = AT + B T .

Agora, vejamos que (αA)T = αAT , onde A = (aij ) é uma matriz m × n. Pela definição de
produto de uma matriz por um escalar, temos αA = (αaij ). Assim, segue que (αA)T =
(αaji ) = αAT .

Deixaremos a verificação das propriedades 3) e 4) como exercı́cio.

Matriz simétrica: Uma matriz quadrada A = (aij ) é uma matriz simétrica se AT = A,


ou seja, se aij = aji para quaisquer i e j.

   
1 3 T 1 3
Exemplo 16. a) A matriz A = é simétrica, já que A = = A.
3 1 3 1

   
2 −4 0 2 −4 0
b) A matriz A =  −4 1 16  é simétrica, pois AT =  −4 1 16  = A.
0 16 5 0 16 5

Observação 17. Uma propriedade interessante envolvendo uma matriz quadrada e sua
transposta é a seguinte: seja A uma matriz quadrada, então A.AT é uma matriz simétrica,
ou seja, A.AT = C, onde C é uma matriz simétrica.

De fato, suponha que A = (aij ) seja uma matriz quadrada de ordem n. Então, AT = (aji )
que também é uma matriz quadrada de ordem n. Pela definição de produto de matrizes,
temos que A.AT = C, com C = (cij ) quadrada de ordem n e cij = ai1 aj1 + ai2 aj2 + ai3 aj3 +
. . .+ain ajn . Assim, vemos que cji = cij , e portanto C = C T . Logo, A.AT = C é simétrica.

   
0 2 1 0 3 4
Exemplo 18. Seja A =  3 −1 5 . Então, AT =  2 −1 0 .
4 0 8 1 5 8

Logo,
15
   
0.0 + 2.2 + 1.1 0.3 + 2.(−1) + 1.5 0.4 + 2.0 + 1.8 5 3 8
A.AT =  3.0 + (−1).2 + 5.1 3.3 + (−1).(−1) + 5.5 3.4 + (−1).0 + 5.8  =  3 35 52 ,
4.0 + 0.2 + 8.1 4.3 + 0.(−1) + 8.5 4.4 + 0.0 + 8.8 8 52 80

que é uma matriz simétrica.

Matriz antissimétrica: Dizemos que uma matriz quadrada A é antissimétrica se A =


−AT .

   
0 3 T 0 −3
Exemplo 19. a) A matriz M = é antissimétrica, já que M = =
−3 0 3 0
−M .

   
0 1 −5 0 −1 5
b) A matriz B =  −1 0 −7  é antissimétrica, pois B T =  1 0 7  = −B.
5 7 0 −5 −7 0

Observação 20. Note que se A = (aij ) é uma matriz antissimétrica, então ela é uma
matriz quadrada com os elementos da diagonal principal sendo todos nulos e os elementos
dispostos simetricamente em relação à diagonal principal sendo opostos.

Matriz ortogonal: Uma matriz A é chamada de matriz ortogonal se A−1 = AT , ou seja,


se A.AT = AT .A = Id .

   
cos θ −senθ cos θ senθ
Exemplo 21. Considere a matriz G = . Então, GT = .
senθ cos θ −senθ cos θ

   
T cos θ −senθ cos θ senθ
Logo, G.G = .
senθ cos θ −senθ cos θ

cos2 θ + sen2 θ
   
cos θsenθ − senθ cos θ 1 0
= = .
senθ cos θ − cos θsenθ sen2 θ + cos2 θ 0 1

Portanto, G é uma matriz ortogonal.


16 GUILHERME CHAUD TIZZIOTTI

4. Escalonamento de Matrizes

Nesta seção vamos descrever um processo muito útil no tratamento não só de matrizes,
que nos ajuda a calcular o determinante de uma matriz de ordem n, mas também a
solução de sistemas lineares, como veremos mais adiante. Tal processo utiliza operações
chamadas elementares de matrizes e é chamado de escalonamento ou triangulação de
matrizes. Antes, porém, vamos definir alguns conceitos importantes que justificam este
processo.

Dependência e independência linear de linhas e colunas de uma matriz

Seja A = (aij ) uma matriz m × n. Vamos representar a linha i de A por:


Li = [ ai1 ai2 ai3 . . . ain ],
onde, para cada i = 1, 2, . . . , m, Li será uma matriz 1 × n.
Uma combinação linear de k linhas de A será qualquer expressão do tipo
L = α1 .Li1 + α2 .Li2 + . . . + αk .Lik
onde αi ∈ R, para todo i = 1, 2, . . . , k, e ij ∈ {1, 2, . . . , m}, para cada j = 1, 2, . . . , k.

Note que se L0 = [ 0 0 0 . . . 0 ] for uma matriz nula, então tomando αi = 0, para todo
i = 1, 2, . . . , k, temos que
L0 = 0.Li1 + 0.Li2 + . . . + 0.Lik .

Considerando a expressão L0 = α1 .Li1 + α2 .Li2 + . . . + αk .Lik , se a única possibilidade de


obtermos esta igualdade for quando αi = 0, para todo i = 1, 2, . . . , k, então dizemos que as
linhas Li1 , Li2 , . . . , Lik são linearmente independentes. Agora, se a igualdade for válida
para pelo menos um αi diferente de zero, então dizemos que as linhas Li1 , Li2 , . . . , Lik são
linearmente dependentes.

Observação 22. Note que se uma das linhas Lij for igual a L0 , então Li1 , Li2 , . . . , Lik
são linearmente dependentes.

De fato, sem perda de generalidade, suponhamos que Li1 = L0 . Assim, temos que
L0 = α1 .Li1 + α2 .Li2 + . . . + αk .Lik = α1 .L0 + α2 .Li2 + . . . + αk .Lik .

Agora, tomando α1 6= 0 e α2 = α3 = · · · = αn = 0, temos que


L0 = α1 .L0 + 0.Li2 + . . . + 0.Lik .
17

Ou seja, a igualdade L0 = α1 .L0 + α2 .Li2 + . . . + αk .Lik é válida para pelo menos um dos
αj ’s diferente de zero. Daı́, temos que L0 , Li2 , . . . , Lik são linearmente dependentes.

Analogamente, podemos definir dependência e independência linear do ponto de vista das


colunas de uma matriz. Um fato importante é que o número máximo de linhas linear-
mente independentes em uma matriz A é igual ao número máximo de colunas linearmente
independentes de A.

Algumas propriedades da dependência e independência linear são as seguintes:

1) A dependência ou independência linear das linhas de uma matriz não se altera se


trocarmos a ordem dessas linhas.

2) Se Li1 , Li2 , . . . , Lik são linearmente dependentes, então Li1 , Li2 , . . . , Lik , Lik+1 também
são linearmente dependentes. Ou seja, acrescentar uma linha em um conjunto linearmente
dependente mantém a dependência linear.

3) Se Li1 , Li2 , . . . , Lik são linearmente dependentes (independentes), então Li1 , Li2 , . . . , α.Lij , . . . , Lik
também é linearmente dependente (independente) se α 6= 0. Ou seja, multiplicar uma das
linhas por um escalar não nulo mantém a dependência (independência) linear.

4) Se Li1 , Li2 , . . . , Lis , . . . , Lij , . . . , Lik são linearmente dependentes (independentes), então
Li1 , Li2 , . . . , Lis , . . . , Lij + Lik , . . . , Lik também é linearmente dependente (independente).
Ou seja, somar uma das linhas a uma linha mantém a dependência (independência) linear.

5) As linhas de uma matriz triangular (superior ou inferior), com os elementos da diagonal


principal diferentes de zero, são linearmente independentes.

Definição 23. A caracterı́stica ou posto de uma matriz A é o número máximo de


linhas de A que são linearmente independentes. Ou seja, é a dimensão do espaço gerado
pelas linhas de A.

Como o número de linhas linearmente independentes é igual ao número de colunas line-


armente independentes, podemos calcular o posto de uma matriz tanto por linhas como
por colunas.

Definição 24. Um matriz A ∈ Mn (R) é chamada de singular se seu posto for igual a
n. Caso contrário ela é chamada de não-singular.
18 GUILHERME CHAUD TIZZIOTTI

Proposição 25. Sejam A uma matriz k × l e B uma matriz l × m. Então, posto(AB) ≤


min{posto(A), posto(B)}.

Demonstração. O espaço gerado pelas colunas de AB é o espaço S gerado por todos os


vetores s que podem ser escrito como combinação linear das colunas de AB: s = (AB)v,
onde v é uma matriz m × 1 e é o vetor formado pelos coeficientes da combinação linear
dos elementos da base que gera S (veremos isso quando falarmos de espaço vetorial).
Escrevendo s = A(Bv), onde Bv é uma matriz l × 1. Assim, qualquer s ∈ S pode ser
escrito como combinação linear das colunas de A, com coeficientes tomados do vetor Bv.
Como consequência, a dimensão do espaço S não é maior que a do espaço gerado pelas
colunas de A, cuja dimensão é posto(A). Isso implica que a dimensão de S é menor ou
igual do que posto(A). Daı́, como a dimensão de S é o posto(AB), segue que
posto(AB) ≤ posto(A).

Agora, o espaço gerado pelas linhas de AB é o espaço T de todos os vetores t que podem
ser escritos como combinação linear das linhas de AB: t = u(AB), onde u é um vetor 1×k
formado coeficientes da combinação linear dos elementos da base que gera T . Escrevendo
t = (uA)B, e prosseguindo como no caso do posto de A concluı́mos que
posto(AB) ≤ posto(B).

Daı́, concluı́mos que posto(AB) ≤ min{posto(A), posto(B)}. 

Definição 26. Dizemos que duas matrizes A e B são equivalentes, indicamos A ∼ B,


se ambas possuem a mesma ordem e têm o mesmo posto.

Observamos que, se A é uma matriz triangular, então o posto de A é igual ao número de


elementos da diagonal principal que são diferentes de zero.

O processo de escalonamento de uma matriz A consiste obter, a partir de A, uma matriz


B, equivalente a A, na qual figure uma matriz triangular superior ou inferior da maior
ordem possı́vel. Este processo utiliza operações elementares, as quais veremos a seguir.

 
L1
 L2 
Suponha que A =  , onde L1 , L2 , . . . , Ln são as linhas da matriz A de ordem n×m.
 
..
 . 
Ln
Então, chamaremos de operações elementares de A as seguintes:

1) Permutar duas linhas, ou seja, trocar as linhas Li e Lj , com i 6= j, de lugar;


19

2) Multiplicar uma linha por um número diferente de zero;

3) Substituir uma linha por uma linha formada pela soma da linha que está sendo subs-
tituı́da com uma outra linha da matriz previamente multiplicada por um número diferente
de zero, ou seja, substituir Li por Li + k.Lj , com k 6= 0.

Observamos que, de forma análoga, as operações elementares também são definidas sobre
as colunas da matriz.

Definição 27. Uma matriz n × n é dita elementar se ela for obtida através de uma
operação elementar (linha ou coluna) a partir da matriz identidade In .

Exemplo 28. Se tomamos I3 e multiplicamos a primeira linha por 2 (L1 → 2L1 ), obtemos
a matriz elementar  
2 0 0
 0 1 0 
0 0 1

Exemplo 29. Se tomamos I3 e fazemos C3 → 5C2 + C3 , obtemos a matriz elementar


 
1 0 0
 0 1 5 
0 0 1

Exemplo 30. Se tomamos I2 e fazemos L1 ↔ L2 , obtemos a matriz elementar


 
0 1
1 0

O processo de escalonamento possui várias etapas, onde, em cada uma delas, vamos
anulando as entradas abaixo (ou acima) da diagonal principal de uma submatriz quadrada
de maior ordem possı́vel, ou da diagonal principal da própria matriz no caso de a matriz
a ser escalonada seja quadrada.

Vejamos como fazer o escalonamento de uma matriz não nula A = (aij ) de ordem m × n.
 
a11 a12 . . . a1n
 a21 a22 . . . a2n 
Seja A =  ..
 
.. .. .. 
 . . . . 
am1 am2 . . . amn
20 GUILHERME CHAUD TIZZIOTTI

Suponhamos que a11 6= 0. Se a11 = 0, basta trocar linhas ou colunas de forma a colocar
um elemento não nulo na posição de a11 . O primeiro passo é adicionar a primeira linha a
todas as outras restantes, multiplicada por fatores de forma que anulem todos os elementos
seguintes da primeira coluna que estão abaixo de a11 . Dessa forma, obtemos a matriz
abaixo, que é equivalente à matriz A,
 
a11 a12 . . . a1n
 0 a22 . . . a2n 
..  ∼ A
 
 .. .. ..
 . . . . 
0 am2 . . . amn

A seguir, procedemos com a22 em relação à segunda coluna, como procedemos com a11
em relação à primeira coluna. Daı́, obtemos a matriz
 
a11 a12 a13 . . . a1n
 0 a22 a23 . . . a2n 
 
 0 0 a33 . . . a2n 
 ∼A
 .. .. .. .. 
 . . . . 
0 0 am3 . . . amn

E assim, procedemos de modo análogo para os restantes aii até que o escalonamento
termine ou porque não há mais linhas ou porque as linhas que existem são todas formadas
por zeros. A matriz ao final do processo, dada abaixo, terá uma forma onde nela figure uma
matriz ou uma submatriz triangular da maior ordem possı́vel com elementos principais
não nulos. Uma matriz nessa forma é chamada de escalonada.
 
a11 a12 a13 . . . a1k . . . a1n
 0 a22 a23 . . . a2k . . . a2n 
 
 0 0 a33 . . . a3k . . . a3n 
∼A
 
 0 0 0 . . . a . . . a
 4k 4n 
 . .. .. ..
 ..

. . . 
0 0 0 ... ... 0

Ao final, podemos dividir cada linha i, onde aii for não nulo, por aii , de modo a ter 1 no
lugar destes aii .

Vejamos como fazer o escalonamento através de exemplos.

 
2 4 −1
Exemplo 31. Seja A =  0 −3 2 .
6 1 0
21

1o ) Temos que a11 = 2. Como a entrada a21 , logo abaixo de a11 , é igual a zero, o primeiro
passo (ou etapa) é substituir a linha 3 pela linha 1 multiplicada por (−3) e somada pela
linha 3. Vamos representar esta operação por: L3 → (−3).L1 + L3 . Assim, obtemos a
matriz  
2 4 −1
 0 −3 2 
0 −11 3

Por praticidade, escrevemos este procedimento como:

   
2 4 −1 2 4 −1
A =  0 −3 2  L3 → −3.L1 + L3 ∼  0 −3 2 
6 1 0 0 −11 3

2o ) Tendo a primeira coluna no modo desejado, o próximo passo é deixar o elemento a32
11
igual a 0. Para isso basta multiplicar a segunda linha por − e somar com a terceira.
3
Assim, obtemos

−1
 

2 4 −1
 2 4
 0 −3 2  L3 → − 11 .L2 + L3 ∼ 
 0 −3 2 
3 13

0 −11 3 0 0 −
3

E o processo acaba, já que chegamos a uma matriz na forma desejada. Caso quiséssemos
1
deixar os elementos principais iguais a 1, bastaria multiplicar a primeira linha por , a
2
1 3
segunda por − e a terceira por − . Assim, temos
3 13

−1
  
2 4 1 2 − 21

A ∼  0 −3 2  ∼  0 1 − 23 

13
0 0 − 0 0 1
3

De forma resumida escrevemos da seguinte maneira:

 
2 4 −1
A =  0 −3 2  L3 → −3.L1 + L3
6 1 0
22 GUILHERME CHAUD TIZZIOTTI
 
2 4 −1
11
∼  0 −3 2  L3 → − .L2 + L3
3
0 −11 3

−1
 
2 4 L1 → 12 .L1

1 2 − 21

∼  0 −3 2  L2 → − 31 .L2 ∼  0 1 − 23 

13 3
0 0 − L3 → − 13 .L3 0 0 1
3

 
0 3 2 −1
Exemplo 32. Seja A =  2 8 0 4 . Vamos escalonar a matriz A.
1 5 −1 2

1o ) Note que a11 = 0 e que a31 = 1. Assim, vamos trocar as linhas 1 e 3 de posição.
Poderı́amos também trocar as linhas 1 e 2, já que a21 = 2 6= 0. Então, temos que:

   
0 3 2 −1 1 5 −1 2
 2 8 0 4 ∼ 2 8 0 4 
1 5 −1 2 0 3 2 −1

2o ) Agora,substituindo a linha
 2  por −2 e somando com a linha
pela linha 1 multiplicada
1 5 −1 2 1 5 −1 2
2 temos:  2 8 0 4  ∼  0 −2 2 0 
0 3 2 −1 0 3 2 −1

Logo, a primeira coluna está na forma desejada.

   
1 5 −1 2 1 5 −1 2
1
3o ) Multiplicando a linha 2 por − , temos  0 −2 2 0  ∼  0 1 −1 0 
2
0 3 2 −1 0 3 2 −1

4o ) Substituindo a 
linha
3 pela linha 2 multiplicada
 por −3 e somada com a linha 3, temos
1 5 −1 2 1 5 −1 2
 0 1 −1 0  ∼  0 1 −1 0 
0 3 2 −1 0 0 5 −1
23

1
Finalmente, multiplicamos a linha 3 por , e obtemos
5

   
1 5 −1 2 1 5 −1 2
 0 1 −1 0  ∼  0 1 −1 0  .
0 0 5 −1 0 0 1 − 51

2 1 4
 

 1 1 0 

Exemplo 33. Seja M = 
 0 2 3 , escalone a matriz M .

 −1 4 −5 
3 2 6
Vejamos. Escrevendo resumidamente, temos:

2 1 4
 

 1 1 0 
 L1 → L2

 0 2 3 
 L2 → L1
 −1 4 −5 
3 2 6

1 1 0
 
 2 1 4  L2 → −2.L1 + L2
 
∼
 0 2 3  L4 →
 L1 + L4
 −1 4 −5  L5 → −3.L1 + L5
3 2 6

1 1 0
 
 0 −1 4  L2 → − 1.L2
  L3 → 2.L2 + L3
∼
 0 2 3 
 L4 → 5.L2 + L4
 0 5 −5 
L5 → −1.L2 + L5
0 −1 6

1 1 0
 
 0 1 −4 
  1
∼
 0 0 11 
 L3 → 11 .L3
 0 0 15 
0 0 2
24 GUILHERME CHAUD TIZZIOTTI

1 1 0
 

 0 1 −4 
 L4 → −15.L3 + L4
∼
 0 0 1  L5 → −2.L3 + L5
 0 0 15 
0 0 2

1 1 0
 

 0 1 −4 

∼
 0 0 1 
 0 0 0 
0 0 0

Portanto,

1 1 0
 

 0 1 −4 

M ∼
 0 0 1 
 0 0 0 
0 0 0

5. Determinante

Definição 34. (Função determinante) Uma função f : Mn×n (R) → R é chamada de


função determinante se possui as seguintes propriedades.
(i) f (A) = 0, se A tem colunas L.D..
(ii) f (In ) = 1.
(iii) f (A) é forma multilinear das colunas de A.

O item (iii) significa que uma função determinante é uma transformação linear quando
fixamos todas as colunas e variamos apenas uma delas: para todo escalar λ, todo vetor
coluna v e toda coluna cj ,
f (c1 , . . . , λcj , . . . , cn ) = λf (c1 , . . . , cj , . . . , cn )
f (c1 , . . . , cj + v, . . . , cn ) = f (c1 , . . . , cj , . . . , cn ) + f (c1 , . . . , v, . . . , cn ).

Faremos uma definição de determinante usando permutações.


25

Definição 35. Seja n ∈ N. Uma aplicação bijetiva


σ : {1, 2, . . . , n} → {1, 2, . . . , n}, j 7→ σ(j)
é chamada de permutação de {1, 2, . . . , n}.

O conjunto de todas as permutações de {1, 2, . . . , n} é denotado por Sn e sua cardinalidade


é n!.

Uma permutação σ ∈ Sn por ser escrita na forma


[σ(1)σ(2) · · · σ(n)].

Por exemplo, S1 = {[1]}, S2 = {[1 2], [2 1} e


S3 = {[1 2 3], [1 3 2], [2 1 3], [2 3 1], [3 1 2], [3 2 1]}.

• O conjunto Sn com a composição de funções formam um grupo, chamado de grupo


simétrico.

Definição 36. Uma permutação τ ∈ Sn é chamada de transposição, se troca exata-


mente dois elementos distintos k, l ∈ {1, . . . , n}, isto é, se τ (k) = l, τ (l) = k, e τ (j) = j
para todo j ∈ {1, . . . , n} \ {k, l}.

Definição 37. Sejam n ≥ 2 e σ ∈ Sn . O par (σ(i), σ(j)) com 1 ≤ i < j ≤ n e


σ(i) > σ(j) é chamado uma inversão de σ. Se k é o número de inversões de σ, então
sgn(σ) := (−1)k é chamado de sinal de σ. Para n = 1 definimos sgn([1]) := 1 = (−1)0 .

Em outras palavras, uma inversão de uma permutação é um par que está “ fora de ordem”.

• Não confunda a nomenclatura inversão com aplicação inversa.

Exemplo 38. A permutação [2 3 1 4] ∈ S4 possui duas inversões: (2, 1) e (3, 1). Logo,
sgn([2 3 1 4]) = (−1)2 = 1. Já a permutação [4 1 2 3] ∈ S4 possui três inversões: (4, 1),
(4, 2) e (4, 3). Logo, sgn([4 1 2 3]) = (−1)3 = −1.
26 GUILHERME CHAUD TIZZIOTTI

Definição 39. (Determinante) A aplicação

det : Mn×n (R) → R


X n
Y
A = (aij ) 7→ det(A) := sgn(σ) aiσ(i)
σ∈Sn i=1

é chamada de determinante, e o número det(A) é chamado de determinante de A.

A fórmula dada na definição anterior é chamada de fórmula de assinatura de Leibniz.

Exemplo 40. Para n = 1, temos A = [a11 ] e assim det(A) = sgn([1])a11 = a11 .


Para n = 2, temos

 
a11 a12
det(A) = det = sgn([1 2])a11 a22 + sgn([2 1])a12 a21 = a11 a22 − a12 a21 .
a21 a22

Para n = 3, temos a regra de Sarrus (Pierre Fréderic Sarrus, 1798-1861).


= a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a11 a23 a32 − a12 a21 a33 − a13 a22 a31 .

• Observamos que para computar det(A) usando a fórmula de assinatura de Leibniz temos
que computar n! produtos com n fatores cada. Para n grande o custo para se calcular
o determinante é alto. Veremos mais adiante (Corolário 50) uma maneira mais eficiente
de computar det(A). Mas, claro, a fórmula de Leibniz é muito importante, já que ela
representa o determinante de A explicitamente em termos das entradas de A.

A seguir, apresentamos algumas propriedades do determinante. Antes enunciaremos al-


guns resultados envolvendo permutações que serão importantes para obtermos tais pro-
priedades.

Teorema 41. Para quaisquer σ1 , σ2 ∈ Sn , temos que sgn(σ1 ◦ σ2 ) = sgn(σ1 )sgn(σ2 ). Em


particular, sgn(σ −1 ) = sgn(σ), para todo σ ∈ Sn .

Demonstração. Ver livro Linear Algebra de J. Liesen e V. Mehrmann, Teorema 7.7. 

Lema 42. Seja τ ∈ Sn uma transposição que troca k e l, com 1 ≤ k < l ≤ n. Então, τ
tem exatamente 2(l − k) − 1 inversões e, assim, sgn(τ ) = −1.

Demonstração. Ver livro Linear Algebra de J. Liesen e V. Mehrmann, Lema 7.9. 


27

Lema 43. Seja A ∈ Mn×n (R). Então, as seguintes propriedades são válidas.
(1) Para λ ∈ R,
   
λ ? λ 01×n
det = det = λ det(A).
0n×1 A ? A

n
Y
(2) Se A = (aij ) é uma matriz triangular (superior ou inferiror), então det(A) = aii .
i=1

(3) Se A tem uma linha, ou coluna, nula (formada só por zeros), então det(A) = 0.

(4) Se n ≥ 2 e A tem duas linhas, ou colunas, iguais, então det(A) = 0.

(5) det(A) = det(AT ).

 
λ ?
Demonstração. (1) Seja B = . Note que, b11 = λ, bi1 = 0, para todo
0n×1 A
i = 2, . . . , n + 1, e bij = ai−1j−1 , para todo i, j ≥ 2. Pela definição de determinante temos
que det(B) = σ∈Sn+1 sgn(σ) n+1
P Q
i=1 biσ(i) . Agora, como bi1 = 0, para todo i = 2, . . . , n+1,
a parcela em det(B) que possui uma permutação σ com σ(1) 6= 1 será igual a zero. Então,
X n+1
Y X Yn
podemos escrever det(B) = b11 sgn(σ) biσ(i) = b11 sgn(σ) aiσ(i) =
σ∈Sn+1 ,σ(1)=1 i=2 σ∈Sn i=1
λ det(A).

(2) Segue aplicando o item anterior repetidas vezes começando da matriz A.

(3) Se A possui uma linha ou coluna nula, então para todo σ ∈ Sn pelo menos um dos
n
Y
fatores no produto aiσ(i) é igual a zero, e daı́ det(A) = 0.
i=1

(4) Sejam k e l, com k < l, as linhas iguais de A = (aij ), ou seja, akj = alj para todo
j = 1, . . . , n. Seja τ ∈ Sn uma transposição que troca os elementos k e l, e seja
Tn := {σ ∈ Sn ; σ(k) < σ(l)}.

Como o conjunto Tn contém todas as permutações σ ∈ Sn tais que σ(k) < σ(l), segue que
|Sn |
|Tn | = e Sn \ Tn = {σ ◦ τ ; σ ∈ Tn }.
2
28 GUILHERME CHAUD TIZZIOTTI

Além disso, 
 aiσ(i) , i 6= k, l,
ai(σ◦τ )(i) = a , i = k,
 kσ(l)
alσ(k) , i = l.
Temos que akσ(l) = alσ(l) e alσ(k) = akσ(k) . Daı́, usando o Teorema 41 e o Lema 42, obtemos
o seguinte

X n
Y X n
Y
sgn(σ) aiσ(i) = sgn(σ ◦ τ ) ai(σ◦τ )(i)
σ∈Sn \Tn i=1 σ∈Tn i=1

X n
Y X n
Y
= −sgn(σ) ai(σ◦τ )(i) = − sgn(σ) aiσ(i) .
σ∈Tn i=1 σ∈Tn i=1

Isso implica que

X n
Y X n
Y X n
Y
det(A) = sgn(σ) aiσ(i) = sgn(σ) aiσ(i) + sgn(σ) aiσ(i) = 0.
σ∈Sn i=1 σ∈Tn i=1 σ∈Sn \Tn i=1

A prova para o caso de duas colunas iguais é análoga.

(5) Primeiramente, observamos que, para todo σ ∈ Sn

{(σ(i), i) ; 1 ≤ i ≤ n} = {(i, σ −1 (i)) ; 1 ≤ i ≤ n}.


De fato, fixado 1 ≤ i ≤ n, então σ(i) = j se, e somente se, i = σ −1 (j). Assim, (σ(i), i) =
(j, i) é um elemento do primeiro conjunto se, e somente se, (j, σ −1 (j)) = (j, i) é um
elemento do segundo conjunto. Como σ é bijetora, os dois conjunto são iguais.

Seja A = (aij ). Logo, AT = (bij ) com bij = aji . Então,

X n
Y X n
Y
T
det(A ) = sgn(σ) biσ(i) = sgn(σ) aσ(i)i
σ∈Sn i=1 σ∈Sn i=1
X n
Y X n
Y
−1 −1
= sgn(σ ) aσ(i)i = sgn(σ ) aiσ−1 (i)
σ∈Sn i=1 σ∈Sn i=1
X n
Y
= sgn(σ) aiσ(i) = det(A)
σ∈Sn i=1
Qn
Usamos que sgn(σ) = sgn(σ −1 ) (Teorema 41), e o fato de que os produtos i=1 aσ(i)i e
Qn
i=1 aiσ −1 (i) possuem os mesmos fatores. 
29

• Note que, pelo item (2) do resultado anterior, det(In ) = 1.

Escrevendo In = (e1 , e2 , · · · en ), para σ ∈ Sn a matriz


Pσ := (eσ(1) , eσ(2) , · · · eσ(n) )

é chamada de matriz de permutação associada a σ. Essa aplicação do grupo Sn para


o grupo das matrizes de permutação em Mn×n (R) é bijetiva. A inversa de uma matriz de
permutação é sua transposta (veja Teorema 4.16 livro Linear Algebra de J. Liesen e V.
Mehrmann) e temos que

Pσ−1 = PσT = Pσ−1 .

Observação 44. Escrevendo A = (a1 , a2 , · · · an ), ou seja, aj ∈ Mn×1 (R) é a j-ésima


coluna de A, então temos que

APσ = (aσ(1) , aσ(2) , · · · aσ(n) ),

isto é, a multiplicação de A à direita com Pσ troca as colunas de A de acordo com a


permutação σ. Se por outro lado, ai ∈ M1×n (R) é a j-ésima linha de A, então

 
aσ(1)
 aσ(2) 
PσT A = ,
 
..
 . 
aσ(n)

isto é, a multiplicação de A à esquerda com PσT troca as linhas de A de acordo com a
permutação σ.

Lema 45. Sejam σ ∈ Sn e Pσ matriz de permutação associada à σ. Então, sgn(σ) =


det(Pσ ). Além disso, se n ≥ 2 e

Pij := (e1 , · · · ei−1 , ej , ei+1 , · · · ej−1 , ei , ej+1 , · · · en ),

então det(Pij ) = −1.

Demonstração. Se σ̃ ∈ Sn e Pσ̃ = (aij ), então aσ̃(j)j = 1 para j = 1, . . . , n, e todas as


outras entradas de Pσ̃ são iguais a zero. Assim,
30 GUILHERME CHAUD TIZZIOTTI

X n
Y n
Y
det(Pσ̃ ) = det(Pσ̃T ) = sgn(σ) aσ(j)j = sgn(σ̃) aσ̃(j)j = sgn(σ̃).
σ∈Sn j=1 j=1
| {z }
| {z } =1
=0 para σ6=σ̃

A matriz de permutação Pij é associada com a transposição que troca i e j. Assim, pelo
Lema 42, segue que det(Pij ) = −1. 

Observação 46. Para λ ∈ R, considere as seguintes matrizes

Mi (λ) := (e1 , · · · ei−1 , λei , ei+1 , · · · en )


e

Gij (λ) := (e1 , · · · ei−1 , ei + λej , ei+1 , · · · en ).

Então, det(Mi (λ)) = λ e det(Gij (λ)) = 1.

De fato, como Mi (λ) e Gij (λ) são matrizes triangulares, as igualdades seguem diretamente
do item (2) do Lema 43.

Lema 47. Sejam A ∈ Mn×n (R), n ≥ 2, e λ ∈ R. As seguintes propriedades são válidas.

(1) A multiplicação de uma linha de A por λ implica a multiplicação de det(A) por λ:


det(Mi (λ)A) = λ det(A) = det(Mi (λ)) det(A).

(2) A adição de uma linha de A multiplicada por λ a outra linha de A não altera o
determinante de A: det(Gij (λ)A) = det(A) = det(Gij (λ)) det(A), e det(Gij (λ)T A) =
det(A) = det(Gij (λ)T ) det(A).

(3) Trocando duas linhas de A se altera o sinal do determinante de A: det(Pij A) =


− det(A) = det(Pij ) det(A).

Demonstração. (1) Se A = (amk ) e à = Mi (λ)A = (ãmk ), então



amk , m 6= i,
ãmk =
λamk m = i.
Daı́,
X n
Y X n
Y
det(Ã) = sgn(σ) ãmσ(m) = sgn(σ) ãiσ(i) ãmσ(m)
σ∈Sn m=1 σ∈Sn
| {z } m=1,m6=i
| {z }
=λaiσ(i) =amσ(m)
31

X n
Y n
X Y 
= sgn(σ)λ amσ(m) = λ sgn(σ) amσ(m) = λ det(A).
σ∈Sn m=1 σ∈Sn m=1

(2) Se A = (amk ) e à = Gij (λ)A = (ãmk ), então


amk , m 6= j,
ãmk =
ajk + λaik m = j.
Então,

X n
Y X n
Y
det(Ã) = sgn(σ) ãmσ(m) = sgn(σ)(ajσ(j) + λaiσ(j) ) amσ(m)
σ∈Sn m=1 σ∈Sn m=1,m6=j

X n
Y X n
Y
= sgn(σ) amσ(m) + λ sgn(σ)aiσ(j) amσ(m) .
σ∈Sn m=1 σ∈Sn m=1,m6=j

Note que, o primeiro termo é igual a det(A), e o segundo termo é igual a λ multiplicado
pelo determinante de uma matriz com duas linhas iguais, e assim igual a zero.

A prova para a matriz Gij (λ)T A é análoga.

(3) A matriz de permutação Pij troca as linhas i e j de A, em que i < j. Essa troca
pode ser expressada através das seguintes quatro operações elementares: multiplicar a
linha j por −1 (Lj → −Lj ); adicionar a linha i na linha j (Lj → Li + Lj ); adicionar
a linha j multiplicada por −1 na linha i (Li → Li − Lj ); adicionar a linha i na linha j
(Lj → Li + Lj ). Portanto,

Pij = G(ij)(1)(G(ij)(−1))T Gij (1)Mj (−1).

Daı́, usando os itens (1) e (2) anteriores obtemos

det(Pij A) = det(G(ij)(1)(G(ij)(−1))T Gij (1)Mj (−1)A)


= det(G(ij)(1)) det((G(ij)(−1))T ) det(Gij (1)) det(Mj (−1)) det(A) = (−1) det(A).

• Agora, como det(A) = det(AT ), os resultados do lema anterior para linhas de A podem
ser reformulados de forma análoga para colunas de A.
32 GUILHERME CHAUD TIZZIOTTI

Teorema 48. Seja A ∈ Mn×n (R). Então, existem matrizes invertı́veis S1 , . . . , St ∈


Mn×n (R), que são produtos de matrizes elementares, tais que M := St · · · S1 · A está na
forma escalonada.

Demonstração. Veja Teorema 5.2 do livro Linear Algebra de J. Liesen e V. Mehrmann. 

Teorema 49. Sejam A, B ∈ Mn×n (R). Então, det(AB) = det(A) det(B). Mais ainda,
se A é invertı́vel, então det(A−1 ) = (det(A))−1 .

Demonstração. Pelo Teorema 48 sabemos que para A ∈ Mn×n (R) existem matrizes ele-
mentares invertı́veis S1 , . . . , St tais que à = St · · · S1 · A está na forma escalonada. Assim,
podemos escrever A = S1−1 · · · St−1 · Ã, e pelo Lema 47 temos que
det(A) = det(S1−1 · · · St−1 · Ã) = det(S1−1 ) · · · det(St−1 ) det(Ã),
e também
det(AB) = det(S1−1 · · · St−1 · ÃB) = det(S1−1 ) · · · det(St−1 ) det(ÃB).

Se A é não invertı́vel, então à não é invertı́vel, e consequentemente ÃB, tem uma linha
igual a zero. Então, det(Ã) = det(ÃB) = 0, o que implica que det(A) = 0, e temos que
det(AB) = 0 = det(A) det(B). Caso contrário, se A é invertı́vel, então à = In , já que Ã
está na forma escalonada. Logo, A = S1−1 · · · St−1 e ÃB = B. Agora, como det(In ) = 1
temos que det(Ã) = 1, e concluı́mos que det(AB) = det(A) det(B).

Finalmente, para concluirmos a última afirmação do enunciado, se A é invertı́vel, então


1 = det(In ) = det(AA−1 ) = det(A) det(A−1 ), e temos que det(A−1 ) = (det(A))−1 . 

O teorema anterior nos diz que det(A) pode ser computado transformando A em uma
matriz escalonada.

Corolário 50. Sejam A ∈ Mn×n (R) e S1 , . . . , St ∈ Mn×n (R) matrizes elementares tais
que à = St · · · S1 · A é da forma escalonada. Então, ou à tem uma linha formada por
zeros, e assim det(Ã) = 0, ou à = In e assim det(A) = (det(S1 ))−1 · · · (det(St ))−1 .

O Método de Laplace

Apesar do uso de escalonamento ser mais eficiente para calcular determinantes, há outros
métodos conhecidos que também podem ser úteis. Um deles é o método de Laplace
(Pierre-Simon Laplace, 1749-1827). Para vermos como esse método funciona precisamos
das seguintes definições.
33

Definição 51. Seja A uma matriz quadrada de ordem n. Denotaremos por [A]ij a matriz
quadrada de ordem n − 1 obtida de A removendo sua i-ésima linha e j-ésima coluna.
O menor complementar de A relativo ao elemento aij é det([A]ij ).
O cofator de um elemento aij de A é (−1)i+j det([A]ij ), e será denotado por cof (A, i, j).

Exemplo 52. Considere a matriz


 
3 −2 1
A= 0 4 5 
−6 7 6

O menor complementar do elemento a23 é


 
3 −2
det([A]23 ) = det = 3 · 7 − (−2) · (−6) = 21 − 12 = 9.
−6 7

Já o cofator é (−1)2+3 det([A]23 ) = −9.

O Teorema de Laplace para se calcular o determinante de uma matriz quadrada é o


seguinte.

Teorema 53. Seja A ∈ Mn×n (R). Então, para qualquer linha i de A,


n
X
det(A) = aij (−1)i+j det([A]ij ).
j=1

Demonstração. Veja Teorema 5.25 no livro Álgebra Linear, de J. C. Pellegrini. 

Exemplo 54. Seja


2 −1 −2
 
1
 0 3 4 1 
A=
 3
.
5 0 0 
−1 2 3 1

Vamos escolher a linha 3 já que ela possui dois zeros e isso facilita nossos cálculos.
34 GUILHERME CHAUD TIZZIOTTI

det(A) = 3(−1)3+1 det([A]31 ) + 5(−1)3+2 det([A]32 ) + 0(−1)3+3 det([A]33 ) + 0(−1)3+4 det([A]34 )

= 3(−1)3+1 det([A]31 ) + 5(−1)3+2 det([A]32 )


   
2 −1 −2 1 −1 −2
= 3 det  3 4 1  + (−5) det  0 4 1 
2 3 1 −1 3 1

= 3 · 1 + (−5) · (−6) = 33.

A transposta da matriz dos cofatores de uma matriz A é chamada de matriz adjunta


de A, denotada por adj(A). Assim,
adj(A) = (cof (A, i, j))T .
 
a b
Exemplo 55. Se A = , a matriz formada pelos cofatores de A será
c d
(−1)1+1 det(d) (−1)1+2 det(c)
   
d −c
cof (A) = = .
(−1)2+1 det(b) (−1)2+2 det(a) −b a
 
d −b
Daı́, adj(A) = .
−c a

 
a b c
Exemplo 56. Se A =  d e f . A matriz formada pelos cofatores de A será
g h i
       
e f d f d e
 det h i − det det
 g i g h 
      
b c a c a b
 
cof (A) =  − det det − det .
 
 h i g i g h 
       
b c a c a b
− det
 
det det
e f d f d e

E assim, temos

adj(A) = (cof (A))T .


35

Teorema 57. Seja A ∈ Mn (R). Então,


A · adj(A) = adj(A) · A = det(A) · Id .

Demonstração. Vamos mostrar que A · adj(A) = det(A) · Id . (a outra igualdade se mostra


de maneira análoga usando coluna ao invés de linha)
Sejam i, j ∈ {1, . . . , n} e Aij o cofator de aij .
Se i = i, calculado o determinante pelo método de Laplace pela linha i temos que
Xn
det(A) = aik Aik .
k=1

Se i 6= j, defina A0 como sendo a matriz obtida substituindo a linha j de A pela linha i


de A. Assim, A0 = (a0ij ) possui duas linhas iguais, e então temos que
n
X n
X
0
0 = det(A ) = a0jk A0jk (expandindo o determinante sobre a linha j) = aik Ajk .
k=1 k=1

Logo, pela definição de produto de matriz, o elemento/entrada (i, j) de A · adj(A) é

n 
X 0 para i 6= j
aik Ajk = .
det(A) para i = j
k=1
Portanto, temos que A · adj(A) = det(A) · Id . 
36 GUILHERME CHAUD TIZZIOTTI

6. Inversão de Matrizes

Vamos começar esta seção com o seguinte resultado.

Teorema 58. Seja A ∈ Mn (R). A matriz A é invertı́vel se, e somente se, det(A) 6= 0.

Demonstração. (⇒) Se A é invertı́vel, então existe A−1 tal que AA−1 = Id e o resultado
segue do Teorema 49.
(⇐) Se det(A) 6= 0, então pelo Teorema 57 temos que
 
adj(A)
A· = Id .
det(A)
 
adj(A)
Logo, A−1 = , e temos que A é invertı́vel. 
det(A)

Matriz Singular e Não-Singular: Chamamos uma matriz quadrada A de singular se o


determinante de A for nulo, ou seja, se det(A) = 0. Caso contrário, dizemos que a matriz
A é não-singular (ou regular).

 
−1 3
Exemplo 59. A matriz A = é uma matriz singular.
−2 6

 
1 5
Já a matriz B = é não-singular.
2 7

Observação 60. Se A é uma matriz singular, então ela não possui inversa. Mas, se A é
não-singular, então ela possui inversa. Lembre que det(I) = 1 e que se A possui inversa,
então A.A−1 = I.

Propriedades da matriz inversa:

1) Se uma matriz A admite inversa, então esta inversa é única.

2) Se A é uma matriz não-singular, então sua inversa A−1 também é não-singular. Além
disso, a inversa de A−1 é A, ou seja, (A−1 )−1 = A.

3) A inversa da matriz identidade I é ela mesma, ou seja, I −1 = I.


37

4) Se a matriz A é não-singular, então AT também é não-singular. Além disso, (A−1 )T é


a inversa de AT .

5) Se A e B são matrizes não-singulares de mesma ordem, então o produto AB também


é uma matriz não-singular e (AB)−1 = B −1 A−1 .

Demonstração. 1) Suponhamos que A admite inversa e que B e C são duas inversas de


A. Vejamos que B = C. De fato, como B é inversa de A, então A.B = I. Multiplicando
ambos os lados desta igualdade pela matriz C, temos que C.(A.B) = C.I ⇒ (C.A).B =
C ⇒ I.B = C ⇒ B = C. c.q.d. (como querı́amos demonstrar)

2) Suponhamos que A é não-singular, ou seja, det(A) 6= 0. Como A.A−1 = I e det(I) = 1,


segue que det(A.A−1 ) = 1 ⇒ det(A).det(A−1 ) = 1. Agora, det(A) 6= 0 e então temos que
1
det(A−1 ) = 6= 0. c.q.d.
det(A)

3) Segue diretamente do fato de que I.I = I.

4) Sabemos que det(AT ) = det(A). Logo, se A é não-singular, então é claro que AT


também será não-singular. Agora, vejamos que (A−1 )T é a inversa de AT .
De fato, (A−1 )T .AT = (A.A−1 )T = I T = I. Portanto (A−1 )T = (AT )−1 . c.q.d.

5) Suponhamos que A e B são matrizes não-singulares de mesma ordem.


Então, como det(AB) = det(A).det(B), segue que AB é não-singular. Para mostrar que
(AB)−1 = B −1 A−1 , basta observar que (B −1 A−1 ).(AB) = I.


Um método para se inverter uma matriz quadrada A utilizando as operações elementares,


dadas na seção onde estudamos escalonamento, é o seguinte:

1o ) coloca-se à direita da matriz A a matriz I, separada por um traço vertical;

2o ) transforma-se, por meio de operações elementares, a matriz A na matriz I, aplicando-


se simultaneamente à matriz I, as mesmas operações elementares.
38 GUILHERME CHAUD TIZZIOTTI

3o ) a matriz que estará à direita da matriz I, ao final do processo, será a inversa de A,


que é A−1 .

As mesmas operações elementares que transformarão a matriz A na matriz identidade I,


transformarão I na matriz A−1 .

Vejamos como fazer este processo através de alguns exemplos.

 
3 −2
Exemplo 61. Vamos determinar a inversa de A = .
2 −1

Primeiramente, vamos colocar a matriz I à direita de A, separando-as com um traço.

 
3 −2 1 0
2 −1 0 1

Agora, vamos transfomar, utilizando operações elementares, a A na matriz I.

 
3 −2 1 0 1
−→ L1 → .L1
2 −1 0 1 3

1 − 32 13 0
 
⇒ −→ L2 → 2.L1 − L2
2 −1 0 1

1 − 32 1
 
3
0
⇒ −→ L2 → −3.L2
0 − 13 2
3
−1

1 − 23 13 0
 
2
⇒ −→ L1 → .L2 + L1
0 1 −2 3 3

 
1 0 −1 2

0 1 −2 3

 
−1 −1 2
Portanto, a inversa de A será A = .
−2 3
39
       
3 −2 −1 2 3.(−1) + (−2).(−2) 3.2 + (−2).3 1 0
Note que . = = .
2 −1 −2 3 2.(−1) + (−1).(−2) 2.2 + (−1).3 0 1

 
−2 4 0
Exemplo 62. Determine a inversa da matriz M =  1 0 0 .
3 6 −1

A primeira coisa a fazer é colocar a matriz I à direita de M , separando-as com um traço.

 
−2 4 0 1 0 0
 1 0 0 0 1 0 
3 6 −1 0 0 1

Utilizando as operações elementares teremos:

 
−2 4 0 1 0 0
 1 0 0 0 1 0  −→ Permutamos as linhas L1 e L2
3 6 −1 0 0 1

 
1 0 0 0 1 0
⇒  −2 4 0 1 0 0  −→ L2 → 2.L1 + L2
3 6 −1 0 0 1

 
1 0 0 0 1 0
1
⇒  0 4 0 1 2 0  −→ L2 → .L2
4
3 6 −1 0 0 1

 
1 0 0 0 1 0
⇒  0 1 0 14 12 0  −→ L3 → 3.L1 − L3
3 6 −1 0 0 1

 
1 0 0 0 1 0
⇒  0 1 0 14 12 0  −→ L3 → 6.L2 + L3
0 −6 1 0 3 −1
40 GUILHERME CHAUD TIZZIOTTI
 
1 0 0 0 1 0
⇒  0 1 0 14 12 0 
0 0 1 32 6 −1

 
0 1 0
Logo, temos que M −1 =  1
4
1
2
0 .
3
2
6 −1

Faça os produtos M.M −1 e M −1 .M e comprove que de fato eles resultam na matriz iden-
tidade.
41

7. Sistemas Lineares

Nesta seção, vamos estudar sistemas de equações lineares, que constituem um tópico de
muito interesse prático. Veremos como classificá-los e resolvê-los.

Para começar vamos ver como é definida uma equação linear.

Uma equação linear é uma equação da forma: a1 x1 + a2 x2 + . . . + an xn = b, na


qual x1 , x2 , . . . , xn são chamados de variáveis (ou incógnitas); a1 , a2 , . . . , an são chamados
coeficientes das variáveis; e b é chamado de termo independente.

Os valores das variáveis x1 , x2 , . . . , xn que satisfazem a equação são chamados de solução


da equação.

Um sistema de equações lineares, ou simplesmente sistema linear, é um conjunto de


equações lineares. Representamos um sistema linear de m equações com n variáveis da
seguinte maneira:


 a11 x1 + a12 x2 + . . . + a1n xn = b1
 a21 x1 + a22 x2 + . . . + a2n xn = b2

..


 .
am1 x1 + am2 x2 + . . . + amn xn = bm

Sistema possı́vel: Um sistema que admite solução é chamado de sistema possı́vel.

Exemplo 63. O sistema



−x + 2y = 0
x−y =1
é um sistema possı́vel, já que x = 2 e y = 1 é uma solução.

Sistema determinado: Um sistema possı́vel é chamado de sistema determinado quando


possui uma única solução.

O exemplo anterior é um exemplo de um sistema determinado.


42 GUILHERME CHAUD TIZZIOTTI

Sistema indeterminado: Um sistema possı́vel é chamado de sistema indeterminado


quando possui mais de uma solução (no caso infinitas).

Exemplo 64. O sistema 


x + 2y = 1
2x + 4y = 2
é um sistema possı́vel e indeterminado, já que x = −1 e y = 2 é uma solução, x = 1 e
y = 0 também é uma solução, assim como todos os valores de x e y tais que x = 1 − 2y.

Sistema impossı́vel: Um sistema linear é chamado de sistema impossı́vel quando não


possui solução.

Exemplo 65. O sistema 


x + 2y = 0
x + 2y = 2
é um sistema impossı́vel, já que a expressão 2x + y não pode ser simultaneamente igual a
0 e igual a 2.

Sistema homogêneo: Quando os termos independentes de um sistema linear são todos


nulos o chamamos de sistema homogêneo.

Exemplo 66. O sistema 


 x + 2y + 3z = 0
2x − 2y + z = 0
−2x + 5y − 4z = 0

é um sistema homogêneo.

Observação 67. Note que um sistema homogêneo sempre possui pelo menos uma solução,
que é x1 = x2 = . . . = xn = 0. Essa solução é chamada de solução trivial.

Teorema 68. Seja A ∈ Mn (R). O sistema homogêneo AX = (0) tem solução não trivial
se, e somente se, det(A) = 0.

Sistemas equivalentes: Dizemos que dois, ou mais, sistemas de equações lineares são
equivalentes quando eles possuem a mesma solução.
43

Exemplo 69. Os sistemas 


−x + 2y = 0
x−y =1
e 
−2x + 4y = 0
2x − 2y = 2
são equivalentes, pois possuem a mesma solução x = 2 e y = 1

Operações elementares: Um sistema linear se transforma em um sistema equivalente


quando se efetuam as seguintes operações elementares:

1) Permutação de duas equações.

2) Multiplicação de uma equação por um número real diferente de zero.

3) Substituição de uma equação por sua soma com outra equação previamente multiplicada
por um número real diferente de zero.

Observação 70. Observe que estas operações elementares são análogas às dadas na seção
onde aprednemos a escalonar matrizes. O processo que será feito para resolver um sistema
linear será essencialmente o mesmo para escalonar uma matriz.

Primeiramente, vejamos como encontrar a solução de um sistema de n equações com


n variáveis. Veremos dois métodos para esse propósito, o método de Gauss-Jordan e o
método da matriz inversa.

Solução de um sistema de n equações com n variáveis: método de Gauss-


Jordan

O método de Guass-Jordan consite em trabalhar com as operações elementares a fim de


deixar o sistema inicial equivalente a um sistema cujos termos independentes sejam a sua
solução. O método consiste no seguinte:

1o ) coloca-se ao lado da matriz dos coeficientes a matriz coluna dos termos independen-
tes, separadas por um traço vertical (de maneira semelhante ao processo de inversão de
matrizes);
44 GUILHERME CHAUD TIZZIOTTI

2o ) transforma-se, por meio de operações elementares, a matriz dos coefientes na matriz


identidade, aplicando-se, simultanemente, à matriz coluna dos termos independentes, as
mesmas operações;

3o ) transformada a matriz dos coeficientes na matriz identidade, a matriz dos termos


independentes ficará transformada, ao final, na solução do sistema.

A matriz, associada ao sistema, formada no primeiro passo, é chamada de matriz am-


pliada do sistema. Cada uma de suas linhas é uma representação abreviada da equação
correspondente no sistema. O traço vertical é dispensável, mas é colocado para facilitar a
visualização da matriz dos coeficientes e da matriz coluna dos termos independentes. O
exemplo a seguir ilustra a aplicação do método de Guass-Jordan.

Exemplo 71. Vamos resolver o sistema



 3x + 2y − 5z = 8
2x − 4y − 2z = −4
x − 2y − 3z = −4

utilizando o método de Guass-Jordan.


O primeiro passo é colocar a matriz coluna dos termos independentes ao lado da matriz
dos coeficientes, separadas por um traço vertical. Ou seja, construir a matriz ampliada
do sistema, que é dada abaixo.

 
3 2 −5 8
 2 −4 −2 −4 
1 −2 −3 −4

Agora, analogamente ao processo feito para encontrar a inversa de uma matriz, vamos
usar operações elementares para transformar a matriz dos coefientes na matriz identi-
dade, aplicando-se, simultanemente,
 à matriz 
coluna dos termos independentes, as mes-
3 2 −5 8
1
mas operações. Vejamos.  2 −4 −2 −4  −→ L1 → L1
3
1 −2 −3 −4

1 23 − 53 83
 

⇒  2 −4 −2 −4  −→ L2 → L2 + (−2)L1
1 −2 −3 −4
45

1 23 − 53 8
 
3
⇒  0 − 16
3
4
3
− 28
3
 −→ L3 → L3 + (−1)L1
1 −2 −3 −4

1 32 − 53 8
 
3
⇒  0 − 16 4
− 28  −→ L2 → − 3 L2
3 3 3
16
0 − 83 − 43 − 20
3

1 23 − 53 8
 
3
⇒  0 1 − 41 7  −→ L3 → L3 + 8 L2
4
3
0 − 38 − 43 − 20
3

1 23 − 53 83
 
2
⇒  0 1 − 14 74  −→ L1 → L1 − L2
3
0 0 −2 −2

1 0 − 32 32
 
1
⇒  0 1 − 14 74  −→ L3 → − L3
2
0 0 −2 −2

1 0 − 32 32
 
3
⇒  0 1 − 14 74  −→ L1 → L1 + L3
2
0 0 1 1

 
1 0 0 3
1
⇒  0 1 − 14 74  −→ L2 → L2 + L3
4
0 0 1 1

 
1 0 0 3
⇒ 0 1 0 2 
0 0 1 1


 3x + 2y − 5z = 8
Portanto, os sistemas 2x − 4y − 2z = −4
x − 2y − 3z = −4

46 GUILHERME CHAUD TIZZIOTTI

 x + 0y + 0z = 3
e 0x + y + 0z = 2 são equivalentes.
0x + 0y + z = 1

E do último sistema vem que a solução é x = 3, y = 2 e z = 1.

Solução de um sistema de n equações com n variáveis: método de matriz


inversa

Consideremos o sistema de n equações com n variáveis




 a11 x1 + a12 x2 + . . . + a1n xn = b1
 a21 x1 + a22 x2 + . . . + a2n xn = b2

..


 .
an1 x1 + an2 x2 + . . . + ann xn = bn

     
a11 a12 a13 . . . a1n x1 b1
 a21 a22 a23 . . . a2n 

 x2
   b2 
Tomando A =  .. , X =  .. eB=
   
.. .. .. .. .. 
 . . . . .   .   . 
an1 an2 an3 . . . ann xn bn

o sistema pode ser representado na forma matricial A.X = B. Se a matriz A possui


inversa, tem-se A−1 .A.X = A−1 .B. Logo, X = A−1 .B e temos a solução do sistema.

Portanto, se A possui inversa, a solução do sistema A.X = B é obtida de uma forma


muito simples, bastando multiplicar A−1 pela matriz B. Vejamos como fazer isso usando
o exemplo anterior.

Exemplo 72. Resolva o sistema



 3x + 2y − 5z = 8
2x − 4y − 2z = −4
x − 2y − 3z = −4

usando o método da matriz inversa.


 
3 2 −5
O primeiro passo é encontrar, se existir, a inversa da matriz A =  2 −4 −2 .
1 −2 −3
47

Fazendo o procedimento dado


 na seção onde estudamos a inversão de matrizes encontra-
−3
 1 1
4 2 4
mos A−1 =  1
8
− 18 − 18 .
0 14 − 12

−3
   1 1     
x 4 2 4
8 3
1 1 1  
Assim, temos  y  = 
8
−8 −8 . −4  =  2 .
1 1
z 0 4 −2 −4 1

Portanto, a solução do sistema é x = 3, y = 2 e z = 1.

Solução de um sistema de m equações com n variáveis (m 6= n)

O método para resolver um sistema de m equações com n variáveis (m 6= n) é semelhante


ao método de Guass-Jordan. Neste caso, como m 6= n, a matriz dos coeficientes não pode
ser transformada na matriz identidade, pois não é quadrada. Entretanto, o procedimento
será o mesmo: transformar os elementos aii em 1 e em zeros os demais elementos das
colunas em que se situam estes aii . Feito isso se consegue encontrar a solução do sistema.
Vejamos como fazemos isso através de alguns exemplos.

Exemplo 73. Resolva o sistema


 2x + 3y = 1
x − 2y = −1
4x + 6y = 2

Note que o sistema acima possui 3 equações com 2 variáveis.

Vejamos como resolvê-lo.

1 32 1
   
2 3 1 2
 1 −2 −1  −→ L1 → 1 .L1 ⇒  1 −2 −1  −→ L3 → L3 − 4L1
2
4 6 2 4 6 2
48 GUILHERME CHAUD TIZZIOTTI

1 32 1
1 23 1
   
2 2 2
⇒  1 −2 −1  −→ L2 → L2 − L1 ⇒  0 − 72 − 32  −→ L2 → − L2
7
0 0 0 0 0 0

1 23 12 1 0 − 71
   
3
⇒  0 1 37  −→ L1 → L1 − L2 ⇒  0 1 37 .
2
0 0 0 0 0 0

1
 
 x + 0.y = − 7  2x + 3y = 1
3
Essa matriz corresponde ao sistema 0.x + y = 7 que é equivalente ao sistema x − 2y = −1
0.x + 0.y = 0 4x + 6y = 2
 

Note que a terceira equação 0.x + 0.y = 0 não estabelece nenhuma condição para x e y,
pois ela é satisfeita para quaisquer valores de x e y. Portanto, a solução do sistema será
dada pelas duas primeiras equações: x + 0.y = − 17 e 0.x + y = 37 , cujas soluções são
1 3
x=− ey= .
7 7

Exemplo 74. Resolva o sistema


x − 3y + 4z − w = 2
2x − y + 3z − 2w = 19

Note que o sistema acima possui 2 equações com 4 variáveis.

Resolução.

   
1 −3 4 −1 2 1 −3 4 −1 2
−→ L2 → L2 − 2L1 ⇒ −→ L2 →
2 −1 3 −2 19 0 5 −5 0 15
1
L2
5

   
1 −3 4 −1 2 1 0 1 −1 11
⇒ −→ L1 → L1 + 3L2 ⇒
0 1 −1 0 3 0 1 −1 0 3
49
  
1 0 1 −1 11 x = 11 − z + w
A matriz corresponde ao sistema , que é equi-
0 1 −1 0 3 y =3+z
valente ao sistema dado.

Assim, o sistema é possı́vel e indeterminado, pois admite infinitas soluções. Os valores de


x e y são obtidos atribuindo valores arbitrários a z e w. Por exemplo, se z = 1 e w = 1,
temos x = 11 e y = 4. Portanto, x = 11, y = 4, z = 1 e w = 1 é uma solução do sistema.

Exemplo 75. Resolva o sistema


 2x − 6y = −4
x + 3y = 1
4x + 12y = 2

Resolução.

   
2 −6 −4 1 −3 −2
1
 1 3 1  −→ L1 → L1 ⇒  1 3 1  −→ L2 → L2 − L1
2
4 12 2 4 12 2

   
1 −3 −2 1 −3 −2
1
⇒ 0 6 3  −→ L3 → L3 − 4L1 ⇒  0 6 3  −→ L2 → L2
6
4 12 2 0 24 10

1 0 − 12
   
1 −3 −2
1  1 
⇒ 0 1 2
−→ L1 → L1 + 3L2 ⇒  0 1 2
−→ L3 → L3 − 24L2
0 24 10 0 24 10

1 0 − 12
 

⇒  0 1 12 
0 0 −2

1

 x + 0.y = − 2
A matriz acima corresponde ao sistema 0.x + y = 12 , que é equivalente ao sistema
0.x + 0.y = −2

dado.
50 GUILHERME CHAUD TIZZIOTTI

Mas não existem valores de x e y que satisfaçam a equação 0.x + 0.y = −2. Portanto, o
sistema é incompatı́vel.
51

8. Espaços e subespaços vetoriais

Definição 76. Corpo: Um anel (K, +, .) comutativo com unidade é um corpo se a


seguinte condição é satisfeita: ∀a ∈ K \ {0}, existe b ∈ K tal que a.b = 1, ou seja, todo
elemento a ∈ K \ {0} é invertı́vel.

• Aqui podemos pensar que K = R.

Definição 77. Espaço vetorial: Sejam V um conjunto não vazio e K um corpo. Di-
zemos que V é um espaço vetorial sobre K se estiverem definidas as seguintes operações:
adição: cada par (u, v) ∈ V × V corresponde a um vetor u + v ∈ V , chamado de soma
de u e v;
multiplicação por escalar: cada par (a, u) ∈ K × V corresponde a um vetor a.u ∈ V ,
denominado produto por escalar de a por u.
Estas operações devem satisfazer, para ∀ u, v, w ∈ V e ∀ a, b ∈ K, as seguintes proprie-
dades:

A1) u + v = v + u (comutatividade de +)

A2) (u + v) + w = u + (v + w) (associatividade +)

A3) existe 0 ∈ V , denominado vetor nulo, tal que 0 + u = u + 0 = u

A4) para cada u ∈ V , existe −u ∈ V , chamado de inverso aditivo de u, tal que (−u)+u =
u + (−u) = 0

M1) (ab).u = a.(b.u)

M2) se 1 é o elemento neutro de K, então 1.u = u

AM1) a.(u + v) = a.u + a.v (distributividade)

AM2) (a + b).u = a.u + b.u

• Os elementos de um espaço vetorial V são chamados de vetores, e os elementos do


corpo K, onde o espaço está definido, são chamados de escalares.

Vejamos, agora, alguns exemplos de conjuntos e operações que se enquadram na estrutura


de espaços vetoriais.
52 GUILHERME CHAUD TIZZIOTTI

Exemplo 78. O conjunto V = R2 = {(x, y); x, y ∈ R} é um espaço vetorial com as


operações de adição e multiplicação por um número real assim definidas:
(x1 , y1 ) + (x2 , y2 ) = (x1 + x2 , y1 + y2 )
α(x, y) = (αx, αy).
Essas operações são denominadas operações usuais.
Para verificar os oito axiomas de espaço vetorial, sejam u = (x1 , y1 ), v = (x2 , y2 ) e
w = (x3 , y3 ).

A1 ) (u + v) + w = ((x1 , y1 ) + (x2 , y2 )) + (x3 , y3 )


= (x1 + x2 , y1 + y2 ) + (x3 , y3 )
= ((x1 + x2 ) + x3 , (y1 + y2 ) + y3 )
= (x1 + (x2 + x3 ), y1 + (y2 + y3 ))
= (x1 , y1 ) + (x2 + x3 , y2 + y3 )
= (x1 , y1 ) + ((x2 , y2 ) + (x3 , y3 ))
= u + (v + w)

Na primeira igualdade, simplesmente substituı́mos os vetores u, v e w. Na segunda,


aplicamos a definição de soma dentro do parêntese. Na terceira, aplicamos a definição
com o vetor fora do parêntese. Na quarta, aplicamos a associatividade de números reais.
Na quinta, voltamos a usar a definição de soma (agora no sentido contrário da segunda
igualdade). Na sexta, novamente a definição de soma dentro do parêntese. Por fim,
voltamos com u, v e w.

Os axiomas seguintes são estabelecidos de maneira análoga ao primeiro. Um excelente


exercı́cio para o leitor é explicar, por escrito, cada uma das igualdades como foi feito
acima.

A2 ) u + v = (x1 , y1 ) + (x2 , y2 )
= (x1 + x2 , y1 + y2 )
= (x2 + x1 , y2 + y1 )
= (x2 , y2 ) + (x1 , y1 )
= v+u

A3 ) Seja 0 = (0, 0) ∈ R2 , ∀u = (x1 , y1 ) ∈ R2 ,


u+0 = (x1 , y1 ) + (0, 0)
= (x1 + 0, y1 + 0)
= (x1 , y1 )
= u
53

A4 ) ∀u = (x1 , y1 ) ∈ R2 , consideremos (−u) = (−x1 , −y1 ) ∈ R2 ,


u + (−u) = (x1 , y1 ) + (−x1 , −y1 )
= (x1 − x1 , y1 − y1 )
= (0, 0)
= 0

M1 ) (αβ)u = (αβ)(x1 , y1 )
= ((αβ)x1 , (αβ)y1 )
= (α(βx1 ), α(βy1 ))
= α(βx1 , βy1 )
= α(β(x1 , y1 ))
= α(βu)

M2 ) (α + β)u = (α + β)(x1 , y1 )
= ((α + β)x1 , (α + β)y1 )
= (αx1 + βx1 , αy1 + βy1 )
= (αx1 , αy1 ) + (βx1 , βy1 )
= α(x1 , y1 ) + β(x1 , y1 )
= αu + βu

M3 ) α(u + v) = α((x1 , y1 ) + (x2 , y2 ))


= α(x1 + x2 , y1 + y2 )
= (α(x1 + x2 ), α(y1 + y2 ))
= (αx1 + αx2 , αy1 + αy2 )
= (αx1 , αy1 ) + (αx2 , αy2 )
= α(x1 , y1 ) + α(x2 , y2 )
= αu + αv

M4 ) 1u = 1(x1 , y1 )
= (1x1 , 1y1 )
= (x1 , y1 )
= u

Exemplo 79. Da geometria analı́tica se sabe que um par ordenado (x1 , x2 ) de números
reais representa um ponto ou um vetor do plano R2 , assim como uma terna (x1 , x2 , x3 )
representa um ponto ou um vetor no R3 . Em geral, uma quádrupla (x1 , x2 , x3 , x4 ) é um
ponto ou um vetor de R4 e uma n-upla (x1 , x2 , ..., xn ) é um ponto ou um vetor de Rn .
54 GUILHERME CHAUD TIZZIOTTI

Procedendo como no Exemplo 78, verifica-se que os conjuntos R3 , R4 ,..., Rn são também
espaços vetoriais com as operações usuais de adição e multiplicação por escalar.

Exemplo 80. O conjunto R, em relação às operações usuais de adição e de multiplicação


por escalar, é um espaço vetorial. De fato, sabe-se que a adição de números reais satisfaz
os axiomas A1 , A2 , A3 e A4 e que, na multiplicação, se verificam os axiomas M1 , M2 , M3 e
M4 .

Exemplo 81. Em geral, todo corpo é um espaço vetorial sobre si mesmo.


De fato, se K é um corpo, então as duas operações internas em K (adição e multiplicação)
podem ser vistas como a soma de vetores e a multiplicação por escalares.

Exemplo 82. O conjunto R2 = {(a, b); a, b ∈ R} não é um espaço vetorial em relação às
operações assim definidas:
(a, b) + (c, d) = (a + c, b + d)
α(a, b) = (αa, b), α ∈ R.
Como a adição aqui definida é a usual, verificam-se os axiomas A1 , A2 , A3 e A4 de espaço
vetorial conforme se viu no Exemplo 78. Logo, não devem se verificar alguns (ou algum)
dos axiomas relativos à multiplicação.
Sejam u = (x1 , y1 ), v = (x2 , y2 ) e α, β ∈ R.
M1 ) (αβ)u = (αβ)(x1 , y1 )
= ((αβ)x1 , y1 )
= (α(βx1 ), y1 )
= α(βx1 , y1 )
= α(β(x1 , y1 ))
= α(βu)
(Este axioma se verifica)
M2 ) (α + β)u = (α + β)(x1 , y1 )
= ((α + β)x1 , y1 )
= (αx1 + βx1 , y1 )
6= α(x1 , y1 ) + β(x1 , y1 )
= (αx1 , y1 ) + (βx1 , y1 )
= (αx1 + βx1 , 2y1 ).
Como se vê, (α + β)u 6= αu + βu e, portanto, não se verifica, no mı́nimo, o axioma M2 .
Assim, o conjunto de que trata este exemplo não é um espaço vetorial.
55

Exemplo 83. De uma maneira mais geral à considerada no exemplo anterior, para cada
n ≥ 1, o conjunto K n = {(u1 , u2 , . . . , un ) ; ui ∈ K, para todo i = 1, 2, . . . , n} tem uma
estrutura de espaço vetorial sobre K bastante natural com as operações:
• (u1 , u2 , . . . , un )+(v1 , v2 , . . . , vn ) = (u1 +v1 , u2 +v2 , . . . , un +vn ), para quaisquer (u1 , u2 , . . . , un ), (v1 , v2 , . . .
K n.

• a.(u1 , u2 , . . . , un ) = (au1 , au2 , . . . , aun ), para quaisquer a ∈ K e (u1 , u2 , . . . , un ) ∈ K n .

Analogamante, podemos ver que o espaço K ∞ formado pelas sequências de elementos em


K também é um espaço vetorial sobre K.

Exemplo 84. O conjunto R2 com as operações


(x1 , y1 ) + (x2 , y2 ) = (x1 + 2x2 , y1 + 2y2 )
α(x1 , y1 ) = (αx1 , αy1 )
não é um espaço vetorial, pois, pelo menos, o axioma A1 não é satisfeito.
De fato, sejam u = (x1 , y1 ), v = (x2 , y2 ) e w = (x3 , y3 ),
(u + v) + w = ((x1 , y1 ) + (x2 , y2 )) + (x3 , y3 )
= (x1 + 2x2 , y1 + 2y2 ) + (x3 , y3 )
= ((x1 + 2x2 ) + 2x3 , (y1 + 2y2 ) + 2y3 )
= (x1 + 2x2 + 2x3 , y1 + 2y2 + 2y3 )
6= (x1 + 2x2 + 4x3 , y1 + 2y2 + 4y3 )
= (x1 + 2(x2 + 2x3 ), y1 + 2(y2 + 2y3 ))
= (x1 , y1 ) + (x2 + 2x3 , y2 + 2y3 )
= (x1 , y1 ) + ((x2 , y2 ) + (x3 , y3 ))
= u + (v + w).

Exemplo 85. O conjunto de polinômios


P (K) = {p(x) = an xn + . . . + a1 x + a0 ; ai ∈ K e n ∈ Z+ }
é um K-espaço vetorial com as operações de soma de polinômios e multiplicação por
escalar.

Exemplo 86. O conjunto Mm×n (K) das matrizes m × n com entradas em K é um K-


espaço vetorial com as operações de soma de matrizes e multiplicação por escalar usuais.
56 GUILHERME CHAUD TIZZIOTTI

Exemplo 87. Espaço das funções: Sejam X um conjunto não vazio e F(X, K) o
conjunto de todas as funções f : X → K. Defina as seguintes operações em F(X, K):
• para f, g ∈ F(X, K), defina a função f + g : X → K dada por (f + g)(x) = f (x) + g(x),
para todo x ∈ X.

• para f ∈ F(X, K) e a ∈ K, defina a função a.f : X → K dada por (a.f )(x) = a.f (x),
para todo x ∈ X.

Com estas operações, o conjunto F(X, K) é um K-espaço vetorial, onde a função nula é
o vetor nulo desse espaço. De fato,
A1) Sejam, f, g ∈ F(X, K) e seja x ∈ X. Note que, por definição da operação, (f +
g)(x) = f (x) + g(x). Agora, como f (x), g(x) ∈ K e K é um corpo, então f (x) + g(x) =
g(x) + f (x). Logo, (f + g)(x) = g(x) + f (x). Por definição da operação, g(x) + f (x) =
(g + f )(x). Logo, temos que (f + g)(x) = (g + f )(x). Como tomamos x ∈ X arbitrário,
segue que f + g = g + f .

A2) Sejam, f, g, h ∈ F(X, K) e seja x ∈ X. Note que, por definição da operação, ((f +
g) + h)(x) = (f + g)(x) + h(x) = (f (x) + g(x)) + h(x). Agora, como f (x), g(x), h(x) ∈ K e
K é um corpo, então (f (x)+g(x))+h(x) = f (x)+(g(x)+h(x)). Assim, ((f +g)+h)(x) =
f (x) + (g(x) + h(x)). Agora, pela definição da operação, temos que f (x) + (g(x) + h(x)) =
f (x) + (g + h)(x) = (f + (g + h))(x). Logo, ((f + g) + h)(x) = (f + (g + h))(x). Daı́,
como tomamos um x ∈ X arbitrário, segue que (f + g) + h = f + (g + h).

A3) Seja 0 ∈ F(X, K) a função identicamente nula dada por x 7→ 0 ∈ K, para todo
x ∈ X, e seja f ∈ F(X, K). Logo, para todo x ∈ X, temos (0 + f )(x) = 0(x) + f (x) =
0 + f (x) = f (x). Assim, vemos que 0 + f = f . Analogamente, vemos que f + 0 = f .
Então, a função identicamente nula é o vetor nulo de F(X, K).

A4) Seja f ∈ F(X, K). Para cada x ∈ X, defina −f a função dada por (−f )(x) = −f (x).
Logo, (f + (−f ))(x) = f (x) + (−f )(x) = f (x) + (−f (x)) = 0, para todo x ∈ X. Portanto,
f +(−f ) é a função identicamente nula (vetor nulo), ou seja, f +(−f ) = 0. Analogamente,
vemos que (−f ) + f = 0.

M1) Sejam a, b ∈ K e f ∈ F(X, K). Assim, ((a.b).f )(x) = (a.b).f (x). Agora, como K é
um corpo e a, b, f (x) ∈ K, temos que (a.b).f (x) = a.(b.f (x)). Pela definição da operação,
a.(b.f (x)) = a.((b.f )(x)) = (a.(b.f ))(x). Logo, temos que (a.b).f (x) = (a.(b.f ))(x), e
segue que (a.b).f = a.(b.f ).

M2), AM1) e AM2) Exercı́cio!

Propriedades básicas: Seja V um K-espaço vetorial. Sejam u, v, w ∈ V e a ∈ K


quaisquer.
57

1) Se w + u = w + v, então u = v. Em particular, w + u = w ⇒ u = 0 e w + u = 0 ⇒
u = −w.
De fato, supondo w + u = w + v temos que
u = 0 + u = (−w + w) + u = −w + (w + u) = −w + (w + v) = (−w + w) + v = 0 + v = v.

2) Dados 0 ∈ K (elemento neutro da adição de K) e v ∈ V , tem-se 0.v = 0 ∈ V .


Analogamente, dados a ∈ K e 0 ∈ V , tem-se a.0 = 0 ∈ V .
Com efeito, v + 0.v = 1.v + 0.v = (1 + 0).v = 1.v = v. Logo, como vimos em 1) acima,
temos que 0.v = 0.
De modo análogo, como a.0 + a.0 = a.(0 + 0) = a.0, segue de 1) que a.0 = 0.

3) Se a 6= 0 e v 6= 0, então a.v 6= 0.
De fato, suponha que a.v = 0, com a 6= 0 e v 6= 0. Então, v = 1.v = (a−1 .a).v =
a−1 (a.v) = a−1 .0 = 0, e terı́amos v = 0, contradição.

4) (−1).v = −v.
Com efeito, v + (−1).v = 1.v + (−1).v = (1 + (−1)).v = 0.v = 0. Logo, por 1) segue que
(−1).v = −v.

Notação: Para efeito de simplificação, vamos escrever u − v, para indicar u + (−v).

Subespaços

Certos subconjuntos de um espaço vetorial possuem a propriedade de que a soma de dois


de seus elementos é um elemento do próprio subconjunto, bem como, ao multiplicar um
elemento do subconjunto por um real (escalar), o resultado continua pertencendo a este
subconjunto. Em outras palavras, dizemos que tais subconjuntos são fechados para a soma
e produto por escalar. Tais subconjuntos jogam um papel fundamental dentro da teoria da
álgebra linear e são conhecidos como subespaços vetoriais. De forma mais precisa:

Definição 88 (Subespaço vetorial). Seja V um K-espaço vetorial. Um subespaço vetorial


de V é um subconjunto W ⊂ V com as seguintes propriedades:
i) 0 ∈ W ;
ii) se u, v ∈ W , então u + v ∈ W ;
iii) se v ∈ W , então a.v ∈ W , para todo a ∈ K.
58 GUILHERME CHAUD TIZZIOTTI

Em outras palavras, W ⊂ V é um subespaço de V se a restrição das operações de V a W


torna W um K-espaço vetorial.

Observação 89. É importante salientar que todo subespaço vetorial S de um espaço


vetorial V é ele próprio um espaço vetorial. De fato, as propriedades A1 , A2 , M1 , M2 , M3
e M4 são herdadas do próprio espaço vetorial V . O elemento neutro da adição (A3 ) é
um elemento de S por S2 ) e pela propriedade 6) acima, pois dado u ∈ S, 0u = 0 ∈ S.
Finalmente (A4 ), se u ∈ S, então −u = (−1)u ∈ S pela propriedade 9) acima e por S2 ).

A seguir veremos alguns exemplos de subconjuntos que são subespaços vetoriais e outros
que não são.

Exemplo 90. Os subconjuntos {0} e V são subespaços vetoriais do espaço vetorial V e


são conhecidos como subespaços vetoriais triviais.

Exemplo 91. Sejam V = R2 e S = {(x, y) ∈ R2 ; y = 5x} = {(x, 5x); x ∈ R}.


Note que S 6= ∅, pois (0, 0) ∈ S. Sejam u = (x1 , 5x1 ), v = (x2 , 5x2 ) ∈ S e α ∈ R, então:

ii) u + v = (x1 , 5x1 ) + (x2 , 5x2 )


= (x1 + x2 , 5x1 + 5x2 )
= (x1 + x2 , 5(x1 + x2 )) ∈ S,
pois a segunda componente de u + v é cinco vezes a primeira.

iii) αu = α(x1 , 5x1 )


= (αx1 , α(5x1 ))
= (αx1 , 5(αx1 )) ∈ S,
pois a segunda componente de αu é o quı́ntuplo da primeira.

Exemplo 92. Considere X o intervalo [a, b] em R e K = C. Então


C(X, C) = {f : X → C ; f é uma função contı́nua}
é um subespaço de F(X, C) (dado no Exemplo 87).
59
 
3 3 −2x − 3y
Exemplo 93. Sejam V = R e S = {(x, y, z) ∈ R ; 2x+3y+4z = 0} = x, y, .
4
   
−2x1 − 3y1 −2x2 − 3y2
Note que S 6= ∅, pois (0, 0, 0) ∈ S. Dados u = x1 , y1 , , v = x2 , y2 , ∈
4 4
S e α ∈ R, então:

   
−2x1 − 3y1 −2x2 − 3y2
ii) u + v = x1 , y1 , + x2 , y2 ,
4 4
 
−2x1 − 3y1 −2x2 − 3y2
= x1 + x2 , y1 + y2 , +
4 4
 
−2(x1 + x2 ) − 3(y1 + y2 )
= x1 + x2 , y1 + y2 , ∈ S.
4

 
−2x1 − 3y1
iii) αu = α x1 , y1 ,
4
 
−2x1 − 3y1
= αx1 , αy1 , α
4
 
−2αx1 − 3αy1
= αx1 , αy1 , ∈ S.
4
Portanto, S é um subespaço vetorial de R3 .

Da geometria analı́tica sabe-se que a equação que define o subespaço S no exemplo an-
terior, é a equação de um plano em R3 que passa pela origem. Utilizando o Teste do 0,
conclui-se que, se um plano não passa pela origem, então ele não é um subespaço vetorial
do R3 .

Exemplo 94. Sejam V = R3 e S o conjunto solução do sistema linear homogêneo:



3x + 4y − 2z = 0


2x + y − z = 0 .

x − y + 3y = 0

Note que S 6= ∅, pois (0, 0, 0) ∈ S. Sejam u = (x1 , y1 , z1 ), v = (x2 , y2 , z2 ) ∈ S e α ∈ R,


então:
ii) u + v ∈ S. De fato, u + v = (x1 + x2 , y1 + y2 , z1 + z2 ) e
60 GUILHERME CHAUD TIZZIOTTI

3(x1 + x2 ) + 4(y1 + y2 ) − 2(z1 + z2 ) = 3x1 + 3x2 + 4y1 + 4y2 − 2z1 − 2z2


= (3x1 + 4y1 − 2z1 ) + (3x2 + 4y2 − 2z2 )
= 0 + 0 = 0.
2(x1 + x2 ) + (y1 + y2 ) − (z1 + z2 ) = 2x1 + 2x2 + y1 + y2 − z1 − z2
= (2x1 + y1 − z1 ) + (2x2 + y2 − z2 )
= 0 + 0 = 0.
(x1 + x2 ) − (y1 + y2 ) + 3(z1 + z2 ) = x1 + x2 − y1 − y2 + 3z1 + 3z2
= (x1 − y1 + 3z1 ) + (x2 − y2 + 3z2 )
= 0 + 0 = 0.

iii) αu ∈ S. De fato, αu = (αx1 , αy1 , αz1 ) e


3(αx1 ) + 4(αy1 ) − 2(αz1 ) = 3αx1 + 4αy1 − 2αz1
= α(3x1 + 4y1 − 2z1 )
= α0 = 0.
2(αx1 ) + (αy1 ) − (αz1 ) = 2αx1 + αy1 − αz1
= α(2x1 + y1 − z1 )
= α0 = 0.
(αx1 ) − (αy1 ) + 3(αz1 ) = αx1 − αy1 + 3αz1
= α(x1 − y1 + 3z1 )
= α0 = 0.

Exemplo 95. Seja V = R2 . O subconjunto S = {(x, y); x ≥ 0} de V não é subespaço


vetorial, pois não satisfaz a condição iii) da definição de subespaço (Definição) 88.

Exemplo 96. Sejam a1 , . . . , an números reais. O conjunto H de todos os vetores v =


(x1 , . . . , xn ) ∈ Rn tais que a1 x1 + . . . + an xn = 0 é um subespaço de Rn .
No caso desinteressante em que a1 = . . . = an = 0, tem-se H = Rn . Se, ao contrário,
pelo menos um dos ai é diferente de zero, H é chamado de hiperplano de Rn que passa
pela origem.

Exemplo 97. `∞ = {(xn )n∈N ∈ K ∞ ; (xn ) é uma sequência limitada} é um subespaço


vetorial do espaço das sequências K ∞ .
Lembrando que (xn )n∈N ∈ K ∞ é limitada se existe M > 0 tal que |xn | ≤ M , para todo
n ∈ N.
61

Vejamos.

1) Note que a sequência (xn )n∈N , onde xn = 0, para todo n ∈ N, é limitada.

2) Sejam (xn )n∈N , (yn )n∈N ∈ `∞ . Assim, (xn )n∈N + (yn )n∈N = (xn + yn )n∈N ∈ K ∞ , e
como (xn )n∈N e (yn )n∈N são limitadas, existem M1 > 0 e M2 > 0 tais que |xn | ≤ M1 e
|yn | ≤ M2 , ∀n.
Agora, |xn + yn | ≤ |xn | + |yn | ≤ M1 + M2 = M , ∀n. Então, (xn + yn )n∈N é limitada, e
temos que (xn + yn )n∈N ∈ `∞ .

3) Dado α ∈ K, temos que α.(xn )n∈N = (α.xn )n∈N . Daı́, |α.xn | = |α|.|xn | ≤ |α|.M1 ≤ M .
Ou seja, (α.xn )n∈N ∈ `∞ .

Exemplo 98. Considere o sistema linear homogêneo T , de n incógnitas x1 , x2 , . . . , xn ,


dado por
α11 x1 + α12 x2 + . . . + α1n xn = 0
α21 x1 + α22 x2 + . . . + α2n xn = 0
..
.
αn1 x1 + αn2 x2 + . . . + αnn xn = 0
onde αij ∈ K.

S = {(a1 , a2 , . . . , an ) ∈ K n ; (a1 , a2 , . . . , an ) é solução de T } é um subespaço vetorial de


K n.

Observamos que se o sistema linear não for homogêneo o conjunto solução não será um
subespaço, pois o elemento (0, . . . , 0) não fará parte desse conjunto.
62 GUILHERME CHAUD TIZZIOTTI

Combinação Linear

Nesta seção introduziremos o conceito de combinação linear de vetores com o intuito de


definir subespaços gerados por um conjunto, bem como, espaço vetorial finitamente gerado.

Definição 99 (Combinação Linear). Sejam V um K-espaço vetorial e v1 , . . . , vn ∈ V . Di-


zemos que um vetor v ∈ V é uma combinação linear de v1 , . . . , vn se existem escalares
α1 , . . . , αn ∈ K tais que v = α1 v1 + . . . + αn vn .

Notaremos nos exemplos abaixo que o fato de um vetor ser ou não uma combinação
linear de outros vetores dados está ligado ao fato de um certo sistema linear ser possı́vel
ou impossı́vel.

Exemplo 100. Dados os vetores v1 = (−1, 2, 3) e v2 = (7, −2, 1) de R3 , escreva o vetor


v = (17, −10, −7) como combinação linear de v1 e v2 .

O objetivo é encontrar escalares a1 e a2 tais que v = a1 v1 + a2 v2 , ou seja,


(17, −10, −7) = a1 (−1, 2, 3) + a2 (7, −2, 1)
= (−a1 , 2a1 , 3a1 ) + (7a2 , −2a2 , a2 )
= (−a1 + 7a2 , 2a1 − 2a2 , 3a1 + a2 ).

Pela condição de igualdade de vetores, segue a igualdade das respectivas coordenadas e


portanto obtemos o sistema:

−a1 + 7a2 = 17


(1) 2a1 − 2a2 = −10

3a1 + a2 = −7

cuja solução é a1 = −3 e a2 = 2.

Exemplo 101. No espaço vetorial R3 , o vetor v = (5, 2, 7) é uma combinação linear dos
vetores v1 e v2 do Exemplo 100, pois v = 2v1 + v2 . (Verifique!)

No próximo exemplo apresentamos um vetor que não é combinação linear dos vetores v1
e v2 dados no Exemplo 100.
63

Exemplo 102. Mostre que o vetor v = (13, −2, 4) de R3 não é combinação linear dos
vetores v1 e v2 do Exemplo 100.

A idéia agora é mostrar que não existem escalares a1 e a2 tais que v = a1 v1 + a2 v2 .


Procedendo como no Exemplo 100, temos
(13, −2, 4) = a1 (−1, 2, 3) + a2 (7, −2, 1),
o que resultará num sistema parecido com (1), mudando somente os termos independentes,
isto é, 
−a1 + 7a2 = 13


2a1 − 2a2 = −2 .

3a1 + a2 = 4

Como este sistema é impossı́vel, segue que v não pode ser escrito como combinação linear
de v1 e v2 .

Exemplo 103. Determine o valor de m para que o vetor u = (13, −2, m) seja combinação
linear de v1 e v2 do Exemplo 100.

Pelo Exemplo 102, o objetivo é obter m tal que o seguinte sistema seja possı́vel:

−a1 + 7a2 = 13


2a1 − 2a2 = −2 ,

3a1 + a2 = m

donde resulta que m = 5, a1 = 1 e a2 = 2.

Exemplo 104. Verifique de quantas maneiras diferentes o vetor w = (5, 2) ∈ R2 pode


ser escrito como combinação linear dos vetores w1 = (1, 0), w2 = (0, 1) e w3 = (2, 4).

Buscamos escalares a1 , a2 e a3 tais que


(5, 2) = a1 w1 + a2 w2 + a3 w3
= a1 (1, 0) + a2 (0, 1) + a3 (2, 4)
= (a1 , 0) + (0, a2 ) + (2a3 , 4a3 )
= (a1 + 2a3 , a2 + 4a3 ),
que equivale ao sistema
( (
a1 + 2a3 = 5 a1 = 5 − 2a3
ou .
a2 + 4a3 = 2 a2 = 2 − 4a3
64 GUILHERME CHAUD TIZZIOTTI

Assim, para cada valor atribuı́do a a3 obtemos valores para a1 e a2 . Portanto, w pode ser
escrito de infinitas maneiras como combinação linear de w1 , w2 e w3 .

Subespaço vetorial gerado por um conjunto

Sejam V um espaço vetorial e A = {v1 , v2 , . . . , vn } um conjunto não vazio de V .

Afirmação: O conjunto S de todos os vetores de V que são combinações lineares dos


vetores de A é um subespaço vetorial de V .

Demonstração: É claro que 0 ∈ S, pois 0 = 0v1 + · · · + 0vn . Agora, sejam u =


a1 v1 + a2 v2 + · · · + an vn e v = b1 v1 + b2 v2 + · · · + bn vn dois vetores quaisquer de S, então
podemos escrever:
ii) u + v = (a1 v1 + a2 v2 + · · · + an vn ) + (b1 v1 + b2 v2 + · · · + bn vn ) = (a1 + b1 )v1 + (a2 +
b2 )v2 + · · · + (an + bn )vn
iii) αu = α(a1 v1 + a2 v2 + · · · + an vn ) = (αa1 )v1 + (αa2 )v2 + · · · + (αan )vn
isto é, u + v, αu ∈ S, uma vez que são combinações lineares de v1 , v2 , . . . , vn . Logo, S é
um subespaço vetorial de V .

Chamamos o subespaço S de subespaço gerado pelos vetores v1 , v2 , . . . , vn , ou, subespaço


gerado pelo conjunto A, e o denotamos por S = [v1 , v2 , . . . , vn ] ou, S = hv1 , v2 , . . . , vn i,
ou ainda S = [A]. Os vetores v1 , v2 , . . . , vn são chamados geradores do subespaço S e A é
um conjunto gerador de S.
Formalmente, podemos escrever
S = hv1 , v2 , . . . , vn i = {v ∈ V ; v = a1 v1 + · · · + an vn ; ai ∈ R, i = 1, . . . , n}.

Todo subconjunto A de V gera um subespaço vetorial [A] de V . Quando A é um conjunto


gerador de V teremos que [A] = V . Isto nos motiva introduzir a seguinte definição.

Definição 105 (Espaço finitamente gerado). Dizemos que um espaço vetorial V é fini-
tamente gerado se existir um subconjunto finito A de V tal que V = hAi.

Nos exemplos a seguir ficará claro que Rn é um espaço vetorial finitamente gerado para
qualquer número natural n.
65

Exemplo 106. Os vetores e1 = (1, 0) e e2 = (0, 1) geram o espaço vetorial V = R2 , pois


qualquer par (x, y) ∈ R2 é combinação linear de e1 e e2 . De fato,
(x, y) = (x, 0) + (0, y) = x(1, 0) + y(0, 1) = xe1 + ye2 .

Assim, [e1 , e2 ] = R2 .

Exemplo 107. Os vetores e2 = (0, 1, 0) e e3 = (0, 0, 1) do R3 geram o subespaço


S = {(0, y, z) ∈ R3 ; y, z ∈ R}, pois
(0, y, z) = (0, y, 0) + (0, 0, z) = ye2 + ze3 ,
isto é, S = [e2 , e3 ]. S é um subespaço próprio do R3 e representa geometricamente o plano
yOz.

Exemplo 108. Os vetores e1 = (1, 0, ..., 0), e2 = (0, 1, . . . , 0),. . . ,en = (0, 0, . . . , 1) geram
o espaço vetorial V = Rn , pois dado um vetor v = (x1 , x2 , . . . , xn ) ∈ Rn qualquer, ele pode
ser escrito como combinação linear de e1 , e2 , . . . , en . De fato, basta tomar as coordenadas
de v como os escalares da combinação linear:
x1 e1 + x2 e2 + · · ·xn en = x1 (1, 0, . . . , 0) + x2 (0, 1, . . . , 0) + · · · + xn (0, 0, . . . , 1)

= (x1 , x2 , . . . , xn ).

Um espaço vetorial finitamente gerado V pode ser gerado por subconjuntos diferentes.
Este fato é evidenciado nos próximos exemplos.
Exemplo 109. O conjunto A = {u = (1, 2), v = (3, 5)} gera o R2 . De fato, para que o
conjunto A gere o R2 é necessário que qualquer vetor w = (x, y) ∈ R2 seja combinação
linear de u e v, isto é, devem existir números reais α e β, tais que:
w = αu + βv
(x, y) = α(1, 2) + β(3, 5)
(x, y) = (α, 2α) + (3β, 5β)
(x, y) = (α + 3β, 2α + 5β).
Dessa igualdade resulta o sistema:
(
α + 3β = x
2α + 5β = y
que, resolvido em função de x e y, fornece:
α = −5x + 3y e β = 2x − y,
isto é, R2 = [u, v].
66 GUILHERME CHAUD TIZZIOTTI

No próximo exemplo veremos que o R2 pode ser gerado por um conjunto formado por mais
de dois elementos.

Exemplo 110. Os vetores e1 = (1, 0), e2 = (0, 1) e u = (7, 4) geram R2 . De fato,


para que os vetores e1 , e2 e u gerem o R2 é necessário mostrar que para qualquer vetor
w = (x, y) ∈ R2 , existem números reais a, b e c tais que
w = ae1 + be2 + cu
(x, y) = a(1, 0) + b(0, 1) + c(7, 4)
(x, y) = (a, 0) + (0, b) + (7c, 4c)
(x, y) = (a + 7c, b + 4c).
Dessa igualdade resulta o sistema
( (
a + 7c = x a = x − 7c
ou
b + 4c = y b = y − 4c
Tomando, por exemplo, c = 2 temos
a = x − 14 b=y−8
e, portanto,
(x, y) = (x − 14)e1 + (y − 8)e2 + 2u,
isto é, [e1 , e2 , u] = R2 .

Em geral, um espaço vetorial possui muitos conjuntos geradores e muitas vezes é impor-
tante termos um conjunto gerador que seja o “menor”possı́vel. A situação ideal é que
exista um conjunto gerador onde cada elemento de V se escreva de maneira única como
combinação linear dos elementos deste conjunto gerador. Por trás dessa unicidade está o
importante conceito de conjunto linearmente independente, que veremos a seguir.
67

Dependência e Independência Linear

Vimos no Exemplo 106 que o conjunto {e1 = (1, 0), e2 = (0, 1)} gera o R2 . Com um
pouco de reflexão é possı́vel concluir que os conjuntos {e1 , e2 , v1 } e {e1 , e2 , v1 , v2 } também
geram o R2 , para quaisquer v1 , v2 ∈ R2 . Ou seja, o espaço vetorial R2 pode ser gerado
por dois vetores, ou também por três, ou quatro, etc. Porém em nossos estudos estamos
interessados em conjuntos geradores que tenham o menor número possı́vel de vetores. De
fato, vimos que para gerar o R2 são necessários somente dois vetores. Assim, outros
vetores que eventualmente aparecem no conjunto gerador são desnecessários.
A noção de dependência e independência linear será muito útil para a determinação do
menor conjunto gerador de um espaço vetorial.

Sejam V um espaço vetorial e v1 , . . . , vn ∈ V . Considere a equação

(2) α1 v1 + · · · + αn vn = 0, em que α1 , . . . , αn ∈ R.
Note que ela possui pelo menos uma solução que é a trivial:
α1 = α2 = · · · = αn = 0.

Isto nos motiva a próxima definição.

Definição 111 (LI e LD). Dizemos que o conjunto {v1 , . . . , vn } é linearmente indepen-
dente, ou simplesmente que os vetores v1 , . . . , vn são LI, se a equação (2) admitir somente
a solução trivial. Se existir solução com algum αi 6= 0, dizemos que {v1 , . . . , vn } é linear-
mente dependente, ou simplesmente que os vetores v1 , . . . , vn são LD.

• Por convenção, o conjunto vazio é um conjunto L.I. e gera o espaço nulo.

• Note que todo conjunto que possui o vetor nulo é L.D.

• Todo espaço vetorial não nulo possui um conjunto L.I., não vazio. Basta considerar,
por exemplo, um conjunto que consiste de um único vetor não nulo.

• Todo subconjunto de um conjunto L.I. também é L.I. (Verifique!)

Vejamos alguns exemplos de conjuntos LI e LD.


68 GUILHERME CHAUD TIZZIOTTI

Exemplo 112. O conjunto {e1 = (1, 0), e2 = (0, 1)} do espaço vetorial R2 é LI. Com
efeito,
(0, 0) = α1 e1 + α2 e2
= α1 (1, 0) + α2 (0, 1)
= (α1 , 0) + (0, α2 )
= (α1 , α2 )
o que implica α1 = 0 e α2 = 0.

Exemplo 113. Procedendo de maneira análoga ao exemplo anterior, podemos concluir


que os vetores e1 = (1, 0, 0), e2 = (0, 1, 0) e e3 = (0, 0, 1) do espaço vetorial R3 são LI.

Exemplo 114. O conjunto {sen x, cos x} é um conjunto L.I. no R-espaço vetorial C([0, 2π], R).
De fato, suponha que {sen x, cos x} é L.D.. Então, existem α, β ∈ R, ao menos um deles
não nulo, tais que α · sen x + β · cos x = 0, para todo x ∈ [0, 2π], o que é uma contradição.
Logo, {sen x, cos x} é um conjunto L.I.

Exemplo 115. Considere as funções fn : [a, b] → C, dadas por fn (t) = tn , para n =


0, 1, 2, . . .. O conjunto B = {fn ; n = 0, 1, 2, . . .} é um subconjunto (infinito) L.I. de
C([a, b], C). (Verifique!)

Exemplo 116. Os vetores v1 = (6, 4) e v2 = (15, 10) do R2 , são LD. De fato,

(0, 0) = α1 v1 + α2 v2
= α1 (6, 4) + α2 (15, 10)
= (6α1 , 4α1 ) + (15α2 , 10α2 )
= (6α1 + 15α2 , 4α1 + 10α2 ).
Donde resulta o sistema
(
6α1 + 15α2 = 0
4α1 + 10α2 = 0
−5
o qual admite a solução α1 = 2 2
α. Assim, fazendo α2 = 2, temos α1 = −5 e a equação

−5v1 + 2v2 = 0, ou seja, −5(6, 4) + 2(15, 10) = (0, 0)

se verifica e, portanto, (6, 4) e (15, 10) são LD.


69

Note que, no exemplo anterior, o fato de (6, 4) e (15, 10) serem LD implica que um dos
vetores é múltiplo do outro. De fato, podemos escrever
2
(6, 4) = (15, 10).
5
Por outro lado, se dois vetores são múltiplos entre si, isto é, v1 = βv2 , para algum β ∈ R,
é fácil concluir que eles serão LD, pois a equação α1 v1 + α2 v2 = 0 admite solução não
trivial, a saber, α1 = 1 6= 0 e α2 = −β.
Esta propriedade é generalizada para mais que dois vetores no seguinte resultado.

Proposição 117. Dado um espaço vetorial V , o conjunto {v1 , . . . , vn } ⊂ V é LD se, e


somente se, um destes vetores é uma combinação linear dos demais.

Demonstração. Primeiro mostraremos que se v1 , . . . , vn são LD, então um destes vetores


é a combinação linear dos demais. Da definição de conjunto LD, existe algum αi 6= 0
satisfazendo
α1 v1 + · · · + αi vi + · · · + αn vn = 0.
αi−1 αi+1
Assim, isolando o vetor vi obtemos vi = − αα1i v1 − · · · − αi
vi−1 − αi
vi+1 −···− αn
v ,
αi n

pois αi 6= 0. Logo, vi é a combinação linear dos vetores v1 , . . . , vi−1 , vi+1 , . . . , vn .


Assumimos agora que algum vi ∈ {v1 , . . . , vn } é a combinação linear dos outros vetores
do conjunto, ou seja,
vi = a1 v1 + · · · + ai−1 vi−1 + ai+1 vi+1 + · · · + an vn ,
donde temos
−a1 v1 + · · · − ai−1 vi−1 + vi − ai+1 vi+1 − · · · − an vn = 0.
Como nesta equação o coeficiente de vi é 1 6= 0, concluı́mos que {v1 , . . . , vn } é LD. 

Nos exemplos seguintes usaremos a proposição anterior para concluir que um determinado
conjunto é LD.

Exemplo 118. O conjunto {e1 = (1, 0), e2 = (0, 1), v = (a, b)} de vetores de R2 , onde
(a, b) é qualquer vetor de R2 , é LD. Com efeito, podemos escrever v como combinação
linear de e1 e e2
v = (a, b) = (a, 0) + (0, b) = a(1, 0) + b(0, 1) = ae1 + be2 ,
e portanto, pela Proposição 117, o conjunto é LD.
70 GUILHERME CHAUD TIZZIOTTI

Exemplo 119. Os vetores v1 = (1, 1, 1), v2 = (−2, 0, 2) e v3 = (2, 3, 4) do R3 são LD. De


fato,
v3 = a1 v1 + a2 v2
(2, 3, 4) = a1 (1, 1, 1) + a2 (−2, 0, 2)
= (a1 , a1 , a1 ) + (−2a2 , 0, 2a2 )
= (a1 − 2a2 , a1 , a1 + 2a2 ).
Equivale ao sistema linear: 
a1 − 2a2 = 2


a1 = 3

a1 + 2a2 = 4

que tem como solução a1 = 3 e a2 = 21 . Logo, v3 = 3v1 + 12 v2 e, portanto, o conjunto


{v1 , v2 , v3 } é LD.

Exemplo 120. Os vetores v1 = (2, 1, 2, 1), v2 = (1, 2, 1, 0) e v3 = (−3, 0, 5, 0) do espaço


vetorial R4 são LI. Com efeito
0 = α1 v1 + α2 v2 + α3 v3
= α1 (2, 1, 2, 1) + α2 (1, 2, 1, 0) + α3 (−3, 0, 5, 0)
= (2α1 , α1 , 2α1 , α1 ) + (α2 , 2α2 , α2 , 0) + (−3α3 , 0, 5α3 , 0)
= (2α1 + α2 − 3α3 , α1 + 2α2 , 2α1 + α2 + 5α3 , α1 ).
que equivale ao sistema linear


 2α1 + α2 − 3α3 = 0


α + 2α = 0
1 2


 2α1 + α2 + 5α3 = 0

α1 = 0

o qual admite somente a solução trivial, ou seja, α1 = α2 = α3 = 0. Portanto, v1 , v2 e v3


são LI.
71

Base e Dimensão

Dado um espaço vetorial V estamos interessados em encontrar um subconjunto de V que


o gere e ao mesmo tempo que seja o menor possı́vel, isto é, se subtrairmos deste conjunto
algum vetor, ele não gera mais todo V . Um conjunto com tais propriedades é chamado
base de V . Vejamos a definição precisa de base.

Definição 121. Um conjunto de vetores {v1 , . . . , vn } ⊂ V é uma base de V se for LI e


gerar V .

Vejamos alguns exemplos de conjuntos que são bases dos espaços vetoriais R2 , R3 , . . . , Rn .

Exemplo 122. O conjunto C = {e1 = (1, 0), e2 = (0, 1)} é base de R2 , conhecida como
base canônica de R2 . De fato, vimos no Exemplo 106 que C gera R2 e no Exemplo 112
que C é LI.

Exemplo 123. O conjunto B = {(1, 1), (0, 1)} também é uma base de R2 . Com efeito,
se
(0, 0) = a(1, 1) + b(0, 1) = (a, a + b),
temos a = b = 0, ou seja, B é LI. Além disto, dado (x, y) ∈ R2 qualquer, podemos escrever
(x, y) = x(1, 1) + (y − x)(0, 1),
isto é, todo vetor de R2 é uma combinação linear de (1, 1) e (0, 1), provando que B gera
R2 .

No entanto, nem todo conjunto com dois elementos forma uma base de R2 . Vejamos um
exemplo disto.
Exemplo 124. O conjunto {(−1, 0), (5, 0)} não é base de R2 , pois (5, 0) = −5(−1, 0),
isto é, o conjunto é LD.

No próximo exemplo veremos um conjunto de R3 que é LI, porém não é base de R3 .


Exemplo 125. O conjunto {e2 = (0, 1, 0), e3 = (0, 0, 1)} não é base de R3 . Apesar de LI
ele não gera todo o R3 , ou seja, [e2 , e3 ] 6= R3 . De fato, notemos que todo elemento de R3
da forma (a, 0, 0), a ∈ R \ {0}, não pertence ao espaço [e2 , e3 ].
Exemplo 126. Os vetores e1 = (1, 0, 0), e2 = (0, 1, 0) e e3 = (0, 0, 1) formam uma base
de R3 , chamada base canônica de R3 .
72 GUILHERME CHAUD TIZZIOTTI

Exemplo 127. Mais geralmente, não é difı́cil ver que os vetores e1 , . . . , en ∈ Rn , onde
e1 = (1, 0, . . . , 0), e2 = (0, 1, . . . , 0), . . . , en = (0, 0, . . . , 1), formam uma base de Rn ,
conhecida como base canônica de Rn .

Exemplo 128. B = {1, x, x2 , x3 } é uma base de P3 (K) = {a3 x3 + a2 x2 + a1 x + a0 ; ai ∈


K}.

Exemplo 129. B = {(1, 0), (0, 1)} é uma base de C2 como C-espaço vetorial. Pois, dado
(a, b) ∈ C2 , podemos escrever (a, b) = a.(1, 0) + b.(0, 1), com a, b ∈ C. Assim, B gera C2 .
E B é L.I., pois se tomarmos α1 , α2 ∈ C com α1 .(1, 0) + α2 .(0, 1) = (0, 0) ⇒ (α1 , α2 ) =
(0, 0) ⇒ α1 = 0 e α2 = 0.
Porém, B NÃO é uma base para C2 como um R-espaço vetorial. Note que, B não
gera C2 como um R-espaço vetorial. Pois, por exemplo, não existem a, b ∈ R tais que
a.(1, 0) + b.(0, 1) = (i, 2i).
Temos que, B 0 = {(1, 0), (0, 1), (i, 0), (0, i)} é uma base para C2 como um R-espaço veto-
rial. Verifique!

Do próximo resultado concluiremos que duas bases quaisquer de um espaço vetorial fini-
tamente gerado têm o mesmo número de vetores.

Proposição 130. Seja V um K-espaço vetorial finitamente gerado não nulo. Assuma
que {v1 , . . . , vm } seja um conjunto gerador de V . Então, todo conjunto L.I. de vetores em
V tem no máximo m elementos.

Demonstração. Vamos provar que todo conjunto de elementos de V que contenha mais
do que m vetores é L.D.
Para tanto, seja A = {u1 , . . . , un } ⊂ V , com n > m. Note que, como {v1 , . . . , vm } é um
conjunto gerador de V , então existem escalares αij ∈ K tais que, para cada j = 1, . . . , n.

uj = α1j v1 + . . . + αmj vm .

Assim, se λ1 , . . . , λn são escalares quaisquer em K, teremos


n m
! n Xm m n
!
X X X X X
λ1 u1 + . . . + λn un = λj αij vi = λj αij vi = λj αij vi .
j=1 i=1 j=1 i=1 i=1 j=1
73

n
X
Vamos analisar a situação em que λj αij = 0, para cada i = 1, 2, . . . m. Para tanto,
j=1
considere o sistema
α11 λ1 + . . . α1n λn = 0
..
.
αm1 λ1 + . . . αmn λn = 0
nas incógnitas λ1 , . . . , λn e com coeficientes αij ∈ K.
Como o número de equações do sistema é estritamente menor do que o número de
incógnitas, segue que o sistema tem uma solução não nula, isto é, existem γ1 , . . . , γn ∈ K,
Xn
não todos nulos, tais que γj αij = 0, para i = 1, 2, . . . , m. Portanto, existem γ1 , . . . , γn ,
j=1
não todos nulos, tais que γ1 u1 + . . . γn un = 0, o que implica que {u1 , . . . , un } é L.D.. 

Exercı́cio: Mostre que o conjunto R considerado como um R-espaço vetorial é finita-


mente gerado (o 1 é um gerador, assim como qualquer real não nulo). Entretanto, se con-
siderarmos R como um Q-espaço vetorial, este não é finitamente gerado (dica: suponha
que seja finita, use o resultado anterior, tome um elemento transcendente, π por exemplo,
e use que para quaisquer n + 1 reais a0 , a1 , . . . , an tem-se que a0 + a1 π + . . . + an π n 6= 0,
ou seja, os n + 1 vetores 1, π, . . . , π n são L.I.).

Corolário 131. Seja V um K-espaço vetorial finitamente gerado não nulo. Então, duas
bases quaisquer de V têm o mesmo número de elementos.

Demonstração. Sejam B e B 0 duas bases de V . Como V é finitamente gerado, decorre


da proposição anterior que B e B 0 são finitas (pois são L.I.). Digamos que B possui m
elementos e B 0 possui m0 elementos. Considerando B como conjunto gerador de V e B 0
L.I., segue da proposição anterior que m0 ≤ m. Por outro lado, considerando B 0 como
conjunto gerador e B L.I., teremos que m ≤ m0 . Portanto, m = m0 . 

Definição 132. Seja V um K-espaço vetorial. Se V admite uma base finita, então
chamamos de dimensão de V o número de elementos de tal base. Caso contrário,
dizemos que a dimensão de V é infinita.

Notação: Denotaremos a dimensão do K-espaço vetorial V por dimK V , ou simples-


mente dim(V ).

• Note que:

1) se V é um K-espaço vetorial com dimK V = n, então qualquer conjunto de V com


mais de n elementos é L.D., e nenhum conjunto com menos de n elementos gera V ;
74 GUILHERME CHAUD TIZZIOTTI

2) ainda não analisamos a questão da existência de bases de um dado espaço vetorial


V sobre K. O que podemos falar por enquanto é que se V possui uma base, então sua
dimensão está bem definida;

3) dimK {0} = 0.

Exemplo 133. A dimensão do R-espaço vetorial R2 é 2, pois a base canônica, e portanto


qualquer base de R2 , tem 2 elementos. Da mesma forma, dimR R3 = 3. Mais geralmente,
dimR Rn = n.

A seguir, vejamos mais exemplos.

Exemplo 134. .

dimC C2 = 2

dimR C2 = 4

dimK K n = n, base {(1, 0, . . . , 0), (0, 1, 0, . . . , 0), . . . , (0, . . . , 0, 1)}

dimK P4 (K) = 5, base {1, x, x2 , x3 , x4 }

dimK P (K) = ∞

dimR C([a, b], R) = ∞

dimK Mm×n (K) = m.n

dimR Mm×n (C) = 2.m.n

Observação 135. Na Definição 121 vimos que um conjunto B é base de um K-espaço


vetorial V se for LI e gerar V . No entanto, se soubermos que dimK V = n, bastará
verificar uma as duas condições, ou seja,
(a) Se dimK V = n e B = {v1 , . . . , vn } é LI, então B é base de V .
(b) Se dimK V = n e B = {v1 , . . . , vn } gera V , então B é base de V .

Exemplo 136. O conjunto B = {(1, 2), (−1, −1)} é base de R2 , pois sabemos que
dim R2 = 2 e B é LI, uma vez que (1, 2) não é múltiplo de (−1, −1).
75

Observação 137. Sejam V um K-espaço vetorial com dim V = n e S um subespaço de


V sobr K. Então dimK S ≤ n. No caso em que dimK S = n, tem-se S = V .

Com o auxı́lio da observação acima, apresentamos a seguir uma interpretação geométrica


para os subespaços vetoriais de R3 .
Exemplo 138. Consideremos o espaço tridimensional R3 . A dimensão de qualquer su-
bespaço S ⊆ R3 só poderá ser 0, 1, 2 ou 3. Assim,
(a) se dimS = 0, então S = {0} é a origem.
(b) se dimS = 1, então S é uma reta que passa pela origem.
(c) se dimS = 2, então S é um plano que passa pela origem.
(d) se dimS = 3, então S = R3 .
Observação 139. Seja V um espaço vetorial de dimensão n. Se os vetores v1 , . . . , vr são
LI em V , com r < n, então existem vr+1 , . . . , vn tais que {v1 , . . . , vr , vr+1 , . . . , vn } é uma
base de V .

Exemplo 140. Encontre uma base de R3 sobre R que contenha o vetor (2, 1, 1).
Como dim R3 = 3, precisamos encontrar dois vetores v1 , v2 ∈ R3 que juntos com (2, 1, 1)
formam um conjunto LI. Tomando v1 um vetor que não seja múltiplo de (2, 1, 1) já teremos
que {(2, 1, 1), v1 } é LI. Assim, consideremos v1 = (1, 0, 0). Para completar, escolhemos
v2 que não seja combinação linear de (2, 1, 1)e(1, 0, 0). Dentre os infinitos existentes,
tomemos v2 = (0, 1, 0). Logo, {(2, 1, 1), (1, 0, 0), (0, 1, 0)} é LI e portanto é uma base de
R3 .

Exemplo 141. Consideremos o seguinte subespaço de R4 :


S = {(x, y, z, w); x − 2y = 0 e z = 3w}.
Determinar uma base de S e sua dimensão.
Um vetor (x, y, z, w) ∈ S se x = 2y e z = 3w. As variáveis livres são y e w. Logo,
dimS = 2 e qualquer subconjunto de S com dois vetores LI forma uma base desse espaço.
Façamos y = 1, w = 0 e y = 0, w = 1 para obter os vetores v1 = (2, 1, 0, 0) e v2 =
(0, 0, 3, 1), respectivamente. O conjunto {v1 , v2 } é uma base de S.

Corolário 142. Seja V um K-espaço vetorial de dimensão n ≥ 1 e seja B um subconjunto


de V com n elementos. As seguintes afirmações são equivalentes:
i) B é uma base.
76 GUILHERME CHAUD TIZZIOTTI

ii) B é L.I..

iii) B é um conjunto gerador de V .

Demonstração. Exercı́cio. 

Observação 143. Observamos que se V não for finitamente gerado, então qualquer base
de V não possui um número finito de elementos. Porém, é possı́vel mostrar que as bases
são equivalentes como conjuntos, ou seja, podemos mostrar que duas bases de V têm
sempre a mesma cardinalidade (teoria de conjuntos, axioma da escolha).

Proposição 144. Seja V um K-espaço vetorial. Seja B = {v1 , . . . , vm } um conjunto


L.I. em V . Se existir v ∈ V que não seja combinação linear dos elementos de B, então
{v1 , . . . , vm , v} é L.I..

Demonstração. Suponha que B = {v1 , . . . , vm } é um conjunto L.I. em V e que v ∈ V não


seja combinação linear dos elementos de B.
Sejam α1 , . . . , αm , αm+1 escalares tais que
α1 v1 + . . . + αm vm + αm+1 v = 0

Se αm+1 6= 0, então podemos escrever


α1 αm
v=− v1 − . . . − vm
αm+1 αm+1
o que é uma contradição com a nossa hipótese de v não ser uma combinação linear de
elementos de B. Então, αm+1 = 0, e, portanto, α1 v1 + . . . + αm vm = 0. Como B é L.I.,
segue que α1 = . . . = αm = 0. Portanto, {v1 , . . . , vm , v} é L.I.. 

Teorema 145. Todo espaço vetorial não nulo finitamente gerado possui uma base.

Demonstração. Seja V um espaço vetorial não nulo finitamente gerado sobre K. Então
V possui um conjunto gerador finito, digamos com m ≥ 1 elementos. Agora, seja v1 ∈ V
um vetor não nulo. Então, B1 = {v1 } é L.I.. Se B1 gerar V , então B1 é uma base de
V . Caso contrário, existe v2 ∈ V que não é um múltiplo de v1 . Pela proposição anterior,
B2 = {v1 , v2 } é L.I.. Novamente, se B2 gera V , então B2 é uma base de V . Caso contrário,
existe v3 ∈ V tal que {v1 , v2 , v3 } é L.I.. Repetindo este procedimento, chegaremos ou a
uma base de V ou construiremos conjuntos L.I. em V arbritariamente grandes. O segundo
caso não é possı́vel, pois todo conjunto L.I. de V tem no máximo m elementos. 
77

Observação 146. Observamos que todo espaço vetorial possui uma base. A demonstração
do regultado geral depende essencialmente do chamado Lema de Zorn (um axioma da
teoria dos conjuntos). Apesar do resultado garantir a existência de uma tal base, nem
sempre é possı́vel exibi-la explicitamente. Por exemplo, tente construir uma base do espaço
vetorial R sobre Q. Observe que uma tal base será necessariamente não enumerável.
78 GUILHERME CHAUD TIZZIOTTI

Transformação Linear

As transformações lineares são funções especiais por dois motivos: o primeiro é que são
funções definidas entre espaços vetoriais e o segundo motivo é porque são funções que
respeitam as operações destes espaços vetoriais

Definição 147. Sejam U e V K-espaços vetoriais. Uma função T : U → V é uma


transformação linear se
i) T (u + v) = T (u) + T (v), ∀u, v ∈ U , e
ii) T (λu) = λT (u), ∀λ ∈ K e ∀u ∈ U .

• Não é difı́cil verificar que T : U → V é uma transformação linear se, e somente se,
T (λu + v) = λT (u) + T (v), ∀u, v ∈ U e ∀λ ∈ K.

Além disso, temos que se T : U → V é uma transformação linear, então:

1) T (0U ) = 0V , pois 0V + T (0U ) = T (0U ) = T (0U + 0U ) = T (0U ) + T (0U ).

2) T (−u) = −T (u), para todo u ∈ U , pois −u = (−1).u.

Xn n
X
3) T ( λi ui ) = λi T (ui ).
i=1 i=1

Observação 148. Uma transformação linear de U em U é chamada de operador linear.

Vejamos alguns exemplos de funções que são transformações lineares.

Exemplo 149. A transformação T : R2 → R3 , definida por T (x, y) = (2x + y, x − y, 3y)


é linear.
De fato, dados u = (x1 , y1 ) e v = (x2 , y2 ) vetores quaisquer de R2 e α ∈ R temos:
T L1) T (u + v) = T ((x1 , y1 ) + (x2 , y2 ))
= T (x1 + x2 , y1 + y2 )
= (2(x1 + x2 ) + (y1 + y2 ), (x1 + x2 ) − (y1 + y2 ), 3(y1 + y2 ))
= (2x1 + 2x2 + y1 + y2 , x1 + x2 − y1 − y2 , 3y1 + 3y2 )
= (2x1 + y1 , x1 − y1 , 3y1 ) + (2x2 + y2 , x2 − y2 , 3y2 )
= T (u) + T (v).
79

T L2) T (αu) = T (α(x1 , y1 ))


= T (αx1 , αy1 )
= (2αx1 + αy1 , αx1 − αy1 , 3αy1 )
= (α(2x1 + y1 ), α(x1 − y1 ), α(3y1 ))
= α(2x1 + y1 , x1 − y1 , 3y1 )
= αT (u).

Exemplo 150. Seja T : R → R, dada por T (x) = kx, onde k ∈ R − {0}, é uma
transformação linear.
Com efeito, sejam x, y, α ∈ R, temos:
TL 1) T (x + y) = k(x + y) = kx + ky = T (x) + T (y).
TL 2) T (αx) = k(αx) = αkx = αT (x).

Note que toda transformação linear de R em R só pode ser da forma apresentada no
exemplo anterior.
De fato, T (x) = T (x · 1) e, sendo T linear e x um escalar, podemos escrever T (x · 1) =
xT (1). Denotando T (1) = k, temos T (x) = kx.

Exemplo 151. A aplicação identidade I : U → U , dada por I(u) = u, é um operador


linear.
De fato,
TL 1) I(u + v) = u + v = I(u) + I(v), ∀u, v ∈ U .
TL 2) I(αu) = αu = αI(u), ∀u ∈ U e α ∈ R.

Exemplo 152. A transformação nula T : U → V , dada por T (u) = 0, ∀u ∈ U , é linear,


pois:
TL 1) T (u + v) = 0 = 0 + 0 = T (u) + T (v), ∀u, v ∈ U .
TL 2) T (αu) = 0 = α · 0 = αT (u), ∀u ∈ U e α ∈ R.

Exemplo 153. Uma matriz A de ordem 3 × 2 determina uma transformação da seguinte


maneira:
TA : R2 → R3
u 7→ TA (u) = Au.
80 GUILHERME CHAUD TIZZIOTTI

Além disso, TA é linear. De fato, sejam u, v ∈ R2 e α ∈ R temos


TL 1) TA (u + v) = A(u + v) = Au + Av = T (u) + T (v),
TL 2) TA (αu) = A(αu) = αAu = αT (u).

Vejamos um caso particular de uma transformação linear definida como acima.

 
5 0  
x
Considerando A3×2 =  2 −1  e u = (x, y) como um vetor coluna, u2×1 = ,
y
1 3
temos    
5 0   5x
x
Au =  2 −1  =  2x − y  .
y
1 3 x + 3y
Logo, TA (x, y) = (5x, 2x − y, x + 3y).
Isto significa que a matriz A3×2 determina a transformação do vetor u = (x, y) ∈ R2 no
vetor v = (5x, 2x − y, x + 3y) e tal transformação é linear.

A ideia apresentada no exemplo anterior pode ser generalizada para qualquer matriz de
ordem m × n como segue.
Exemplo 154. Em geral, dada uma matriz A de ordem m × n, fica determinada a
transformação linear TA : Rn × Rm cuja imagem TA (u) do vetor u ∈ Rn é dada pelo
produto da matriz Am×n com o vetor coluna un×1 :
TA (u) = Am×n · un×1 = (Au)m×1 .

Mais adiante veremos que o contrário também acontece, ou seja, toda transformação
linear T : Rn → Rm pode ser representada por uma matriz de ordem m × n.

No próximo exemplo veremos uma transformação que não é linear.


Exemplo 155. A transformação T : R2 → R2 , dada por T (x, y) = (x2 , 2y) não é linear.
De fato, dados u = (x1 , y1 ), v = (x2 , y2 ) ∈ R2 temos
T (u + v) = T (x1 + x2 , y1 + y2 ) = ((x1 + x2 )2 , 2(y1 + y2 )) = (x21 + 2x1 x2 + x22 , 2y1 + 2y2 )
porém
T (u) + T (v) = (x21 , 2y1 ) + (x22 , 2y2 ) = (x21 + x22 , 2(y1 + y2 ))
o que implica
T (u + v) 6= T (u) + T (v),
81

sempre que x1 e x2 são não nulos.

n
X
• Sejam a1 , . . . , an ∈ K. Defina T : K n → K por T (x1 , . . . , xn ) = ai xi . Então, T é
i=1
uma transformação linear.
Seja ei o i-ésimo elemento da base canônica de K n . Assim, T (ei ) = ai .
Por outro lado, se T : K n → K é uma transformação linear, então T (x1 , . . . , xn ) =
n
X n
X
T( xi e i ) = xi T (ei ).
i=1 i=1

Isso mostra que a definição de uma transformação linear cujo domı́nio é K n depende
basicamente da definição de T nos elementos da base {e1 , . . . , en }. Isto pode ser feito
mais geralmente como mostra o resultado a seguir.

Teorema 156. Sejam U e V dois K-espaços vetoriais. Se {u1 , . . . , un } for uma base de
U e {v1 , . . . , vn } ⊆ V , então existe uma única transformação linear T : U → V tal que
T (ui ) = vi , para cada i = 1, . . . , n.

Demonstração. Sejam {u1 , . . . , un } uma base de U e {v1 , . . . , vn } ⊆V . Assim, para u ∈ U ,


Xn Xn
temos que u = λi ui . Vamos definir T : U → V por T (u) = λi vi ∈ V . Devido à
i=1 i=1
unicidade dos valores λi a função T está bem definida.
É claro que T (ui ) = vi , para cada i = 1, . . . , n. Vejamos que T é linear.
Xn Xn
De fato, sejam u = αi ui e w = βi ui dois vetores de U , e λ ∈ K. Então,
i=1 i=1
n
X n
X n
X
T (λu + w) = T (λ( αi ui ) + βi ui ) = T ( (λαi + βi )ui )
i=1 i=1 i=1
n
X Xn n
X
= (λαi + βi )vi = λ( αi vi ) + βi vi = λT (u) + T (v).
i=1 i=1 i=1

Logo, T é linear.
Agora, vejamos que T é única. Para isso, considere uma transformação linear S : U → V
n
X
tal que S(ui ) = vi , para cada i = 1, . . . , n. Para u = λi ui ∈ U , teremos S(u) =
i=1
Xn n
X n
X
S( λi u i ) = λi S(ui ) = λi vi = T (u) e, portanto, só existe uma única trans-
i=1 i=1 i=1
formação linear nas condições requeridas. 
82 GUILHERME CHAUD TIZZIOTTI

• Note que, se T : U → V é uma transformação linear, então a imagem de uma com-


binação linear α1 u1 + α2 u2 em U é uma combinação linear das imagens T (u1 ) e T (u2 )
em V com os mesmos coeficientes α1 e α2 . Ou seja,
T (α1 u1 + α2 u2 ) = T (α1 u1 ) + T (α2 u2 ) = α1 T (u1 ) + α2 T (u2 ).
É claro que isto vale para uma combinação linear qualquer em U , isto é,
T (α1 u1 + · · · + αn un ) = α1 T (u1 ) + · · · + αn T (un ).
Isto nos revela que, caso U seja um espaço vetorial finitamente gerado, a transformação
linear T fica completamente determinada se conhecermos seus valores nos elementos de
uma base de U . De fato, seja B = {u1 , ..., un } uma base de U tal que são conhecidos os
vetores

T (u1 ) = v1 , ..., T (un ) = vn de V.

Dado u ∈ U qualquer, sabemos que existem escalares α1 , ..., αn ∈ R tais que u = α1 u1 +


· · · + αn un . Assim, obtemos T (u) por:
T (u) = T (α1 u1 + · · · + αn un )
= α1 T (u1 ) + · · · + αn T (un )
= α1 v1 + · · · + αn vn .
Exemplo 157. Seja T : R2 → R2 um operador linear e B = {(1, 1), (1, −1)} uma base
do R2 . Supondo que T (1, 1) = (2, 6) e T (1, −1) = (−2, 2), determine T (5, 3) e T (x, y).
Expressando o vetor (5, 3) como combinação linear dos vetores de B, temos:
(5, 3) = a(1, 1) + b(1, −1) = (a + b, a − b)
ou (
a+b=5
a−b=3
cuja solução é a = 4 e b = 1. Assim,
T (5, 3) = T (4(1, 1) + 1(1, −1))
= 4T (1, 1) + 1T (1, −1)
= 4(2, 6) + 1(−2, 2)
= (6, 26).

Procedemos da mesma forma com o vetor genérico (x, y):


(x, y) = a(1, 1) + b(1, −1)
ou (
a+b=x
a−b=y
83

x+y x−y
que tem solução a = eb= . Assim,
2 2
T (x, y) = T ( x+y
2
(1, 1) + x−y
2
(1, −1))
x+y x−y
= 2 T (1, 1) + 2 T (1, −1)
= x+y
2
(2, 6) + x−y
2
(−2, 2) .
= (x + y, 3x + 3y) + (−x + y, x − y)
= (2y, 4x + 2y)

Se calculássemos primeiro T (x, y) = (2y, 4x + 2y) poderı́amos calcular o vetor T (5, 3) por
T (5, 3) = (2 · 3, 4 · 5 + 2 · 3) = (6, 26).

Exemplo 158. Seja T : R3 → R2 uma transformação linear e B = {(1, 1, 1), (1, 1, 0), (1, 0, 0)}
uma base de R3 . Sendo T (1, 1, 1) = (−2, 1), T (1, 1, 0) = (4, 0) e T (1, 0, 0) = (1, 3), deter-
mine T (x, y, z).
Expressando (x, y, z) como combinação linear dos elementos em B, temos
(x, y, z) = a(1, 1, 1) + b(1, 1, 0) + c(1, 0, 0)
ou 
a + b + c = x


a+b=y

a = z

cuja solução é a = z, b = y − z e c = x − y. Assim,


T (x, y, z) = T (z(1, 1, 1) + (y − z)(1, 1, 0) + (x − y)(1, 0, 0))
= zT (1, 1, 1) + (y − z)T (1, 1, 0) + (x − y)T (1, 0, 0)
= z(−2, 1) + (y − z)(4, 0) + (x − y)(1, 3)
= (−2z + 4y − 4z + x − y, z + 3x − 3y)
= (x + 3y − 6z, 3x − 3y + z).

No próximo exemplo o que queremos é encontrar um vetor cuja imagem por uma trans-
formação linear é conhecida.
Exemplo 159. Dado o operador linear no R3 :
T (x, y, z) = (x + 2y + 2z, x + 2y − z, −x + y + 4z).
Determine o vetor u ∈ R3 tal que T (u) = (−1, 8, −11).
Fazendo u = (x, y, z) temos que T (u) = T (x, y, z) = (−1, 8, −11) ou seja,
(x + 2y + 2z, x + 2y − z, −x + y + 4z) = (−1, 8, −11)
84 GUILHERME CHAUD TIZZIOTTI

ou 
x + 2y + 2z = −1


x + 2y − z = 8

−x + y + 4z = −11

cuja solução é x = 1, y = 2 e z = −3. Logo, u = (1, 2, −3).


85

Núcleo e Imagem de uma Transformação Linear

A seguir, introduziremos e estabeleceremos propriedades de núcleo e imagem de uma trans-


formação linear. Veremos que estes objetos têm estrutura de subespaços vetorias e são
usados no estudo das tranformações lineares. Apresentaremos, por exemplo, o teorema
da dimensão, o qual relaciona a dimensão do núcleo e da imagem com a dimensão do
domı́nio de uma transformação linear. Este resultado é muito útil no estudo da injetivi-
dade e/ou da sobrejetividade de uma transformação linerar. Por fim, introduziremos o
conceito de isomorfismos entre espaços vetoriais.

Iniciemos com a definição de núcleo de uma transformação linear.


Definição 160. Dada uma transformação linear T : U → V , chamamos de núcleo de T
o conjunto de todos os vetores u ∈ U tais que T (u) = 0. Denotaremos tal conjunto por
N (T ) ou Ker(T ). Assim, podemos escrever
N (T ) := {u ∈ U ; T (u) = 0}.

Note que N (T ) 6= ∅, uma vez que T (0) = 0, o vetor nulo de U sempre pertence a N (T ).

Agora, consideremos algumas transformações lineares e determinemos seus núcleos.


Exemplo 161. Seja T : R2 → R definida por T (x, y) = x − y. Neste caso,
N (T ) = {(x, y) ∈ R2 ; x − y = 0},
ou seja, N (T ) é a reta y = x. Podemos ainda escrever
N (T ) = {(x, x); x ∈ R}
= {x(1, 1); x ∈ R}
= [(1, 1)].
Exemplo 162. O núcleo da transformação linear T : R2 → R2 , dada por T (x, y) =
(x + y, 2x − y) é o conjunto
N (T ) = {(x, y) ∈ R2 ; (x + y, 2x − y) = (0, 0)},
isto é, a solução geral do sistema
(
x+y =0
2x − y = 0
a qual é x = y = 0.
Logo, N (T ) = {(0, 0)}.
86 GUILHERME CHAUD TIZZIOTTI

Exemplo 163. A transformação linear T : R3 → R2 , dada por T (x, y, z) = (x − y −


z, 2x + y + 2z), apresenta como núcleo o conjunto
N (T ) = {(x, y, z) ∈ R3 ; (x − y − z, 2x + y + 2z) = (0, 0)},
ou seja, (x, y, z) ∈ N (T ) se, e somente se,
(
x−y−z =0
,
2x + y + 2z = 0
y −3
sistema que admite como solução x = 4
ez= 4
y.
Logo,
N (T ) = {( y4 , y, −3
4
y); y ∈ R}
= { y4 (1, 4, −3); y ∈ R}
= [(1, 4, −3)].

A seguir veremos que o conceito de imagem de uma transformação linear coincide com o
conceito de imagem de uma função qualquer.

Definição 164. Seja T : U → V uma transformação linear. Chamamos imagem de T


o conjuntos dos vetores v ∈ V tais que existe um vetor u ∈ U satisfazendo T (u) = v.
Denotaremos tal conjunto por Im(T ) ou T (V ). Assim,
Im(T ) := {v ∈ V ; T (u) = v para algum u ∈ U }.

Note que Im(T ) é sempre não vazia, pois, como T (0) = 0, temos que 0 ∈ Im(T ).

Vejamos alguns exemplos de transformações lineares e suas respectivas imagens.


Exemplo 165. Seja T : R3 → R3 , definida por T (x, y, z) = (0, y, z), isto é, T é a projeção
ortogonal de R3 no plano yOz. A imagem de T é o próprio plano yOz. De fato,
Im(T ) = {(0, y, z); y, z ∈ R}
= {y(0, 1, 0) + z(0, 0, 1); y, z ∈ R}
= [(0, 1, 0), (0, 0, 1)].

Já o núcleo de T é o eixo dos x, pois T (x, 0, 0) = (0, 0, 0), ∀x ∈ R e então


N (T ) = {(x, 0, 0); x ∈ R}
= {x(1, 0, 0); x ∈ R}
= [(1, 0, 0)].
Exemplo 166. A transformação nula T : U → V , T (u) = 0, ∀u ∈ U , tem Im(T ) = {0},
enquanto que o núcleo é todo U .
87

Exemplo 167. A transformação identidade I : U → U , I(u) = u, ∀u ∈ R, tem N (T ) =


{0}, enquanto que a imagem é todo o U .

O próximo resultado nos diz que os conjuntos núcleo e imagem de uma transformação
linear T : U → V são subespaços de U e V , respectivamente.
Proposição 168. Seja T : U → V uma transformação linear. Então,
(1) O núcleo de T , N (T ), é um subespaço vetorial de U .
(2) A imagem de T , Im(T ), é um subespaço vetorial de V .

Demonstração. (1) Como visto, 0 ∈ N (T ), logo N (T ) 6= ∅. Dados u1 , u2 ∈ N (T ) e


α ∈ R temos
SV 1) T (u1 + u2 ) = T (u1 ) + T (u2 ) = 0 + 0 = 0, ou seja, u1 + u2 ∈ N (T ).
SV 2) T (αu1 ) = αT (u1 ) = α0 = 0, ou seja, αu1 ∈ N (T ).
Portanto, N (T ) é um subespaço vetorial de U .
(2) Como 0 ∈ Im(T ), segue que Im(T ) 6= ∅. Dados v1 , v2 ∈ Im(T ) e α ∈ R, existem
u1 , u2 ∈ U tais que T (u1 ) = v1 e T (u2 ) = v2 . Assim,
SV 1) T (u1 + u2 ) = T (u1 ) + T (u2 ) = v1 + v2 , isto é, v1 + v2 ∈ Im(T ).
SV 2) T (αu1 ) = αT (u1 ) = αv1 , isto é, αv1 ∈ Im(T ).
Portanto, Im(T ) é um subespaço vetorial de V .


Os conceitos de injetividade, sobrejetividade e bijetividade já são bem conhecidos quando


se trata de funções. O que veremos a seguir é que estes conceitos também são introduzidos
ao estudo de transformações lineares.
Definição 169. Seja T : U → V uma transformação linear.
(1) Dizemos que T é injetora se para todos u1 , u2 ∈ U , u1 6= u2 implica T (u1 ) 6=
T (u2 ). Equivalentemente, T (u1 ) = T (u2 ) implica u1 = u2 , ∀u1 , u2 ∈ U .
(2) Dizemos que T é sobrejetora se Im(T ) = V , ou seja, para todo v ∈ V existe
pelo menos um u ∈ U tal que T (u) = v.
(3) Dizemos que T é bijetora se ela for injetora e sobrejetora.

O próximo resultado nos auxilia na verificação de uma transformação linear ser ou não
injetora.

Proposição 170. Uma transformação linear T : U → V é injetora se, e somente se,


N (T ) = {0}.
88 GUILHERME CHAUD TIZZIOTTI

Demonstração. Primeiramente suponhamos que T é injetora. Sabemos que T (0) = 0 e,


como T é injetora, dado u ∈ N (T ) temos que T (u) = 0 = T (0) implica que u = 0. Logo,
N (T ) = {0}.
Por fim, suponhamos que N (T ) = {0}. Dados u1 , u2 ∈ U tais que T (u1 ) = T (u2 ), temos
que T (u1 ) − T (u2 ) = 0, o que implica T (u1 − u2 ) = 0, isto é, u1 − u2 ∈ N (T ). Como
N (T ) = {0}, segue que u1 = u2 e portanto T é injetora. 

Teorema 171. (Teorema do núcleo e imagem) Seja T : U → V uma transformação


linear, em que U tem dimensão finita. Então,
dim N (T ) + dim Im(T ) = dim U.

Demonstração. Tome uma base {v1 , ..., vn } de N (T ). Como N (T ) é um subespaço de U ,


podemos completar este conjunto de modo a obter uma base de U . Seja {v1 , ..., vn , u1 , ..., um }
uma tal base de V .
Mostraremos que {T (u1 ), ..., T (um )} é uma base de Im(T ), ou seja,
(i) Im(T ) = [T (u1 ), ..., T (um )]
(ii) {T (u1 ), .., T (um )} é LI,
e com isto teremos que dim N (T ) + dim Im(T ) = n + m = dim U .
Provemos o item (i). Dado v ∈ Im(T ), existe u ∈ U tal que T (u) = v. Assim, existem
α1 , ..., αn , β1 , ..., βm ∈ R tais que
u = α1 v1 + ·... + αn vn + β1 u1 + ·... + βm um .
Além disto,
v = T (u) = T (α1 v1 + ... + αn vn + β1 u1 + ... + βm um )
= α1 T (v1 ) + ... + αn T (vn ) + β1 T (u1 ) + ... + βm T (um ).

Mas T (vi ) = 0, pois vi ∈ N (T ), ∀i = 1, ..., n. Logo,


v = β1 T (u1 ) + ... + βm T (um ),
provando que Im(T ) = [T (u1 ), ..., T (um )].
Provemos agora o item ii). Considerando a combinação linear
γ1 T (u1 ) + · · · + γm T (um ) = 0,
devemos mostrar que γi = 0, ∀i = 1, ..., m.
Sendo T linear temos T (γ1 u1 + · · · + γm um ) = 0, ou seja, γ1 u1 + · · · + γm um ∈ N (T ), isto
é, existem δ1 , ..., δn ∈ R satisfazendo:
γ1 u1 + · · · + γm um = δ1 v1 + · · · + δn vn
89

ou
γ1 u1 + · · · + γm um − δ1 v1 − · · · − δn vn = 0.
Como {v1 , ..., vn , u1 , ..., um } é uma base de V , em particular é LI, concluı́mos que
γ1 = · · · = γm = δ1 = · · · = δn = 0.


Vejamos alguns exemplo de como aplicar o teorema acima.


Exemplo 172. Verifique nos exemplos anteriores as dim N (T ), dim Im(T ) e dim U.
Exemplo 173. Determine o núcleo e a imagem do operador linear T : R3 → R3 , dado
por
T (x, y, z) = (x + 2y + 2z, y − x, 4y − x + 2z),
bem como suas dimensões.
Temos que
N (T ) = {(x, y, z) ∈ R3 ; T (x, y, z) = 0},
ou seja,
(x, y, z) ∈ N (T ) ⇔ (x
 + 2y + 2z, y − x, 4y − x + 2z) = (0, 0, 0)
x + 2y + 2z = 0


⇔ −x + y = 0

−x + 2y + 2z = 0

cuja solução geral é (x, x, − 23 x), x ∈ R. Portanto,


3 3
N (T ) = {(x, x, − x); x ∈ R} = [(1, 1, − )].
2 2
3
Como {(1, 1, 2 )} é LI, segue que dim N (T ) = 1.
Agora,
Im(T ) = {(a, b, c) ∈ R3 ; T (x, y, z) = (a, b, c)},
para algum (x, y, z) ∈ R3 . Ou seja, (a, b, c) ∈ Im(T ) se existe (x, y, z) ∈ R3 tal que
(x + 2y + 2z, −x + y, −x + 4y + 2z) = (a, b, c)
o que equivale ao seguinte sistema possuir solução

x + 2y + 2z = a


−x + y = b .

−x + 4y + 2z = c

Escalonando a matriz ampliada deste sistema concluı́mos que ele só admite solução se
90 GUILHERME CHAUD TIZZIOTTI

−a − 2b + c = 0. Assim,
Im(T ) = {(a, b, c) ∈ R3 ; −a − 2b + c = 0}
= {(−2b + c, b, c); b, c ∈ R2 }
= {b(−2, 1, 0) + c(1, 0, 1); b, c ∈ R}
= [(−2, 1, 0), (1, 0, 1)].
Note que dim Im(T ) = dim R3 − dim N (T ) = 3 − 1 = 2. Desta forma, podemos concluir
que o conjunto {(−2, 1, 0), (1, 0, 1)} é uma base de Im(T ).
Exemplo 174. Seja T : R3 → R2 a transformação linear tal que T (1, 0, 0) = (−1, 1),
T (0, 1, 0) = (3, 2) e T (0, 0, 1) = (1, 0).
(a) Use o teorema da dimensão para concluir que T não é injetora.
(b) Determine N (T ) e uma de suas bases.
(c) Determine Im(T ) e uma de suas bases. T é sobrejetora?
(a) Como dim Im(T ) é no máximo 2, pois Im(T ) ⊂ R2 , temos de

dim N (T ) + dim Im(T ) = dim R3 = 3


e então dim N (T ) é no mı́nimo 1. Logo, N (T ) 6= {0} e T é não injetora.
(b) Inicialmente vamos obter a expressão que define T . Para isto escrevemos
(x, y, z) = x(1, 0, 0) + y(0, 1, 0) + z(0, 0, 1)
e, em seguida, aplicamos T nesta igualdade:
T (x, y, z) = T (x(1, 0, 0) + y(0, 1, 0) + z(0, 0, 1))
= xT (1, 0, 0) + yT (0, 1, 0) + zT (0, 0, 1)
= x(−1, 1) + y(3, 2) + z(1, 0)
= (−x + 3y + z, x + 2y).
Agora,
(x, y, z) ∈ N (T ) ⇔ T (x, y, z) = (0, 0)
⇔ (−x
( + 3y + z, x + 2z) = (0, 0)
−x + 3y + z = 0

x + 2z = 0
cuja solução geral é (−2z, −z, z), z ∈ R. Logo, N (T ) = {(−2z, −z, z); z ∈ R} =
[(−2, −1, 1)] e portanto dim N (T ) = 1.
(c) Como dim Im(T ) = 3 − dim N (T ) = 3 − 1 = 2, segue que Im(T ) = R2 e então
qualquer base de R2 é base de Im(T ), por exemplo, a base canônica {(1, 0), (0, 1)}.
Além disto, T é sobrejetora.
Exemplo 175. Determine uma transformação linear T : R4 → R3 cujo núcleo seja gerado
por (1, 0, 0, 1) e (0, −1, 0, 1).
91

Sendo dim R4 = 4 e dim N (T ) = dim[(1, 0, 0, 1), (0, −1, 0, 1)] = 2, temos que
dim Im(T ) = 4 − 2 = 2.
O primeiro passo é completar o conjunto {(1, 0, 0, 1), (0, −1, 0, 1)} a uma base de R4 . Para
isso basta acrescentar os vetores (0, 0, 1, 0) e (0, 0, 0, 1), pois
α(1, 0, 0, 1) + β(0, −1, 0, 1) + γ(0, 0, 1, 0) + δ(0, 0, 0, 1) = 0
se, e somente se, α = β = γ = δ = 0. Agora, basta tomar o cuidado das imagens de
(0, 0, 1, 0) e (0, 0, 0, 1) pela T serem LI. Para isto, definimos T : R4 → R3 tal que
T (0, 0, 1, 0) = (0, 1, 0), T (0, 0, 0, 1) = (0, 0, 1), T (1, 0, 0, 1) = (0, 0, 0) e T (0, −1, 0, 1) = (0, 0, 0).

Dado (x, y, z, w) ∈ R4 reescrevemos


(x, y, z, w) = (w + y − x)(0, 0, 0, 1) + z(0, 0, 1, 0) + x(1, 0, 0, 1) − y(0, −1, 0, 1).
Assim,
T (x, y, z, w) = T ((w + y − x)(0, 0, 0, 1) + z(0, 0, 1, 0) + x(1, 0, 0, 1) − y(0, −1, 0, 1))
= (w + y − x)T (0, 0, 0, 1) + zT (0, 0, 1, 0) + 0 + 0
= (w + y − x)(0, 0, 1) + z(0, 1, 0)
= (0, z, w + y − x),
a qual é uma transformação linear cujo núcleo é gerado por (1, 0, 0, 1) e (0, −1, 0, 1).

Vejamos agora uma consequência do Teorema 171.


Corolário 176. Se U e V são espaços vetoriais de dimensões finitas, dim U = dim V e se
T : U → V é uma transformação linear, então são equivalentes as seguintes condições:
(a) T é sobrejetora.
(b) T é injetora.
(c) T é bijetora.

Demonstração. (a) ⇒ (b) Se T é sobrejetora, então Im(T ) = V e, como pelo Teorema


171
dim U = dim N (T ) + dim V , segue que dim N (T ) = 0, pois dim U = dim V . Logo,
N (T ) = {0} e, pela Proposição 170, T é injetora.
(b) ⇒ (c) Se T é injetora, então dim N (T ) = 0. Deste fato e do Teorema 171 segue que
dim U = dim Im(T ) = dim V . Como Im(T ) é um subespaço de V com mesma dimensão
de V , segue que Im(T ) = V , ou seja, T é sobrejetora e portanto bijetora.
(c) ⇒ (a) Imediato. 
92 GUILHERME CHAUD TIZZIOTTI

Definição 177. Chamamos de isomorfismo do espaço vetorial U em V a uma


transformação linear T : U → V que é bijetora. Neste caso os espaços U e V são ditos
isomorfos.

Sob o ponto de vista da álgebra linear, dois espaços vetoriais isomorfos são equivalentes.
Isto é, para um algebrista estes espaços são “iguais”.
• Note que, pelo Corolário 176, se T : U → V é uma transformação linear e dim U =
dim V , então, para verificar que T é isomorfismo, basta provar que T é injetora (N (T ) =
{0}) ou que T é sobrejetora.
93

Representação Matricial de uma Transformação Linear

Nesta seção, veremos que o estudo das transformações lineares está fortemente ligado ao
estudo das matrizes. De fato, vimos no Exemplo 154 que a qualquer matriz m×n podemos
associar uma transformação linear T : Rn → Rm . No que segue, vamos estabelecer o
contrário, ou seja, veremos que, fixadas bases do Rn e Rm , a toda transformação linear
T : Rn → Rm está associada uma única matriz.

Dadas uma transformação linear T : V → W , A uma base de V e B uma base W .


Buscamos uma matriz que represente T nestas bases. Para isto, sem perda de generali-
dade, considere o caso particular dim V = 3 e dim W = 2. Considere A = {v1 , v2 , v3 } e
B = {w1 , w2 }. Dado v ∈ V , podemos expressá-lo por:
v = α1 v1 + α2 v2 + α3 v3 ou vA = (α1 , α2 , α3 ),
e sua imagem T (v) por:
(3) T (v) = β1 w1 + β2 w2
ou T (v)B = (β1 , β2 ).
Por outro lado,
(4) T (v) = T (α1 v1 + α2 v2 + α3 v3 ) = α1 T (v1 ) + α2 T (v2 ) + α3 T (v3 ).

Sendo T (v1 ), T (v2 ) e T (v3 ) vetores de W podemos escrevê-los como combinação linear dos
vetores de B, ou seja,
T (v1 ) = a11 w1 + a21 w2

(5) T (v2 ) = a12 w1 + a22 w2

T (v3 ) = a13 w1 + a23 w2 .

Substituindo (5) em (4), obtemos


T (v) = α1 (a11 w1 + a21 w2 ) + α2 (a12 w1 + a22 w2 ) + α3 (a13 w1 + a23 w2 )

= (a11 α1 + a12 α2 + a13 α3 )w1 + (a21 α1 + a22 α2 + a23 α3 )w2 .

Comparando a última igualdade com (3), concluı́mos que:


β1 = a11 α1 + a12 α2 + a13 α3

β2 = a21 α1 + a22 α2 + a23 α3


94 GUILHERME CHAUD TIZZIOTTI

que em forma matricial se escreve:


α1
 
   
β1 a11 a12 a13 



  =    α2  .
 
β2 a21 a22 a23  
α3

Denotando por [T ]A
B , a matriz (aij )2×3 acima, podemos escrever:

[T (v)]B = [T ]A
B [v]A .

A matriz [T ]A
B é chamada matriz de T em relação às bases A e B.

Observação 178. Uma observação importante para se obter [T ]A


B é que suas colunas
são as componentes das imagens dos vetores da base A em relação à base B, o que é
compravado pelas igualdades em (5):
T (v1 )B T (v2 )B T (v3 )B
↓ ↓ ↓
 
a11 a12 a13
.
a21 a22 a23

Em geral, dada uma transformação linear T : V → W , com dim V = n e dim W = m,


A = {v1 , ..., vn } e B = {w1 , ..., wm } bases de V e W , respectivamente, [T ]A
B será uma
matriz m × n, cuja coluna j é formada pelas componentes da imagem de vj ∈ A em
relação à base B, ou seja:
95

T (v1 )B T (v2 )B ··· T (vn )B


↓ ↓ ↓
 
a11 a12 ··· a1n
 a21 a22 ··· a2n 
.
 
 .. .. ..
 . . . 
am1 am2 ··· amn
Sendo assim, como a matriz [T ]A B depende das bases A e B, uma mesma transformação
linear pode ser representada por infinitas matrizes, bastando mudar as bases. Porém, uma
vez fixadas A e B, a matriz será única.

A seguir, veremos alguns exemplos deste processo de obter a matriz de uma transformação
linear relacionada a bases dadas.

Exemplo 179. Seja T : R2 → R3 a transformação linear


T (x, y) = (x − 2y, 5x + 3y, y − 4x).
Considere as bases A = {v1 = (−1, −1), v2 = (1, 2)} do R2 e B = {w1 = (1, 0, 0), w2 =
(1, 1, 0), w3 = (1, 1, 1)} do R3 .
(a) Determine [T ]A B
(b) Dado v = (5, 4) (coordenadas em relação à base canônica do R2 ), usando [T ]A
B
calcule T (v)B .

(a) Temos que


T (v1 )B T (v2 )B
↓ ↓
 
a11 a12
 a21 a22 ,
a31 a32
onde
T (v1 ) = T (−1, −1) = (1, −8, 3) = a11 (1, 0, 0) + a21 (1, 1, 0) + a31 (1, 1, 1),
ou seja,  
a11 + a21 + a31 = 1 a11 = 9

 

a21 + a31 = −8 ⇒ a21 = −11
 
a31 = 3
 a31 = 3

e
T (v2 ) = T (1, 2) = (−3, 11, −2) = a12 (1, 0, 0) + a22 (1, 1, 0) + a32 (1, 1, 1),
96 GUILHERME CHAUD TIZZIOTTI

isto é,  
a12 + a22 + a32 = −3

 a12 = −14


a22 + a32 = 11 ⇒ a22 = 13 .
 
a32 = −2
 a32 = −2

Assim,  
9 −14
[T ]A
B =
 −11 13 
3 −2

(b) Vamos usar a relação


[T (v)]B = [T ]A
B [v]A .

Para isto, devemos expresar v = (5, 4) como coordenadas na base A,


v = (5, 4) = a(−1, −1) + b(1, 2)
isto é, ( (
−a + b = 5 a = −6

−a + 2b = 4 b = −1
ou seja, vA = (−6, −1).
Logo,    
9 −14   −40
−6
[T (v)]B =  −11 13  =  53  .
−1
3 −2 −16

Exemplo 180. Considere a mesma transformação linear do exemplo anterior e a mesma


base A do R2 . Seja C = {(1, 0, 0), (0, 1, 0), (0, 0, 1)} a base canônica do R3 .
(a) Determine [T ]AC.
(b) Calcule [T (v)]C , utizando [T ]A
C sendo v = (5, 4).

(a)
T (v1 ) = T (−1, −1) = (1, −8, 3) = 1(1, 0, 0) − 8(0, 1, 0) + 3(0, 0, 1)
T (v2 ) = T (1, 2) = (−3, 11, −2) = −3(1, 0, 0) + 11(0, 1, 0) − 2(0, 0, 1).
Assim,  
1 −3
[T ]A
C =
 −8 11  .
3 −2
97

(b) Como vA = (−6, −1), obtemos:


   
1 −3   −3
−6
[T (v)]C =  −8 11  =  37  .
−1
3 −2 −16

Note que, sendo C a base canônica do R3 , T (v)C = T (v) também poderia ser obtido
diretamente da lei que define T ,
T (v) = T (5, 4) = (5 − 2 · 4, 5 · 5 + 3 · 4, · − 4 · 5) = (−3, 37, −16).

Exemplo 181. Considere a mesma transformação linear e sejam C 0 = {(1, 0), (0, 1)} e
C = {(1, 0, 0), (0, 1, 0), (0, 0, 1)} as bases canônicas do R2 e do R3 , respectivamente.
0
(a) Determine [T ]CC .
0
(b) Se v = (5, 4) calcule T (v)C utizando [T ]C
C .

(a)
T (1, 0) = (1, 5, −4) = 1(1, 0, 0) + 5(0, 1, 0) − 4(0, 0, 1)
T (0, 1) = (−2, 3, 1) = −2(1, 0, 0) + 3(0, 1, 0) + 1(0, 0, 1).
Assim,  
1 −2
C 0
[T ]C = 5 3 .
−4 1
(b) Note que T (v)C não depende da base do domı́nio, mas sim do vetor v e da base C
e como tais objetos são idênticos aos do exemplo anterior teremos novamente T (v)C =
(−3, 37, −16).

Definição 182. No caso de A e B serem bases canônicas, representa-se [T ]A


B simplesmeste
por [T ] a qual é chamada matriz canônica de T . Neste caso, tem-se [T (v)] = [T ][v].

Observe que calcular T (v) pela matriz [T ] é o mesmo que fazê-lo pela expressão de T ,
como pode ser observado no último exemplo: T (5, 4) = (−3, 37, −16).

Os exemplos anteriores ilustram que dada uma transformação linear T , a cada dupla de
bases A e B corresponde uma matriz [T ]A
B . Por outro lado, no próximo exemplo veremos
que dadas uma matriz e um par de bases A e B, pode-se obter a expressão de T .
98 GUILHERME CHAUD TIZZIOTTI

Exemplo 183. Dadas A = {(1, 1, 1), (1, 1, 0), (1, 0, 0)} base do R3 e B = {(1, 0), (1, 1)}
base do R2 , determine a transformação linear T : R3 → R2 tal que
 
A 1 0 1
[T ]B = .
2 −1 −1

Sabe-se que o significado de cada coluna de [T ]A B é:


     
1 0 1
[T (1, 1, 1)]B = , [T (1, 1, 0)]B = e [T (1, 0, 0)]B = .
2 −1 −1

Assim,
T (1, 1, 1) = 1(1, 0) + 2(1, 1) = (3, 2)
T (1, 1, 0) = 0(1, 0) − 1(1, 1) = (−1, −1)
T (1, 0, 0) = 1(1, 0) − 1(1, 1) = (0, −1).
Conhecidas as imagens dos vetores numa base A do domı́nio R3 de T , expressando o vetor
genérico (x, y, z) ∈ R3 como combinação linear dos elementos desta base A, obteremos
T (x, y, z):
(x, y, z) = α(1, 1, 1) + β(1, 1, 0) + γ(1, 0, 0)
 


 α + β + γ = x α = z


⇒ α+β =y ⇒ β =y−z .
 
α = z
 γ = x − y

Ou seja,
(x, y, z) = z(1, 1, 1) + (y − z)(1, 1, 0) + (x − y)(1, 0, 0).
Pela linearidade de T temos
T (x, y, z) = zT (1, 1, 1) + (y − z)T (1, 1, 0) + (x − y)T (1, 0, 0)
= z(3, 2) + (y − z)(−1, −1) + (x − y)(0, −1)
= (3z − y + z, 2z − y + z − x + y)
= (4z − y, 3z − x).

Dado um espaço vetorial V , lembre-se que um operador linear T sobre V nada mais é do
que uma transformação linear T : V → V . Neste caso, para tomar uma representação
matricial de T , é comum considerar a mesma base no domı́nio e no contradomı́nio, isto
é, fazer A = B. A matriz resultante, denotada simplesmente por [T ]A , é chamada matriz
de T em relação à base A. Por exemplo, o leitor pode verificar que a matriz do operador
T : R2 → R2 , T (x, y) = (2x + y, x − 3y) em relação à base A = {(−1, −1), (0, 1)} é
 
3 −1
[T ]A = .
5 −4
99

Produto Interno

O conceito de produto interno, que estudaremos a partir de agora, enriquece a estrutura


de espaço vetorial. De certa maneira, vamos formalizar conceitos geométricos, como o de
comprimento de um vetor e ângulos entre dois vetores. Isso dará uma melhor compreensão
de certos conceitos estudados anteriormente, como os de base ortogonal e ortonormal.
Além dessa linguagem mais geométrica, podemos, de certa forma, ver um espaço com
produto interno como uma generalização natural do espaço euclidiano R3 , que é um espaço
que estamos mais acostumados a estudar.
Lembramos que, quando falamos em espaço vetorial, estamos nos referindo a espaços
vetorias sobre R.

Definição 184. Seja V um espaço vetorial. Um produto interno sobre V é uma função
de V × V em R, denotada por h, i, que associa a cada par de vetores u, v ∈ V um número
real hu, vi e que satisfaz as seguintes propriedades:
i) hu, ui > 0, se u 6= 0.
ii) hu, vi = hv, ui, para quaisquer u, v ∈ V .
iii) hu + v, wi = hu, wi + hv, wi, para quaisquer u, v, w ∈ V .
iv) hλ.u, vi = λ.hu, vi, para quaisquer u, v ∈ V e λ ∈ R.

O número real hu, vi é chamado de produto interno de u por v.

Observação 185. Seja V um espaço vetorial.


1) Note que h0, ui = 0, para todo u ∈ V . De fato, h0, ui = h0 + 0, ui = h0, ui + h0, ui ⇒
h0, ui = 0.
2) hu, ui = 0 se, e somente se, u = 0. De fato, de i) da definição de espaço vetorial,
sabemos que hu, ui > 0, se u 6= 0. Logo, como hu, ui = 0, segue que u = 0. Por outro
lado, por 1) acima, é claro que se u = 0, então hu, ui = 0.
3) Dado u ∈ V , se hu, vi = 0, para todo v ∈ V . Então, u = 0. (Deixamos esta verificação
a cargo do leitor, ela será cobrada na seção de exercı́cios.)
4) Sejam u, w ∈ V tais que hu, vi = hw, vi, para todo v ∈ V . Então, u = w. (Deixamos
esta verificação a cargo do leitor, ela será cobrada na seção de exercı́cios.)
100 GUILHERME CHAUD TIZZIOTTI

Exemplo 186. Para cada u = (u1 , . . . , un ) e v = (v1 , . . . , vn ) em Rn , defina


n
X
hu, vi = ui .vi .
i=1
n
Esta função é um produto interno sobre R , chamado de produto interno canônico.
Vejamos se as quatro propriedades da definição de produto interno são de fato satisfeitas.
n
X n
X
n
i) Seja u = (u1 , . . . , un ) 6= (0, 0, . . . , 0) em R . Logo, hu, ui = ui .ui = u2i . Como,
i=1 i=1
(u1 , . . . , un ) 6= (0, 0, . . . , 0), então ui 6= 0 para pelo menos um i ∈ {1, 2, . . . , n}. Daı́,
Xn
u2i > 0, ou seja, hu, ui > 0.
i=1

ii) Dados u = (u1 , . . . , un ) e v = (v1 , . . . , vn ) em Rn , temos que


n
X n
X
hu, vi = ui .vi = vi .ui = hv, ui.
i=1 i=1

iii) Dados u = (u1 , . . . , un ), v = (v1 , . . . , vn ) e w = (w1 , . . . , wn ) em Rn , temos que


n
X n
X n
X n
X
hu + v, wi = (ui + vi ).wi = (ui .wi + vi .wi ) = ui .wi + vi .wi = hu, wi + hv, wi.
i=1 i=1 i=1 i=1

iv) Dados u = (u1 , . . . , un ) e v = (v1 , . . . , vn ) em Rn , e λ ∈ R, temos que


n
X n
X n
X
hλu, vi = (λui ).vi = λ.(ui .vi ) = λ ui .vi = λhu, vi.
i=1 i=1 i=1

Exemplo 187. Seja f uma função de R2 × R2 em R, dedinida, para cada u = (u1 , u2 ) e


v = (v1 , v2 ) em R2 , por
f (u, v) = 2u1 v1 + u2 v2 .
Será que a função f é um produto interno sobre R2 ?
Para responder esta pergunta devemos verificar se as quatro propriedades da definição de
produto interno são satisfeitas.
i) Seja u = (u1 , u2 ) ∈ R2 , com (u1 , u2 ) 6= (0, 0). Então, f (u, u) = 2u1 u1 + u2 u2 =
2u21 + u22 > 0, pois (u1 , u2 ) 6= (0, 0). Logo, i) é satisfeita.
ii) Sejam u = (u1 , u2 ) e v = (v1 , v2 ) em R2 . Então, f (u, v) = 2u1 v1 +u2 v2 = 2v1 u1 +v2 u2 =
f (u, v). Daı́, ii) também é satisfeita.
iii) Sejam u = (u1 , u2 ), v = (v1 , v2 ) e w = (w1 , w2 ) em R2 . Então, f (u + v, w) =
2(u1 +v1 )w1 +(u2 +v2 )w2 = 2u1 w1 +2v1 w1 +u2 w2 +v2 w2 = 2u1 w1 +u2 w2 +2v1 w1 +v2 w2 =
f (u, w) + f (v, w). Assim, iii) também é satisfeita.
101

iv) Sejam u = (u1 , u2 ) e v = (v1 , v2 ) em R2 e λ ∈ R.


Então, f (λu, v) = 2(λu1 )v1 + (λu2 )v2 = λ.2u1 v1 + λu2 v2 = λ(2u1 v1 + u2 v2 ) = λf (u, v). E
iv) também é satisfeita.
Portanto, f é um produto interno.

V um espaço vetorial com um produto interno h, i. Para cada v ∈ V ,


Definição 188. Seja p
o número real kvk = hv, vi é chamado de norma, ou comprimento, do vetor v.

A seguir, veremos algumas propriedades elementares relacionadas à norma de um vetor.

Seja V um espaço vetorial com pruduto interno h, i. Então, das definições de produto
interno e de norma, temos que:
• kvk = 0 se, e somente se, v = 0.
• kvk ≥ 0, para todo v ∈ V .
• kλ.vk = |λ|.kvk, para quaisquer v ∈ V e λ ∈ R.

Definição 189. Se kvk = 1, dizemos que v é um vetor unitário.

Exemplo 190. Considere o espaço vetorial R2 p com o produto interno canônico. Então,
2
para cada v = (v1 , v2 ) ∈ R , tem-se que kvk = v12 + v22 . Assim, o vetor v = (1, 0) tem
norma 1.

Exemplo 191. Agora, considere o espaço vetorial R2 com o produto p interno dado no
Exemplo 187. Logo, para cada v = (v1 , v2 ) ∈ R2 , tem-se que √
kvk = 2v12 + v22 . Daı́, com
respeito a esta norma, o vetor v = (1, 0) tem norma igual a 2.

Observação 192. É interessante observar que se V é um espaço com produto interno


h, i, então, para quaisquer u, v ∈ V , tem-se que

ku + vk2 = hu + v, u + vi = hu, ui + hu, vi + hv, ui + hv, vi = kuk2 + 2hu, vi + kvk2 .


102 GUILHERME CHAUD TIZZIOTTI

O teorema que veremos a seguir apresenta uma desigualdade, conhecida por Desigualdade
de Schwarz, que é muito útil no estudo da Álgebra Linear, além de outros ramos da
Matemática.
Teorema 193. (Desigualdade de Schwarz) Seja V um espaço vetorial com produto in-
terno. Então,
|hu, vi| ≤ kuk.kvk , ∀u, v ∈ V.

Demonstração. Sejam V um espaço com produto interno e u, v ∈ V . Considere a função


real f (x) = ku − x.vk = hu − x.v, u − x.vi, para todo x ∈ R. Observe que f (x) ≥ 0, para
todo x. Além disso, pelas propriedades do produto interno, segue que
ku − x.vk = hu − x.v, u − x.vi = kuk2 − 2hu, vi.x + kvk2 .x2 ≥ 0.
Agora, como f é uma função quadrática, da forma ax2 + bx + c, não negativa, segue que
o discriminante ∆ = b2 − 4ac ≤ 0, ou seja, (−2hu, vi)2 − 4kuk2 kvk2 ≤ 0.
Portanto, 4(hu, vi)2 − 4kuk2 kvk2 ≤ 0 ⇒ |hu, vi| ≤ kuk.kvk.


Exercı́cio: Seja V um espaço vetorial com produto interno. Mostre que


ku + vk ≤ kuk + kvk , ∀u, v ∈ V.

Esta desigualdade é conhecida com Desigualdade Triangular.


103

Ortogonalidade

Definição 194. Seja V um espaço com produto interno h, i. Dizemos que u, v ∈ V são
ortogonais, indicamos u⊥v, se hu, vi = 0.

Observe que o vetor nulo 0 é ortogonal a todos elementos de um espaço vetorial V com
produto interno, já que h0, vi = 0, ∀v ∈ V .

Exemplo 195. Considere o espaço R2 com o produto interno canônico. Então, os vetores
u = (2, −1) e v = (2, 4) são ortogonais, já que hu, vi = 2.2 + (−1).4 = 0.

Definição 196. Um subconjunto W de V é chamado de ortogonal se hu, vi = 0, ∀u, v ∈


W , com u 6= v. Se em um conjunto ortogonal W tem-se kuk = 1, ∀u ∈ W , dizemos que
W é ortonormal.

Exemplo 197. Considere R2 com o produto interno canônico. Seja A = {(−1, 2), (6, 3)}.
Então, A é um conjunto ortogonal, pois h(−1,p √ + 2.3 = −6 + 6 = 0.
2), (6, 3)i = (−1).6
2 2
Mas, A não é ortonormal, já que k(−1, 2)k = (−1) + 2 = 5 6= 1.

( √ √ √ √ )
2 2 2 2
Exemplo 198. Considere R3 com o produto interno canônico. Seja A = ( , , 0), ( ,− , 0) .
2 2 2 2
√ √ √ √ √ √
2 2 2 2 2 2
Então, A é um conjunto ortonormal, pois h( , , 0), ( ,− , 0)i = 0, k( , , 0)k =
√ √ 2 2 2 2 2 2
2 2
1 e k( ,− , 0)k = 1.
2 2

Um resultado interessante a respeito de subconjuntos ortogonais é o seguinte.

Proposição 199. Sejam V um espaço vetorial com produto interno e W = {w1 , w2 , . . . , wn }


um subconjunto ortogonal de V , com wi 6= 0, para todo i = 1, 2, . . . , n.
a) Se v é um elemento do subespaço gerado por W , então
n
X hv, wi i
v= .wi .
i=1
kwi k2
104 GUILHERME CHAUD TIZZIOTTI

b) O conjunto W é linearmente independente.


n
X
Demonstração. a) Seja v um elemento do subespaço gerado por W . Logo, v = ai w i ,
i=1
com
ai ∈ R, para todo i = 1, 2, . . . , n. Como W = {w1 , w2 , . . . , wn } é ortogonal, para cada
k = 1, 2, . . . , n, temos que
Xn n
X
hv, wk i = h ai wi , wk i = ai hwi , wk i = ak hwk , wk i.
i=1 i=1

hv, wk i
Como wk 6= 0, para todo k, e hwk , wk i = kwk k2 , segue que ak = .
kwk k2
n
X hv, wi i
Portanto, v = .wi .
i=1
kwi k2

b) Sejam a1 , a2 , . . . , an ∈ R tais que a1 w1 + a2 w2 + . . . + wn = 0.


Daı́, para cada k = 1, 2, . . . , n, temos que
Xn n
X
0 = h0, wk i = h ai wi , wk i = ai hwi , wk i = ak hwk , wk i.
i=1 i=1

Como hwk , wk i 6= 0, para todo k, pois wk 6= 0, então ak = 0, para todo k, e segue que W
é linearmente independente. 

Definição 200. Uma base B de um espaço vetorial V é chamada de base ortonormal,


se B for ortonormal.

Exemplo 201. Considere Rn com o produto interno canônico. Então, a base canônica
{e1 , e2 , . . . , en } de Rn é um conjunto ortonormal, já que hei , ej i = 0, se i 6= j, e hei , ei i =
1 ⇒ kei k = 1, para todo i = 1, 2, . . . , n. Assim, a base canônica é um exemplo de base
ortonormal de Rn .

Observação 202. Da Proposição 199, segue que se B = {w1 , w2 , . . . , wn } é uma base


ortonormal de um espaço vetorial V com produto interno, então, para todo v ∈ V , tem-se
n
X
v= hv, wi iwi .
i=1
105

Será que todo espaço vetorial de dimensão finita com produto interno possui uma base
ortonormal?

A resposta é sim. Veremos que, se V é um espaço de dimensão finita com produto interno,
é possı́vel, a partir de uma base qualquer de V , construir uma base ortonormal de V . Este
processo é chamado de processo de ortonormalização de Gram-Schmidt e consiste
no seguinte.

Dada uma base B = {v1 , v2 , . . . , vn } do espaço V , primeiramente obteremos uma base


ortogonal B 0 = {w1 , w2 , . . . , wn } de V . A seguir, obtemos a base ortonormal B 00 =
wi
{u1 , u2 , . . . , un }, onde, para cada i = 1, 2, . . . , n, ui = .
kwi k

Processo de ortonormalização de Gram-Schmidt

Seja V um espaço vetorial de dimensão finita n com produto interno. Seja B = {v1 , v2 , . . . , vn }
uma base de V .

1) defina w1 = v1

hw1 , v2 i
2) defina w2 = v2 − .w1
hw1 , w1 i
É importante observar que w2 6= 0 , já que {v1 , v2 } é linearmente independente.

3) definidos w1 , w2 , . . . , wk , com 1 ≤ k < n, podemos definir wk+1 como sendo


k
X hwi , vk+1 i
wk+1 = vk+1 − .wi .
i=1
hwi , wi i

Assim, temos que B 0 = {w1 , w2 , . . . , wn } é uma base ortogonal de V . Daı́, tomando ui =


wi
, para cada i = 1, 2, . . . , n, segue que B 00 = {u1 , u2 , . . . , un } é uma base ortonormal
kwi k
de V .

De fato, para n = 1 o resultado é claramente válido.


106 GUILHERME CHAUD TIZZIOTTI

Suponhamos que para um inteiro n > 1 arbitrário o algoritmo é válido, ou seja, o processo
produz uma base ortonormal B 00 = {u1 , u2 , . . . , un } para qualquer espaço V de dimensão
n.
Agora, sejam V um espaço com produto interno de dimensão n+1 e B = {v1 , v2 , . . . , vn , vn+1 }
uma base de V . Pela hipótese de indução, é possı́vel, a partir de {v1 , v2 , . . . , vn }, obter
uma base ortogonal {u1 , . . . , un } para o espaço V 0 gerado por {v1 , v2 , . . . , vn }. Definindo
o vetor wn+1 por
Xn
wn+1 = vn+1 − hui , vn+1 i.ui ,
i=1

temos que wn+1 é ortogonal a cada um dos uj , 1 ≤ j ≤ n, já que


n
X n
X
hwn+1 , uj i = hvn+1 − hui , vn+1 i.ui , uj i = hvn+1 , uj i − h hui , vn+1 i.ui , uj i
i=1 i=1

= hvn+1 , uj i − hvn+1 , uj i.huj , uj i = hvn+1 , uj i − hvn+1 , uj i = 0.


wn+1
Daı́, tomando un+1 = , segue que {u1 , . . . , un , un+1 } é um conjunto ortonormal.
kwn+1 k
Para mostrar que {u1 , . . . , un , un+1 } é uma base de V , note que cada uj é uma combinação
linear dos vetores {v1 , . . . , vn+1 }. Logo, temos n + 1 vetores linearmente independentes
em um espaço V de dimensão n + 1, e assim temos que {u1 , . . . , un , un+1 } é de fato uma
base de V .
Portanto, por indução matemática, provamos que o processo de ortonormalização de
Gram-Schmidt é válido.

Exemplo 203. Considere o espaço R2 com o produto interno usual. Utilizando o processo
de ortonormalização de Gram-Schmidt, vamos construir uma base ortonormal de R2 a
partir da base B = {(2, 0), (−1, 1)}, a qual claramente não é ortonormal.

Sejam v1 = (2, 0) e v2 = (−1, 1).

1) w1 = (2, 0)

h(2, 0), (−1, 1)i (−2)


2) w2 = (−1, 1)− .(2, 0) = (−1, 1)− .(2, 0) = (−1, 1)−(−1, 0) = (0, 1)
h(2, 0), (2, 0)i 4

(2, 0) (2, 0)
Finalmente, tomando u1 = = = (1, 0) e u2 = w2 = (0, 1), já que kw2 k = 1,
k(2, 0)k 2
temos que {u1 , u2 } é uma base ortonormal de R2 .
107

Exemplo 204. Considere o espaço R3 com o produto interno usual. Encontre uma base
ortonormal para R3 a partir da base {(1, 1, 1), (0, 2, 1), (0, 0, 1)}.

Sejam v1 = (0, 0, 1), v2 = (1, 1, 1) e v3 = (0, 2, 1).

1) w1 = (0, 0, 1)
h(0, 0, 1), (1, 1, 1)i 1
2) w2 = (1, 1, 1) − .(0, 0, 1) = (1, 1, 1) − (0, 0, 1) = (1, 1, 0)
h(0, 0, 1), (0, 0, 1)i 1
h(0, 0, 1), (0, 2, 1)i h(1, 1, 0), (0, 2, 1)i
3) w3 = (0, 2, 1) − .(0, 0, 1) − .(1, 1, 0)
h(0, 0, 1), (0, 0, 1)i h(1, 1, 0), (1, 1, 0)i
= (0, 2, 1) − (0, 0, 1) − (1, 1, 0) = (−1, 1, 0)

Assim, temos que:


w1 (0, 0, 1)
u1 = = = (0, 0, 1)
kw1 k 1
w2 (1, 1, 0) 1 1
u2 = = √ = ( √ , √ , 0)
kw2 k 2 2 2
w3 (−1, 1, 0) 1 1
u3 = = √ = (− √ , √ , 0)
kw3 k 2 2 2
 
1 1 1 1
Logo, a base ortonormal procurada será (0, 0, 1), ( √ , √ , 0), (− √ , √ , 0) .
2 2 2 2

Seguindo os exemplos feitos nesta seção, faça os exercı́cios para uma melhor fixação do
processo de ortonormalização de Gram-Schmidt.

Você também pode gostar