Notas de Aula Algebra Linear

NOTAS DE AULA DE ÁLGEBRA LINEAR
GUILHERME CHAUD TIZZIOTTI
email: [email protected]
Bibliografia básica:
[1] LIMA, E. L. Álgebra Linear. Rio de Janeiro: Sociedade Brasileira de Matemática,

1998.
[2] LIESEN, J. ; MEHRMANN, V. Linear Algebra. Springer, 2015.
[3] COELHO, F. U.; LOURENÇO, M. L. Um curso de álgebra linear. 2nd ed. São Paulo:
EDUSP, 2010.
[4] CALLIOLI, C. A.; DOMINGUES, H. H.; COSTA, R. C. F., Álgebra linear e aplicações.
6. ed. São Paulo: Atual Editora, 1990.
[5] BOLDRINI, J. L.; COSTA, S. I. R.; FIGUEIREDO, V. L.; WETZLER, H. G. Álgebra

Linear. 3. ed. São Paulo: Harbra, 1986.
[6] ANTON, H. A.; RORRES, C. Álgebra linear com aplicações. 8. ed. Porto Alegre:
Bookman, 2001.
Datas das provas:
Primeira prova (P1) - 03 de novembro - 35 pontos.
Segunda prova (P2) - 01 de dezembro - 35 pontos.
Terceira prova (P3) - 19 de janeiro - 30 pontos.
Prova substitutiva - 26 de janeiro
Atendimento: sexta-feira das 9h às 10:30h sala 1F 102
1
2 GUILHERME CHAUD TIZZIOTTI
1. Matrizes
Nesta primeira aula, veremos como representar uma matriz e como são definidas certas
matrizes especiais.
Quando falamos em matrizes, o que lhe vem à mente? Certamente a resposta é um

quadro, ou tabela, formados por números. Bem, a definição de matriz passa por isso
mesmo, como veremos a seguir.
Definição 1 (Matriz ). Chamamos de matriz de ordem m por n um quadro com m linhas

e n colunas cujos elementos, que podem ser números, funções, etc., estão dispostos em m
linhas e n colunas, como abaixo
 
a11 a12 a13 . . . a1n
 a21 a22 a23 . . . a2n 
 
 a a a . . . a3n  .

 31 32 33
 .. .. .. .. .. 
 . . . . . 
am1 am2 am3 . . . amn
Em geral, denotamos uma matriz por uma letra maiúscula, por exemplo A, M ou I. E
escrevemos “A é uma matriz m × n”, para dizer que A tem ordem m por n, lembrando
que m denota o número de linhas e n o número de colunas da matriz. Para efeito de
simplificação, usa-se também a notação A(m,n) ou Am×n , para dizer que A é uma matriz
de ordem m por n.
Outra notação importante é a representação dos elementos de uma matriz, que também
são chamados de entradas. Se A é uma matriz m × n, denotam-se os elementos, ou
entradas, de A por aij , onde o primeiro ı́ndice, i, indica a linha, e o segundo ı́ndice, j,
a coluna a que o elemento aij pertence. Usando esta notação, pode-se representar uma
matriz por A = (aij ), ou ainda, A = [aij ], onde i varia de 1 a m (isto é, i = 1, 2, . . . , m),
e j varia de 1 a n (isto é, j = 1, 2, . . . , n).
• De agora em diante, representaremos uma matriz B por (bij ), uma X por (xij ) e assim
por diante.
Denota-se o conjunto das matrizes Am×n com entradas reais por Mm×n (R). Já o conjunto
das matrizes Am×n cujas entradas são números inteiros, é denotado por Mm×n (Z), etc.
• Nesta disciplina, vamos trabalhar com matrizes em Mm×n (R).
3
A seguir, veremos como chamamos algumas matrizes com caracterı́sticas especiais.
Matriz coluna: Uma matriz de ordem m por 1 é chamada de matriz coluna.

1
 0 
Por exemplo, a matriz 
 2  é uma matriz coluna.

−1
Matriz linha: Uma matriz de ordem 1 por n é chamada de matriz linha.

A matriz 3 1 −2 é um exemplo de matriz linha.
Matriz retangular: É uma matriz de ordem m por n com m 6= n.

1 −1 0 cos θ
A matriz é uma matriz retangular.
cos θ 3 0 senθ
Matriz quadrada: É uma matriz na qual o número de linhas é igual ao número de

colunas, ou seja, é uma matriz de ordem n por n.
 
1 0 1
A matriz  9 2 −2  é uma matriz quadrada.
4 3 7
Observação 2. Quando nos referirmos à ordem de uma matriz quadrada n × n, diremos

simplesmente que ela tem ordem n.
Duas definições importantes no estudo de matrizes relacionada a matrizes quadradas são

as seguintes.
Definição 3. Seja A = (aij ) uma matriz quadrada de ordem n. Os elementos aij , com
i = j, ou seja, a11 , a22 , . . . , ann , são chamados de elementos principais e constituem a
diagonal principal da matriz A.
−1
 
8 3 0
 4 3 2 1 
Por exemplo, a diagonal principal da matriz   é formada por −1, 3, 0
 7 2 0 −4 
0 2 1 −7
e −7.
Definição 4. Seja A = (aij ) uma matriz quadrada de ordem n. O traço de A, denotado

por tr(A), é a soma dos elementos da diagonal principal de A, ou seja,
n
X
tr(A) = aii .
i=1
 
−1 8 0
Por exemplo, o traço da matriz  4 3 2  é dado por: tr(A) = −1 + 3 + 1 = 3.
0 2 1
Matriz diagonal: Uma matriz quadrada A = (aij ), de ordem n, é chamada de matriz

diagonal se os elementos aij são iguais a zero quando i 6= j.
 
1 0 0
A matriz  0 5 0  é um exemplo de matriz diagonal.
0 0 −1
 
0 0 0
A matriz  0 0 0  também é um exemplo de matriz diagonal.
0 0 2
Matriz triangular: Uma matriz quadrada A = (aij ), de ordem n, é chamada de matriz

triangular superior se os elementos aij são iguais a zero quando i > j. No caso em que os
elementos aij são iguais a zero quando j > i, dizemos que a matriz quadrada A = (aij ) é
uma matriz triangular inferior.
5
 
  1 0 0 0
6 1 3  7 0 0 0 
A matriz A =  0 −2 7  é triangular superior. Já a matriz B =  
 9 2 −3 0 
0 0 8
10 0 8 2
é triangular inferior.
Matriz nula: Uma matriz A = (aij ) é chamada de matriz nula se todos os seus elementos
aij são iguais a zero. Em geral, denota-se uma matriz nula simplesmente por 0.

0 0
Um exemplo de matriz nula é a matriz .
0 0
Além das matrizes que definimos até o momento, uma em particular é muito importante
tanto no estudo de matrizes quanto para todo o decorrer deste curso. A matriz a que
estamos nos referindo é a matriz identidade que é definida da seguinte maneira.
Matriz identidade: Uma matriz diagonal que possui todos os elementos de sua diagonal
iguais a 1 é chamada de matriz identidade. Se esta matriz tem ordem n a denotamos In .
Ainda pode-se denotá-la por Id , ou simplesmente por I.
 
1 0 0 0

1 0  0 1 0 0 
Exemplos de matrizes identidade são I2 =  0 0 1 0 .
e I4 =  
0 1
0 0 0 1
Observação 5. Note que, para uma matriz ser uma matriz identidade ela antes tem que
ser uma matriz diagonal, que por sua vez tem que ser uma matriz quadrada. Portanto,
uma matriz identidade é antes de tudo uma matriz quadrada!
• Dizemos que duas matrizes A = (aij ) e B = (bij ), ambas de ordem m por n, são iguais
se aij = bij , para quaisquer i e j.

7 2 0 −3 7 2 0 −3
Por exemplo, as matrizes A = eB= são iguais, isto
1 8 3 1 1 8 3 1

7 2 0 −3 7 2 0 −3
é, = .
1 8 3 1 1 8 3 1
É perfeitamente possı́vel definirmos operações que envolvam matrizes. Nesta seção, vamos
definir a adição, e como consequência a subtração, de matrizes. Na próxima seção veremos
como definir o produto de uma matriz por um escalar e o produto de duas matrizes.
Adição e subtração de matrizes: Sejam A = (aij ) e B = (bij ) duas matrizes m × n.

A soma de A e B é uma matriz C = (cij ) de ordem m × n, tal que cij = aij + bij , para
quaisquer i e j. E a diferença A − B será a matriz C = (cij ) também m × n, tal que
cij = aij − bij , para quaisquer i e j.
Observação 6. Note que a adição e a subtração de duas matrizes só podem ser feitas se
ambas as matrizes possuem a mesma ordem.
A seguir, vemos alguns exemplos de adição e subtração de matrizes.
Exemplo 7.
−2 1 −2
       
0 2 0 + (−2) 2+1 3
 1 −1   1 1   1+1 −1 + 1   2
  0 
 + = = 
 3 0   −1 2   3 + (−1) 0+2   2 2 
−5 7 3 −4 −5 + 3 7 + (−4) −2 3
Exemplo 8.

1 −1 0 2 0 4 1−2 −1 − 0 0 − 4 −1 −1 −4
− = =
3 6 2 −5 3 1 3 − (−5) 6 − 3 2 − 1 8 3 1
Finalizamos esta seção introduzindo propriedades fundamentais a respeito da adição de

matrizes. Antes, observamos que dada uma matriz A = (aij ), utilizamos a notação −A
para denotar a matriz (−aij ).
Propriedades da adição de matrizes: Sejam A = (aij ), B = (bij ) e C = (cij ) matrizes

m × n quaisquer, e 0 a matriz nula de ordem m × n. Então são válidas as seguintes
propriedades:
1) A + (B + C) = (A + B) + C, ou seja, a adição de matrizes é associativa.
2) A + B = B + A, isto é, a adição de matrizes é comutativa.

7
3) A + 0 = A, a matriz nula 0 é o elemento neutro com respeito à adição de matrizes.
4) −A + A = A − A = 0, isto é, a matriz −A é a matriz inversa da matriz A com respeito

à adição.
Utilizando as definições de adição a subtração de matrizes não é difı́cil mostrar a veraci-

dade das quatro propriedades acima. (Exercı́cio!)
2. Produto de Matrizes
Começaremos esta seção definindo o produto de uma matriz A por um número real α.
Na linguagem de matrizes, como na de vetores que veremos mais à frente, o número real
α será chamado de escalar.
Produto de uma matriz por um escalar: Sejam α um escalar e A = (aij ) uma matriz
m × n. O produto de A por α é uma matriz B = (bij ) também m × n tal que bij = αaij
para quaisquer i e j. Costuma-se denotar por αA = (αaij ) a matriz que é o produto do
escalar α pela matriz A.
Por exemplo,

2 −1 0 3 4.2 4.(−1) 4.0 4.3 8 −4 0 12
4. = =
1 0 −2 1 4.1 4.0 4.(−2) 4.1 4 0 −8 4
O produto de uma matriz por um escalar satisfaz as seguintes propriedades.
Propriedades do produto de uma matriz por um escalar: Sejam α e β escalares,

e A e B matrizes m × n quaisquer. Então, são válidas as seguintes propriedades:
1) (αβ)A = α(βA)
2) (α + β)A = αA + βA
3) α(A + B) = αA + αB
4) 1.A = A
Vamos mostrar somente a segunda propriedade. As demais podem ser mostradas de forma
análoga e serão deixadas como exercı́cio.
Vejamos que dados dois escalares α e β, e uma matriz A = (aij ), de ordem m × n,

quaisquer, então (α + β)A = αA + βA.
De fato, (α + β)A é, por definição, uma matriz B = (bij ), onde bij = (α + β)aij .
9
Agora, (α + β)aij = αaij + βaij . Assim, bij = αaij + βaij . Sendo αA = (αaij ) e
βA = (βaij ), então, por definição de soma de matrizes, segue que B = αA+βA. Portanto,
(α + β)A = αA + βA.
Dadas duas matrizes A e B será que sempre é possı́vel fazer o produto de A por B? Será
que o produto de A por B é igual ao produto de B por A? A partir de agora vejamos
como responder estas e outras questões relacionadas ao produto de matrizes cuja definição
é dada abaixo.
Produto de matrizes: Sejam A = (aij ) uma matriz m × n e B = (bij ) uma matriz r × s.

Definimos o produto de A por B, e denotamos A.B, ou simplesmente AB, da seguinte
maneira: primeiramente, temos que ter n = r, esta condição é necessária para se definir
o produto de duas matrizes; sendo n = r, o produto A.B será a matriz C = (cij ), de
ordem m × s, tal que cij = ai1 b1j + ai2 b2j + ai3 b3j + . . . + ain bnj , com i = 1, 2, . . . , m e
j = 1, 2, . . . , s.

1 2 5 1.5 + 2.6 17
Exemplo 9. . = =
3 4 6 3.5 + 4.6 39
1 1 −1
 

0 2 −1 0  5 2 0 
Exemplo 10. . 
3 −2 4 1  3 −4 7 
9 1 0

0.1 + 2.5 + (−1).3 + 0.9 0.1 + 2.2 + (−1).(−4) + 0.1 0.(−1) + 2.0 + (−1).7 + 0.0
=
3.1 + (−2).5 + 4.3 + 1.9 3.1 + (−2).2 + 4.(−4) + 1.1 3.(−1) + (−2).0 + 4.7 + 1.0

7 8 −7
=
14 −16 25
Observação 11. Note que em geral, não temos a igualdade AB = BA. Primeiro que
para ambos os produtos existam é necessário, pela definição de produto de matrizes, que
A seja uma matriz m × n e que B seja uma matriz n × m. Segundo, mesmo que isso
ocorra, podemos não ter AB = BA, como veremos nos exemplos a seguir.
 
1 0 −2
0 2 1
Exemplo 12. Sejam A = e B =  0 −1 4 . Então,
3 0 −1
3 5 2
 
1 0 −2
0 2 1
AB = .  0 −1 4 
3 0 −1
3 5 2

0.1 + 2.0 + 1.3 0.0 + 2.(−1) + 1.5 0.(−2) + 2.4 + 1.2 3 3 8
= =
3.1 + 0.0 + (−1).3 3.0 + 0.(−1) + (−1).5 3.(−2) + 0.4 + (−1).2 0 −5 −8
.
Agora, o produto BA não existe, já que B é uma matriz 3 × 3 e A é uma matriz 2 × 3.
 
1
Exemplo 13. Sejam A =  2  e B = −3 0 5 . Assim,
4
    
1 1.(−3) 1.0 1.5 −3 0 5
AB =  2  . −3 0 5 =  2.(−3) 2.0 2.5  =  −6 0 10  que é uma
4 4.(−3) 4.0 4.5 −12 0 20
matriz 3 × 3.
 
1
BA = −3 0 5 . 2  = (−3).1 + 0.2 + 5.4 = 17 que é uma matriz 1 × 1.
4
Note que, tanto AB quanto BA existem, mas claramente AB é diferente de BA.

0 1 1 −1
Exemplo 14. Sejam A = eB= . Então,
1 −1 0 2

0 1 1 −1 0.1 + 1.0 0.(−1) + 1.2 0 2
AB = . = =
1 −1 0 2 1.1 + (−1).0 1.(−1) + (−1).2 1 −3

1 −1 0 1 1.0 + (−1).1 1.1 + (−1).(−1) −1 2
BA = . = =
0 2 1 −1 0.0 + 2.1 0.1 + 2.(−1) 2 −2
11
E temos mais um exemplo em que AB 6= BA.
Portanto, podemos dizer que a multiplicação de matrizes não é comutativa.
Mas existem matrizes A e B tais que AB = BA. Um exemplo óbvio é quando B = A.

Outro exemplo é quando A é uma matriz quadrada de ordem n e B = In , neste caso
tem-se AIn = In A. Além disso, usando a definição de produto de matrizes, mostra-se que
AIn = In A = A.

3 −1 0 1
Considere as matrizes A = eB= .
1 0 −1 3

3 −1 0 1 3.0 + (−1).(−1) 3.1 + (−1).3 1 0
Então, AB = . = = .
1 0 −1 3 1.0 + 0.(−1) 1.1 + 0.3 0 1

0 1 3 −1 0.3 + 1.1 0.(−1) + 1.0 1 0
E BA = . = = .
−1 3 1 0 (−1).3 + 3.1 (−1).(−1) + 3.0 0 1
Ou seja, temos que AB = BA = I2 .
Matriz inversa: Dada uma matriz quadrada de A de ordem n. A matriz B (quando

existir) tal que AB = BA = In é chamada de matriz inversa de A. Veremos que se uma
matriz A possui inversa esta será única. Diante disso denotamos a inversa da matriz A
por A−1 .
Falaremos mais sobre matriz inversa nas aulas seguintes, onde veremos suas propriedades
e como encontrá-la. Mas adiantamos que nem todas matrizes possuem uma inversa.
Observe que na definição acima que uma condição necessária para uma matriz A ter
uma inversa é que A seja uma matriz quadrada. Porém, veremos mais adiante que esta
condição não é suficiente, isto é, existem matrizes quadradas que não possuem inversa.
Apesar de não ser comutativo o produto de matrizes satisfaz algumas importantes pro-
priedades que vemos a seguir.
Propriedades do produto de matrizes:

1) Sejam A, B e C matrizes de ordem m × n, n × p e p × r, respectivamente. Então,

(AB)C = A(BC);
2) Sejam A, B e C matrizes de ordem m × n, m × n e n × p, respectivamente. Então,

(A + B)C = AC + BC;
3) Sejam A, B e C matrizes de ordem m × n, m × n e p × m, respectivamente. Então,

C(A + B) = CA + CB;
4) Se A é uma matrizes de ordem m × n, então Im A = AIn = A;
5) Sejam A e B matrizes de ordem m × n, n × p, respectivamente. Então, para todo

número α tem-se: (αA)B = A(αB) = α(AB).
13
3. Matrizes Transposta, Simétrica e Ortogonal
Vamos começar esta seção definindo a transposta de uma matriz.
Matriz transposta: Seja A = (aij ) uma matriz m × n. A matriz transposta de A,

denotada por AT , ou At , é uma matriz n × m obtida, a partir de A, trocando as linhas
pelas colunas de mesmo ı́ndice. Ou seja, se A = (aij ), então a matriz transposta de A é
definida por AT = (aji ).
−1 9
 

−1 2 0 3  2 17 
Exemplo 15. a) Seja A = . Então, AT = 
 0 11 .

9 17 11 8
3 8
 
a11 a12 a13  
 a21 a11 a21 a31 a41
a22 a23 

b) Se A = 
 a31 , então AT =  a12 a22 a32 a42 .
a32 a33 
a13 a23 a33 a43
a41 a42 a43
 
1
 2  T

c) Se B = 
 3 , então B =
 1 2 3 4 .
4
Temos algumas propriedades que podem ser úteis quando tratamos de matrizes transpos-
tas. Tais propriedades são as seguintes.
Propriedades da matriz transposta:
1) (A + B)T = AT + B T , onde A e B são matrizes m × n.
2) (αA)T = αAT , sendo A uma matriz qualquer.
3) (AT )T = A, sendo A uma matriz qualquer.
4) (AB)T = B T AT , onde A é uma matriz m × n e B é uma matriz n × m.

Primeiramente, vejamos a validade de 1), isto é, (A + B)T = AT + B T . De fato, sejam

A = (aij ) e B = (bij ) matrizes m × n. Então, pela definição de soma de matrizes,
A+B = C = (cij ), onde cij = aij +bij , para quaisquer i e j. Agora, (A+B)T = C T = (cji ),
com cji = aji + bji , ou seja, C T = AT + B T . Logo, (A + B)T = AT + B T .
Agora, vejamos que (αA)T = αAT , onde A = (aij ) é uma matriz m × n. Pela definição de
produto de uma matriz por um escalar, temos αA = (αaij ). Assim, segue que (αA)T =
(αaji ) = αAT .
Deixaremos a verificação das propriedades 3) e 4) como exercı́cio.
Matriz simétrica: Uma matriz quadrada A = (aij ) é uma matriz simétrica se AT = A,

ou seja, se aij = aji para quaisquer i e j.

1 3 T 1 3
Exemplo 16. a) A matriz A = é simétrica, já que A = = A.
3 1 3 1
   
2 −4 0 2 −4 0
b) A matriz A =  −4 1 16  é simétrica, pois AT =  −4 1 16  = A.
0 16 5 0 16 5
Observação 17. Uma propriedade interessante envolvendo uma matriz quadrada e sua
transposta é a seguinte: seja A uma matriz quadrada, então A.AT é uma matriz simétrica,
ou seja, A.AT = C, onde C é uma matriz simétrica.
De fato, suponha que A = (aij ) seja uma matriz quadrada de ordem n. Então, AT = (aji )
que também é uma matriz quadrada de ordem n. Pela definição de produto de matrizes,
temos que A.AT = C, com C = (cij ) quadrada de ordem n e cij = ai1 aj1 + ai2 aj2 + ai3 aj3 +
. . .+ain ajn . Assim, vemos que cji = cij , e portanto C = C T . Logo, A.AT = C é simétrica.
   
0 2 1 0 3 4
Exemplo 18. Seja A =  3 −1 5 . Então, AT =  2 −1 0 .
4 0 8 1 5 8
Logo,
15
   
0.0 + 2.2 + 1.1 0.3 + 2.(−1) + 1.5 0.4 + 2.0 + 1.8 5 3 8
A.AT =  3.0 + (−1).2 + 5.1 3.3 + (−1).(−1) + 5.5 3.4 + (−1).0 + 5.8  =  3 35 52 ,
4.0 + 0.2 + 8.1 4.3 + 0.(−1) + 8.5 4.4 + 0.0 + 8.8 8 52 80
que é uma matriz simétrica.
Matriz antissimétrica: Dizemos que uma matriz quadrada A é antissimétrica se A =

−AT .

0 3 T 0 −3
Exemplo 19. a) A matriz M = é antissimétrica, já que M = =
−3 0 3 0
−M .
   
0 1 −5 0 −1 5
b) A matriz B =  −1 0 −7  é antissimétrica, pois B T =  1 0 7  = −B.
5 7 0 −5 −7 0
Observação 20. Note que se A = (aij ) é uma matriz antissimétrica, então ela é uma
matriz quadrada com os elementos da diagonal principal sendo todos nulos e os elementos
dispostos simetricamente em relação à diagonal principal sendo opostos.
Matriz ortogonal: Uma matriz A é chamada de matriz ortogonal se A−1 = AT , ou seja,

se A.AT = AT .A = Id .

cos θ −senθ cos θ senθ
Exemplo 21. Considere a matriz G = . Então, GT = .
senθ cos θ −senθ cos θ

T cos θ −senθ cos θ senθ
Logo, G.G = .
senθ cos θ −senθ cos θ
cos2 θ + sen2 θ

cos θsenθ − senθ cos θ 1 0
= = .
senθ cos θ − cos θsenθ sen2 θ + cos2 θ 0 1
Portanto, G é uma matriz ortogonal.

4. Escalonamento de Matrizes
Nesta seção vamos descrever um processo muito útil no tratamento não só de matrizes,
que nos ajuda a calcular o determinante de uma matriz de ordem n, mas também a
solução de sistemas lineares, como veremos mais adiante. Tal processo utiliza operações
chamadas elementares de matrizes e é chamado de escalonamento ou triangulação de
matrizes. Antes, porém, vamos definir alguns conceitos importantes que justificam este
processo.
Dependência e independência linear de linhas e colunas de uma matriz
Seja A = (aij ) uma matriz m × n. Vamos representar a linha i de A por:

Li = [ ai1 ai2 ai3 . . . ain ],
onde, para cada i = 1, 2, . . . , m, Li será uma matriz 1 × n.
Uma combinação linear de k linhas de A será qualquer expressão do tipo
L = α1 .Li1 + α2 .Li2 + . . . + αk .Lik
onde αi ∈ R, para todo i = 1, 2, . . . , k, e ij ∈ {1, 2, . . . , m}, para cada j = 1, 2, . . . , k.
Note que se L0 = [ 0 0 0 . . . 0 ] for uma matriz nula, então tomando αi = 0, para todo
i = 1, 2, . . . , k, temos que
L0 = 0.Li1 + 0.Li2 + . . . + 0.Lik .
Considerando a expressão L0 = α1 .Li1 + α2 .Li2 + . . . + αk .Lik , se a única possibilidade de

obtermos esta igualdade for quando αi = 0, para todo i = 1, 2, . . . , k, então dizemos que as
linhas Li1 , Li2 , . . . , Lik são linearmente independentes. Agora, se a igualdade for válida
para pelo menos um αi diferente de zero, então dizemos que as linhas Li1 , Li2 , . . . , Lik são
linearmente dependentes.
Observação 22. Note que se uma das linhas Lij for igual a L0 , então Li1 , Li2 , . . . , Lik
são linearmente dependentes.
De fato, sem perda de generalidade, suponhamos que Li1 = L0 . Assim, temos que
L0 = α1 .Li1 + α2 .Li2 + . . . + αk .Lik = α1 .L0 + α2 .Li2 + . . . + αk .Lik .
Agora, tomando α1 6= 0 e α2 = α3 = · · · = αn = 0, temos que

L0 = α1 .L0 + 0.Li2 + . . . + 0.Lik .
17
Ou seja, a igualdade L0 = α1 .L0 + α2 .Li2 + . . . + αk .Lik é válida para pelo menos um dos
αj ’s diferente de zero. Daı́, temos que L0 , Li2 , . . . , Lik são linearmente dependentes.
Analogamente, podemos definir dependência e independência linear do ponto de vista das

colunas de uma matriz. Um fato importante é que o número máximo de linhas linear-
mente independentes em uma matriz A é igual ao número máximo de colunas linearmente
independentes de A.
Algumas propriedades da dependência e independência linear são as seguintes:
1) A dependência ou independência linear das linhas de uma matriz não se altera se

trocarmos a ordem dessas linhas.
2) Se Li1 , Li2 , . . . , Lik são linearmente dependentes, então Li1 , Li2 , . . . , Lik , Lik+1 também
são linearmente dependentes. Ou seja, acrescentar uma linha em um conjunto linearmente
dependente mantém a dependência linear.
3) Se Li1 , Li2 , . . . , Lik são linearmente dependentes (independentes), então Li1 , Li2 , . . . , α.Lij , . . . , Lik
também é linearmente dependente (independente) se α 6= 0. Ou seja, multiplicar uma das
linhas por um escalar não nulo mantém a dependência (independência) linear.
4) Se Li1 , Li2 , . . . , Lis , . . . , Lij , . . . , Lik são linearmente dependentes (independentes), então
Li1 , Li2 , . . . , Lis , . . . , Lij + Lik , . . . , Lik também é linearmente dependente (independente).
Ou seja, somar uma das linhas a uma linha mantém a dependência (independência) linear.
5) As linhas de uma matriz triangular (superior ou inferior), com os elementos da diagonal

principal diferentes de zero, são linearmente independentes.
Definição 23. A caracterı́stica ou posto de uma matriz A é o número máximo de

linhas de A que são linearmente independentes. Ou seja, é a dimensão do espaço gerado
pelas linhas de A.
Como o número de linhas linearmente independentes é igual ao número de colunas line-

armente independentes, podemos calcular o posto de uma matriz tanto por linhas como
por colunas.
Definição 24. Um matriz A ∈ Mn (R) é chamada de singular se seu posto for igual a
n. Caso contrário ela é chamada de não-singular.
Proposição 25. Sejam A uma matriz k × l e B uma matriz l × m. Então, posto(AB) ≤

min{posto(A), posto(B)}.
Demonstração. O espaço gerado pelas colunas de AB é o espaço S gerado por todos os

vetores s que podem ser escrito como combinação linear das colunas de AB: s = (AB)v,
onde v é uma matriz m × 1 e é o vetor formado pelos coeficientes da combinação linear
dos elementos da base que gera S (veremos isso quando falarmos de espaço vetorial).
Escrevendo s = A(Bv), onde Bv é uma matriz l × 1. Assim, qualquer s ∈ S pode ser
escrito como combinação linear das colunas de A, com coeficientes tomados do vetor Bv.
Como consequência, a dimensão do espaço S não é maior que a do espaço gerado pelas
colunas de A, cuja dimensão é posto(A). Isso implica que a dimensão de S é menor ou
igual do que posto(A). Daı́, como a dimensão de S é o posto(AB), segue que
posto(AB) ≤ posto(A).
Agora, o espaço gerado pelas linhas de AB é o espaço T de todos os vetores t que podem
ser escritos como combinação linear das linhas de AB: t = u(AB), onde u é um vetor 1×k
formado coeficientes da combinação linear dos elementos da base que gera T . Escrevendo
t = (uA)B, e prosseguindo como no caso do posto de A concluı́mos que
posto(AB) ≤ posto(B).
Daı́, concluı́mos que posto(AB) ≤ min{posto(A), posto(B)}.
Definição 26. Dizemos que duas matrizes A e B são equivalentes, indicamos A ∼ B,

se ambas possuem a mesma ordem e têm o mesmo posto.
Observamos que, se A é uma matriz triangular, então o posto de A é igual ao número de

elementos da diagonal principal que são diferentes de zero.
O processo de escalonamento de uma matriz A consiste obter, a partir de A, uma matriz

B, equivalente a A, na qual figure uma matriz triangular superior ou inferior da maior
ordem possı́vel. Este processo utiliza operações elementares, as quais veremos a seguir.
 
L1
 L2 
Suponha que A =  , onde L1 , L2 , . . . , Ln são as linhas da matriz A de ordem n×m.
 
..
 . 
Ln
Então, chamaremos de operações elementares de A as seguintes:
1) Permutar duas linhas, ou seja, trocar as linhas Li e Lj , com i 6= j, de lugar;

19
2) Multiplicar uma linha por um número diferente de zero;
3) Substituir uma linha por uma linha formada pela soma da linha que está sendo subs-
tituı́da com uma outra linha da matriz previamente multiplicada por um número diferente
de zero, ou seja, substituir Li por Li + k.Lj , com k 6= 0.
Observamos que, de forma análoga, as operações elementares também são definidas sobre
as colunas da matriz.
Definição 27. Uma matriz n × n é dita elementar se ela for obtida através de uma
operação elementar (linha ou coluna) a partir da matriz identidade In .
Exemplo 28. Se tomamos I3 e multiplicamos a primeira linha por 2 (L1 → 2L1 ), obtemos
a matriz elementar  
2 0 0
 0 1 0 
0 0 1
Exemplo 29. Se tomamos I3 e fazemos C3 → 5C2 + C3 , obtemos a matriz elementar

 
1 0 0
 0 1 5 
0 0 1
Exemplo 30. Se tomamos I2 e fazemos L1 ↔ L2 , obtemos a matriz elementar

0 1
1 0
O processo de escalonamento possui várias etapas, onde, em cada uma delas, vamos
anulando as entradas abaixo (ou acima) da diagonal principal de uma submatriz quadrada
de maior ordem possı́vel, ou da diagonal principal da própria matriz no caso de a matriz
a ser escalonada seja quadrada.
Vejamos como fazer o escalonamento de uma matriz não nula A = (aij ) de ordem m × n.
 
a11 a12 . . . a1n
 a21 a22 . . . a2n 
Seja A =  ..
 
.. .. .. 
 . . . . 
am1 am2 . . . amn
Suponhamos que a11 6= 0. Se a11 = 0, basta trocar linhas ou colunas de forma a colocar
um elemento não nulo na posição de a11 . O primeiro passo é adicionar a primeira linha a
todas as outras restantes, multiplicada por fatores de forma que anulem todos os elementos
seguintes da primeira coluna que estão abaixo de a11 . Dessa forma, obtemos a matriz
abaixo, que é equivalente à matriz A,
 
a11 a12 . . . a1n
 0 a22 . . . a2n 
..  ∼ A
 
 .. .. ..
 . . . . 
0 am2 . . . amn
A seguir, procedemos com a22 em relação à segunda coluna, como procedemos com a11
em relação à primeira coluna. Daı́, obtemos a matriz
 
a11 a12 a13 . . . a1n
 0 a22 a23 . . . a2n 
 
 0 0 a33 . . . a2n 
 ∼A
 .. .. .. .. 
 . . . . 
0 0 am3 . . . amn
E assim, procedemos de modo análogo para os restantes aii até que o escalonamento
termine ou porque não há mais linhas ou porque as linhas que existem são todas formadas
por zeros. A matriz ao final do processo, dada abaixo, terá uma forma onde nela figure uma
matriz ou uma submatriz triangular da maior ordem possı́vel com elementos principais
não nulos. Uma matriz nessa forma é chamada de escalonada.
 
a11 a12 a13 . . . a1k . . . a1n
 0 a22 a23 . . . a2k . . . a2n 
 
 0 0 a33 . . . a3k . . . a3n 
∼A
 
 0 0 0 . . . a . . . a
 4k 4n 
 . .. .. ..
 ..

. . . 
0 0 0 ... ... 0
Ao final, podemos dividir cada linha i, onde aii for não nulo, por aii , de modo a ter 1 no
lugar destes aii .
Vejamos como fazer o escalonamento através de exemplos.
 
2 4 −1
Exemplo 31. Seja A =  0 −3 2 .
6 1 0
21
1o ) Temos que a11 = 2. Como a entrada a21 , logo abaixo de a11 , é igual a zero, o primeiro
passo (ou etapa) é substituir a linha 3 pela linha 1 multiplicada por (−3) e somada pela
linha 3. Vamos representar esta operação por: L3 → (−3).L1 + L3 . Assim, obtemos a
matriz  
2 4 −1
 0 −3 2 
0 −11 3
Por praticidade, escrevemos este procedimento como:
   
2 4 −1 2 4 −1
A =  0 −3 2  L3 → −3.L1 + L3 ∼  0 −3 2 
6 1 0 0 −11 3
2o ) Tendo a primeira coluna no modo desejado, o próximo passo é deixar o elemento a32
11
igual a 0. Para isso basta multiplicar a segunda linha por − e somar com a terceira.
3
Assim, obtemos
−1
 

2 4 −1
 2 4
 0 −3 2  L3 → − 11 .L2 + L3 ∼ 
 0 −3 2 
3 13

0 −11 3 0 0 −
3
E o processo acaba, já que chegamos a uma matriz na forma desejada. Caso quiséssemos
1
deixar os elementos principais iguais a 1, bastaria multiplicar a primeira linha por , a
2
1 3
segunda por − e a terceira por − . Assim, temos
3 13
−1
  
2 4 1 2 − 21

A ∼  0 −3 2  ∼  0 1 − 23 

13
0 0 − 0 0 1
3
De forma resumida escrevemos da seguinte maneira:
 
2 4 −1
A =  0 −3 2  L3 → −3.L1 + L3
6 1 0
 
2 4 −1
11
∼  0 −3 2  L3 → − .L2 + L3
3
0 −11 3
−1
 
2 4 L1 → 12 .L1

1 2 − 21

∼  0 −3 2  L2 → − 31 .L2 ∼  0 1 − 23 

13 3
0 0 − L3 → − 13 .L3 0 0 1
3
 
0 3 2 −1
Exemplo 32. Seja A =  2 8 0 4 . Vamos escalonar a matriz A.
1 5 −1 2
1o ) Note que a11 = 0 e que a31 = 1. Assim, vamos trocar as linhas 1 e 3 de posição.
Poderı́amos também trocar as linhas 1 e 2, já que a21 = 2 6= 0. Então, temos que:
   
0 3 2 −1 1 5 −1 2
 2 8 0 4 ∼ 2 8 0 4 
1 5 −1 2 0 3 2 −1
2o ) Agora,substituindo a linha
 2  por −2 e somando com a linha
pela linha 1 multiplicada
1 5 −1 2 1 5 −1 2
2 temos:  2 8 0 4  ∼  0 −2 2 0 
0 3 2 −1 0 3 2 −1
Logo, a primeira coluna está na forma desejada.
   
1 5 −1 2 1 5 −1 2
1
3o ) Multiplicando a linha 2 por − , temos  0 −2 2 0  ∼  0 1 −1 0 
2
0 3 2 −1 0 3 2 −1
4o ) Substituindo a 
linha
3 pela linha 2 multiplicada
 por −3 e somada com a linha 3, temos
1 5 −1 2 1 5 −1 2
 0 1 −1 0  ∼  0 1 −1 0 
0 3 2 −1 0 0 5 −1
23
1
Finalmente, multiplicamos a linha 3 por , e obtemos
5
   
1 5 −1 2 1 5 −1 2
 0 1 −1 0  ∼  0 1 −1 0  .
0 0 5 −1 0 0 1 − 51
2 1 4
 

 1 1 0 

Exemplo 33. Seja M = 
 0 2 3 , escalone a matriz M .

 −1 4 −5 
3 2 6
Vejamos. Escrevendo resumidamente, temos:
2 1 4
 

 1 1 0 
 L1 → L2

 0 2 3 
 L2 → L1
 −1 4 −5 
3 2 6
1 1 0
 
 2 1 4  L2 → −2.L1 + L2
 
∼
 0 2 3  L4 →
 L1 + L4
 −1 4 −5  L5 → −3.L1 + L5
3 2 6
1 1 0
 
 0 −1 4  L2 → − 1.L2
  L3 → 2.L2 + L3
∼
 0 2 3 
 L4 → 5.L2 + L4
 0 5 −5 
L5 → −1.L2 + L5
0 −1 6
1 1 0
 
 0 1 −4 
  1
∼
 0 0 11 
 L3 → 11 .L3
 0 0 15 
0 0 2
1 1 0
 

 0 1 −4 
 L4 → −15.L3 + L4
∼
 0 0 1  L5 → −2.L3 + L5
 0 0 15 
0 0 2
1 1 0
 

 0 1 −4 

∼
 0 0 1 
 0 0 0 
0 0 0
Portanto,
1 1 0
 

 0 1 −4 

M ∼
 0 0 1 
 0 0 0 
0 0 0
5. Determinante
Definição 34. (Função determinante) Uma função f : Mn×n (R) → R é chamada de

função determinante se possui as seguintes propriedades.
(i) f (A) = 0, se A tem colunas L.D..
(ii) f (In ) = 1.
(iii) f (A) é forma multilinear das colunas de A.
O item (iii) significa que uma função determinante é uma transformação linear quando
fixamos todas as colunas e variamos apenas uma delas: para todo escalar λ, todo vetor
coluna v e toda coluna cj ,
f (c1 , . . . , λcj , . . . , cn ) = λf (c1 , . . . , cj , . . . , cn )
f (c1 , . . . , cj + v, . . . , cn ) = f (c1 , . . . , cj , . . . , cn ) + f (c1 , . . . , v, . . . , cn ).
Faremos uma definição de determinante usando permutações.

25
Definição 35. Seja n ∈ N. Uma aplicação bijetiva

σ : {1, 2, . . . , n} → {1, 2, . . . , n}, j 7→ σ(j)
é chamada de permutação de {1, 2, . . . , n}.
O conjunto de todas as permutações de {1, 2, . . . , n} é denotado por Sn e sua cardinalidade

é n!.
Uma permutação σ ∈ Sn por ser escrita na forma

[σ(1)σ(2) · · · σ(n)].
Por exemplo, S1 = {[1]}, S2 = {[1 2], [2 1} e

S3 = {[1 2 3], [1 3 2], [2 1 3], [2 3 1], [3 1 2], [3 2 1]}.
• O conjunto Sn com a composição de funções formam um grupo, chamado de grupo

simétrico.
Definição 36. Uma permutação τ ∈ Sn é chamada de transposição, se troca exata-

mente dois elementos distintos k, l ∈ {1, . . . , n}, isto é, se τ (k) = l, τ (l) = k, e τ (j) = j
para todo j ∈ {1, . . . , n} \ {k, l}.
Definição 37. Sejam n ≥ 2 e σ ∈ Sn . O par (σ(i), σ(j)) com 1 ≤ i < j ≤ n e

σ(i) > σ(j) é chamado uma inversão de σ. Se k é o número de inversões de σ, então
sgn(σ) := (−1)k é chamado de sinal de σ. Para n = 1 definimos sgn([1]) := 1 = (−1)0 .
Em outras palavras, uma inversão de uma permutação é um par que está “ fora de ordem”.
• Não confunda a nomenclatura inversão com aplicação inversa.
Exemplo 38. A permutação [2 3 1 4] ∈ S4 possui duas inversões: (2, 1) e (3, 1). Logo,
sgn([2 3 1 4]) = (−1)2 = 1. Já a permutação [4 1 2 3] ∈ S4 possui três inversões: (4, 1),
(4, 2) e (4, 3). Logo, sgn([4 1 2 3]) = (−1)3 = −1.
Definição 39. (Determinante) A aplicação
det : Mn×n (R) → R

X n
Y
A = (aij ) 7→ det(A) := sgn(σ) aiσ(i)
σ∈Sn i=1
é chamada de determinante, e o número det(A) é chamado de determinante de A.
A fórmula dada na definição anterior é chamada de fórmula de assinatura de Leibniz.
Exemplo 40. Para n = 1, temos A = [a11 ] e assim det(A) = sgn([1])a11 = a11 .

Para n = 2, temos

a11 a12
det(A) = det = sgn([1 2])a11 a22 + sgn([2 1])a12 a21 = a11 a22 − a12 a21 .
a21 a22
Para n = 3, temos a regra de Sarrus (Pierre Fréderic Sarrus, 1798-1861).

= a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a11 a23 a32 − a12 a21 a33 − a13 a22 a31 .
• Observamos que para computar det(A) usando a fórmula de assinatura de Leibniz temos
que computar n! produtos com n fatores cada. Para n grande o custo para se calcular
o determinante é alto. Veremos mais adiante (Corolário 50) uma maneira mais eficiente
de computar det(A). Mas, claro, a fórmula de Leibniz é muito importante, já que ela
representa o determinante de A explicitamente em termos das entradas de A.
A seguir, apresentamos algumas propriedades do determinante. Antes enunciaremos al-

guns resultados envolvendo permutações que serão importantes para obtermos tais pro-
priedades.
Teorema 41. Para quaisquer σ1 , σ2 ∈ Sn , temos que sgn(σ1 ◦ σ2 ) = sgn(σ1 )sgn(σ2 ). Em

particular, sgn(σ −1 ) = sgn(σ), para todo σ ∈ Sn .
Demonstração. Ver livro Linear Algebra de J. Liesen e V. Mehrmann, Teorema 7.7.
Lema 42. Seja τ ∈ Sn uma transposição que troca k e l, com 1 ≤ k < l ≤ n. Então, τ
tem exatamente 2(l − k) − 1 inversões e, assim, sgn(τ ) = −1.
Demonstração. Ver livro Linear Algebra de J. Liesen e V. Mehrmann, Lema 7.9.

27
Lema 43. Seja A ∈ Mn×n (R). Então, as seguintes propriedades são válidas.
(1) Para λ ∈ R,

λ ? λ 01×n
det = det = λ det(A).
0n×1 A ? A
n
Y
(2) Se A = (aij ) é uma matriz triangular (superior ou inferiror), então det(A) = aii .
i=1
(3) Se A tem uma linha, ou coluna, nula (formada só por zeros), então det(A) = 0.
(4) Se n ≥ 2 e A tem duas linhas, ou colunas, iguais, então det(A) = 0.
(5) det(A) = det(AT ).

λ ?
Demonstração. (1) Seja B = . Note que, b11 = λ, bi1 = 0, para todo
0n×1 A
i = 2, . . . , n + 1, e bij = ai−1j−1 , para todo i, j ≥ 2. Pela definição de determinante temos
que det(B) = σ∈Sn+1 sgn(σ) n+1
P Q
i=1 biσ(i) . Agora, como bi1 = 0, para todo i = 2, . . . , n+1,
a parcela em det(B) que possui uma permutação σ com σ(1) 6= 1 será igual a zero. Então,
X n+1
Y X Yn
podemos escrever det(B) = b11 sgn(σ) biσ(i) = b11 sgn(σ) aiσ(i) =
σ∈Sn+1 ,σ(1)=1 i=2 σ∈Sn i=1
λ det(A).
(2) Segue aplicando o item anterior repetidas vezes começando da matriz A.
(3) Se A possui uma linha ou coluna nula, então para todo σ ∈ Sn pelo menos um dos
n
Y
fatores no produto aiσ(i) é igual a zero, e daı́ det(A) = 0.
i=1
(4) Sejam k e l, com k < l, as linhas iguais de A = (aij ), ou seja, akj = alj para todo
j = 1, . . . , n. Seja τ ∈ Sn uma transposição que troca os elementos k e l, e seja
Tn := {σ ∈ Sn ; σ(k) < σ(l)}.
Como o conjunto Tn contém todas as permutações σ ∈ Sn tais que σ(k) < σ(l), segue que
|Sn |
|Tn | = e Sn \ Tn = {σ ◦ τ ; σ ∈ Tn }.
2
Além disso, 
 aiσ(i) , i 6= k, l,
ai(σ◦τ )(i) = a , i = k,
 kσ(l)
alσ(k) , i = l.
Temos que akσ(l) = alσ(l) e alσ(k) = akσ(k) . Daı́, usando o Teorema 41 e o Lema 42, obtemos
o seguinte
X n
Y X n
Y
sgn(σ) aiσ(i) = sgn(σ ◦ τ ) ai(σ◦τ )(i)
σ∈Sn \Tn i=1 σ∈Tn i=1
X n
Y X n
Y
= −sgn(σ) ai(σ◦τ )(i) = − sgn(σ) aiσ(i) .
σ∈Tn i=1 σ∈Tn i=1
Isso implica que
X n
Y X n
Y X n
Y
det(A) = sgn(σ) aiσ(i) = sgn(σ) aiσ(i) + sgn(σ) aiσ(i) = 0.
σ∈Sn i=1 σ∈Tn i=1 σ∈Sn \Tn i=1
A prova para o caso de duas colunas iguais é análoga.
(5) Primeiramente, observamos que, para todo σ ∈ Sn
{(σ(i), i) ; 1 ≤ i ≤ n} = {(i, σ −1 (i)) ; 1 ≤ i ≤ n}.

De fato, fixado 1 ≤ i ≤ n, então σ(i) = j se, e somente se, i = σ −1 (j). Assim, (σ(i), i) =
(j, i) é um elemento do primeiro conjunto se, e somente se, (j, σ −1 (j)) = (j, i) é um
elemento do segundo conjunto. Como σ é bijetora, os dois conjunto são iguais.
Seja A = (aij ). Logo, AT = (bij ) com bij = aji . Então,
X n
Y X n
Y
T
det(A ) = sgn(σ) biσ(i) = sgn(σ) aσ(i)i
σ∈Sn i=1 σ∈Sn i=1
X n
Y X n
Y
−1 −1
= sgn(σ ) aσ(i)i = sgn(σ ) aiσ−1 (i)
σ∈Sn i=1 σ∈Sn i=1
X n
Y
= sgn(σ) aiσ(i) = det(A)
σ∈Sn i=1
Qn
Usamos que sgn(σ) = sgn(σ −1 ) (Teorema 41), e o fato de que os produtos i=1 aσ(i)i e
Qn
i=1 aiσ −1 (i) possuem os mesmos fatores.
29
• Note que, pelo item (2) do resultado anterior, det(In ) = 1.
Escrevendo In = (e1 , e2 , · · · en ), para σ ∈ Sn a matriz

Pσ := (eσ(1) , eσ(2) , · · · eσ(n) )
é chamada de matriz de permutação associada a σ. Essa aplicação do grupo Sn para

o grupo das matrizes de permutação em Mn×n (R) é bijetiva. A inversa de uma matriz de
permutação é sua transposta (veja Teorema 4.16 livro Linear Algebra de J. Liesen e V.
Mehrmann) e temos que
Pσ−1 = PσT = Pσ−1 .
Observação 44. Escrevendo A = (a1 , a2 , · · · an ), ou seja, aj ∈ Mn×1 (R) é a j-ésima

coluna de A, então temos que
APσ = (aσ(1) , aσ(2) , · · · aσ(n) ),
isto é, a multiplicação de A à direita com Pσ troca as colunas de A de acordo com a

permutação σ. Se por outro lado, ai ∈ M1×n (R) é a j-ésima linha de A, então
 
aσ(1)
 aσ(2) 
PσT A = ,
 
..
 . 
aσ(n)
isto é, a multiplicação de A à esquerda com PσT troca as linhas de A de acordo com a
permutação σ.
Lema 45. Sejam σ ∈ Sn e Pσ matriz de permutação associada à σ. Então, sgn(σ) =

det(Pσ ). Além disso, se n ≥ 2 e
Pij := (e1 , · · · ei−1 , ej , ei+1 , · · · ej−1 , ei , ej+1 , · · · en ),
então det(Pij ) = −1.
Demonstração. Se σ̃ ∈ Sn e Pσ̃ = (aij ), então aσ̃(j)j = 1 para j = 1, . . . , n, e todas as

outras entradas de Pσ̃ são iguais a zero. Assim,
X n
Y n
Y
det(Pσ̃ ) = det(Pσ̃T ) = sgn(σ) aσ(j)j = sgn(σ̃) aσ̃(j)j = sgn(σ̃).
σ∈Sn j=1 j=1
| {z }
| {z } =1
=0 para σ6=σ̃
A matriz de permutação Pij é associada com a transposição que troca i e j. Assim, pelo
Lema 42, segue que det(Pij ) = −1.
Observação 46. Para λ ∈ R, considere as seguintes matrizes
Mi (λ) := (e1 , · · · ei−1 , λei , ei+1 , · · · en )

e
Gij (λ) := (e1 , · · · ei−1 , ei + λej , ei+1 , · · · en ).
Então, det(Mi (λ)) = λ e det(Gij (λ)) = 1.
De fato, como Mi (λ) e Gij (λ) são matrizes triangulares, as igualdades seguem diretamente
do item (2) do Lema 43.
Lema 47. Sejam A ∈ Mn×n (R), n ≥ 2, e λ ∈ R. As seguintes propriedades são válidas.
(1) A multiplicação de uma linha de A por λ implica a multiplicação de det(A) por λ:

det(Mi (λ)A) = λ det(A) = det(Mi (λ)) det(A).
(2) A adição de uma linha de A multiplicada por λ a outra linha de A não altera o
determinante de A: det(Gij (λ)A) = det(A) = det(Gij (λ)) det(A), e det(Gij (λ)T A) =
det(A) = det(Gij (λ)T ) det(A).
(3) Trocando duas linhas de A se altera o sinal do determinante de A: det(Pij A) =

− det(A) = det(Pij ) det(A).
Demonstração. (1) Se A = (amk ) e Ã = Mi (λ)A = (ãmk ), então

amk , m 6= i,
ãmk =
λamk m = i.
Daı́,
X n
Y X n
Y
det(Ã) = sgn(σ) ãmσ(m) = sgn(σ) ãiσ(i) ãmσ(m)
σ∈Sn m=1 σ∈Sn
| {z } m=1,m6=i
| {z }
=λaiσ(i) =amσ(m)
31
X n
Y n
X Y
= sgn(σ)λ amσ(m) = λ sgn(σ) amσ(m) = λ det(A).
σ∈Sn m=1 σ∈Sn m=1
(2) Se A = (amk ) e Ã = Gij (λ)A = (ãmk ), então

amk , m 6= j,
ãmk =
ajk + λaik m = j.
Então,
X n
Y X n
Y
det(Ã) = sgn(σ) ãmσ(m) = sgn(σ)(ajσ(j) + λaiσ(j) ) amσ(m)
σ∈Sn m=1 σ∈Sn m=1,m6=j
X n
Y X n
Y
= sgn(σ) amσ(m) + λ sgn(σ)aiσ(j) amσ(m) .
σ∈Sn m=1 σ∈Sn m=1,m6=j
Note que, o primeiro termo é igual a det(A), e o segundo termo é igual a λ multiplicado
pelo determinante de uma matriz com duas linhas iguais, e assim igual a zero.
A prova para a matriz Gij (λ)T A é análoga.
(3) A matriz de permutação Pij troca as linhas i e j de A, em que i < j. Essa troca
pode ser expressada através das seguintes quatro operações elementares: multiplicar a
linha j por −1 (Lj → −Lj ); adicionar a linha i na linha j (Lj → Li + Lj ); adicionar
a linha j multiplicada por −1 na linha i (Li → Li − Lj ); adicionar a linha i na linha j
(Lj → Li + Lj ). Portanto,
Pij = G(ij)(1)(G(ij)(−1))T Gij (1)Mj (−1).
Daı́, usando os itens (1) e (2) anteriores obtemos
det(Pij A) = det(G(ij)(1)(G(ij)(−1))T Gij (1)Mj (−1)A)

= det(G(ij)(1)) det((G(ij)(−1))T ) det(Gij (1)) det(Mj (−1)) det(A) = (−1) det(A).
• Agora, como det(A) = det(AT ), os resultados do lema anterior para linhas de A podem
ser reformulados de forma análoga para colunas de A.
Teorema 48. Seja A ∈ Mn×n (R). Então, existem matrizes invertı́veis S1 , . . . , St ∈

Mn×n (R), que são produtos de matrizes elementares, tais que M := St · · · S1 · A está na
forma escalonada.
Demonstração. Veja Teorema 5.2 do livro Linear Algebra de J. Liesen e V. Mehrmann.
Teorema 49. Sejam A, B ∈ Mn×n (R). Então, det(AB) = det(A) det(B). Mais ainda,
se A é invertı́vel, então det(A−1 ) = (det(A))−1 .
Demonstração. Pelo Teorema 48 sabemos que para A ∈ Mn×n (R) existem matrizes ele-
mentares invertı́veis S1 , . . . , St tais que Ã = St · · · S1 · A está na forma escalonada. Assim,
podemos escrever A = S1−1 · · · St−1 · Ã, e pelo Lema 47 temos que
det(A) = det(S1−1 · · · St−1 · Ã) = det(S1−1 ) · · · det(St−1 ) det(Ã),
e também
det(AB) = det(S1−1 · · · St−1 · ÃB) = det(S1−1 ) · · · det(St−1 ) det(ÃB).
Se A é não invertı́vel, então Ã não é invertı́vel, e consequentemente ÃB, tem uma linha
igual a zero. Então, det(Ã) = det(ÃB) = 0, o que implica que det(A) = 0, e temos que
det(AB) = 0 = det(A) det(B). Caso contrário, se A é invertı́vel, então Ã = In , já que Ã
está na forma escalonada. Logo, A = S1−1 · · · St−1 e ÃB = B. Agora, como det(In ) = 1
temos que det(Ã) = 1, e concluı́mos que det(AB) = det(A) det(B).
Finalmente, para concluirmos a última afirmação do enunciado, se A é invertı́vel, então

1 = det(In ) = det(AA−1 ) = det(A) det(A−1 ), e temos que det(A−1 ) = (det(A))−1 .
O teorema anterior nos diz que det(A) pode ser computado transformando A em uma
matriz escalonada.
Corolário 50. Sejam A ∈ Mn×n (R) e S1 , . . . , St ∈ Mn×n (R) matrizes elementares tais
que Ã = St · · · S1 · A é da forma escalonada. Então, ou Ã tem uma linha formada por
zeros, e assim det(Ã) = 0, ou Ã = In e assim det(A) = (det(S1 ))−1 · · · (det(St ))−1 .
O Método de Laplace
Apesar do uso de escalonamento ser mais eficiente para calcular determinantes, há outros
métodos conhecidos que também podem ser úteis. Um deles é o método de Laplace
(Pierre-Simon Laplace, 1749-1827). Para vermos como esse método funciona precisamos
das seguintes definições.
33
Definição 51. Seja A uma matriz quadrada de ordem n. Denotaremos por [A]ij a matriz
quadrada de ordem n − 1 obtida de A removendo sua i-ésima linha e j-ésima coluna.
O menor complementar de A relativo ao elemento aij é det([A]ij ).
O cofator de um elemento aij de A é (−1)i+j det([A]ij ), e será denotado por cof (A, i, j).
Exemplo 52. Considere a matriz

 
3 −2 1
A= 0 4 5 
−6 7 6
O menor complementar do elemento a23 é

3 −2
det([A]23 ) = det = 3 · 7 − (−2) · (−6) = 21 − 12 = 9.
−6 7
Já o cofator é (−1)2+3 det([A]23 ) = −9.
O Teorema de Laplace para se calcular o determinante de uma matriz quadrada é o

seguinte.
Teorema 53. Seja A ∈ Mn×n (R). Então, para qualquer linha i de A,

n
X
det(A) = aij (−1)i+j det([A]ij ).
j=1
Demonstração. Veja Teorema 5.25 no livro Álgebra Linear, de J. C. Pellegrini.
Exemplo 54. Seja

2 −1 −2
 
1
 0 3 4 1 
A=
 3
.
5 0 0 
−1 2 3 1
Vamos escolher a linha 3 já que ela possui dois zeros e isso facilita nossos cálculos.
det(A) = 3(−1)3+1 det([A]31 ) + 5(−1)3+2 det([A]32 ) + 0(−1)3+3 det([A]33 ) + 0(−1)3+4 det([A]34 )
= 3(−1)3+1 det([A]31 ) + 5(−1)3+2 det([A]32 )

   
2 −1 −2 1 −1 −2
= 3 det  3 4 1  + (−5) det  0 4 1 
2 3 1 −1 3 1
= 3 · 1 + (−5) · (−6) = 33.
A transposta da matriz dos cofatores de uma matriz A é chamada de matriz adjunta

de A, denotada por adj(A). Assim,
adj(A) = (cof (A, i, j))T .

a b
Exemplo 55. Se A = , a matriz formada pelos cofatores de A será
c d
(−1)1+1 det(d) (−1)1+2 det(c)

d −c
cof (A) = = .
(−1)2+1 det(b) (−1)2+2 det(a) −b a

d −b
Daı́, adj(A) = .
−c a
 
a b c
Exemplo 56. Se A =  d e f . A matriz formada pelos cofatores de A será
g h i
 
e f d f d e
 det h i − det det
 g i g h 

b c a c a b
 
cof (A) =  − det det − det .
 
 h i g i g h 
 
b c a c a b
− det
 
det det
e f d f d e
E assim, temos
adj(A) = (cof (A))T .

35
Teorema 57. Seja A ∈ Mn (R). Então,

A · adj(A) = adj(A) · A = det(A) · Id .
Demonstração. Vamos mostrar que A · adj(A) = det(A) · Id . (a outra igualdade se mostra

de maneira análoga usando coluna ao invés de linha)
Sejam i, j ∈ {1, . . . , n} e Aij o cofator de aij .
Se i = i, calculado o determinante pelo método de Laplace pela linha i temos que
Xn
det(A) = aik Aik .
k=1
Se i 6= j, defina A0 como sendo a matriz obtida substituindo a linha j de A pela linha i

de A. Assim, A0 = (a0ij ) possui duas linhas iguais, e então temos que
n
X n
X
0
0 = det(A ) = a0jk A0jk (expandindo o determinante sobre a linha j) = aik Ajk .
k=1 k=1
Logo, pela definição de produto de matriz, o elemento/entrada (i, j) de A · adj(A) é
n
X 0 para i 6= j
aik Ajk = .
det(A) para i = j
k=1
Portanto, temos que A · adj(A) = det(A) · Id .
6. Inversão de Matrizes
Vamos começar esta seção com o seguinte resultado.
Teorema 58. Seja A ∈ Mn (R). A matriz A é invertı́vel se, e somente se, det(A) 6= 0.
Demonstração. (⇒) Se A é invertı́vel, então existe A−1 tal que AA−1 = Id e o resultado
segue do Teorema 49.
(⇐) Se det(A) 6= 0, então pelo Teorema 57 temos que

adj(A)
A· = Id .
det(A)

adj(A)
Logo, A−1 = , e temos que A é invertı́vel.
det(A)
Matriz Singular e Não-Singular: Chamamos uma matriz quadrada A de singular se o

determinante de A for nulo, ou seja, se det(A) = 0. Caso contrário, dizemos que a matriz
A é não-singular (ou regular).

−1 3
Exemplo 59. A matriz A = é uma matriz singular.
−2 6

1 5
Já a matriz B = é não-singular.
2 7
Observação 60. Se A é uma matriz singular, então ela não possui inversa. Mas, se A é
não-singular, então ela possui inversa. Lembre que det(I) = 1 e que se A possui inversa,
então A.A−1 = I.
Propriedades da matriz inversa:
1) Se uma matriz A admite inversa, então esta inversa é única.
2) Se A é uma matriz não-singular, então sua inversa A−1 também é não-singular. Além
disso, a inversa de A−1 é A, ou seja, (A−1 )−1 = A.
3) A inversa da matriz identidade I é ela mesma, ou seja, I −1 = I.

37
4) Se a matriz A é não-singular, então AT também é não-singular. Além disso, (A−1 )T é

a inversa de AT .
5) Se A e B são matrizes não-singulares de mesma ordem, então o produto AB também

é uma matriz não-singular e (AB)−1 = B −1 A−1 .
Demonstração. 1) Suponhamos que A admite inversa e que B e C são duas inversas de

A. Vejamos que B = C. De fato, como B é inversa de A, então A.B = I. Multiplicando
ambos os lados desta igualdade pela matriz C, temos que C.(A.B) = C.I ⇒ (C.A).B =
C ⇒ I.B = C ⇒ B = C. c.q.d. (como querı́amos demonstrar)
2) Suponhamos que A é não-singular, ou seja, det(A) 6= 0. Como A.A−1 = I e det(I) = 1,

segue que det(A.A−1 ) = 1 ⇒ det(A).det(A−1 ) = 1. Agora, det(A) 6= 0 e então temos que
1
det(A−1 ) = 6= 0. c.q.d.
det(A)
3) Segue diretamente do fato de que I.I = I.
4) Sabemos que det(AT ) = det(A). Logo, se A é não-singular, então é claro que AT

também será não-singular. Agora, vejamos que (A−1 )T é a inversa de AT .
De fato, (A−1 )T .AT = (A.A−1 )T = I T = I. Portanto (A−1 )T = (AT )−1 . c.q.d.
5) Suponhamos que A e B são matrizes não-singulares de mesma ordem.

Então, como det(AB) = det(A).det(B), segue que AB é não-singular. Para mostrar que
(AB)−1 = B −1 A−1 , basta observar que (B −1 A−1 ).(AB) = I.

Um método para se inverter uma matriz quadrada A utilizando as operações elementares,

dadas na seção onde estudamos escalonamento, é o seguinte:
1o ) coloca-se à direita da matriz A a matriz I, separada por um traço vertical;
2o ) transforma-se, por meio de operações elementares, a matriz A na matriz I, aplicando-

se simultaneamente à matriz I, as mesmas operações elementares.
3o ) a matriz que estará à direita da matriz I, ao final do processo, será a inversa de A,

que é A−1 .
As mesmas operações elementares que transformarão a matriz A na matriz identidade I,

transformarão I na matriz A−1 .
Vejamos como fazer este processo através de alguns exemplos.

3 −2
Exemplo 61. Vamos determinar a inversa de A = .
2 −1
Primeiramente, vamos colocar a matriz I à direita de A, separando-as com um traço.

3 −2 1 0
2 −1 0 1
Agora, vamos transfomar, utilizando operações elementares, a A na matriz I.

3 −2 1 0 1
−→ L1 → .L1
2 −1 0 1 3
1 − 32 13 0

⇒ −→ L2 → 2.L1 − L2
2 −1 0 1
1 − 32 1

3
0
⇒ −→ L2 → −3.L2
0 − 13 2
3
−1
1 − 23 13 0

2
⇒ −→ L1 → .L2 + L1
0 1 −2 3 3

1 0 −1 2
⇒
0 1 −2 3

−1 −1 2
Portanto, a inversa de A será A = .
−2 3
39

3 −2 −1 2 3.(−1) + (−2).(−2) 3.2 + (−2).3 1 0
Note que . = = .
2 −1 −2 3 2.(−1) + (−1).(−2) 2.2 + (−1).3 0 1
 
−2 4 0
Exemplo 62. Determine a inversa da matriz M =  1 0 0 .
3 6 −1
A primeira coisa a fazer é colocar a matriz I à direita de M , separando-as com um traço.
 
−2 4 0 1 0 0
 1 0 0 0 1 0 
3 6 −1 0 0 1
Utilizando as operações elementares teremos:
 
−2 4 0 1 0 0
 1 0 0 0 1 0  −→ Permutamos as linhas L1 e L2
3 6 −1 0 0 1
 
1 0 0 0 1 0
⇒  −2 4 0 1 0 0  −→ L2 → 2.L1 + L2
3 6 −1 0 0 1
 
1 0 0 0 1 0
1
⇒  0 4 0 1 2 0  −→ L2 → .L2
4
3 6 −1 0 0 1
 
1 0 0 0 1 0
⇒  0 1 0 14 12 0  −→ L3 → 3.L1 − L3
3 6 −1 0 0 1
 
1 0 0 0 1 0
⇒  0 1 0 14 12 0  −→ L3 → 6.L2 + L3
0 −6 1 0 3 −1
 
1 0 0 0 1 0
⇒  0 1 0 14 12 0 
0 0 1 32 6 −1
 
0 1 0
Logo, temos que M −1 =  1
4
1
2
0 .
3
2
6 −1
Faça os produtos M.M −1 e M −1 .M e comprove que de fato eles resultam na matriz iden-
tidade.
41
7. Sistemas Lineares
Nesta seção, vamos estudar sistemas de equações lineares, que constituem um tópico de
muito interesse prático. Veremos como classificá-los e resolvê-los.
Para começar vamos ver como é definida uma equação linear.
Uma equação linear é uma equação da forma: a1 x1 + a2 x2 + . . . + an xn = b, na

qual x1 , x2 , . . . , xn são chamados de variáveis (ou incógnitas); a1 , a2 , . . . , an são chamados
coeficientes das variáveis; e b é chamado de termo independente.
Os valores das variáveis x1 , x2 , . . . , xn que satisfazem a equação são chamados de solução

da equação.
Um sistema de equações lineares, ou simplesmente sistema linear, é um conjunto de

equações lineares. Representamos um sistema linear de m equações com n variáveis da
seguinte maneira:


 a11 x1 + a12 x2 + . . . + a1n xn = b1
 a21 x1 + a22 x2 + . . . + a2n xn = b2

..


 .
am1 x1 + am2 x2 + . . . + amn xn = bm

Sistema possı́vel: Um sistema que admite solução é chamado de sistema possı́vel.
Exemplo 63. O sistema

−x + 2y = 0
x−y =1
é um sistema possı́vel, já que x = 2 e y = 1 é uma solução.
Sistema determinado: Um sistema possı́vel é chamado de sistema determinado quando

possui uma única solução.
O exemplo anterior é um exemplo de um sistema determinado.

Sistema indeterminado: Um sistema possı́vel é chamado de sistema indeterminado

quando possui mais de uma solução (no caso infinitas).

x + 2y = 1
2x + 4y = 2
é um sistema possı́vel e indeterminado, já que x = −1 e y = 2 é uma solução, x = 1 e
y = 0 também é uma solução, assim como todos os valores de x e y tais que x = 1 − 2y.
Sistema impossı́vel: Um sistema linear é chamado de sistema impossı́vel quando não

possui solução.

x + 2y = 0
x + 2y = 2
é um sistema impossı́vel, já que a expressão 2x + y não pode ser simultaneamente igual a
0 e igual a 2.
Sistema homogêneo: Quando os termos independentes de um sistema linear são todos

nulos o chamamos de sistema homogêneo.
Exemplo 66. O sistema 

 x + 2y + 3z = 0
2x − 2y + z = 0
−2x + 5y − 4z = 0

é um sistema homogêneo.
Observação 67. Note que um sistema homogêneo sempre possui pelo menos uma solução,
que é x1 = x2 = . . . = xn = 0. Essa solução é chamada de solução trivial.
Teorema 68. Seja A ∈ Mn (R). O sistema homogêneo AX = (0) tem solução não trivial
se, e somente se, det(A) = 0.
Sistemas equivalentes: Dizemos que dois, ou mais, sistemas de equações lineares são
equivalentes quando eles possuem a mesma solução.
43
Exemplo 69. Os sistemas

−x + 2y = 0
x−y =1
e
−2x + 4y = 0
2x − 2y = 2
são equivalentes, pois possuem a mesma solução x = 2 e y = 1
Operações elementares: Um sistema linear se transforma em um sistema equivalente

quando se efetuam as seguintes operações elementares:
1) Permutação de duas equações.
2) Multiplicação de uma equação por um número real diferente de zero.
3) Substituição de uma equação por sua soma com outra equação previamente multiplicada
por um número real diferente de zero.
Observação 70. Observe que estas operações elementares são análogas às dadas na seção
onde aprednemos a escalonar matrizes. O processo que será feito para resolver um sistema
linear será essencialmente o mesmo para escalonar uma matriz.
Primeiramente, vejamos como encontrar a solução de um sistema de n equações com

n variáveis. Veremos dois métodos para esse propósito, o método de Gauss-Jordan e o
método da matriz inversa.
Solução de um sistema de n equações com n variáveis: método de Gauss-

Jordan
O método de Guass-Jordan consite em trabalhar com as operações elementares a fim de

deixar o sistema inicial equivalente a um sistema cujos termos independentes sejam a sua
solução. O método consiste no seguinte:
1o ) coloca-se ao lado da matriz dos coeficientes a matriz coluna dos termos independen-
tes, separadas por um traço vertical (de maneira semelhante ao processo de inversão de
matrizes);
2o ) transforma-se, por meio de operações elementares, a matriz dos coefientes na matriz

identidade, aplicando-se, simultanemente, à matriz coluna dos termos independentes, as
mesmas operações;
3o ) transformada a matriz dos coeficientes na matriz identidade, a matriz dos termos

independentes ficará transformada, ao final, na solução do sistema.
A matriz, associada ao sistema, formada no primeiro passo, é chamada de matriz am-

pliada do sistema. Cada uma de suas linhas é uma representação abreviada da equação
correspondente no sistema. O traço vertical é dispensável, mas é colocado para facilitar a
visualização da matriz dos coeficientes e da matriz coluna dos termos independentes. O
exemplo a seguir ilustra a aplicação do método de Guass-Jordan.
Exemplo 71. Vamos resolver o sistema


 3x + 2y − 5z = 8
2x − 4y − 2z = −4
x − 2y − 3z = −4

utilizando o método de Guass-Jordan.

O primeiro passo é colocar a matriz coluna dos termos independentes ao lado da matriz
dos coeficientes, separadas por um traço vertical. Ou seja, construir a matriz ampliada
do sistema, que é dada abaixo.
 
3 2 −5 8
 2 −4 −2 −4 
1 −2 −3 −4
Agora, analogamente ao processo feito para encontrar a inversa de uma matriz, vamos
usar operações elementares para transformar a matriz dos coefientes na matriz identi-
dade, aplicando-se, simultanemente,
 à matriz 
coluna dos termos independentes, as mes-
3 2 −5 8
1
mas operações. Vejamos.  2 −4 −2 −4  −→ L1 → L1
3
1 −2 −3 −4
1 23 − 53 83
 
⇒  2 −4 −2 −4  −→ L2 → L2 + (−2)L1
1 −2 −3 −4
45
1 23 − 53 8
 
3
⇒  0 − 16
3
4
3
− 28
3
 −→ L3 → L3 + (−1)L1
1 −2 −3 −4
1 32 − 53 8
 
3
⇒  0 − 16 4
− 28  −→ L2 → − 3 L2
3 3 3
16
0 − 83 − 43 − 20
3
1 23 − 53 8
 
3
⇒  0 1 − 41 7  −→ L3 → L3 + 8 L2
4
3
0 − 38 − 43 − 20
3
1 23 − 53 83
 
2
⇒  0 1 − 14 74  −→ L1 → L1 − L2
3
0 0 −2 −2
1 0 − 32 32
 
1
⇒  0 1 − 14 74  −→ L3 → − L3
2
0 0 −2 −2
1 0 − 32 32
 
3
⇒  0 1 − 14 74  −→ L1 → L1 + L3
2
0 0 1 1
 
1 0 0 3
1
⇒  0 1 − 14 74  −→ L2 → L2 + L3
4
0 0 1 1
 
1 0 0 3
⇒ 0 1 0 2 
0 0 1 1

 3x + 2y − 5z = 8
Portanto, os sistemas 2x − 4y − 2z = −4
x − 2y − 3z = −4


 x + 0y + 0z = 3
e 0x + y + 0z = 2 são equivalentes.
0x + 0y + z = 1

E do último sistema vem que a solução é x = 3, y = 2 e z = 1.
Solução de um sistema de n equações com n variáveis: método de matriz

inversa
Consideremos o sistema de n equações com n variáveis



 a11 x1 + a12 x2 + . . . + a1n xn = b1
 a21 x1 + a22 x2 + . . . + a2n xn = b2

..


 .
an1 x1 + an2 x2 + . . . + ann xn = bn

     
a11 a12 a13 . . . a1n x1 b1
 a21 a22 a23 . . . a2n 

 x2
   b2 
Tomando A =  .. , X =  .. eB=
   
.. .. .. .. .. 
 . . . . .   .   . 
an1 an2 an3 . . . ann xn bn
o sistema pode ser representado na forma matricial A.X = B. Se a matriz A possui

inversa, tem-se A−1 .A.X = A−1 .B. Logo, X = A−1 .B e temos a solução do sistema.
Portanto, se A possui inversa, a solução do sistema A.X = B é obtida de uma forma

muito simples, bastando multiplicar A−1 pela matriz B. Vejamos como fazer isso usando
o exemplo anterior.
Exemplo 72. Resolva o sistema


 3x + 2y − 5z = 8
2x − 4y − 2z = −4
x − 2y − 3z = −4

usando o método da matriz inversa.

 
3 2 −5
O primeiro passo é encontrar, se existir, a inversa da matriz A =  2 −4 −2 .
1 −2 −3
47
Fazendo o procedimento dado

 na seção onde estudamos a inversão de matrizes encontra-
−3
 1 1
4 2 4
mos A−1 =  1
8
− 18 − 18 .
0 14 − 12
−3
   1 1     
x 4 2 4
8 3
1 1 1  
Assim, temos  y  = 
8
−8 −8 . −4  =  2 .
1 1
z 0 4 −2 −4 1
Portanto, a solução do sistema é x = 3, y = 2 e z = 1.
Solução de um sistema de m equações com n variáveis (m 6= n)
O método para resolver um sistema de m equações com n variáveis (m 6= n) é semelhante

ao método de Guass-Jordan. Neste caso, como m 6= n, a matriz dos coeficientes não pode
ser transformada na matriz identidade, pois não é quadrada. Entretanto, o procedimento
será o mesmo: transformar os elementos aii em 1 e em zeros os demais elementos das
colunas em que se situam estes aii . Feito isso se consegue encontrar a solução do sistema.
Vejamos como fazemos isso através de alguns exemplos.

 2x + 3y = 1
x − 2y = −1
4x + 6y = 2

Note que o sistema acima possui 3 equações com 2 variáveis.
Vejamos como resolvê-lo.
1 32 1
   
2 3 1 2
 1 −2 −1  −→ L1 → 1 .L1 ⇒  1 −2 −1  −→ L3 → L3 − 4L1
2
4 6 2 4 6 2
1 32 1
1 23 1
   
2 2 2
⇒  1 −2 −1  −→ L2 → L2 − L1 ⇒  0 − 72 − 32  −→ L2 → − L2
7
0 0 0 0 0 0
1 23 12 1 0 − 71
   
3
⇒  0 1 37  −→ L1 → L1 − L2 ⇒  0 1 37 .
2
0 0 0 0 0 0
1
 
 x + 0.y = − 7  2x + 3y = 1
3
Essa matriz corresponde ao sistema 0.x + y = 7 que é equivalente ao sistema x − 2y = −1
0.x + 0.y = 0 4x + 6y = 2
 
Note que a terceira equação 0.x + 0.y = 0 não estabelece nenhuma condição para x e y,
pois ela é satisfeita para quaisquer valores de x e y. Portanto, a solução do sistema será
dada pelas duas primeiras equações: x + 0.y = − 17 e 0.x + y = 37 , cujas soluções são
1 3
x=− ey= .
7 7

x − 3y + 4z − w = 2
2x − y + 3z − 2w = 19
Note que o sistema acima possui 2 equações com 4 variáveis.
Resolução.

1 −3 4 −1 2 1 −3 4 −1 2
−→ L2 → L2 − 2L1 ⇒ −→ L2 →
2 −1 3 −2 19 0 5 −5 0 15
1
L2
5

1 −3 4 −1 2 1 0 1 −1 11
⇒ −→ L1 → L1 + 3L2 ⇒
0 1 −1 0 3 0 1 −1 0 3
49

1 0 1 −1 11 x = 11 − z + w
A matriz corresponde ao sistema , que é equi-
0 1 −1 0 3 y =3+z
valente ao sistema dado.
Assim, o sistema é possı́vel e indeterminado, pois admite infinitas soluções. Os valores de

x e y são obtidos atribuindo valores arbitrários a z e w. Por exemplo, se z = 1 e w = 1,
temos x = 11 e y = 4. Portanto, x = 11, y = 4, z = 1 e w = 1 é uma solução do sistema.

 2x − 6y = −4
x + 3y = 1
4x + 12y = 2

Resolução.
   
2 −6 −4 1 −3 −2
1
 1 3 1  −→ L1 → L1 ⇒  1 3 1  −→ L2 → L2 − L1
2
4 12 2 4 12 2
   
1 −3 −2 1 −3 −2
1
⇒ 0 6 3  −→ L3 → L3 − 4L1 ⇒  0 6 3  −→ L2 → L2
6
4 12 2 0 24 10
1 0 − 12
   
1 −3 −2
1  1 
⇒ 0 1 2
−→ L1 → L1 + 3L2 ⇒  0 1 2
−→ L3 → L3 − 24L2
0 24 10 0 24 10
1 0 − 12
 
⇒  0 1 12 
0 0 −2
1

 x + 0.y = − 2
A matriz acima corresponde ao sistema 0.x + y = 12 , que é equivalente ao sistema
0.x + 0.y = −2

dado.
Mas não existem valores de x e y que satisfaçam a equação 0.x + 0.y = −2. Portanto, o
sistema é incompatı́vel.
51
8. Espaços e subespaços vetoriais
Definição 76. Corpo: Um anel (K, +, .) comutativo com unidade é um corpo se a

seguinte condição é satisfeita: ∀a ∈ K \ {0}, existe b ∈ K tal que a.b = 1, ou seja, todo
elemento a ∈ K \ {0} é invertı́vel.
• Aqui podemos pensar que K = R.
Definição 77. Espaço vetorial: Sejam V um conjunto não vazio e K um corpo. Di-
zemos que V é um espaço vetorial sobre K se estiverem definidas as seguintes operações:
adição: cada par (u, v) ∈ V × V corresponde a um vetor u + v ∈ V , chamado de soma
de u e v;
multiplicação por escalar: cada par (a, u) ∈ K × V corresponde a um vetor a.u ∈ V ,
denominado produto por escalar de a por u.
Estas operações devem satisfazer, para ∀ u, v, w ∈ V e ∀ a, b ∈ K, as seguintes proprie-
dades:
A1) u + v = v + u (comutatividade de +)
A2) (u + v) + w = u + (v + w) (associatividade +)
A3) existe 0 ∈ V , denominado vetor nulo, tal que 0 + u = u + 0 = u
A4) para cada u ∈ V , existe −u ∈ V , chamado de inverso aditivo de u, tal que (−u)+u =
u + (−u) = 0
M1) (ab).u = a.(b.u)
M2) se 1 é o elemento neutro de K, então 1.u = u
AM1) a.(u + v) = a.u + a.v (distributividade)
AM2) (a + b).u = a.u + b.u
• Os elementos de um espaço vetorial V são chamados de vetores, e os elementos do

corpo K, onde o espaço está definido, são chamados de escalares.
Vejamos, agora, alguns exemplos de conjuntos e operações que se enquadram na estrutura

de espaços vetoriais.
Exemplo 78. O conjunto V = R2 = {(x, y); x, y ∈ R} é um espaço vetorial com as

operações de adição e multiplicação por um número real assim definidas:
(x1 , y1 ) + (x2 , y2 ) = (x1 + x2 , y1 + y2 )
α(x, y) = (αx, αy).
Essas operações são denominadas operações usuais.
Para verificar os oito axiomas de espaço vetorial, sejam u = (x1 , y1 ), v = (x2 , y2 ) e
w = (x3 , y3 ).
A1 ) (u + v) + w = ((x1 , y1 ) + (x2 , y2 )) + (x3 , y3 )

= (x1 + x2 , y1 + y2 ) + (x3 , y3 )
= ((x1 + x2 ) + x3 , (y1 + y2 ) + y3 )
= (x1 + (x2 + x3 ), y1 + (y2 + y3 ))
= (x1 , y1 ) + (x2 + x3 , y2 + y3 )
= (x1 , y1 ) + ((x2 , y2 ) + (x3 , y3 ))
= u + (v + w)
Na primeira igualdade, simplesmente substituı́mos os vetores u, v e w. Na segunda,

aplicamos a definição de soma dentro do parêntese. Na terceira, aplicamos a definição
com o vetor fora do parêntese. Na quarta, aplicamos a associatividade de números reais.
Na quinta, voltamos a usar a definição de soma (agora no sentido contrário da segunda
igualdade). Na sexta, novamente a definição de soma dentro do parêntese. Por fim,
voltamos com u, v e w.
Os axiomas seguintes são estabelecidos de maneira análoga ao primeiro. Um excelente

exercı́cio para o leitor é explicar, por escrito, cada uma das igualdades como foi feito
acima.
A2 ) u + v = (x1 , y1 ) + (x2 , y2 )
= (x1 + x2 , y1 + y2 )
= (x2 + x1 , y2 + y1 )
= (x2 , y2 ) + (x1 , y1 )
= v+u
A3 ) Seja 0 = (0, 0) ∈ R2 , ∀u = (x1 , y1 ) ∈ R2 ,

u+0 = (x1 , y1 ) + (0, 0)
= (x1 + 0, y1 + 0)
= (x1 , y1 )
= u
53
A4 ) ∀u = (x1 , y1 ) ∈ R2 , consideremos (−u) = (−x1 , −y1 ) ∈ R2 ,

u + (−u) = (x1 , y1 ) + (−x1 , −y1 )
= (x1 − x1 , y1 − y1 )
= (0, 0)
= 0
M1 ) (αβ)u = (αβ)(x1 , y1 )
= ((αβ)x1 , (αβ)y1 )
= (α(βx1 ), α(βy1 ))
= α(βx1 , βy1 )
= α(β(x1 , y1 ))
= α(βu)
M2 ) (α + β)u = (α + β)(x1 , y1 )
= ((α + β)x1 , (α + β)y1 )
= (αx1 + βx1 , αy1 + βy1 )
= (αx1 , αy1 ) + (βx1 , βy1 )
= α(x1 , y1 ) + β(x1 , y1 )
= αu + βu
M3 ) α(u + v) = α((x1 , y1 ) + (x2 , y2 ))

= α(x1 + x2 , y1 + y2 )
= (α(x1 + x2 ), α(y1 + y2 ))
= (αx1 + αx2 , αy1 + αy2 )
= (αx1 , αy1 ) + (αx2 , αy2 )
= α(x1 , y1 ) + α(x2 , y2 )
= αu + αv
M4 ) 1u = 1(x1 , y1 )
= (1x1 , 1y1 )
= (x1 , y1 )
= u
Exemplo 79. Da geometria analı́tica se sabe que um par ordenado (x1 , x2 ) de números
reais representa um ponto ou um vetor do plano R2 , assim como uma terna (x1 , x2 , x3 )
representa um ponto ou um vetor no R3 . Em geral, uma quádrupla (x1 , x2 , x3 , x4 ) é um
ponto ou um vetor de R4 e uma n-upla (x1 , x2 , ..., xn ) é um ponto ou um vetor de Rn .
Procedendo como no Exemplo 78, verifica-se que os conjuntos R3 , R4 ,..., Rn são também
espaços vetoriais com as operações usuais de adição e multiplicação por escalar.
Exemplo 80. O conjunto R, em relação às operações usuais de adição e de multiplicação

por escalar, é um espaço vetorial. De fato, sabe-se que a adição de números reais satisfaz
os axiomas A1 , A2 , A3 e A4 e que, na multiplicação, se verificam os axiomas M1 , M2 , M3 e
M4 .
Exemplo 81. Em geral, todo corpo é um espaço vetorial sobre si mesmo.

De fato, se K é um corpo, então as duas operações internas em K (adição e multiplicação)
podem ser vistas como a soma de vetores e a multiplicação por escalares.
Exemplo 82. O conjunto R2 = {(a, b); a, b ∈ R} não é um espaço vetorial em relação às
operações assim definidas:
(a, b) + (c, d) = (a + c, b + d)
α(a, b) = (αa, b), α ∈ R.
Como a adição aqui definida é a usual, verificam-se os axiomas A1 , A2 , A3 e A4 de espaço
vetorial conforme se viu no Exemplo 78. Logo, não devem se verificar alguns (ou algum)
dos axiomas relativos à multiplicação.
Sejam u = (x1 , y1 ), v = (x2 , y2 ) e α, β ∈ R.
M1 ) (αβ)u = (αβ)(x1 , y1 )
= ((αβ)x1 , y1 )
= (α(βx1 ), y1 )
= α(βx1 , y1 )
= α(β(x1 , y1 ))
= α(βu)
(Este axioma se verifica)
M2 ) (α + β)u = (α + β)(x1 , y1 )
= ((α + β)x1 , y1 )
= (αx1 + βx1 , y1 )
6= α(x1 , y1 ) + β(x1 , y1 )
= (αx1 , y1 ) + (βx1 , y1 )
= (αx1 + βx1 , 2y1 ).
Como se vê, (α + β)u 6= αu + βu e, portanto, não se verifica, no mı́nimo, o axioma M2 .
Assim, o conjunto de que trata este exemplo não é um espaço vetorial.
55
Exemplo 83. De uma maneira mais geral à considerada no exemplo anterior, para cada
n ≥ 1, o conjunto K n = {(u1 , u2 , . . . , un ) ; ui ∈ K, para todo i = 1, 2, . . . , n} tem uma
estrutura de espaço vetorial sobre K bastante natural com as operações:
• (u1 , u2 , . . . , un )+(v1 , v2 , . . . , vn ) = (u1 +v1 , u2 +v2 , . . . , un +vn ), para quaisquer (u1 , u2 , . . . , un ), (v1 , v2 , . . .
K n.
• a.(u1 , u2 , . . . , un ) = (au1 , au2 , . . . , aun ), para quaisquer a ∈ K e (u1 , u2 , . . . , un ) ∈ K n .
Analogamante, podemos ver que o espaço K ∞ formado pelas sequências de elementos em

K também é um espaço vetorial sobre K.
Exemplo 84. O conjunto R2 com as operações

(x1 , y1 ) + (x2 , y2 ) = (x1 + 2x2 , y1 + 2y2 )
α(x1 , y1 ) = (αx1 , αy1 )
não é um espaço vetorial, pois, pelo menos, o axioma A1 não é satisfeito.
De fato, sejam u = (x1 , y1 ), v = (x2 , y2 ) e w = (x3 , y3 ),
(u + v) + w = ((x1 , y1 ) + (x2 , y2 )) + (x3 , y3 )
= (x1 + 2x2 , y1 + 2y2 ) + (x3 , y3 )
= ((x1 + 2x2 ) + 2x3 , (y1 + 2y2 ) + 2y3 )
= (x1 + 2x2 + 2x3 , y1 + 2y2 + 2y3 )
6= (x1 + 2x2 + 4x3 , y1 + 2y2 + 4y3 )
= (x1 + 2(x2 + 2x3 ), y1 + 2(y2 + 2y3 ))
= (x1 , y1 ) + (x2 + 2x3 , y2 + 2y3 )
= (x1 , y1 ) + ((x2 , y2 ) + (x3 , y3 ))
= u + (v + w).
Exemplo 85. O conjunto de polinômios

P (K) = {p(x) = an xn + . . . + a1 x + a0 ; ai ∈ K e n ∈ Z+ }
é um K-espaço vetorial com as operações de soma de polinômios e multiplicação por
escalar.
Exemplo 86. O conjunto Mm×n (K) das matrizes m × n com entradas em K é um K-

espaço vetorial com as operações de soma de matrizes e multiplicação por escalar usuais.
Exemplo 87. Espaço das funções: Sejam X um conjunto não vazio e F(X, K) o
conjunto de todas as funções f : X → K. Defina as seguintes operações em F(X, K):
• para f, g ∈ F(X, K), defina a função f + g : X → K dada por (f + g)(x) = f (x) + g(x),
para todo x ∈ X.
• para f ∈ F(X, K) e a ∈ K, defina a função a.f : X → K dada por (a.f )(x) = a.f (x),
para todo x ∈ X.
Com estas operações, o conjunto F(X, K) é um K-espaço vetorial, onde a função nula é
o vetor nulo desse espaço. De fato,
A1) Sejam, f, g ∈ F(X, K) e seja x ∈ X. Note que, por definição da operação, (f +
g)(x) = f (x) + g(x). Agora, como f (x), g(x) ∈ K e K é um corpo, então f (x) + g(x) =
g(x) + f (x). Logo, (f + g)(x) = g(x) + f (x). Por definição da operação, g(x) + f (x) =
(g + f )(x). Logo, temos que (f + g)(x) = (g + f )(x). Como tomamos x ∈ X arbitrário,
segue que f + g = g + f .
A2) Sejam, f, g, h ∈ F(X, K) e seja x ∈ X. Note que, por definição da operação, ((f +
g) + h)(x) = (f + g)(x) + h(x) = (f (x) + g(x)) + h(x). Agora, como f (x), g(x), h(x) ∈ K e
K é um corpo, então (f (x)+g(x))+h(x) = f (x)+(g(x)+h(x)). Assim, ((f +g)+h)(x) =
f (x) + (g(x) + h(x)). Agora, pela definição da operação, temos que f (x) + (g(x) + h(x)) =
f (x) + (g + h)(x) = (f + (g + h))(x). Logo, ((f + g) + h)(x) = (f + (g + h))(x). Daı́,
como tomamos um x ∈ X arbitrário, segue que (f + g) + h = f + (g + h).
A3) Seja 0 ∈ F(X, K) a função identicamente nula dada por x 7→ 0 ∈ K, para todo
x ∈ X, e seja f ∈ F(X, K). Logo, para todo x ∈ X, temos (0 + f )(x) = 0(x) + f (x) =
0 + f (x) = f (x). Assim, vemos que 0 + f = f . Analogamente, vemos que f + 0 = f .
Então, a função identicamente nula é o vetor nulo de F(X, K).
A4) Seja f ∈ F(X, K). Para cada x ∈ X, defina −f a função dada por (−f )(x) = −f (x).
Logo, (f + (−f ))(x) = f (x) + (−f )(x) = f (x) + (−f (x)) = 0, para todo x ∈ X. Portanto,
f +(−f ) é a função identicamente nula (vetor nulo), ou seja, f +(−f ) = 0. Analogamente,
vemos que (−f ) + f = 0.
M1) Sejam a, b ∈ K e f ∈ F(X, K). Assim, ((a.b).f )(x) = (a.b).f (x). Agora, como K é
um corpo e a, b, f (x) ∈ K, temos que (a.b).f (x) = a.(b.f (x)). Pela definição da operação,
a.(b.f (x)) = a.((b.f )(x)) = (a.(b.f ))(x). Logo, temos que (a.b).f (x) = (a.(b.f ))(x), e
segue que (a.b).f = a.(b.f ).
M2), AM1) e AM2) Exercı́cio!
Propriedades básicas: Seja V um K-espaço vetorial. Sejam u, v, w ∈ V e a ∈ K

quaisquer.
57
1) Se w + u = w + v, então u = v. Em particular, w + u = w ⇒ u = 0 e w + u = 0 ⇒
u = −w.
De fato, supondo w + u = w + v temos que
u = 0 + u = (−w + w) + u = −w + (w + u) = −w + (w + v) = (−w + w) + v = 0 + v = v.
2) Dados 0 ∈ K (elemento neutro da adição de K) e v ∈ V , tem-se 0.v = 0 ∈ V .

Analogamente, dados a ∈ K e 0 ∈ V , tem-se a.0 = 0 ∈ V .
Com efeito, v + 0.v = 1.v + 0.v = (1 + 0).v = 1.v = v. Logo, como vimos em 1) acima,
temos que 0.v = 0.
De modo análogo, como a.0 + a.0 = a.(0 + 0) = a.0, segue de 1) que a.0 = 0.
3) Se a 6= 0 e v 6= 0, então a.v 6= 0.
De fato, suponha que a.v = 0, com a 6= 0 e v 6= 0. Então, v = 1.v = (a−1 .a).v =
a−1 (a.v) = a−1 .0 = 0, e terı́amos v = 0, contradição.
4) (−1).v = −v.
Com efeito, v + (−1).v = 1.v + (−1).v = (1 + (−1)).v = 0.v = 0. Logo, por 1) segue que
(−1).v = −v.
Notação: Para efeito de simplificação, vamos escrever u − v, para indicar u + (−v).
Subespaços
Certos subconjuntos de um espaço vetorial possuem a propriedade de que a soma de dois

de seus elementos é um elemento do próprio subconjunto, bem como, ao multiplicar um
elemento do subconjunto por um real (escalar), o resultado continua pertencendo a este
subconjunto. Em outras palavras, dizemos que tais subconjuntos são fechados para a soma
e produto por escalar. Tais subconjuntos jogam um papel fundamental dentro da teoria da
álgebra linear e são conhecidos como subespaços vetoriais. De forma mais precisa:
Definição 88 (Subespaço vetorial). Seja V um K-espaço vetorial. Um subespaço vetorial

de V é um subconjunto W ⊂ V com as seguintes propriedades:
i) 0 ∈ W ;
ii) se u, v ∈ W , então u + v ∈ W ;
iii) se v ∈ W , então a.v ∈ W , para todo a ∈ K.
Em outras palavras, W ⊂ V é um subespaço de V se a restrição das operações de V a W

torna W um K-espaço vetorial.
Observação 89. É importante salientar que todo subespaço vetorial S de um espaço

vetorial V é ele próprio um espaço vetorial. De fato, as propriedades A1 , A2 , M1 , M2 , M3
e M4 são herdadas do próprio espaço vetorial V . O elemento neutro da adição (A3 ) é
um elemento de S por S2 ) e pela propriedade 6) acima, pois dado u ∈ S, 0u = 0 ∈ S.
Finalmente (A4 ), se u ∈ S, então −u = (−1)u ∈ S pela propriedade 9) acima e por S2 ).
A seguir veremos alguns exemplos de subconjuntos que são subespaços vetoriais e outros
que não são.
Exemplo 90. Os subconjuntos {0} e V são subespaços vetoriais do espaço vetorial V e

são conhecidos como subespaços vetoriais triviais.
Exemplo 91. Sejam V = R2 e S = {(x, y) ∈ R2 ; y = 5x} = {(x, 5x); x ∈ R}.

Note que S 6= ∅, pois (0, 0) ∈ S. Sejam u = (x1 , 5x1 ), v = (x2 , 5x2 ) ∈ S e α ∈ R, então:
ii) u + v = (x1 , 5x1 ) + (x2 , 5x2 )

= (x1 + x2 , 5x1 + 5x2 )
= (x1 + x2 , 5(x1 + x2 )) ∈ S,
pois a segunda componente de u + v é cinco vezes a primeira.
iii) αu = α(x1 , 5x1 )

= (αx1 , α(5x1 ))
= (αx1 , 5(αx1 )) ∈ S,
pois a segunda componente de αu é o quı́ntuplo da primeira.
Exemplo 92. Considere X o intervalo [a, b] em R e K = C. Então

C(X, C) = {f : X → C ; f é uma função contı́nua}
é um subespaço de F(X, C) (dado no Exemplo 87).
59

3 3 −2x − 3y
Exemplo 93. Sejam V = R e S = {(x, y, z) ∈ R ; 2x+3y+4z = 0} = x, y, .
4

−2x1 − 3y1 −2x2 − 3y2
Note que S 6= ∅, pois (0, 0, 0) ∈ S. Dados u = x1 , y1 , , v = x2 , y2 , ∈
4 4
S e α ∈ R, então:

−2x1 − 3y1 −2x2 − 3y2
ii) u + v = x1 , y1 , + x2 , y2 ,
4 4

−2x1 − 3y1 −2x2 − 3y2
= x1 + x2 , y1 + y2 , +
4 4

−2(x1 + x2 ) − 3(y1 + y2 )
= x1 + x2 , y1 + y2 , ∈ S.
4

−2x1 − 3y1
iii) αu = α x1 , y1 ,
4

−2x1 − 3y1
= αx1 , αy1 , α
4

−2αx1 − 3αy1
= αx1 , αy1 , ∈ S.
4
Portanto, S é um subespaço vetorial de R3 .
Da geometria analı́tica sabe-se que a equação que define o subespaço S no exemplo an-
terior, é a equação de um plano em R3 que passa pela origem. Utilizando o Teste do 0,
conclui-se que, se um plano não passa pela origem, então ele não é um subespaço vetorial
do R3 .
Exemplo 94. Sejam V = R3 e S o conjunto solução do sistema linear homogêneo:


3x + 4y − 2z = 0


2x + y − z = 0 .

x − y + 3y = 0

Note que S 6= ∅, pois (0, 0, 0) ∈ S. Sejam u = (x1 , y1 , z1 ), v = (x2 , y2 , z2 ) ∈ S e α ∈ R,

então:
ii) u + v ∈ S. De fato, u + v = (x1 + x2 , y1 + y2 , z1 + z2 ) e
3(x1 + x2 ) + 4(y1 + y2 ) − 2(z1 + z2 ) = 3x1 + 3x2 + 4y1 + 4y2 − 2z1 − 2z2

= (3x1 + 4y1 − 2z1 ) + (3x2 + 4y2 − 2z2 )
= 0 + 0 = 0.
2(x1 + x2 ) + (y1 + y2 ) − (z1 + z2 ) = 2x1 + 2x2 + y1 + y2 − z1 − z2
= (2x1 + y1 − z1 ) + (2x2 + y2 − z2 )
= 0 + 0 = 0.
(x1 + x2 ) − (y1 + y2 ) + 3(z1 + z2 ) = x1 + x2 − y1 − y2 + 3z1 + 3z2
= (x1 − y1 + 3z1 ) + (x2 − y2 + 3z2 )
= 0 + 0 = 0.
iii) αu ∈ S. De fato, αu = (αx1 , αy1 , αz1 ) e

3(αx1 ) + 4(αy1 ) − 2(αz1 ) = 3αx1 + 4αy1 − 2αz1
= α(3x1 + 4y1 − 2z1 )
= α0 = 0.
2(αx1 ) + (αy1 ) − (αz1 ) = 2αx1 + αy1 − αz1
= α(2x1 + y1 − z1 )
= α0 = 0.
(αx1 ) − (αy1 ) + 3(αz1 ) = αx1 − αy1 + 3αz1
= α(x1 − y1 + 3z1 )
= α0 = 0.
Exemplo 95. Seja V = R2 . O subconjunto S = {(x, y); x ≥ 0} de V não é subespaço

vetorial, pois não satisfaz a condição iii) da definição de subespaço (Definição) 88.
Exemplo 96. Sejam a1 , . . . , an números reais. O conjunto H de todos os vetores v =

(x1 , . . . , xn ) ∈ Rn tais que a1 x1 + . . . + an xn = 0 é um subespaço de Rn .
No caso desinteressante em que a1 = . . . = an = 0, tem-se H = Rn . Se, ao contrário,
pelo menos um dos ai é diferente de zero, H é chamado de hiperplano de Rn que passa
pela origem.
Exemplo 97. `∞ = {(xn )n∈N ∈ K ∞ ; (xn ) é uma sequência limitada} é um subespaço

vetorial do espaço das sequências K ∞ .
Lembrando que (xn )n∈N ∈ K ∞ é limitada se existe M > 0 tal que |xn | ≤ M , para todo
n ∈ N.
61
Vejamos.
1) Note que a sequência (xn )n∈N , onde xn = 0, para todo n ∈ N, é limitada.
2) Sejam (xn )n∈N , (yn )n∈N ∈ `∞ . Assim, (xn )n∈N + (yn )n∈N = (xn + yn )n∈N ∈ K ∞ , e
como (xn )n∈N e (yn )n∈N são limitadas, existem M1 > 0 e M2 > 0 tais que |xn | ≤ M1 e
|yn | ≤ M2 , ∀n.
Agora, |xn + yn | ≤ |xn | + |yn | ≤ M1 + M2 = M , ∀n. Então, (xn + yn )n∈N é limitada, e
temos que (xn + yn )n∈N ∈ `∞ .
3) Dado α ∈ K, temos que α.(xn )n∈N = (α.xn )n∈N . Daı́, |α.xn | = |α|.|xn | ≤ |α|.M1 ≤ M .
Ou seja, (α.xn )n∈N ∈ `∞ .
Exemplo 98. Considere o sistema linear homogêneo T , de n incógnitas x1 , x2 , . . . , xn ,

dado por
α11 x1 + α12 x2 + . . . + α1n xn = 0
α21 x1 + α22 x2 + . . . + α2n xn = 0
..
.
αn1 x1 + αn2 x2 + . . . + αnn xn = 0
onde αij ∈ K.
S = {(a1 , a2 , . . . , an ) ∈ K n ; (a1 , a2 , . . . , an ) é solução de T } é um subespaço vetorial de

K n.
Observamos que se o sistema linear não for homogêneo o conjunto solução não será um
subespaço, pois o elemento (0, . . . , 0) não fará parte desse conjunto.
Combinação Linear
Nesta seção introduziremos o conceito de combinação linear de vetores com o intuito de

definir subespaços gerados por um conjunto, bem como, espaço vetorial finitamente gerado.
Definição 99 (Combinação Linear). Sejam V um K-espaço vetorial e v1 , . . . , vn ∈ V . Di-

zemos que um vetor v ∈ V é uma combinação linear de v1 , . . . , vn se existem escalares
α1 , . . . , αn ∈ K tais que v = α1 v1 + . . . + αn vn .
Notaremos nos exemplos abaixo que o fato de um vetor ser ou não uma combinação
linear de outros vetores dados está ligado ao fato de um certo sistema linear ser possı́vel
ou impossı́vel.
Exemplo 100. Dados os vetores v1 = (−1, 2, 3) e v2 = (7, −2, 1) de R3 , escreva o vetor

v = (17, −10, −7) como combinação linear de v1 e v2 .
O objetivo é encontrar escalares a1 e a2 tais que v = a1 v1 + a2 v2 , ou seja,

(17, −10, −7) = a1 (−1, 2, 3) + a2 (7, −2, 1)
= (−a1 , 2a1 , 3a1 ) + (7a2 , −2a2 , a2 )
= (−a1 + 7a2 , 2a1 − 2a2 , 3a1 + a2 ).
Pela condição de igualdade de vetores, segue a igualdade das respectivas coordenadas e

portanto obtemos o sistema:

−a1 + 7a2 = 17


(1) 2a1 − 2a2 = −10

3a1 + a2 = −7

cuja solução é a1 = −3 e a2 = 2.
Exemplo 101. No espaço vetorial R3 , o vetor v = (5, 2, 7) é uma combinação linear dos
vetores v1 e v2 do Exemplo 100, pois v = 2v1 + v2 . (Verifique!)
No próximo exemplo apresentamos um vetor que não é combinação linear dos vetores v1
e v2 dados no Exemplo 100.
63
Exemplo 102. Mostre que o vetor v = (13, −2, 4) de R3 não é combinação linear dos
vetores v1 e v2 do Exemplo 100.
A idéia agora é mostrar que não existem escalares a1 e a2 tais que v = a1 v1 + a2 v2 .

Procedendo como no Exemplo 100, temos
(13, −2, 4) = a1 (−1, 2, 3) + a2 (7, −2, 1),
o que resultará num sistema parecido com (1), mudando somente os termos independentes,
isto é, 
−a1 + 7a2 = 13


2a1 − 2a2 = −2 .

3a1 + a2 = 4

Como este sistema é impossı́vel, segue que v não pode ser escrito como combinação linear
de v1 e v2 .
Exemplo 103. Determine o valor de m para que o vetor u = (13, −2, m) seja combinação
linear de v1 e v2 do Exemplo 100.
Pelo Exemplo 102, o objetivo é obter m tal que o seguinte sistema seja possı́vel:

−a1 + 7a2 = 13


2a1 − 2a2 = −2 ,

3a1 + a2 = m

donde resulta que m = 5, a1 = 1 e a2 = 2.
Exemplo 104. Verifique de quantas maneiras diferentes o vetor w = (5, 2) ∈ R2 pode

ser escrito como combinação linear dos vetores w1 = (1, 0), w2 = (0, 1) e w3 = (2, 4).
Buscamos escalares a1 , a2 e a3 tais que

(5, 2) = a1 w1 + a2 w2 + a3 w3
= a1 (1, 0) + a2 (0, 1) + a3 (2, 4)
= (a1 , 0) + (0, a2 ) + (2a3 , 4a3 )
= (a1 + 2a3 , a2 + 4a3 ),
que equivale ao sistema
( (
a1 + 2a3 = 5 a1 = 5 − 2a3
ou .
a2 + 4a3 = 2 a2 = 2 − 4a3
Assim, para cada valor atribuı́do a a3 obtemos valores para a1 e a2 . Portanto, w pode ser
escrito de infinitas maneiras como combinação linear de w1 , w2 e w3 .
Subespaço vetorial gerado por um conjunto
Sejam V um espaço vetorial e A = {v1 , v2 , . . . , vn } um conjunto não vazio de V .
Afirmação: O conjunto S de todos os vetores de V que são combinações lineares dos

vetores de A é um subespaço vetorial de V .
Demonstração: É claro que 0 ∈ S, pois 0 = 0v1 + · · · + 0vn . Agora, sejam u =

a1 v1 + a2 v2 + · · · + an vn e v = b1 v1 + b2 v2 + · · · + bn vn dois vetores quaisquer de S, então
podemos escrever:
ii) u + v = (a1 v1 + a2 v2 + · · · + an vn ) + (b1 v1 + b2 v2 + · · · + bn vn ) = (a1 + b1 )v1 + (a2 +
b2 )v2 + · · · + (an + bn )vn
iii) αu = α(a1 v1 + a2 v2 + · · · + an vn ) = (αa1 )v1 + (αa2 )v2 + · · · + (αan )vn
isto é, u + v, αu ∈ S, uma vez que são combinações lineares de v1 , v2 , . . . , vn . Logo, S é
um subespaço vetorial de V .
Chamamos o subespaço S de subespaço gerado pelos vetores v1 , v2 , . . . , vn , ou, subespaço

gerado pelo conjunto A, e o denotamos por S = [v1 , v2 , . . . , vn ] ou, S = hv1 , v2 , . . . , vn i,
ou ainda S = [A]. Os vetores v1 , v2 , . . . , vn são chamados geradores do subespaço S e A é
um conjunto gerador de S.
Formalmente, podemos escrever
S = hv1 , v2 , . . . , vn i = {v ∈ V ; v = a1 v1 + · · · + an vn ; ai ∈ R, i = 1, . . . , n}.
Todo subconjunto A de V gera um subespaço vetorial [A] de V . Quando A é um conjunto

gerador de V teremos que [A] = V . Isto nos motiva introduzir a seguinte definição.
Definição 105 (Espaço finitamente gerado). Dizemos que um espaço vetorial V é fini-
tamente gerado se existir um subconjunto finito A de V tal que V = hAi.
Nos exemplos a seguir ficará claro que Rn é um espaço vetorial finitamente gerado para
qualquer número natural n.
65
Exemplo 106. Os vetores e1 = (1, 0) e e2 = (0, 1) geram o espaço vetorial V = R2 , pois

qualquer par (x, y) ∈ R2 é combinação linear de e1 e e2 . De fato,
(x, y) = (x, 0) + (0, y) = x(1, 0) + y(0, 1) = xe1 + ye2 .
Assim, [e1 , e2 ] = R2 .
Exemplo 107. Os vetores e2 = (0, 1, 0) e e3 = (0, 0, 1) do R3 geram o subespaço

S = {(0, y, z) ∈ R3 ; y, z ∈ R}, pois
(0, y, z) = (0, y, 0) + (0, 0, z) = ye2 + ze3 ,
isto é, S = [e2 , e3 ]. S é um subespaço próprio do R3 e representa geometricamente o plano
yOz.
Exemplo 108. Os vetores e1 = (1, 0, ..., 0), e2 = (0, 1, . . . , 0),. . . ,en = (0, 0, . . . , 1) geram
o espaço vetorial V = Rn , pois dado um vetor v = (x1 , x2 , . . . , xn ) ∈ Rn qualquer, ele pode
ser escrito como combinação linear de e1 , e2 , . . . , en . De fato, basta tomar as coordenadas
de v como os escalares da combinação linear:
x1 e1 + x2 e2 + · · ·xn en = x1 (1, 0, . . . , 0) + x2 (0, 1, . . . , 0) + · · · + xn (0, 0, . . . , 1)
= (x1 , x2 , . . . , xn ).
Um espaço vetorial finitamente gerado V pode ser gerado por subconjuntos diferentes.
Este fato é evidenciado nos próximos exemplos.
Exemplo 109. O conjunto A = {u = (1, 2), v = (3, 5)} gera o R2 . De fato, para que o
conjunto A gere o R2 é necessário que qualquer vetor w = (x, y) ∈ R2 seja combinação
linear de u e v, isto é, devem existir números reais α e β, tais que:
w = αu + βv
(x, y) = α(1, 2) + β(3, 5)
(x, y) = (α, 2α) + (3β, 5β)
(x, y) = (α + 3β, 2α + 5β).
Dessa igualdade resulta o sistema:
(
α + 3β = x
2α + 5β = y
que, resolvido em função de x e y, fornece:
α = −5x + 3y e β = 2x − y,
isto é, R2 = [u, v].
No próximo exemplo veremos que o R2 pode ser gerado por um conjunto formado por mais
de dois elementos.
Exemplo 110. Os vetores e1 = (1, 0), e2 = (0, 1) e u = (7, 4) geram R2 . De fato,

para que os vetores e1 , e2 e u gerem o R2 é necessário mostrar que para qualquer vetor
w = (x, y) ∈ R2 , existem números reais a, b e c tais que
w = ae1 + be2 + cu
(x, y) = a(1, 0) + b(0, 1) + c(7, 4)
(x, y) = (a, 0) + (0, b) + (7c, 4c)
(x, y) = (a + 7c, b + 4c).
Dessa igualdade resulta o sistema
( (
a + 7c = x a = x − 7c
ou
b + 4c = y b = y − 4c
Tomando, por exemplo, c = 2 temos
a = x − 14 b=y−8
e, portanto,
(x, y) = (x − 14)e1 + (y − 8)e2 + 2u,
isto é, [e1 , e2 , u] = R2 .
Em geral, um espaço vetorial possui muitos conjuntos geradores e muitas vezes é impor-
tante termos um conjunto gerador que seja o “menor”possı́vel. A situação ideal é que
exista um conjunto gerador onde cada elemento de V se escreva de maneira única como
combinação linear dos elementos deste conjunto gerador. Por trás dessa unicidade está o
importante conceito de conjunto linearmente independente, que veremos a seguir.
67
Dependência e Independência Linear
Vimos no Exemplo 106 que o conjunto {e1 = (1, 0), e2 = (0, 1)} gera o R2 . Com um
pouco de reflexão é possı́vel concluir que os conjuntos {e1 , e2 , v1 } e {e1 , e2 , v1 , v2 } também
geram o R2 , para quaisquer v1 , v2 ∈ R2 . Ou seja, o espaço vetorial R2 pode ser gerado
por dois vetores, ou também por três, ou quatro, etc. Porém em nossos estudos estamos
interessados em conjuntos geradores que tenham o menor número possı́vel de vetores. De
fato, vimos que para gerar o R2 são necessários somente dois vetores. Assim, outros
vetores que eventualmente aparecem no conjunto gerador são desnecessários.
A noção de dependência e independência linear será muito útil para a determinação do
menor conjunto gerador de um espaço vetorial.
Sejam V um espaço vetorial e v1 , . . . , vn ∈ V . Considere a equação
(2) α1 v1 + · · · + αn vn = 0, em que α1 , . . . , αn ∈ R.
Note que ela possui pelo menos uma solução que é a trivial:
α1 = α2 = · · · = αn = 0.
Isto nos motiva a próxima definição.
Definição 111 (LI e LD). Dizemos que o conjunto {v1 , . . . , vn } é linearmente indepen-
dente, ou simplesmente que os vetores v1 , . . . , vn são LI, se a equação (2) admitir somente
a solução trivial. Se existir solução com algum αi 6= 0, dizemos que {v1 , . . . , vn } é linear-
mente dependente, ou simplesmente que os vetores v1 , . . . , vn são LD.
• Por convenção, o conjunto vazio é um conjunto L.I. e gera o espaço nulo.
• Note que todo conjunto que possui o vetor nulo é L.D.
• Todo espaço vetorial não nulo possui um conjunto L.I., não vazio. Basta considerar,
por exemplo, um conjunto que consiste de um único vetor não nulo.
• Todo subconjunto de um conjunto L.I. também é L.I. (Verifique!)
Vejamos alguns exemplos de conjuntos LI e LD.

Exemplo 112. O conjunto {e1 = (1, 0), e2 = (0, 1)} do espaço vetorial R2 é LI. Com
efeito,
(0, 0) = α1 e1 + α2 e2
= α1 (1, 0) + α2 (0, 1)
= (α1 , 0) + (0, α2 )
= (α1 , α2 )
o que implica α1 = 0 e α2 = 0.
Exemplo 113. Procedendo de maneira análoga ao exemplo anterior, podemos concluir

que os vetores e1 = (1, 0, 0), e2 = (0, 1, 0) e e3 = (0, 0, 1) do espaço vetorial R3 são LI.
Exemplo 114. O conjunto {sen x, cos x} é um conjunto L.I. no R-espaço vetorial C([0, 2π], R).
De fato, suponha que {sen x, cos x} é L.D.. Então, existem α, β ∈ R, ao menos um deles
não nulo, tais que α · sen x + β · cos x = 0, para todo x ∈ [0, 2π], o que é uma contradição.
Logo, {sen x, cos x} é um conjunto L.I.
Exemplo 115. Considere as funções fn : [a, b] → C, dadas por fn (t) = tn , para n =

0, 1, 2, . . .. O conjunto B = {fn ; n = 0, 1, 2, . . .} é um subconjunto (infinito) L.I. de
C([a, b], C). (Verifique!)
Exemplo 116. Os vetores v1 = (6, 4) e v2 = (15, 10) do R2 , são LD. De fato,
(0, 0) = α1 v1 + α2 v2
= α1 (6, 4) + α2 (15, 10)
= (6α1 , 4α1 ) + (15α2 , 10α2 )
= (6α1 + 15α2 , 4α1 + 10α2 ).
Donde resulta o sistema
(
6α1 + 15α2 = 0
4α1 + 10α2 = 0
−5
o qual admite a solução α1 = 2 2
α. Assim, fazendo α2 = 2, temos α1 = −5 e a equação
−5v1 + 2v2 = 0, ou seja, −5(6, 4) + 2(15, 10) = (0, 0)
se verifica e, portanto, (6, 4) e (15, 10) são LD.

69
Note que, no exemplo anterior, o fato de (6, 4) e (15, 10) serem LD implica que um dos
vetores é múltiplo do outro. De fato, podemos escrever
2
(6, 4) = (15, 10).
5
Por outro lado, se dois vetores são múltiplos entre si, isto é, v1 = βv2 , para algum β ∈ R,
é fácil concluir que eles serão LD, pois a equação α1 v1 + α2 v2 = 0 admite solução não
trivial, a saber, α1 = 1 6= 0 e α2 = −β.
Esta propriedade é generalizada para mais que dois vetores no seguinte resultado.
Proposição 117. Dado um espaço vetorial V , o conjunto {v1 , . . . , vn } ⊂ V é LD se, e

somente se, um destes vetores é uma combinação linear dos demais.
Demonstração. Primeiro mostraremos que se v1 , . . . , vn são LD, então um destes vetores

é a combinação linear dos demais. Da definição de conjunto LD, existe algum αi 6= 0
satisfazendo
α1 v1 + · · · + αi vi + · · · + αn vn = 0.
αi−1 αi+1
Assim, isolando o vetor vi obtemos vi = − αα1i v1 − · · · − αi
vi−1 − αi
vi+1 −···− αn
v ,
αi n
pois αi 6= 0. Logo, vi é a combinação linear dos vetores v1 , . . . , vi−1 , vi+1 , . . . , vn .

Assumimos agora que algum vi ∈ {v1 , . . . , vn } é a combinação linear dos outros vetores
do conjunto, ou seja,
vi = a1 v1 + · · · + ai−1 vi−1 + ai+1 vi+1 + · · · + an vn ,
donde temos
−a1 v1 + · · · − ai−1 vi−1 + vi − ai+1 vi+1 − · · · − an vn = 0.
Como nesta equação o coeficiente de vi é 1 6= 0, concluı́mos que {v1 , . . . , vn } é LD.
Nos exemplos seguintes usaremos a proposição anterior para concluir que um determinado
conjunto é LD.
Exemplo 118. O conjunto {e1 = (1, 0), e2 = (0, 1), v = (a, b)} de vetores de R2 , onde
(a, b) é qualquer vetor de R2 , é LD. Com efeito, podemos escrever v como combinação
linear de e1 e e2
v = (a, b) = (a, 0) + (0, b) = a(1, 0) + b(0, 1) = ae1 + be2 ,
e portanto, pela Proposição 117, o conjunto é LD.
Exemplo 119. Os vetores v1 = (1, 1, 1), v2 = (−2, 0, 2) e v3 = (2, 3, 4) do R3 são LD. De

fato,
v3 = a1 v1 + a2 v2
(2, 3, 4) = a1 (1, 1, 1) + a2 (−2, 0, 2)
= (a1 , a1 , a1 ) + (−2a2 , 0, 2a2 )
= (a1 − 2a2 , a1 , a1 + 2a2 ).
Equivale ao sistema linear: 
a1 − 2a2 = 2


a1 = 3

a1 + 2a2 = 4

que tem como solução a1 = 3 e a2 = 21 . Logo, v3 = 3v1 + 12 v2 e, portanto, o conjunto

{v1 , v2 , v3 } é LD.
Exemplo 120. Os vetores v1 = (2, 1, 2, 1), v2 = (1, 2, 1, 0) e v3 = (−3, 0, 5, 0) do espaço

vetorial R4 são LI. Com efeito
0 = α1 v1 + α2 v2 + α3 v3
= α1 (2, 1, 2, 1) + α2 (1, 2, 1, 0) + α3 (−3, 0, 5, 0)
= (2α1 , α1 , 2α1 , α1 ) + (α2 , 2α2 , α2 , 0) + (−3α3 , 0, 5α3 , 0)
= (2α1 + α2 − 3α3 , α1 + 2α2 , 2α1 + α2 + 5α3 , α1 ).
que equivale ao sistema linear


 2α1 + α2 − 3α3 = 0


α + 2α = 0
1 2


 2α1 + α2 + 5α3 = 0

α1 = 0

o qual admite somente a solução trivial, ou seja, α1 = α2 = α3 = 0. Portanto, v1 , v2 e v3

são LI.
71
Base e Dimensão
Dado um espaço vetorial V estamos interessados em encontrar um subconjunto de V que

o gere e ao mesmo tempo que seja o menor possı́vel, isto é, se subtrairmos deste conjunto
algum vetor, ele não gera mais todo V . Um conjunto com tais propriedades é chamado
base de V . Vejamos a definição precisa de base.
Definição 121. Um conjunto de vetores {v1 , . . . , vn } ⊂ V é uma base de V se for LI e

gerar V .
Vejamos alguns exemplos de conjuntos que são bases dos espaços vetoriais R2 , R3 , . . . , Rn .
Exemplo 122. O conjunto C = {e1 = (1, 0), e2 = (0, 1)} é base de R2 , conhecida como
base canônica de R2 . De fato, vimos no Exemplo 106 que C gera R2 e no Exemplo 112
que C é LI.
Exemplo 123. O conjunto B = {(1, 1), (0, 1)} também é uma base de R2 . Com efeito,
se
(0, 0) = a(1, 1) + b(0, 1) = (a, a + b),
temos a = b = 0, ou seja, B é LI. Além disto, dado (x, y) ∈ R2 qualquer, podemos escrever
(x, y) = x(1, 1) + (y − x)(0, 1),
isto é, todo vetor de R2 é uma combinação linear de (1, 1) e (0, 1), provando que B gera
R2 .
No entanto, nem todo conjunto com dois elementos forma uma base de R2 . Vejamos um
exemplo disto.
Exemplo 124. O conjunto {(−1, 0), (5, 0)} não é base de R2 , pois (5, 0) = −5(−1, 0),
isto é, o conjunto é LD.
No próximo exemplo veremos um conjunto de R3 que é LI, porém não é base de R3 .

Exemplo 125. O conjunto {e2 = (0, 1, 0), e3 = (0, 0, 1)} não é base de R3 . Apesar de LI
ele não gera todo o R3 , ou seja, [e2 , e3 ] 6= R3 . De fato, notemos que todo elemento de R3
da forma (a, 0, 0), a ∈ R \ {0}, não pertence ao espaço [e2 , e3 ].
Exemplo 126. Os vetores e1 = (1, 0, 0), e2 = (0, 1, 0) e e3 = (0, 0, 1) formam uma base
de R3 , chamada base canônica de R3 .
Exemplo 127. Mais geralmente, não é difı́cil ver que os vetores e1 , . . . , en ∈ Rn , onde
e1 = (1, 0, . . . , 0), e2 = (0, 1, . . . , 0), . . . , en = (0, 0, . . . , 1), formam uma base de Rn ,
conhecida como base canônica de Rn .
Exemplo 128. B = {1, x, x2 , x3 } é uma base de P3 (K) = {a3 x3 + a2 x2 + a1 x + a0 ; ai ∈

K}.
Exemplo 129. B = {(1, 0), (0, 1)} é uma base de C2 como C-espaço vetorial. Pois, dado
(a, b) ∈ C2 , podemos escrever (a, b) = a.(1, 0) + b.(0, 1), com a, b ∈ C. Assim, B gera C2 .
E B é L.I., pois se tomarmos α1 , α2 ∈ C com α1 .(1, 0) + α2 .(0, 1) = (0, 0) ⇒ (α1 , α2 ) =
(0, 0) ⇒ α1 = 0 e α2 = 0.
Porém, B NÃO é uma base para C2 como um R-espaço vetorial. Note que, B não
gera C2 como um R-espaço vetorial. Pois, por exemplo, não existem a, b ∈ R tais que
a.(1, 0) + b.(0, 1) = (i, 2i).
Temos que, B 0 = {(1, 0), (0, 1), (i, 0), (0, i)} é uma base para C2 como um R-espaço veto-
rial. Verifique!
Do próximo resultado concluiremos que duas bases quaisquer de um espaço vetorial fini-
tamente gerado têm o mesmo número de vetores.
Proposição 130. Seja V um K-espaço vetorial finitamente gerado não nulo. Assuma
que {v1 , . . . , vm } seja um conjunto gerador de V . Então, todo conjunto L.I. de vetores em
V tem no máximo m elementos.
Demonstração. Vamos provar que todo conjunto de elementos de V que contenha mais
do que m vetores é L.D.
Para tanto, seja A = {u1 , . . . , un } ⊂ V , com n > m. Note que, como {v1 , . . . , vm } é um
conjunto gerador de V , então existem escalares αij ∈ K tais que, para cada j = 1, . . . , n.
uj = α1j v1 + . . . + αmj vm .
Assim, se λ1 , . . . , λn são escalares quaisquer em K, teremos

n m
! n Xm m n
!
X X X X X
λ1 u1 + . . . + λn un = λj αij vi = λj αij vi = λj αij vi .
j=1 i=1 j=1 i=1 i=1 j=1
73
n
X
Vamos analisar a situação em que λj αij = 0, para cada i = 1, 2, . . . m. Para tanto,
j=1
considere o sistema
α11 λ1 + . . . α1n λn = 0
..
.
αm1 λ1 + . . . αmn λn = 0
nas incógnitas λ1 , . . . , λn e com coeficientes αij ∈ K.
Como o número de equações do sistema é estritamente menor do que o número de
incógnitas, segue que o sistema tem uma solução não nula, isto é, existem γ1 , . . . , γn ∈ K,
Xn
não todos nulos, tais que γj αij = 0, para i = 1, 2, . . . , m. Portanto, existem γ1 , . . . , γn ,
j=1
não todos nulos, tais que γ1 u1 + . . . γn un = 0, o que implica que {u1 , . . . , un } é L.D..
Exercı́cio: Mostre que o conjunto R considerado como um R-espaço vetorial é finita-

mente gerado (o 1 é um gerador, assim como qualquer real não nulo). Entretanto, se con-
siderarmos R como um Q-espaço vetorial, este não é finitamente gerado (dica: suponha
que seja finita, use o resultado anterior, tome um elemento transcendente, π por exemplo,
e use que para quaisquer n + 1 reais a0 , a1 , . . . , an tem-se que a0 + a1 π + . . . + an π n 6= 0,
ou seja, os n + 1 vetores 1, π, . . . , π n são L.I.).
Corolário 131. Seja V um K-espaço vetorial finitamente gerado não nulo. Então, duas
bases quaisquer de V têm o mesmo número de elementos.
Demonstração. Sejam B e B 0 duas bases de V . Como V é finitamente gerado, decorre

da proposição anterior que B e B 0 são finitas (pois são L.I.). Digamos que B possui m
elementos e B 0 possui m0 elementos. Considerando B como conjunto gerador de V e B 0
L.I., segue da proposição anterior que m0 ≤ m. Por outro lado, considerando B 0 como
conjunto gerador e B L.I., teremos que m ≤ m0 . Portanto, m = m0 .
Definição 132. Seja V um K-espaço vetorial. Se V admite uma base finita, então
chamamos de dimensão de V o número de elementos de tal base. Caso contrário,
dizemos que a dimensão de V é infinita.
Notação: Denotaremos a dimensão do K-espaço vetorial V por dimK V , ou simples-

mente dim(V ).
• Note que:
1) se V é um K-espaço vetorial com dimK V = n, então qualquer conjunto de V com

mais de n elementos é L.D., e nenhum conjunto com menos de n elementos gera V ;
2) ainda não analisamos a questão da existência de bases de um dado espaço vetorial

V sobre K. O que podemos falar por enquanto é que se V possui uma base, então sua
dimensão está bem definida;
3) dimK {0} = 0.
Exemplo 133. A dimensão do R-espaço vetorial R2 é 2, pois a base canônica, e portanto

qualquer base de R2 , tem 2 elementos. Da mesma forma, dimR R3 = 3. Mais geralmente,
dimR Rn = n.
A seguir, vejamos mais exemplos.
Exemplo 134. .
dimC C2 = 2
dimR C2 = 4
dimK K n = n, base {(1, 0, . . . , 0), (0, 1, 0, . . . , 0), . . . , (0, . . . , 0, 1)}
dimK P4 (K) = 5, base {1, x, x2 , x3 , x4 }
dimK P (K) = ∞
dimR C([a, b], R) = ∞
dimK Mm×n (K) = m.n
dimR Mm×n (C) = 2.m.n
Observação 135. Na Definição 121 vimos que um conjunto B é base de um K-espaço

vetorial V se for LI e gerar V . No entanto, se soubermos que dimK V = n, bastará
verificar uma as duas condições, ou seja,
(a) Se dimK V = n e B = {v1 , . . . , vn } é LI, então B é base de V .
(b) Se dimK V = n e B = {v1 , . . . , vn } gera V , então B é base de V .
Exemplo 136. O conjunto B = {(1, 2), (−1, −1)} é base de R2 , pois sabemos que
dim R2 = 2 e B é LI, uma vez que (1, 2) não é múltiplo de (−1, −1).
75
Observação 137. Sejam V um K-espaço vetorial com dim V = n e S um subespaço de

V sobr K. Então dimK S ≤ n. No caso em que dimK S = n, tem-se S = V .
Com o auxı́lio da observação acima, apresentamos a seguir uma interpretação geométrica

para os subespaços vetoriais de R3 .
Exemplo 138. Consideremos o espaço tridimensional R3 . A dimensão de qualquer su-
bespaço S ⊆ R3 só poderá ser 0, 1, 2 ou 3. Assim,
(a) se dimS = 0, então S = {0} é a origem.
(b) se dimS = 1, então S é uma reta que passa pela origem.
(c) se dimS = 2, então S é um plano que passa pela origem.
(d) se dimS = 3, então S = R3 .
Observação 139. Seja V um espaço vetorial de dimensão n. Se os vetores v1 , . . . , vr são
LI em V , com r < n, então existem vr+1 , . . . , vn tais que {v1 , . . . , vr , vr+1 , . . . , vn } é uma
base de V .
Exemplo 140. Encontre uma base de R3 sobre R que contenha o vetor (2, 1, 1).
Como dim R3 = 3, precisamos encontrar dois vetores v1 , v2 ∈ R3 que juntos com (2, 1, 1)
formam um conjunto LI. Tomando v1 um vetor que não seja múltiplo de (2, 1, 1) já teremos
que {(2, 1, 1), v1 } é LI. Assim, consideremos v1 = (1, 0, 0). Para completar, escolhemos
v2 que não seja combinação linear de (2, 1, 1)e(1, 0, 0). Dentre os infinitos existentes,
tomemos v2 = (0, 1, 0). Logo, {(2, 1, 1), (1, 0, 0), (0, 1, 0)} é LI e portanto é uma base de
R3 .
Exemplo 141. Consideremos o seguinte subespaço de R4 :

S = {(x, y, z, w); x − 2y = 0 e z = 3w}.
Determinar uma base de S e sua dimensão.
Um vetor (x, y, z, w) ∈ S se x = 2y e z = 3w. As variáveis livres são y e w. Logo,
dimS = 2 e qualquer subconjunto de S com dois vetores LI forma uma base desse espaço.
Façamos y = 1, w = 0 e y = 0, w = 1 para obter os vetores v1 = (2, 1, 0, 0) e v2 =
(0, 0, 3, 1), respectivamente. O conjunto {v1 , v2 } é uma base de S.
Corolário 142. Seja V um K-espaço vetorial de dimensão n ≥ 1 e seja B um subconjunto

de V com n elementos. As seguintes afirmações são equivalentes:
i) B é uma base.
ii) B é L.I..
iii) B é um conjunto gerador de V .
Demonstração. Exercı́cio.
Observação 143. Observamos que se V não for finitamente gerado, então qualquer base
de V não possui um número finito de elementos. Porém, é possı́vel mostrar que as bases
são equivalentes como conjuntos, ou seja, podemos mostrar que duas bases de V têm
sempre a mesma cardinalidade (teoria de conjuntos, axioma da escolha).
Proposição 144. Seja V um K-espaço vetorial. Seja B = {v1 , . . . , vm } um conjunto

L.I. em V . Se existir v ∈ V que não seja combinação linear dos elementos de B, então
{v1 , . . . , vm , v} é L.I..
Demonstração. Suponha que B = {v1 , . . . , vm } é um conjunto L.I. em V e que v ∈ V não

seja combinação linear dos elementos de B.
Sejam α1 , . . . , αm , αm+1 escalares tais que
α1 v1 + . . . + αm vm + αm+1 v = 0
Se αm+1 6= 0, então podemos escrever

α1 αm
v=− v1 − . . . − vm
αm+1 αm+1
o que é uma contradição com a nossa hipótese de v não ser uma combinação linear de
elementos de B. Então, αm+1 = 0, e, portanto, α1 v1 + . . . + αm vm = 0. Como B é L.I.,
segue que α1 = . . . = αm = 0. Portanto, {v1 , . . . , vm , v} é L.I..
Teorema 145. Todo espaço vetorial não nulo finitamente gerado possui uma base.
Demonstração. Seja V um espaço vetorial não nulo finitamente gerado sobre K. Então
V possui um conjunto gerador finito, digamos com m ≥ 1 elementos. Agora, seja v1 ∈ V
um vetor não nulo. Então, B1 = {v1 } é L.I.. Se B1 gerar V , então B1 é uma base de
V . Caso contrário, existe v2 ∈ V que não é um múltiplo de v1 . Pela proposição anterior,
B2 = {v1 , v2 } é L.I.. Novamente, se B2 gera V , então B2 é uma base de V . Caso contrário,
existe v3 ∈ V tal que {v1 , v2 , v3 } é L.I.. Repetindo este procedimento, chegaremos ou a
uma base de V ou construiremos conjuntos L.I. em V arbritariamente grandes. O segundo
caso não é possı́vel, pois todo conjunto L.I. de V tem no máximo m elementos.
77
Observação 146. Observamos que todo espaço vetorial possui uma base. A demonstração
do regultado geral depende essencialmente do chamado Lema de Zorn (um axioma da
teoria dos conjuntos). Apesar do resultado garantir a existência de uma tal base, nem
sempre é possı́vel exibi-la explicitamente. Por exemplo, tente construir uma base do espaço
vetorial R sobre Q. Observe que uma tal base será necessariamente não enumerável.
Transformação Linear
As transformações lineares são funções especiais por dois motivos: o primeiro é que são
funções definidas entre espaços vetoriais e o segundo motivo é porque são funções que
respeitam as operações destes espaços vetoriais
Definição 147. Sejam U e V K-espaços vetoriais. Uma função T : U → V é uma

transformação linear se
i) T (u + v) = T (u) + T (v), ∀u, v ∈ U , e
ii) T (λu) = λT (u), ∀λ ∈ K e ∀u ∈ U .
• Não é difı́cil verificar que T : U → V é uma transformação linear se, e somente se,
T (λu + v) = λT (u) + T (v), ∀u, v ∈ U e ∀λ ∈ K.
Além disso, temos que se T : U → V é uma transformação linear, então:
1) T (0U ) = 0V , pois 0V + T (0U ) = T (0U ) = T (0U + 0U ) = T (0U ) + T (0U ).
2) T (−u) = −T (u), para todo u ∈ U , pois −u = (−1).u.
Xn n
X
3) T ( λi ui ) = λi T (ui ).
i=1 i=1
Observação 148. Uma transformação linear de U em U é chamada de operador linear.
Vejamos alguns exemplos de funções que são transformações lineares.
Exemplo 149. A transformação T : R2 → R3 , definida por T (x, y) = (2x + y, x − y, 3y)

é linear.
De fato, dados u = (x1 , y1 ) e v = (x2 , y2 ) vetores quaisquer de R2 e α ∈ R temos:
T L1) T (u + v) = T ((x1 , y1 ) + (x2 , y2 ))
= T (x1 + x2 , y1 + y2 )
= (2(x1 + x2 ) + (y1 + y2 ), (x1 + x2 ) − (y1 + y2 ), 3(y1 + y2 ))
= (2x1 + 2x2 + y1 + y2 , x1 + x2 − y1 − y2 , 3y1 + 3y2 )
= (2x1 + y1 , x1 − y1 , 3y1 ) + (2x2 + y2 , x2 − y2 , 3y2 )
= T (u) + T (v).
79
T L2) T (αu) = T (α(x1 , y1 ))

= T (αx1 , αy1 )
= (2αx1 + αy1 , αx1 − αy1 , 3αy1 )
= (α(2x1 + y1 ), α(x1 − y1 ), α(3y1 ))
= α(2x1 + y1 , x1 − y1 , 3y1 )
= αT (u).
Exemplo 150. Seja T : R → R, dada por T (x) = kx, onde k ∈ R − {0}, é uma
transformação linear.
Com efeito, sejam x, y, α ∈ R, temos:
TL 1) T (x + y) = k(x + y) = kx + ky = T (x) + T (y).
TL 2) T (αx) = k(αx) = αkx = αT (x).
Note que toda transformação linear de R em R só pode ser da forma apresentada no
exemplo anterior.
De fato, T (x) = T (x · 1) e, sendo T linear e x um escalar, podemos escrever T (x · 1) =
xT (1). Denotando T (1) = k, temos T (x) = kx.
Exemplo 151. A aplicação identidade I : U → U , dada por I(u) = u, é um operador

linear.
De fato,
TL 1) I(u + v) = u + v = I(u) + I(v), ∀u, v ∈ U .
TL 2) I(αu) = αu = αI(u), ∀u ∈ U e α ∈ R.
Exemplo 152. A transformação nula T : U → V , dada por T (u) = 0, ∀u ∈ U , é linear,

pois:
TL 1) T (u + v) = 0 = 0 + 0 = T (u) + T (v), ∀u, v ∈ U .
TL 2) T (αu) = 0 = α · 0 = αT (u), ∀u ∈ U e α ∈ R.
Exemplo 153. Uma matriz A de ordem 3 × 2 determina uma transformação da seguinte

maneira:
TA : R2 → R3
u 7→ TA (u) = Au.
Além disso, TA é linear. De fato, sejam u, v ∈ R2 e α ∈ R temos

TL 1) TA (u + v) = A(u + v) = Au + Av = T (u) + T (v),
TL 2) TA (αu) = A(αu) = αAu = αT (u).
Vejamos um caso particular de uma transformação linear definida como acima.
 
5 0
x
Considerando A3×2 =  2 −1  e u = (x, y) como um vetor coluna, u2×1 = ,
y
1 3
temos    
5 0 5x
x
Au =  2 −1  =  2x − y  .
y
1 3 x + 3y
Logo, TA (x, y) = (5x, 2x − y, x + 3y).
Isto significa que a matriz A3×2 determina a transformação do vetor u = (x, y) ∈ R2 no
vetor v = (5x, 2x − y, x + 3y) e tal transformação é linear.
A ideia apresentada no exemplo anterior pode ser generalizada para qualquer matriz de
ordem m × n como segue.
Exemplo 154. Em geral, dada uma matriz A de ordem m × n, fica determinada a
transformação linear TA : Rn × Rm cuja imagem TA (u) do vetor u ∈ Rn é dada pelo
produto da matriz Am×n com o vetor coluna un×1 :
TA (u) = Am×n · un×1 = (Au)m×1 .
Mais adiante veremos que o contrário também acontece, ou seja, toda transformação
linear T : Rn → Rm pode ser representada por uma matriz de ordem m × n.
No próximo exemplo veremos uma transformação que não é linear.

Exemplo 155. A transformação T : R2 → R2 , dada por T (x, y) = (x2 , 2y) não é linear.
De fato, dados u = (x1 , y1 ), v = (x2 , y2 ) ∈ R2 temos
T (u + v) = T (x1 + x2 , y1 + y2 ) = ((x1 + x2 )2 , 2(y1 + y2 )) = (x21 + 2x1 x2 + x22 , 2y1 + 2y2 )
porém
T (u) + T (v) = (x21 , 2y1 ) + (x22 , 2y2 ) = (x21 + x22 , 2(y1 + y2 ))
o que implica
T (u + v) 6= T (u) + T (v),
81
sempre que x1 e x2 são não nulos.
n
X
• Sejam a1 , . . . , an ∈ K. Defina T : K n → K por T (x1 , . . . , xn ) = ai xi . Então, T é
i=1
uma transformação linear.
Seja ei o i-ésimo elemento da base canônica de K n . Assim, T (ei ) = ai .
Por outro lado, se T : K n → K é uma transformação linear, então T (x1 , . . . , xn ) =
n
X n
X
T( xi e i ) = xi T (ei ).
i=1 i=1
Isso mostra que a definição de uma transformação linear cujo domı́nio é K n depende
basicamente da definição de T nos elementos da base {e1 , . . . , en }. Isto pode ser feito
mais geralmente como mostra o resultado a seguir.
Teorema 156. Sejam U e V dois K-espaços vetoriais. Se {u1 , . . . , un } for uma base de
U e {v1 , . . . , vn } ⊆ V , então existe uma única transformação linear T : U → V tal que
T (ui ) = vi , para cada i = 1, . . . , n.
Demonstração. Sejam {u1 , . . . , un } uma base de U e {v1 , . . . , vn } ⊆V . Assim, para u ∈ U ,

Xn Xn
temos que u = λi ui . Vamos definir T : U → V por T (u) = λi vi ∈ V . Devido à
i=1 i=1
unicidade dos valores λi a função T está bem definida.
É claro que T (ui ) = vi , para cada i = 1, . . . , n. Vejamos que T é linear.
Xn Xn
De fato, sejam u = αi ui e w = βi ui dois vetores de U , e λ ∈ K. Então,
i=1 i=1
n
X n
X n
X
T (λu + w) = T (λ( αi ui ) + βi ui ) = T ( (λαi + βi )ui )
i=1 i=1 i=1
n
X Xn n
X
= (λαi + βi )vi = λ( αi vi ) + βi vi = λT (u) + T (v).
i=1 i=1 i=1
Logo, T é linear.
Agora, vejamos que T é única. Para isso, considere uma transformação linear S : U → V
n
X
tal que S(ui ) = vi , para cada i = 1, . . . , n. Para u = λi ui ∈ U , teremos S(u) =
i=1
Xn n
X n
X
S( λi u i ) = λi S(ui ) = λi vi = T (u) e, portanto, só existe uma única trans-
i=1 i=1 i=1
formação linear nas condições requeridas.
• Note que, se T : U → V é uma transformação linear, então a imagem de uma com-

binação linear α1 u1 + α2 u2 em U é uma combinação linear das imagens T (u1 ) e T (u2 )
em V com os mesmos coeficientes α1 e α2 . Ou seja,
T (α1 u1 + α2 u2 ) = T (α1 u1 ) + T (α2 u2 ) = α1 T (u1 ) + α2 T (u2 ).
É claro que isto vale para uma combinação linear qualquer em U , isto é,
T (α1 u1 + · · · + αn un ) = α1 T (u1 ) + · · · + αn T (un ).
Isto nos revela que, caso U seja um espaço vetorial finitamente gerado, a transformação
linear T fica completamente determinada se conhecermos seus valores nos elementos de
uma base de U . De fato, seja B = {u1 , ..., un } uma base de U tal que são conhecidos os
vetores
T (u1 ) = v1 , ..., T (un ) = vn de V.
Dado u ∈ U qualquer, sabemos que existem escalares α1 , ..., αn ∈ R tais que u = α1 u1 +

· · · + αn un . Assim, obtemos T (u) por:
T (u) = T (α1 u1 + · · · + αn un )
= α1 T (u1 ) + · · · + αn T (un )
= α1 v1 + · · · + αn vn .
Exemplo 157. Seja T : R2 → R2 um operador linear e B = {(1, 1), (1, −1)} uma base
do R2 . Supondo que T (1, 1) = (2, 6) e T (1, −1) = (−2, 2), determine T (5, 3) e T (x, y).
Expressando o vetor (5, 3) como combinação linear dos vetores de B, temos:
(5, 3) = a(1, 1) + b(1, −1) = (a + b, a − b)
ou (
a+b=5
a−b=3
cuja solução é a = 4 e b = 1. Assim,
T (5, 3) = T (4(1, 1) + 1(1, −1))
= 4T (1, 1) + 1T (1, −1)
= 4(2, 6) + 1(−2, 2)
= (6, 26).
Procedemos da mesma forma com o vetor genérico (x, y):

(x, y) = a(1, 1) + b(1, −1)
ou (
a+b=x
a−b=y
83
x+y x−y
que tem solução a = eb= . Assim,
2 2
T (x, y) = T ( x+y
2
(1, 1) + x−y
2
(1, −1))
x+y x−y
= 2 T (1, 1) + 2 T (1, −1)
= x+y
2
(2, 6) + x−y
2
(−2, 2) .
= (x + y, 3x + 3y) + (−x + y, x − y)
= (2y, 4x + 2y)
Se calculássemos primeiro T (x, y) = (2y, 4x + 2y) poderı́amos calcular o vetor T (5, 3) por
T (5, 3) = (2 · 3, 4 · 5 + 2 · 3) = (6, 26).
Exemplo 158. Seja T : R3 → R2 uma transformação linear e B = {(1, 1, 1), (1, 1, 0), (1, 0, 0)}
uma base de R3 . Sendo T (1, 1, 1) = (−2, 1), T (1, 1, 0) = (4, 0) e T (1, 0, 0) = (1, 3), deter-
mine T (x, y, z).
Expressando (x, y, z) como combinação linear dos elementos em B, temos
(x, y, z) = a(1, 1, 1) + b(1, 1, 0) + c(1, 0, 0)
ou 
a + b + c = x


a+b=y

a = z

cuja solução é a = z, b = y − z e c = x − y. Assim,

T (x, y, z) = T (z(1, 1, 1) + (y − z)(1, 1, 0) + (x − y)(1, 0, 0))
= zT (1, 1, 1) + (y − z)T (1, 1, 0) + (x − y)T (1, 0, 0)
= z(−2, 1) + (y − z)(4, 0) + (x − y)(1, 3)
= (−2z + 4y − 4z + x − y, z + 3x − 3y)
= (x + 3y − 6z, 3x − 3y + z).
No próximo exemplo o que queremos é encontrar um vetor cuja imagem por uma trans-
formação linear é conhecida.
Exemplo 159. Dado o operador linear no R3 :
T (x, y, z) = (x + 2y + 2z, x + 2y − z, −x + y + 4z).
Determine o vetor u ∈ R3 tal que T (u) = (−1, 8, −11).
Fazendo u = (x, y, z) temos que T (u) = T (x, y, z) = (−1, 8, −11) ou seja,
(x + 2y + 2z, x + 2y − z, −x + y + 4z) = (−1, 8, −11)
ou 
x + 2y + 2z = −1


x + 2y − z = 8

−x + y + 4z = −11

cuja solução é x = 1, y = 2 e z = −3. Logo, u = (1, 2, −3).

85
Núcleo e Imagem de uma Transformação Linear
A seguir, introduziremos e estabeleceremos propriedades de núcleo e imagem de uma trans-

formação linear. Veremos que estes objetos têm estrutura de subespaços vetorias e são
usados no estudo das tranformações lineares. Apresentaremos, por exemplo, o teorema
da dimensão, o qual relaciona a dimensão do núcleo e da imagem com a dimensão do
domı́nio de uma transformação linear. Este resultado é muito útil no estudo da injetivi-
dade e/ou da sobrejetividade de uma transformação linerar. Por fim, introduziremos o
conceito de isomorfismos entre espaços vetoriais.
Iniciemos com a definição de núcleo de uma transformação linear.

Definição 160. Dada uma transformação linear T : U → V , chamamos de núcleo de T
o conjunto de todos os vetores u ∈ U tais que T (u) = 0. Denotaremos tal conjunto por
N (T ) ou Ker(T ). Assim, podemos escrever
N (T ) := {u ∈ U ; T (u) = 0}.
Note que N (T ) 6= ∅, uma vez que T (0) = 0, o vetor nulo de U sempre pertence a N (T ).
Agora, consideremos algumas transformações lineares e determinemos seus núcleos.

Exemplo 161. Seja T : R2 → R definida por T (x, y) = x − y. Neste caso,
N (T ) = {(x, y) ∈ R2 ; x − y = 0},
ou seja, N (T ) é a reta y = x. Podemos ainda escrever
N (T ) = {(x, x); x ∈ R}
= {x(1, 1); x ∈ R}
= [(1, 1)].
Exemplo 162. O núcleo da transformação linear T : R2 → R2 , dada por T (x, y) =
(x + y, 2x − y) é o conjunto
N (T ) = {(x, y) ∈ R2 ; (x + y, 2x − y) = (0, 0)},
isto é, a solução geral do sistema
(
x+y =0
2x − y = 0
a qual é x = y = 0.
Logo, N (T ) = {(0, 0)}.
Exemplo 163. A transformação linear T : R3 → R2 , dada por T (x, y, z) = (x − y −

z, 2x + y + 2z), apresenta como núcleo o conjunto
N (T ) = {(x, y, z) ∈ R3 ; (x − y − z, 2x + y + 2z) = (0, 0)},
ou seja, (x, y, z) ∈ N (T ) se, e somente se,
(
x−y−z =0
,
2x + y + 2z = 0
y −3
sistema que admite como solução x = 4
ez= 4
y.
Logo,
N (T ) = {( y4 , y, −3
4
y); y ∈ R}
= { y4 (1, 4, −3); y ∈ R}
= [(1, 4, −3)].
A seguir veremos que o conceito de imagem de uma transformação linear coincide com o
conceito de imagem de uma função qualquer.
Definição 164. Seja T : U → V uma transformação linear. Chamamos imagem de T

o conjuntos dos vetores v ∈ V tais que existe um vetor u ∈ U satisfazendo T (u) = v.
Denotaremos tal conjunto por Im(T ) ou T (V ). Assim,
Im(T ) := {v ∈ V ; T (u) = v para algum u ∈ U }.
Note que Im(T ) é sempre não vazia, pois, como T (0) = 0, temos que 0 ∈ Im(T ).
Vejamos alguns exemplos de transformações lineares e suas respectivas imagens.

Exemplo 165. Seja T : R3 → R3 , definida por T (x, y, z) = (0, y, z), isto é, T é a projeção
ortogonal de R3 no plano yOz. A imagem de T é o próprio plano yOz. De fato,
Im(T ) = {(0, y, z); y, z ∈ R}
= {y(0, 1, 0) + z(0, 0, 1); y, z ∈ R}
= [(0, 1, 0), (0, 0, 1)].
Já o núcleo de T é o eixo dos x, pois T (x, 0, 0) = (0, 0, 0), ∀x ∈ R e então

N (T ) = {(x, 0, 0); x ∈ R}
= {x(1, 0, 0); x ∈ R}
= [(1, 0, 0)].
Exemplo 166. A transformação nula T : U → V , T (u) = 0, ∀u ∈ U , tem Im(T ) = {0},
enquanto que o núcleo é todo U .
87
Exemplo 167. A transformação identidade I : U → U , I(u) = u, ∀u ∈ R, tem N (T ) =

{0}, enquanto que a imagem é todo o U .
O próximo resultado nos diz que os conjuntos núcleo e imagem de uma transformação
linear T : U → V são subespaços de U e V , respectivamente.
Proposição 168. Seja T : U → V uma transformação linear. Então,
(1) O núcleo de T , N (T ), é um subespaço vetorial de U .
(2) A imagem de T , Im(T ), é um subespaço vetorial de V .
Demonstração. (1) Como visto, 0 ∈ N (T ), logo N (T ) 6= ∅. Dados u1 , u2 ∈ N (T ) e

α ∈ R temos
SV 1) T (u1 + u2 ) = T (u1 ) + T (u2 ) = 0 + 0 = 0, ou seja, u1 + u2 ∈ N (T ).
SV 2) T (αu1 ) = αT (u1 ) = α0 = 0, ou seja, αu1 ∈ N (T ).
Portanto, N (T ) é um subespaço vetorial de U .
(2) Como 0 ∈ Im(T ), segue que Im(T ) 6= ∅. Dados v1 , v2 ∈ Im(T ) e α ∈ R, existem
u1 , u2 ∈ U tais que T (u1 ) = v1 e T (u2 ) = v2 . Assim,
SV 1) T (u1 + u2 ) = T (u1 ) + T (u2 ) = v1 + v2 , isto é, v1 + v2 ∈ Im(T ).
SV 2) T (αu1 ) = αT (u1 ) = αv1 , isto é, αv1 ∈ Im(T ).
Portanto, Im(T ) é um subespaço vetorial de V .

Os conceitos de injetividade, sobrejetividade e bijetividade já são bem conhecidos quando

se trata de funções. O que veremos a seguir é que estes conceitos também são introduzidos
ao estudo de transformações lineares.
Definição 169. Seja T : U → V uma transformação linear.
(1) Dizemos que T é injetora se para todos u1 , u2 ∈ U , u1 6= u2 implica T (u1 ) 6=
T (u2 ). Equivalentemente, T (u1 ) = T (u2 ) implica u1 = u2 , ∀u1 , u2 ∈ U .
(2) Dizemos que T é sobrejetora se Im(T ) = V , ou seja, para todo v ∈ V existe
pelo menos um u ∈ U tal que T (u) = v.
(3) Dizemos que T é bijetora se ela for injetora e sobrejetora.
O próximo resultado nos auxilia na verificação de uma transformação linear ser ou não
injetora.
Proposição 170. Uma transformação linear T : U → V é injetora se, e somente se,

N (T ) = {0}.
Demonstração. Primeiramente suponhamos que T é injetora. Sabemos que T (0) = 0 e,

como T é injetora, dado u ∈ N (T ) temos que T (u) = 0 = T (0) implica que u = 0. Logo,
N (T ) = {0}.
Por fim, suponhamos que N (T ) = {0}. Dados u1 , u2 ∈ U tais que T (u1 ) = T (u2 ), temos
que T (u1 ) − T (u2 ) = 0, o que implica T (u1 − u2 ) = 0, isto é, u1 − u2 ∈ N (T ). Como
N (T ) = {0}, segue que u1 = u2 e portanto T é injetora.
Teorema 171. (Teorema do núcleo e imagem) Seja T : U → V uma transformação

linear, em que U tem dimensão finita. Então,
dim N (T ) + dim Im(T ) = dim U.
Demonstração. Tome uma base {v1 , ..., vn } de N (T ). Como N (T ) é um subespaço de U ,

podemos completar este conjunto de modo a obter uma base de U . Seja {v1 , ..., vn , u1 , ..., um }
uma tal base de V .
Mostraremos que {T (u1 ), ..., T (um )} é uma base de Im(T ), ou seja,
(i) Im(T ) = [T (u1 ), ..., T (um )]
(ii) {T (u1 ), .., T (um )} é LI,
e com isto teremos que dim N (T ) + dim Im(T ) = n + m = dim U .
Provemos o item (i). Dado v ∈ Im(T ), existe u ∈ U tal que T (u) = v. Assim, existem
α1 , ..., αn , β1 , ..., βm ∈ R tais que
u = α1 v1 + ·... + αn vn + β1 u1 + ·... + βm um .
Além disto,
v = T (u) = T (α1 v1 + ... + αn vn + β1 u1 + ... + βm um )
= α1 T (v1 ) + ... + αn T (vn ) + β1 T (u1 ) + ... + βm T (um ).
Mas T (vi ) = 0, pois vi ∈ N (T ), ∀i = 1, ..., n. Logo,

v = β1 T (u1 ) + ... + βm T (um ),
provando que Im(T ) = [T (u1 ), ..., T (um )].
Provemos agora o item ii). Considerando a combinação linear
γ1 T (u1 ) + · · · + γm T (um ) = 0,
devemos mostrar que γi = 0, ∀i = 1, ..., m.
Sendo T linear temos T (γ1 u1 + · · · + γm um ) = 0, ou seja, γ1 u1 + · · · + γm um ∈ N (T ), isto
é, existem δ1 , ..., δn ∈ R satisfazendo:
γ1 u1 + · · · + γm um = δ1 v1 + · · · + δn vn
89
ou
γ1 u1 + · · · + γm um − δ1 v1 − · · · − δn vn = 0.
Como {v1 , ..., vn , u1 , ..., um } é uma base de V , em particular é LI, concluı́mos que
γ1 = · · · = γm = δ1 = · · · = δn = 0.

Vejamos alguns exemplo de como aplicar o teorema acima.

Exemplo 172. Verifique nos exemplos anteriores as dim N (T ), dim Im(T ) e dim U.
Exemplo 173. Determine o núcleo e a imagem do operador linear T : R3 → R3 , dado
por
T (x, y, z) = (x + 2y + 2z, y − x, 4y − x + 2z),
bem como suas dimensões.
Temos que
N (T ) = {(x, y, z) ∈ R3 ; T (x, y, z) = 0},
ou seja,
(x, y, z) ∈ N (T ) ⇔ (x
 + 2y + 2z, y − x, 4y − x + 2z) = (0, 0, 0)
x + 2y + 2z = 0


⇔ −x + y = 0

−x + 2y + 2z = 0

cuja solução geral é (x, x, − 23 x), x ∈ R. Portanto,

3 3
N (T ) = {(x, x, − x); x ∈ R} = [(1, 1, − )].
2 2
3
Como {(1, 1, 2 )} é LI, segue que dim N (T ) = 1.
Agora,
Im(T ) = {(a, b, c) ∈ R3 ; T (x, y, z) = (a, b, c)},
para algum (x, y, z) ∈ R3 . Ou seja, (a, b, c) ∈ Im(T ) se existe (x, y, z) ∈ R3 tal que
(x + 2y + 2z, −x + y, −x + 4y + 2z) = (a, b, c)
o que equivale ao seguinte sistema possuir solução

x + 2y + 2z = a


−x + y = b .

−x + 4y + 2z = c

Escalonando a matriz ampliada deste sistema concluı́mos que ele só admite solução se
−a − 2b + c = 0. Assim,
Im(T ) = {(a, b, c) ∈ R3 ; −a − 2b + c = 0}
= {(−2b + c, b, c); b, c ∈ R2 }
= {b(−2, 1, 0) + c(1, 0, 1); b, c ∈ R}
= [(−2, 1, 0), (1, 0, 1)].
Note que dim Im(T ) = dim R3 − dim N (T ) = 3 − 1 = 2. Desta forma, podemos concluir
que o conjunto {(−2, 1, 0), (1, 0, 1)} é uma base de Im(T ).
Exemplo 174. Seja T : R3 → R2 a transformação linear tal que T (1, 0, 0) = (−1, 1),
T (0, 1, 0) = (3, 2) e T (0, 0, 1) = (1, 0).
(a) Use o teorema da dimensão para concluir que T não é injetora.
(b) Determine N (T ) e uma de suas bases.
(c) Determine Im(T ) e uma de suas bases. T é sobrejetora?
(a) Como dim Im(T ) é no máximo 2, pois Im(T ) ⊂ R2 , temos de
dim N (T ) + dim Im(T ) = dim R3 = 3

e então dim N (T ) é no mı́nimo 1. Logo, N (T ) 6= {0} e T é não injetora.
(b) Inicialmente vamos obter a expressão que define T . Para isto escrevemos
(x, y, z) = x(1, 0, 0) + y(0, 1, 0) + z(0, 0, 1)
e, em seguida, aplicamos T nesta igualdade:
T (x, y, z) = T (x(1, 0, 0) + y(0, 1, 0) + z(0, 0, 1))
= xT (1, 0, 0) + yT (0, 1, 0) + zT (0, 0, 1)
= x(−1, 1) + y(3, 2) + z(1, 0)
= (−x + 3y + z, x + 2y).
Agora,
(x, y, z) ∈ N (T ) ⇔ T (x, y, z) = (0, 0)
⇔ (−x
( + 3y + z, x + 2z) = (0, 0)
−x + 3y + z = 0
⇔
x + 2z = 0
cuja solução geral é (−2z, −z, z), z ∈ R. Logo, N (T ) = {(−2z, −z, z); z ∈ R} =
[(−2, −1, 1)] e portanto dim N (T ) = 1.
(c) Como dim Im(T ) = 3 − dim N (T ) = 3 − 1 = 2, segue que Im(T ) = R2 e então
qualquer base de R2 é base de Im(T ), por exemplo, a base canônica {(1, 0), (0, 1)}.
Além disto, T é sobrejetora.
Exemplo 175. Determine uma transformação linear T : R4 → R3 cujo núcleo seja gerado
por (1, 0, 0, 1) e (0, −1, 0, 1).
91
Sendo dim R4 = 4 e dim N (T ) = dim[(1, 0, 0, 1), (0, −1, 0, 1)] = 2, temos que
dim Im(T ) = 4 − 2 = 2.
O primeiro passo é completar o conjunto {(1, 0, 0, 1), (0, −1, 0, 1)} a uma base de R4 . Para
isso basta acrescentar os vetores (0, 0, 1, 0) e (0, 0, 0, 1), pois
α(1, 0, 0, 1) + β(0, −1, 0, 1) + γ(0, 0, 1, 0) + δ(0, 0, 0, 1) = 0
se, e somente se, α = β = γ = δ = 0. Agora, basta tomar o cuidado das imagens de
(0, 0, 1, 0) e (0, 0, 0, 1) pela T serem LI. Para isto, definimos T : R4 → R3 tal que
T (0, 0, 1, 0) = (0, 1, 0), T (0, 0, 0, 1) = (0, 0, 1), T (1, 0, 0, 1) = (0, 0, 0) e T (0, −1, 0, 1) = (0, 0, 0).
Dado (x, y, z, w) ∈ R4 reescrevemos

(x, y, z, w) = (w + y − x)(0, 0, 0, 1) + z(0, 0, 1, 0) + x(1, 0, 0, 1) − y(0, −1, 0, 1).
Assim,
T (x, y, z, w) = T ((w + y − x)(0, 0, 0, 1) + z(0, 0, 1, 0) + x(1, 0, 0, 1) − y(0, −1, 0, 1))
= (w + y − x)T (0, 0, 0, 1) + zT (0, 0, 1, 0) + 0 + 0
= (w + y − x)(0, 0, 1) + z(0, 1, 0)
= (0, z, w + y − x),
a qual é uma transformação linear cujo núcleo é gerado por (1, 0, 0, 1) e (0, −1, 0, 1).
Vejamos agora uma consequência do Teorema 171.

Corolário 176. Se U e V são espaços vetoriais de dimensões finitas, dim U = dim V e se
T : U → V é uma transformação linear, então são equivalentes as seguintes condições:
(a) T é sobrejetora.
(b) T é injetora.
(c) T é bijetora.
Demonstração. (a) ⇒ (b) Se T é sobrejetora, então Im(T ) = V e, como pelo Teorema

171
dim U = dim N (T ) + dim V , segue que dim N (T ) = 0, pois dim U = dim V . Logo,
N (T ) = {0} e, pela Proposição 170, T é injetora.
(b) ⇒ (c) Se T é injetora, então dim N (T ) = 0. Deste fato e do Teorema 171 segue que
dim U = dim Im(T ) = dim V . Como Im(T ) é um subespaço de V com mesma dimensão
de V , segue que Im(T ) = V , ou seja, T é sobrejetora e portanto bijetora.
(c) ⇒ (a) Imediato.
Definição 177. Chamamos de isomorfismo do espaço vetorial U em V a uma

transformação linear T : U → V que é bijetora. Neste caso os espaços U e V são ditos
isomorfos.
Sob o ponto de vista da álgebra linear, dois espaços vetoriais isomorfos são equivalentes.
Isto é, para um algebrista estes espaços são “iguais”.
• Note que, pelo Corolário 176, se T : U → V é uma transformação linear e dim U =
dim V , então, para verificar que T é isomorfismo, basta provar que T é injetora (N (T ) =
{0}) ou que T é sobrejetora.
93
Representação Matricial de uma Transformação Linear
Nesta seção, veremos que o estudo das transformações lineares está fortemente ligado ao
estudo das matrizes. De fato, vimos no Exemplo 154 que a qualquer matriz m×n podemos
associar uma transformação linear T : Rn → Rm . No que segue, vamos estabelecer o
contrário, ou seja, veremos que, fixadas bases do Rn e Rm , a toda transformação linear
T : Rn → Rm está associada uma única matriz.
Dadas uma transformação linear T : V → W , A uma base de V e B uma base W .

Buscamos uma matriz que represente T nestas bases. Para isto, sem perda de generali-
dade, considere o caso particular dim V = 3 e dim W = 2. Considere A = {v1 , v2 , v3 } e
B = {w1 , w2 }. Dado v ∈ V , podemos expressá-lo por:
v = α1 v1 + α2 v2 + α3 v3 ou vA = (α1 , α2 , α3 ),
e sua imagem T (v) por:
(3) T (v) = β1 w1 + β2 w2
ou T (v)B = (β1 , β2 ).
Por outro lado,
(4) T (v) = T (α1 v1 + α2 v2 + α3 v3 ) = α1 T (v1 ) + α2 T (v2 ) + α3 T (v3 ).
Sendo T (v1 ), T (v2 ) e T (v3 ) vetores de W podemos escrevê-los como combinação linear dos
vetores de B, ou seja,
T (v1 ) = a11 w1 + a21 w2
(5) T (v2 ) = a12 w1 + a22 w2
T (v3 ) = a13 w1 + a23 w2 .
Substituindo (5) em (4), obtemos

T (v) = α1 (a11 w1 + a21 w2 ) + α2 (a12 w1 + a22 w2 ) + α3 (a13 w1 + a23 w2 )
= (a11 α1 + a12 α2 + a13 α3 )w1 + (a21 α1 + a22 α2 + a23 α3 )w2 .
Comparando a última igualdade com (3), concluı́mos que:

β1 = a11 α1 + a12 α2 + a13 α3
β2 = a21 α1 + a22 α2 + a23 α3

que em forma matricial se escreve:

α1
 
   
β1 a11 a12 a13 



  =    α2  .
 
β2 a21 a22 a23  
α3
Denotando por [T ]A
B , a matriz (aij )2×3 acima, podemos escrever:
[T (v)]B = [T ]A
B [v]A .
A matriz [T ]A
B é chamada matriz de T em relação às bases A e B.
Observação 178. Uma observação importante para se obter [T ]A

B é que suas colunas
são as componentes das imagens dos vetores da base A em relação à base B, o que é
compravado pelas igualdades em (5):
T (v1 )B T (v2 )B T (v3 )B
↓ ↓ ↓

a11 a12 a13
.
a21 a22 a23
Em geral, dada uma transformação linear T : V → W , com dim V = n e dim W = m,

A = {v1 , ..., vn } e B = {w1 , ..., wm } bases de V e W , respectivamente, [T ]A
B será uma
matriz m × n, cuja coluna j é formada pelas componentes da imagem de vj ∈ A em
relação à base B, ou seja:
95
T (v1 )B T (v2 )B ··· T (vn )B

↓ ↓ ↓
 
a11 a12 ··· a1n
 a21 a22 ··· a2n 
.
 
 .. .. ..
 . . . 
am1 am2 ··· amn
Sendo assim, como a matriz [T ]A B depende das bases A e B, uma mesma transformação
linear pode ser representada por infinitas matrizes, bastando mudar as bases. Porém, uma
vez fixadas A e B, a matriz será única.
A seguir, veremos alguns exemplos deste processo de obter a matriz de uma transformação
linear relacionada a bases dadas.
Exemplo 179. Seja T : R2 → R3 a transformação linear

T (x, y) = (x − 2y, 5x + 3y, y − 4x).
Considere as bases A = {v1 = (−1, −1), v2 = (1, 2)} do R2 e B = {w1 = (1, 0, 0), w2 =
(1, 1, 0), w3 = (1, 1, 1)} do R3 .
(a) Determine [T ]A B
(b) Dado v = (5, 4) (coordenadas em relação à base canônica do R2 ), usando [T ]A
B
calcule T (v)B .
(a) Temos que

T (v1 )B T (v2 )B
↓ ↓
 
a11 a12
 a21 a22 ,
a31 a32
onde
T (v1 ) = T (−1, −1) = (1, −8, 3) = a11 (1, 0, 0) + a21 (1, 1, 0) + a31 (1, 1, 1),
ou seja,  
a11 + a21 + a31 = 1 a11 = 9

 

a21 + a31 = −8 ⇒ a21 = −11
 
a31 = 3
 a31 = 3

e
T (v2 ) = T (1, 2) = (−3, 11, −2) = a12 (1, 0, 0) + a22 (1, 1, 0) + a32 (1, 1, 1),
isto é,  
a12 + a22 + a32 = −3

 a12 = −14


a22 + a32 = 11 ⇒ a22 = 13 .
 
a32 = −2
 a32 = −2

Assim,  
9 −14
[T ]A
B =
 −11 13 
3 −2
(b) Vamos usar a relação

[T (v)]B = [T ]A
B [v]A .
Para isto, devemos expresar v = (5, 4) como coordenadas na base A,

v = (5, 4) = a(−1, −1) + b(1, 2)
isto é, ( (
−a + b = 5 a = −6
⇒
−a + 2b = 4 b = −1
ou seja, vA = (−6, −1).
Logo,    
9 −14 −40
−6
[T (v)]B =  −11 13  =  53  .
−1
3 −2 −16
Exemplo 180. Considere a mesma transformação linear do exemplo anterior e a mesma

base A do R2 . Seja C = {(1, 0, 0), (0, 1, 0), (0, 0, 1)} a base canônica do R3 .
(a) Determine [T ]AC.
(b) Calcule [T (v)]C , utizando [T ]A
C sendo v = (5, 4).
(a)
T (v1 ) = T (−1, −1) = (1, −8, 3) = 1(1, 0, 0) − 8(0, 1, 0) + 3(0, 0, 1)
T (v2 ) = T (1, 2) = (−3, 11, −2) = −3(1, 0, 0) + 11(0, 1, 0) − 2(0, 0, 1).
Assim,  
1 −3
[T ]A
C =
 −8 11  .
3 −2
97
(b) Como vA = (−6, −1), obtemos:

   
1 −3 −3
−6
[T (v)]C =  −8 11  =  37  .
−1
3 −2 −16
Note que, sendo C a base canônica do R3 , T (v)C = T (v) também poderia ser obtido
diretamente da lei que define T ,
T (v) = T (5, 4) = (5 − 2 · 4, 5 · 5 + 3 · 4, · − 4 · 5) = (−3, 37, −16).
Exemplo 181. Considere a mesma transformação linear e sejam C 0 = {(1, 0), (0, 1)} e
C = {(1, 0, 0), (0, 1, 0), (0, 0, 1)} as bases canônicas do R2 e do R3 , respectivamente.
0
(a) Determine [T ]CC .
0
(b) Se v = (5, 4) calcule T (v)C utizando [T ]C
C .
(a)
T (1, 0) = (1, 5, −4) = 1(1, 0, 0) + 5(0, 1, 0) − 4(0, 0, 1)
T (0, 1) = (−2, 3, 1) = −2(1, 0, 0) + 3(0, 1, 0) + 1(0, 0, 1).
Assim,  
1 −2
C 0
[T ]C = 5 3 .
−4 1
(b) Note que T (v)C não depende da base do domı́nio, mas sim do vetor v e da base C
e como tais objetos são idênticos aos do exemplo anterior teremos novamente T (v)C =
(−3, 37, −16).
Definição 182. No caso de A e B serem bases canônicas, representa-se [T ]A

B simplesmeste
por [T ] a qual é chamada matriz canônica de T . Neste caso, tem-se [T (v)] = [T ][v].
Observe que calcular T (v) pela matriz [T ] é o mesmo que fazê-lo pela expressão de T ,
como pode ser observado no último exemplo: T (5, 4) = (−3, 37, −16).
Os exemplos anteriores ilustram que dada uma transformação linear T , a cada dupla de
bases A e B corresponde uma matriz [T ]A
B . Por outro lado, no próximo exemplo veremos
que dadas uma matriz e um par de bases A e B, pode-se obter a expressão de T .
Exemplo 183. Dadas A = {(1, 1, 1), (1, 1, 0), (1, 0, 0)} base do R3 e B = {(1, 0), (1, 1)}
base do R2 , determine a transformação linear T : R3 → R2 tal que

A 1 0 1
[T ]B = .
2 −1 −1
Sabe-se que o significado de cada coluna de [T ]A B é:

1 0 1
[T (1, 1, 1)]B = , [T (1, 1, 0)]B = e [T (1, 0, 0)]B = .
2 −1 −1
Assim,
T (1, 1, 1) = 1(1, 0) + 2(1, 1) = (3, 2)
T (1, 1, 0) = 0(1, 0) − 1(1, 1) = (−1, −1)
T (1, 0, 0) = 1(1, 0) − 1(1, 1) = (0, −1).
Conhecidas as imagens dos vetores numa base A do domı́nio R3 de T , expressando o vetor
genérico (x, y, z) ∈ R3 como combinação linear dos elementos desta base A, obteremos
T (x, y, z):
(x, y, z) = α(1, 1, 1) + β(1, 1, 0) + γ(1, 0, 0)
 


 α + β + γ = x α = z


⇒ α+β =y ⇒ β =y−z .
 
α = z
 γ = x − y

Ou seja,
(x, y, z) = z(1, 1, 1) + (y − z)(1, 1, 0) + (x − y)(1, 0, 0).
Pela linearidade de T temos
T (x, y, z) = zT (1, 1, 1) + (y − z)T (1, 1, 0) + (x − y)T (1, 0, 0)
= z(3, 2) + (y − z)(−1, −1) + (x − y)(0, −1)
= (3z − y + z, 2z − y + z − x + y)
= (4z − y, 3z − x).
Dado um espaço vetorial V , lembre-se que um operador linear T sobre V nada mais é do
que uma transformação linear T : V → V . Neste caso, para tomar uma representação
matricial de T , é comum considerar a mesma base no domı́nio e no contradomı́nio, isto
é, fazer A = B. A matriz resultante, denotada simplesmente por [T ]A , é chamada matriz
de T em relação à base A. Por exemplo, o leitor pode verificar que a matriz do operador
T : R2 → R2 , T (x, y) = (2x + y, x − 3y) em relação à base A = {(−1, −1), (0, 1)} é

3 −1
[T ]A = .
5 −4
99
Produto Interno
O conceito de produto interno, que estudaremos a partir de agora, enriquece a estrutura

de espaço vetorial. De certa maneira, vamos formalizar conceitos geométricos, como o de
comprimento de um vetor e ângulos entre dois vetores. Isso dará uma melhor compreensão
de certos conceitos estudados anteriormente, como os de base ortogonal e ortonormal.
Além dessa linguagem mais geométrica, podemos, de certa forma, ver um espaço com
produto interno como uma generalização natural do espaço euclidiano R3 , que é um espaço
que estamos mais acostumados a estudar.
Lembramos que, quando falamos em espaço vetorial, estamos nos referindo a espaços
vetorias sobre R.
Definição 184. Seja V um espaço vetorial. Um produto interno sobre V é uma função
de V × V em R, denotada por h, i, que associa a cada par de vetores u, v ∈ V um número
real hu, vi e que satisfaz as seguintes propriedades:
i) hu, ui > 0, se u 6= 0.
ii) hu, vi = hv, ui, para quaisquer u, v ∈ V .
iii) hu + v, wi = hu, wi + hv, wi, para quaisquer u, v, w ∈ V .
iv) hλ.u, vi = λ.hu, vi, para quaisquer u, v ∈ V e λ ∈ R.
O número real hu, vi é chamado de produto interno de u por v.
Observação 185. Seja V um espaço vetorial.

1) Note que h0, ui = 0, para todo u ∈ V . De fato, h0, ui = h0 + 0, ui = h0, ui + h0, ui ⇒
h0, ui = 0.
2) hu, ui = 0 se, e somente se, u = 0. De fato, de i) da definição de espaço vetorial,
sabemos que hu, ui > 0, se u 6= 0. Logo, como hu, ui = 0, segue que u = 0. Por outro
lado, por 1) acima, é claro que se u = 0, então hu, ui = 0.
3) Dado u ∈ V , se hu, vi = 0, para todo v ∈ V . Então, u = 0. (Deixamos esta verificação
a cargo do leitor, ela será cobrada na seção de exercı́cios.)
4) Sejam u, w ∈ V tais que hu, vi = hw, vi, para todo v ∈ V . Então, u = w. (Deixamos
esta verificação a cargo do leitor, ela será cobrada na seção de exercı́cios.)
Exemplo 186. Para cada u = (u1 , . . . , un ) e v = (v1 , . . . , vn ) em Rn , defina

n
X
hu, vi = ui .vi .
i=1
n
Esta função é um produto interno sobre R , chamado de produto interno canônico.
Vejamos se as quatro propriedades da definição de produto interno são de fato satisfeitas.
n
X n
X
n
i) Seja u = (u1 , . . . , un ) 6= (0, 0, . . . , 0) em R . Logo, hu, ui = ui .ui = u2i . Como,
i=1 i=1
(u1 , . . . , un ) 6= (0, 0, . . . , 0), então ui 6= 0 para pelo menos um i ∈ {1, 2, . . . , n}. Daı́,
Xn
u2i > 0, ou seja, hu, ui > 0.
i=1
ii) Dados u = (u1 , . . . , un ) e v = (v1 , . . . , vn ) em Rn , temos que

n
X n
X
hu, vi = ui .vi = vi .ui = hv, ui.
i=1 i=1
iii) Dados u = (u1 , . . . , un ), v = (v1 , . . . , vn ) e w = (w1 , . . . , wn ) em Rn , temos que

n
X n
X n
X n
X
hu + v, wi = (ui + vi ).wi = (ui .wi + vi .wi ) = ui .wi + vi .wi = hu, wi + hv, wi.
i=1 i=1 i=1 i=1
iv) Dados u = (u1 , . . . , un ) e v = (v1 , . . . , vn ) em Rn , e λ ∈ R, temos que

n
X n
X n
X
hλu, vi = (λui ).vi = λ.(ui .vi ) = λ ui .vi = λhu, vi.
i=1 i=1 i=1
Exemplo 187. Seja f uma função de R2 × R2 em R, dedinida, para cada u = (u1 , u2 ) e

v = (v1 , v2 ) em R2 , por
f (u, v) = 2u1 v1 + u2 v2 .
Será que a função f é um produto interno sobre R2 ?
Para responder esta pergunta devemos verificar se as quatro propriedades da definição de
produto interno são satisfeitas.
i) Seja u = (u1 , u2 ) ∈ R2 , com (u1 , u2 ) 6= (0, 0). Então, f (u, u) = 2u1 u1 + u2 u2 =
2u21 + u22 > 0, pois (u1 , u2 ) 6= (0, 0). Logo, i) é satisfeita.
ii) Sejam u = (u1 , u2 ) e v = (v1 , v2 ) em R2 . Então, f (u, v) = 2u1 v1 +u2 v2 = 2v1 u1 +v2 u2 =
f (u, v). Daı́, ii) também é satisfeita.
iii) Sejam u = (u1 , u2 ), v = (v1 , v2 ) e w = (w1 , w2 ) em R2 . Então, f (u + v, w) =
2(u1 +v1 )w1 +(u2 +v2 )w2 = 2u1 w1 +2v1 w1 +u2 w2 +v2 w2 = 2u1 w1 +u2 w2 +2v1 w1 +v2 w2 =
f (u, w) + f (v, w). Assim, iii) também é satisfeita.
101
iv) Sejam u = (u1 , u2 ) e v = (v1 , v2 ) em R2 e λ ∈ R.

Então, f (λu, v) = 2(λu1 )v1 + (λu2 )v2 = λ.2u1 v1 + λu2 v2 = λ(2u1 v1 + u2 v2 ) = λf (u, v). E
iv) também é satisfeita.
Portanto, f é um produto interno.
V um espaço vetorial com um produto interno h, i. Para cada v ∈ V ,

Definição 188. Seja p
o número real kvk = hv, vi é chamado de norma, ou comprimento, do vetor v.
A seguir, veremos algumas propriedades elementares relacionadas à norma de um vetor.
Seja V um espaço vetorial com pruduto interno h, i. Então, das definições de produto
interno e de norma, temos que:
• kvk = 0 se, e somente se, v = 0.
• kvk ≥ 0, para todo v ∈ V .
• kλ.vk = |λ|.kvk, para quaisquer v ∈ V e λ ∈ R.
Definição 189. Se kvk = 1, dizemos que v é um vetor unitário.
Exemplo 190. Considere o espaço vetorial R2 p com o produto interno canônico. Então,
2
para cada v = (v1 , v2 ) ∈ R , tem-se que kvk = v12 + v22 . Assim, o vetor v = (1, 0) tem
norma 1.
Exemplo 191. Agora, considere o espaço vetorial R2 com o produto p interno dado no
Exemplo 187. Logo, para cada v = (v1 , v2 ) ∈ R2 , tem-se que √
kvk = 2v12 + v22 . Daı́, com
respeito a esta norma, o vetor v = (1, 0) tem norma igual a 2.
Observação 192. É interessante observar que se V é um espaço com produto interno

h, i, então, para quaisquer u, v ∈ V , tem-se que
ku + vk2 = hu + v, u + vi = hu, ui + hu, vi + hv, ui + hv, vi = kuk2 + 2hu, vi + kvk2 .

O teorema que veremos a seguir apresenta uma desigualdade, conhecida por Desigualdade
de Schwarz, que é muito útil no estudo da Álgebra Linear, além de outros ramos da
Matemática.
Teorema 193. (Desigualdade de Schwarz) Seja V um espaço vetorial com produto in-
terno. Então,
|hu, vi| ≤ kuk.kvk , ∀u, v ∈ V.
Demonstração. Sejam V um espaço com produto interno e u, v ∈ V . Considere a função

real f (x) = ku − x.vk = hu − x.v, u − x.vi, para todo x ∈ R. Observe que f (x) ≥ 0, para
todo x. Além disso, pelas propriedades do produto interno, segue que
ku − x.vk = hu − x.v, u − x.vi = kuk2 − 2hu, vi.x + kvk2 .x2 ≥ 0.
Agora, como f é uma função quadrática, da forma ax2 + bx + c, não negativa, segue que
o discriminante ∆ = b2 − 4ac ≤ 0, ou seja, (−2hu, vi)2 − 4kuk2 kvk2 ≤ 0.
Portanto, 4(hu, vi)2 − 4kuk2 kvk2 ≤ 0 ⇒ |hu, vi| ≤ kuk.kvk.

Exercı́cio: Seja V um espaço vetorial com produto interno. Mostre que

ku + vk ≤ kuk + kvk , ∀u, v ∈ V.
Esta desigualdade é conhecida com Desigualdade Triangular.

103
Ortogonalidade
Definição 194. Seja V um espaço com produto interno h, i. Dizemos que u, v ∈ V são
ortogonais, indicamos u⊥v, se hu, vi = 0.
Observe que o vetor nulo 0 é ortogonal a todos elementos de um espaço vetorial V com
produto interno, já que h0, vi = 0, ∀v ∈ V .
Exemplo 195. Considere o espaço R2 com o produto interno canônico. Então, os vetores
u = (2, −1) e v = (2, 4) são ortogonais, já que hu, vi = 2.2 + (−1).4 = 0.
Definição 196. Um subconjunto W de V é chamado de ortogonal se hu, vi = 0, ∀u, v ∈

W , com u 6= v. Se em um conjunto ortogonal W tem-se kuk = 1, ∀u ∈ W , dizemos que
W é ortonormal.
Exemplo 197. Considere R2 com o produto interno canônico. Seja A = {(−1, 2), (6, 3)}.
Então, A é um conjunto ortogonal, pois h(−1,p √ + 2.3 = −6 + 6 = 0.
2), (6, 3)i = (−1).6
2 2
Mas, A não é ortonormal, já que k(−1, 2)k = (−1) + 2 = 5 6= 1.
( √ √ √ √ )
2 2 2 2
Exemplo 198. Considere R3 com o produto interno canônico. Seja A = ( , , 0), ( ,− , 0) .
2 2 2 2
√ √ √ √ √ √
2 2 2 2 2 2
Então, A é um conjunto ortonormal, pois h( , , 0), ( ,− , 0)i = 0, k( , , 0)k =
√ √ 2 2 2 2 2 2
2 2
1 e k( ,− , 0)k = 1.
2 2
Um resultado interessante a respeito de subconjuntos ortogonais é o seguinte.
Proposição 199. Sejam V um espaço vetorial com produto interno e W = {w1 , w2 , . . . , wn }

um subconjunto ortogonal de V , com wi 6= 0, para todo i = 1, 2, . . . , n.
a) Se v é um elemento do subespaço gerado por W , então
n
X hv, wi i
v= .wi .
i=1
kwi k2
b) O conjunto W é linearmente independente.

n
X
Demonstração. a) Seja v um elemento do subespaço gerado por W . Logo, v = ai w i ,
i=1
com
ai ∈ R, para todo i = 1, 2, . . . , n. Como W = {w1 , w2 , . . . , wn } é ortogonal, para cada
k = 1, 2, . . . , n, temos que
Xn n
X
hv, wk i = h ai wi , wk i = ai hwi , wk i = ak hwk , wk i.
i=1 i=1
hv, wk i
Como wk 6= 0, para todo k, e hwk , wk i = kwk k2 , segue que ak = .
kwk k2
n
X hv, wi i
Portanto, v = .wi .
i=1
kwi k2
b) Sejam a1 , a2 , . . . , an ∈ R tais que a1 w1 + a2 w2 + . . . + wn = 0.

Daı́, para cada k = 1, 2, . . . , n, temos que
Xn n
X
0 = h0, wk i = h ai wi , wk i = ai hwi , wk i = ak hwk , wk i.
i=1 i=1
Como hwk , wk i 6= 0, para todo k, pois wk 6= 0, então ak = 0, para todo k, e segue que W
é linearmente independente.
Definição 200. Uma base B de um espaço vetorial V é chamada de base ortonormal,

se B for ortonormal.
Exemplo 201. Considere Rn com o produto interno canônico. Então, a base canônica
{e1 , e2 , . . . , en } de Rn é um conjunto ortonormal, já que hei , ej i = 0, se i 6= j, e hei , ei i =
1 ⇒ kei k = 1, para todo i = 1, 2, . . . , n. Assim, a base canônica é um exemplo de base
ortonormal de Rn .
Observação 202. Da Proposição 199, segue que se B = {w1 , w2 , . . . , wn } é uma base

ortonormal de um espaço vetorial V com produto interno, então, para todo v ∈ V , tem-se
n
X
v= hv, wi iwi .
i=1
105
Será que todo espaço vetorial de dimensão finita com produto interno possui uma base
ortonormal?
A resposta é sim. Veremos que, se V é um espaço de dimensão finita com produto interno,
é possı́vel, a partir de uma base qualquer de V , construir uma base ortonormal de V . Este
processo é chamado de processo de ortonormalização de Gram-Schmidt e consiste
no seguinte.
Dada uma base B = {v1 , v2 , . . . , vn } do espaço V , primeiramente obteremos uma base

ortogonal B 0 = {w1 , w2 , . . . , wn } de V . A seguir, obtemos a base ortonormal B 00 =
wi
{u1 , u2 , . . . , un }, onde, para cada i = 1, 2, . . . , n, ui = .
kwi k
Processo de ortonormalização de Gram-Schmidt
Seja V um espaço vetorial de dimensão finita n com produto interno. Seja B = {v1 , v2 , . . . , vn }
uma base de V .
1) defina w1 = v1
hw1 , v2 i
2) defina w2 = v2 − .w1
hw1 , w1 i
É importante observar que w2 6= 0 , já que {v1 , v2 } é linearmente independente.
3) definidos w1 , w2 , . . . , wk , com 1 ≤ k < n, podemos definir wk+1 como sendo

k
X hwi , vk+1 i
wk+1 = vk+1 − .wi .
i=1
hwi , wi i
Assim, temos que B 0 = {w1 , w2 , . . . , wn } é uma base ortogonal de V . Daı́, tomando ui =

wi
, para cada i = 1, 2, . . . , n, segue que B 00 = {u1 , u2 , . . . , un } é uma base ortonormal
kwi k
de V .
De fato, para n = 1 o resultado é claramente válido.

Suponhamos que para um inteiro n > 1 arbitrário o algoritmo é válido, ou seja, o processo
produz uma base ortonormal B 00 = {u1 , u2 , . . . , un } para qualquer espaço V de dimensão
n.
Agora, sejam V um espaço com produto interno de dimensão n+1 e B = {v1 , v2 , . . . , vn , vn+1 }
uma base de V . Pela hipótese de indução, é possı́vel, a partir de {v1 , v2 , . . . , vn }, obter
uma base ortogonal {u1 , . . . , un } para o espaço V 0 gerado por {v1 , v2 , . . . , vn }. Definindo
o vetor wn+1 por
Xn
wn+1 = vn+1 − hui , vn+1 i.ui ,
i=1
temos que wn+1 é ortogonal a cada um dos uj , 1 ≤ j ≤ n, já que

n
X n
X
hwn+1 , uj i = hvn+1 − hui , vn+1 i.ui , uj i = hvn+1 , uj i − h hui , vn+1 i.ui , uj i
i=1 i=1
= hvn+1 , uj i − hvn+1 , uj i.huj , uj i = hvn+1 , uj i − hvn+1 , uj i = 0.

wn+1
Daı́, tomando un+1 = , segue que {u1 , . . . , un , un+1 } é um conjunto ortonormal.
kwn+1 k
Para mostrar que {u1 , . . . , un , un+1 } é uma base de V , note que cada uj é uma combinação
linear dos vetores {v1 , . . . , vn+1 }. Logo, temos n + 1 vetores linearmente independentes
em um espaço V de dimensão n + 1, e assim temos que {u1 , . . . , un , un+1 } é de fato uma
base de V .
Portanto, por indução matemática, provamos que o processo de ortonormalização de
Gram-Schmidt é válido.
Exemplo 203. Considere o espaço R2 com o produto interno usual. Utilizando o processo
de ortonormalização de Gram-Schmidt, vamos construir uma base ortonormal de R2 a
partir da base B = {(2, 0), (−1, 1)}, a qual claramente não é ortonormal.
Sejam v1 = (2, 0) e v2 = (−1, 1).
1) w1 = (2, 0)
h(2, 0), (−1, 1)i (−2)

2) w2 = (−1, 1)− .(2, 0) = (−1, 1)− .(2, 0) = (−1, 1)−(−1, 0) = (0, 1)
h(2, 0), (2, 0)i 4
(2, 0) (2, 0)
Finalmente, tomando u1 = = = (1, 0) e u2 = w2 = (0, 1), já que kw2 k = 1,
k(2, 0)k 2
temos que {u1 , u2 } é uma base ortonormal de R2 .
107
Exemplo 204. Considere o espaço R3 com o produto interno usual. Encontre uma base
ortonormal para R3 a partir da base {(1, 1, 1), (0, 2, 1), (0, 0, 1)}.
Sejam v1 = (0, 0, 1), v2 = (1, 1, 1) e v3 = (0, 2, 1).
1) w1 = (0, 0, 1)
h(0, 0, 1), (1, 1, 1)i 1
2) w2 = (1, 1, 1) − .(0, 0, 1) = (1, 1, 1) − (0, 0, 1) = (1, 1, 0)
h(0, 0, 1), (0, 0, 1)i 1
h(0, 0, 1), (0, 2, 1)i h(1, 1, 0), (0, 2, 1)i
3) w3 = (0, 2, 1) − .(0, 0, 1) − .(1, 1, 0)
h(0, 0, 1), (0, 0, 1)i h(1, 1, 0), (1, 1, 0)i
= (0, 2, 1) − (0, 0, 1) − (1, 1, 0) = (−1, 1, 0)
Assim, temos que:

w1 (0, 0, 1)
u1 = = = (0, 0, 1)
kw1 k 1
w2 (1, 1, 0) 1 1
u2 = = √ = ( √ , √ , 0)
kw2 k 2 2 2
w3 (−1, 1, 0) 1 1
u3 = = √ = (− √ , √ , 0)
kw3 k 2 2 2

1 1 1 1
Logo, a base ortonormal procurada será (0, 0, 1), ( √ , √ , 0), (− √ , √ , 0) .
2 2 2 2
Seguindo os exemplos feitos nesta seção, faça os exercı́cios para uma melhor fixação do
processo de ortonormalização de Gram-Schmidt.

Notas de Aula Algebra Linear

Enviado por

Direitos autorais:

Formatos disponíveis

Notas de Aula Algebra Linear

Enviado por

Dados do documento

Descrição original:

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Notas de Aula Algebra Linear

Enviado por

Direitos autorais:

Formatos disponíveis

NOTAS DE AULA DE ÁLGEBRA LINEAR

GUILHERME CHAUD TIZZIOTTI

[1] LIMA, E. L. Álgebra Linear. Rio de Janeiro: Sociedade Brasileira de Matemática,

[2] LIESEN, J. ; MEHRMANN, V. Linear Algebra. Springer, 2015.

[5] BOLDRINI, J. L.; COSTA, S. I. R.; FIGUEIREDO, V. L.; WETZLER, H. G. Álgebra

Datas das provas:

Primeira prova (P1) - 03 de novembro - 35 pontos.

Segunda prova (P2) - 01 de dezembro - 35 pontos.

Terceira prova (P3) - 19 de janeiro - 30 pontos.

Prova substitutiva - 26 de janeiro

Atendimento: sexta-feira das 9h às 10:30h sala 1F 102

Quando falamos em matrizes, o que lhe vem à mente? Certamente a resposta é um

Definição 1 (Matriz ). Chamamos de matriz de ordem m por n um quadro com m linhas

A seguir, veremos como chamamos algumas matrizes com caracterı́sticas especiais.

Matriz coluna: Uma matriz de ordem m por 1 é chamada de matriz coluna.

Matriz linha: Uma matriz de ordem 1 por n é chamada de matriz linha.

Matriz retangular: É uma matriz de ordem m por n com m 6= n.

Matriz quadrada: É uma matriz na qual o número de linhas é igual ao número de

Observação 2. Quando nos referirmos à ordem de uma matriz quadrada n × n, diremos

Duas definições importantes no estudo de matrizes relacionada a matrizes quadradas são

Definição 4. Seja A = (aij ) uma matriz quadrada de ordem n. O traço de A, denotado

Matriz diagonal: Uma matriz quadrada A = (aij ), de ordem n, é chamada de matriz

Matriz triangular: Uma matriz quadrada A = (aij ), de ordem n, é chamada de matriz

Adição e subtração de matrizes: Sejam A = (aij ) e B = (bij ) duas matrizes m × n.

A seguir, vemos alguns exemplos de adição e subtração de matrizes.

Finalizamos esta seção introduzindo propriedades fundamentais a respeito da adição de

Propriedades da adição de matrizes: Sejam A = (aij ), B = (bij ) e C = (cij ) matrizes

1) A + (B + C) = (A + B) + C, ou seja, a adição de matrizes é associativa.

2) A + B = B + A, isto é, a adição de matrizes é comutativa.

3) A + 0 = A, a matriz nula 0 é o elemento neutro com respeito à adição de matrizes.

4) −A + A = A − A = 0, isto é, a matriz −A é a matriz inversa da matriz A com respeito

Utilizando as definições de adição a subtração de matrizes não é difı́cil mostrar a veraci-

O produto de uma matriz por um escalar satisfaz as seguintes propriedades.

Propriedades do produto de uma matriz por um escalar: Sejam α e β escalares,

Vejamos que dados dois escalares α e β, e uma matriz A = (aij ), de ordem m × n,

Produto de matrizes: Sejam A = (aij ) uma matriz m × n e B = (bij ) uma matriz r × s.

Note que, tanto AB quanto BA existem, mas claramente AB é diferente de BA.

E temos mais um exemplo em que AB 6= BA.

Portanto, podemos dizer que a multiplicação de matrizes não é comutativa.

Mas existem matrizes A e B tais que AB = BA. Um exemplo óbvio é quando B = A.

Ou seja, temos que AB = BA = I2 .

Matriz inversa: Dada uma matriz quadrada de A de ordem n. A matriz B (quando

Propriedades do produto de matrizes:

1) Sejam A, B e C matrizes de ordem m × n, n × p e p × r, respectivamente. Então,

2) Sejam A, B e C matrizes de ordem m × n, m × n e n × p, respectivamente. Então,

3) Sejam A, B e C matrizes de ordem m × n, m × n e p × m, respectivamente. Então,

4) Se A é uma matrizes de ordem m × n, então Im A = AIn = A;

5) Sejam A e B matrizes de ordem m × n, n × p, respectivamente. Então, para todo

3. Matrizes Transposta, Simétrica e Ortogonal

Vamos começar esta seção definindo a transposta de uma matriz.

Matriz transposta: Seja A = (aij ) uma matriz m × n. A matriz transposta de A,

Propriedades da matriz transposta:

1) (A + B)T = AT + B T , onde A e B são matrizes m × n.

2) (αA)T = αAT , sendo A uma matriz qualquer.

3) (AT )T = A, sendo A uma matriz qualquer.

4) (AB)T = B T AT , onde A é uma matriz m × n e B é uma matriz n × m.

Primeiramente, vejamos a validade de 1), isto é, (A + B)T = AT + B T . De fato, sejam

Deixaremos a verificação das propriedades 3) e 4) como exercı́cio.

Matriz simétrica: Uma matriz quadrada A = (aij ) é uma matriz simétrica se AT = A,