Álgebra A Nodrm

Tapa Álgebra final.
pdf 1 17/02/2020 9:25:07

Álgebra A
Universidad de Buenos Aires
Rector Alberto Edgardo Barbieri

Vicerrector Juan Pablo Más Vélez
Secretaría de Asuntos Académicos María Catalina Nosiglia
Subsecretaría de Innovación y
Calidad Académica Marilina Lipsman
PROGRAMA UBA XXI

Coordinadora General Claudia Lombardo
Vicecoordinadora Laura Basabe
Coordinación Desarrollo Pedagógico María Alejandra Codazzi

Camila Rodríguez
Marianela Renzi
Coordinación Producción Transmedia Liliana Castillo

Griselda Raffo
Ariel F. Guglielmo
Álgebra A / coordinación general de Claudia Lombardo.- 1a ed.-
Ciudad Autónoma de Buenos Aires : Eudeba, 2020.
Libro digital, PDF - (UBA XXI)
Archivo Digital: descarga

ISBN 978-950-23-2970-3
1. Álgebra. 2. Universidades Públicas. I. Lombardo, Claudia, coord.

CDD 512
Eudeba
Universidad de Buenos Aires
Primera edición: marzo de 2020
© 2020
Editorial Universitaria de Buenos Aires
Sociedad de Economía Mixta
Av. Rivadavia 1571/73 (1033) Ciudad de Buenos Aires
Tel: 4383-8025 / Fax: 4383-2202
www.eudeba.com.ar
Legales.indd 1 26/03/2020 12:01:22 p.m.

Presentación
UBA XXI es un Programa de Educación a Distancia de la Universidad de Buenos

Aires, que asume los desafíos de enseñanza del Nivel Superior. Se trata de una
propuesta pedagógica con estrategias de enseñanza orientadas a promover y
consolidar aprendizajes de calidad en los estudiantes que opten por continuar sus
estudios en la UBA.
Álgebra es un texto diferente en el que van a encontrar explicaciones de distintos

conceptos con ejemplos básicos, incluidos para acompañarlos, en la compresión
de las ideas que se encuentran detrás de las definiciones y los objetos que van a
estudiar.
UBA XXI a través de diferentes recursos instala debates para estimular el avance de
las comunidades de conocimiento en el marco de nuevos escenarios de enseñanza y
aprendizaje, sin perder de vista su complejidad.
Los invitamos a leer Álgebra con el deseo de promover nuevas lecturas que les
permitan resignificar y contextualizar los temas aquí presentados.
Claudia Lombardo
Coordinadora General
UBA XXI
A mi mujer Melina y mis hijos Agustín y Santiago, con la promesa que nunca estaré en el lado equivocado otra vez.
Nicolás.
A Ale y Tiara, por animarme a volar y cumplir mis sueños. A Analía por alentarme a asumir este proyecto.
Rosa María.
A todas las personas que me crucé y me sigo cruzando en este camino de aprender y enseñar matemáticas.
Ximena.
A Pasio por su ayuda con el lenguaje. A mis viejos y hermanos por todo lo demás.
Gerardo.
9
Introducción
Este libro es, probablemente, muy diferente a otros libros o apuntes de matemática que hayan leído: aquí encontrarán
un importante caudal de explicaciones de conceptos y ejemplos básicos incluidos para ayudarlos a entender las
ideas detrás de las definiciones y los objetos que estudiaremos. Muchos textos de matemática presentan las teorías
desde un punto de vista formal y abstracto (“la teoría es esta y así funciona”) en lugar de explicar el origen y las
implicaciones y aplicaciones de la misma, lo que clarifica completamente los conceptos que la conforman, de
manera que resulta casi natural su existencia. Asimismo, mucha de la teoría contenida en este libro tiene orígenes
(y aplicaciones) geométricas, y se ha hecho énfasis en resaltar estos hechos, dejando en un segundo plano la
“abstractización” de la teoría para dar lugar a un enfoque más visual e intuitivo.
El cuerpo del texto está separado en dos partes. En la primera donde se desarrollan aspectos más geométricos,
aunque no exentos de álgebra, mientras que en la segunda los aspectos son netamente algebraicos, lo cual no obsta a
que se los relacione con los de la primera parte. Al final de esa segunda parte encontrarán las resoluciones de los
experimentos.
Para los alumnos que no estén familiarizados con el formato de los libros de matemática, es sugerido que tomen el
curso virtual LECMat, disponible gratuitamente en el campus virtual de UBA XXI.
La siguiente lista muestra los distintos tipos de categorías que contiene el apunte:
1. Definiciones, Teoremas y Proposiciones.
2. Ejemplos.
3. Observaciones.
4. Experimentos.
5. Para pensar (representado por una lamparita).
6. Información complementaria (representada por una letra “i”).
Teniendo en cuenta estas disposiciones, el estudiante debe tener presente el siguiente orden de prioridades.
1. P RIORIDAD 1.
Definiciones, Teoremas, Proposiciones.
Ejemplos.
2. P RIORIDAD 2.
Observaciones.
Experimentos.
Texto en cursiva.
3. P RIORIDAD 3.
Para pensar.
Información complementaria.
Sugerimos que, en una primera lectura, el apunte sea leído en su totalidad. Para el alumno que desee, en lecturas
posteriores, utilizar el apunte, puede optar por leer solo las categorías de P RIORIDAD 1 ó de P RORIDAD 1 y 2,
según el grado de produndidad que desee encarar.
En próxima página encontrarán ejemplos de los distintos formatos y categorías del apunte.
10
Página ejemplo
El texto sin formato (estándar) es texto de lectura obligatoria. En él se introducirán objetos, se explicarán conceptos
y se resolverán problemas concretos necesarios para el desarrollo de la teoría.
Definición 1 Las definiciones, Proposiciones y Teoremas aparecen con una barra vertical naranja gruesa sobre
el margen izquierdo. Esto es indicativo de información esencial de la teoría.
Teorema 1 Los Teoremas, Proposiciones y Lemas aparecen con la barra vertical gruesa también.
Ejemplo 1 Los ejemplos aparecen en letra más pequeña y centrados en la página. Esto ayudará al estudiante a
indentificarlos rápidamente dentro del texto. En general, muestran como llevar a cabo cálculos introducidos en la teoría
y de qué manera escribir la solución de los ejercicios.
Observación 2 Las observaciones aparecen con una barra vertical naranja finita sobre el margen izquierdo.
Esta categoría contiene información y notas importantes que complementan la teoría.
Experimento 1 Los experimentos son “ejercicios guiados” que se dejan al estudiante para resolver. Esta es
la mejor manera de aprender los conceptos introducidos. Muchas veces, cuando se considera que el estudiante
tiene las herramientas para entender una definición o una cuenta por su lado, se lo deja planteado para que lo
descubra por su cuenta dentro de un experimento. Las resoluciones de los experimentos se encuentran al final
del libro.
Esta sección “Para pensar...” tiene por objetivo dejarle al estudiante una pregunta relacionada con la teoría
que acaba de aprender. Le será áltamente beneficioso tomarse un tiempo para pensar estas preguntas ya que le
ayudará a comprender en más profundida muchos de los conceptos desarrollados.
Esta sección “Información complementaria” tiene por objetivo complementar algunos de los conceptos
introducidos para una formación más integral del estudiante.
Contenidos
I Parte 1
1 Vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.1 Conjuntos 19
1.1.1 ¿Qué es un conjunto? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.1.2 ¿Cómo describir un conjunto? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.1.3 Subconjuntos del plano y el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.1.4 Cómo construir conjuntos a partir de otros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.2 Vectores de Rn 25
1.2.1 La noción de vector . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.2.2 Vectores en el espacio n-dimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.3 Producto escalar de vectores 32
1.3.1 Producto escalar, norma y distancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.3.2 Ángulo entre vectores y ortogonalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2 Rectas y planos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.1 Rectas 39
2.1.1 ¿Cómo describir una recta? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.1.2 La ecuación vectorial de la recta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.1.3 Ecuación implícita de una recta en R2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.1.4 ¿Cómo hallar la ecuación vectorial a partir de la implícita? ¿y viceversa? . . . . . . . . . . . . . . . . . . . 44

2.2 Planos 47
2.2.1 La ecuación vectorial del plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.2.2 Ecuación implícita de un plano en R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.2.3 ¿Cómo hallar la ecuación vectorial a partir de la implícita, y viceversa? . . . . . . . . . . . . . . . . . . . . 50
2.3 La ecuación normal de un plano 52

2.3.1 La ecuación normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.3.2 El producto vectorial de vectores de R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.3.3 Nuevo cálculo de la ecuación implícita a partir de la vectorial, y viceversa . . . . . . . . . . . . . . . . . . 56
2.4 Intersección de subespacios de R3 57

2.4.1 Intersección de planos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.4.2 Intersección de un plano y una recta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.4.3 Intersección de rectas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.5 Distancias y ángulos entre rectas y planos 65

2.5.1 Ángulos entre rectas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.5.2 Distancia de un punto a una recta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.5.3 Distancia de un punto a un plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
2.5.4 Distancia entre rectas y planos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
2.6 Proyecciones y simetrías 72

2.6.1 Simetrías . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2.6.2 Proyección ortogonal de puntos sobre rectas y planos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3 Espacios vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.1 Subespacios de Rn 79
3.2 Combinación lineal 80
3.3 Dependencia lineal 81
3.4 Generadores, base y dimensión 83

3.4.1 Bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4 Cónicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.1 Curvas cónicas 89
4.1.1 ¿Qué es un cono? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.1.2 Corte del cono con distintos planos planos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
4.2 La circunferencia 92
4.2.1 La circunferencia como lugar geométrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.3 La elipse 94
4.3.1 La elipse como lugar geométrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.3.2 La ecuación de la elipse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
4.3.3 Excentricidad de una elipse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

4.4 La hipérbola 101
4.4.1 La hipérbola como lugar geométrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.4.2 La ecuación de la hipérbola . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.4.3 La excentricidad de la hipérbola . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
4.4.4 Asíntotas de la hipérbola . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
4.5 La parábola 105

4.5.1 La parábola como lugar geométrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.5.2 Ecuación canónica de la parábola . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.5.3 Excentricidad de la parábola (y del resto de las cónicas) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
II Parte 2
5 Ecuaciones lineales, matrices y determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

5.1 Sistemas de ecuaciones lineales 113
5.1.1 ¿Qué es un sistema de ecuaciones lineales? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
5.1.2 Resolución de sistemas de ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
5.1.3 Clasificación de sistemas de ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
5.2 Matrices 121

5.2.1 ¿Qué es una matriz? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
5.2.2 ¿Cómo se relacionan las matrices con los sistemas lineales? . . . . . . . . . . . . . . . . . . . . . . . . . 122
5.2.3 Triangulación de matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
5.2.4 ¿Cuáles son las operaciones que podemos hacer con las filas de una matriz? . . . . . . . . . . . . . . 126
5.3 Resolución y clasificación de sistemas de ecuaciones lineales 129

5.3.1 Resolución de sistemas de ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
5.3.2 Clasificando sistemas de ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
5.3.3 Sistemas con parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
5.4 La teoría de matrices 139

5.4.1 Operaciones con matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
5.4.2 Producto de matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
5.4.3 Matrices cuadradas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
5.4.4 Matrices inversibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
5.4.5 Rango de una matriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
5.4.6 Forma matricial de un sistema de ecuaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
5.5 Determinantes 154

5.5.1 ¿Qué es el determinante? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
5.5.2 El determinante de una matriz de 2 × 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
5.5.3 El determinante de una matriz de 3 × 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
5.5.4 El determinante de una matriz de n × n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
5.5.5 Propiedades del determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
5.5.6 Utilizando el determinante para clasificar sistemas lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
6 Transformaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
6.1 La transformación lineal 167
6.1.1 ¿Que caracteriza a una transformación lineal? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
6.1.2 Forma funcional y matricial de una transformación lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
6.1.3 Cómo construir transformaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
6.2 Imagen y núcleo 174
6.2.1 Imagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
6.2.2 Núcleo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
6.2.3 Clasificación de transformaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
6.3 Interpretación geométrica del efecto de una transformación lineal 179
6.3.1 La interpretación geométrica del determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
6.4 Composición e inversa de transformaciones lineales 188
6.4.1 ¿Qué significa componer funciones? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
6.4.2 Composición de transformaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
6.4.3 Construyendo transformaciones lineales compuestas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
6.4.4 Inversa de una transformación lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
7 Números complejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
7.1 ¿Qué son los números complejos? 195
7.1.1 ¿Cómo surgen los números complejos? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
7.1.2 ¿Cómo se define el conjunto de números complejos? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
7.2 El plano complejo 197
7.2.1 Representación en el plano y forma binómica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
7.2.2 Transformaciones en el plano complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
7.3 Ecuaciones cuadráticas 204
7.3.1 Raíces cuadradas complejas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204
7.3.2 Resolución de ecuaciones cuadráticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
7.4 Formas polar y exponencial 206
7.4.1 El problema de la forma binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
7.4.2 La forma polar de un número complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
7.4.3 La forma exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
7.5 Resolución de ecuaciones generales 211
7.5.1 Raíces n-ésimas de la unidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
7.5.2 Raíces n-ésimas de números complejos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
7.5.3 Resolución de ecuaciones generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213

8 Polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
8.1 ¿Qué es un polinomio? 217
8.1.1 La visión algebraica de los polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
8.1.2 Operaciones con polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
8.2 División de polinomios 220

8.2.1 ¿A qué se le llama dividir dos polinomios? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220
8.2.2 El algoritmo de división . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
8.2.3 El Teorema del resto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
8.3 Raíces 224

8.3.1 ¿Qué son las raíces de un polinomio? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
8.3.2 ¿Cómo encontrar raíces de un polinomio? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
8.4 Factorización de polinomios 229

8.4.1 Polinomios irreducibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
9 Experimentos resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
10 Bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
I
Parte 1
1 Vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.1 Conjuntos
1.2 Vectores de Rn
1.3 Producto escalar de vectores
2 Rectas y planos . . . . . . . . . . . . . . . . . . . . . . . 39
2.1 Rectas
2.2 Planos
2.3 La ecuación normal de un plano
2.4 Intersección de subespacios de R3
2.5 Distancias y ángulos entre rectas y planos
2.6 Proyecciones y simetrías
3 Espacios vectoriales . . . . . . . . . . . . . . . . . . . . 79
3.1 Subespacios de Rn
3.2 Combinación lineal
3.3 Dependencia lineal
3.4 Generadores, base y dimensión
4 Cónicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.1 Curvas cónicas
4.2 La circunferencia
4.3 La elipse
4.4 La hipérbola
4.5 La parábola
1. Vectores
Los vectores constituyen el principal objeto de estudio de la mayor parte del contenido de este libro. Son objetos
sencillos que tienen interpretaciones muy concretas, tanto geométricas como algebraicas. En este capítulo vamos a
definirlos y estudiar sus propiedades principales.
1.1 Conjuntos
Comenzaremos viendo algunas nociones básicas de la teoría de conjuntos que atraviesan el desarrollo de este libro.
Es importante tenerlas presentes e interiorizarlas.
En este apartado estudiaremos...
Cómo describir conjuntos: por extensión o por comprensión.

Los conjuntos R2 , R3 y Rn .
Las operaciones básicas de conjuntos: unión, intersección, diferencia y complemento.

1.1.1 ¿Qué es un conjunto?
Gran parte de la Matemática que conocemos se cimenta alrededor de la noción de conjunto. Un conjunto es una
colección de objetos o elementos. Estos objetos o elementos pueden ser de cualquier tipo: concretos (como los útiles
en nuestra cartuchera o las hojas de un árbol) o abstractos (como los números que usamos para contar o los puntos
en un plano). Un conjunto puede tener cualquier tipo de elementos, concretos o abstractos, y cualquier cantidad de
ellos, ya sea finita o infinita.
Habitualmente se utilizan letras mayúsculas (A, B, C) para representar conjuntos y letras minúsculas para representar
los objetos o elementos pertenecientes a estos conjuntos. Cuando un elemento x pertenece a un conjunto A
escribimos:
x∈A
Por ejemplo, si X es el conjunto cuyos elementos son el número 1, el símbolo @, una manzana y una naranja
20 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
entonces podemos escribir 1 ∈ X. También, @∈ X. Si un elemento no pertenece al conjunto usamos ∈.

/ Por
ejemplo, 2 ∈
/ X y]∈
/ X.
Importante Un conjunto queda determinado de manera única por sus elementos, de forma que dos conjuntos
que tengan los mismos elementos son idénticos. Si A y B son conjuntos con los mismos elementos escribiremos
A = B.
Muchas veces nos interesará trabajar con algunos de los elementos de un conjunto dado. Por ejemplo, podríamos
querer considerar el “conjunto de las frutas que están en X”. Es decir, al conjunto formado por la manzana y la
naranja. Este es un conjunto Y que está contenido o incluido en X, ya que los elementos de Y son, en particular,
elementos de X. En este caso decimos que “Y es un subconjunto de X” y lo escribimos:
Y ⊆X
Lo que implica la notación Y ⊆ X es que todo elemento de Y es un elemento de X. De igual manera que antes,
utilizamos el símbolo tachado * para indicar que un conjunto no está contenido en el otro. Por ejemplo, si Z es el
conjunto de elementos 1, @ y ], entonces Z * X ya que ] ∈
/ X. Observemos que, para que B * A, alcanza con
que al menos un elemento de B no pertenezca a A.
Observación 1 La noción de inclusión brinda una manera de determinar cuando dos conjuntos son idénticos:
A = B si simultáneamente vale que A ⊆ B y B ⊆ A. En efecto, si A = B entonces es cierto que los elementos
de A están en B y viceversa, por lo que es cierto que A ⊆ B y B ⊆ A. Por otro lado, si A ⊆ B entonces todos
los elementos de A también están en B; y si B ⊆ A entonces todos los elementos de B también están en A.
Concluimos que tienen los mismos elementos y, por ende, son iguales.
El conjunto que no posee ningún elementos se llama conjunto vacío y se nota ∅.
1.1.2 ¿Cómo describir un conjunto?
Existen dos maneras clásicas en las que es posible especificar el contenido de un conjunto; se las denomina
descripción por extensión y descripción por comprensión.
Si el conjunto tiene pocos elementos, se puede escribir la lista entre llaves “{ }”. Por ejemplo,
X = {1, @, manzana, naranja} Y = {manzana, naranja}.
Esta manera de describir un conjunto se llama por extensión. Cuando describimos un conjunto de esta mane-
ra, no importa el orden en el que se presentan los objetos. Es decir, los conjuntos {1, @, manzana, naranja} y
{naranja, 1, manzana, @} representan el mismo conjunto (en este caso, X).
Muchas veces es imposible listar todos los elementos del conjunto o es muy tedioso hacerlo. En este caso, se
apela a una propiedad que compartan los elementos del conjunto para describirlo. Por ejemplo, cuando definimos
anteriormente el conjunto Y dijimos que Y era “el conjunto de las frutas en X”. De esta manera, el conjunto Y
quedó determinado por la premisa que entendemos qué es una fruta (o, por lo menos, sabemos distinguir una fruta
de algo que no lo es). Esta manera de describir los conjuntos se llama por comprensión y su expresión simbólica es:
Y = {x ∈ X : x es una fruta}
Aquí las llaves significan “el conjunto de” y los dos puntos “:” sustituyen las palabras “tales que”. La definición
anterior se lee “Y es el conjunto de los x pertenecientes a X tales que x es una fruta”. Notemos que al principio
Álgebra A. Conjuntos. 21
de la descripción se especifica de dónde se están tomando los elementos (en este caso en X) y, luego, cuál es su
propiedad definitoria (en este caso “ser una fruta”). Es habitual que cuando describimos un conjunto por comprensión
utilicemos un conjunto referencial de donde elegimos los elementos. Por ejemplo, el conjunto de los números reales
positivos menores que 10 lo escribimos de la siguiente manera:
W = {x ∈ R : 0 < x ≤ 10}
Aquí el conjunto referencial es R. En general, se especifica (o deja en claro) el “universo” en donde se “va a trabajar”
y se llama conjunto universal.
Observación 2 En Matemática generalmente se trabaja con conjuntos de números que ya tienen nombres
asignados:
N, los números naturales;
Z, los números enteros;
Q, los números racionales;
R, los números reales;
C, los números complejos.
Ejemplos 1 Consideren los siguientes conjuntos.
1. A = {x ∈ N : x es múltiplo de 2 y x ≤ 10};
2. B = {x ∈ R : x2 = 1}
3. C = {x ∈ R : x2 = −1}
Podemos escribir por extensión estos conjuntos. El conjunto A es exactamente el conjunto {2, 4, 6, 8, 10}; el conjunto
B es {1, −1}. Por otro lado, el conjunto C no tiene elementos ya que ningún número real elevado al cuadrado puede
dar como resultado un número negativo. Es decir, C = ∅.
1.1.3 Subconjuntos del plano y el espacio
En este libro vamos a trabajar principalmente con subconjuntos del plano y del espacio. Lo que se conoce como
plano es el conjunto de los pares ordenados de números reales (x, y) y se nota R2 . Formalmente, se escribe:
R2 = {(x, y) : x, y ∈ R}
El adjetivo “ordenados” quiere decir que en la expresión “(x, y)” importa el orden de los números x e y (y, por lo
tanto, (x, y) e (y, x) son objetos diferentes). El nombre “plano” que se le da a R2 surge del hecho que uno puede
representar un elemento de R2 como un punto en el esquema de ejes cartesianos (Figura 1.1). Aquí, el número x
representa cuánto hay que desplazarse en el sentido del eje horizontal y el número y cuánto en el sentido vertical.
De esta manera, a cada punto (x, y) ∈ R2 le corresponde un punto del plano cartesiano y viceversa. Los números x
e y se llaman las coordenadas del punto (x, y). El punto (0, 0) ∈ R2 se llama el origen de coordenadas.
y
2
Figura 1.1: Representación en el plano cartesiano de puntos de R2 .
Ejemplos 2 Consideren los siguientes subconjuntos del plano.
1. P1 = {(x, y) ∈ R2 : 0 ≤ x ≤ 10 y 2 ≤ y ≤ 8}.
2. P2 = {(x, y) ∈ R2 : x = y}.
3. P3 = {(x, y) ∈ R2 : y = x2 + 3}.
El conjunto P1 coincide con los puntos dentro de un rectángulo de base 10 y altura 6. El conjunto P2 son los puntos
cuyas coordenadas son iguales. Esto forma una recta en el plano: la recta de ecuación y = x. El conjunto P3 son los
puntos cuya segunda coordenada es el cuadrado de la primera más 3. Esto forma una parábola en el plano: la parábola
y = x2 + 3. En la Figura 1.2 están representados gráficamente estos conjuntos.
2
x
Figura 1.2: El gráfico de los subconjuntos P1 , P2 y P3 de R2 .
De manera análoga al plano, se puede considerar R3 = {(x, y, z) : x, y, z ∈ R}; es decir, el conjunto de ternas
ordenadas de números reales. Este conjunto se lo llama espacio ya que se identifica con un ambiente tridimensional.
El objeto (x, y, z) ∈ R3 se corresponde con el punto del espacio de tres ejes cartesianos perpendiculares, de manera
que el número x dice cuánto hay que desplazarse en la dirección de ese eje, y lo mismo con los números y, z y sus
respectivos ejes (Figura 1.3). En este caso, (0, 0, 0) ∈ R3 es el origen de coordenadas.
Ejemplos 3 Consideren los siguientes subconjuntos del espacio.
1. E1 = {(x, y, z) ∈ R3 : 0 ≤ x ≤ 5, 2 ≤ y ≤ 4 y 1 ≤ z ≤ 3}.
2. E2 = {(x, y, z) ∈ R3 : z = 0}
3. E3 = {(x, y, z) ∈ R3 : x = y = z}
El conjunto E1 coincide con los puntos dentro de un paralelepípedo de lados de tamaño 5, 2 y 2. El conjunto E2 son los
puntos que se encuentran en el plano xy (aquí consideramos el valor de la coordenada z como la “altura” a la que se
Álgebra A. Conjuntos. 23
Figura 1.3: Representación en el espacio cartesiano de puntos de R3 .
encuentran los puntos respecto del “piso” xy). El hecho de que z = 0 nos dice precisamente que se trata de los puntos
que se encuentran en el “piso”. El conjunto E3 esta conformado por los puntos tales que sus coordenadas son todas
iguales. Esto forma una recta en el espacio. En la Figura 1.4 están representados estos conjuntos.
Figura 1.4: El gráfico de los subconjuntos E1 , E2 y E3 de R3 .
Generalizando estas ideas, podemos también considerar el conjunto de “tiras ordenadas” de números reales
Rn = {(x1 , . . . , xn ) : x1 , . . . , xn ∈ R}. Una tira como la que acabamos de describir se la llama n-upla ordenada
de números reales. Para n > 3 ya no podemos representar las n-uplas como puntos en un esquema de ejes cartesianos
(el ser humano sólo visualiza hasta tres dimensiones). El espacio Rn se lo conoce como el espacio n-dimensional.
El origen de coordenadas de Rn es la n-upla (0, 0, . . . , 0) de n ceros.
Importante Cuando mencionemos un objeto de Rn pero no tengamos la necesidad de especificar sus coordena-
das, escribiremos solamente X ∈ Rn (utilizando letras mayúsculas). Aquí se entiende que X = (x1 , . . . , xn )
para ciertos x1 , . . . , xn ∈ R.
1.1.4 Cómo construir conjuntos a partir de otros
Hay un número de operaciones básicas que es necesario hacer con los conjuntos: unión, intersección, diferencia y
complemento.
Unión de conjuntos. Esta operación consiste en “juntar” el contenido de dos conjuntos.
Definición 1 Si A y B son conjuntos que viven dentro del mismo universo U, entonces, el nuevo conjunto
A ∪ B, llamado unión entre A y B, es el que tiene por elementos aquellos que pertenecen a A o a B; es decir, a
alguno de los dos. Simbólicamente se define:
A ∪ B = {x ∈ U : x ∈ A o x ∈ B}
Por ejemplo, con los conjuntos X = {1, @, manzana, naranja}, Y = {manzana, naranja} y Z = {@, ]} que
consideramos anteriormente, tenemos:
X ∪ Y = {manzana, naranja, 1, @}
Y ∪ Z = {manzana, naranja, @, ]}
X ∪ Z = {manzana, naranja, 1, @, ]}
Observemos que X ∪ Y = X. Esto se debe a que Y ⊆ X, por lo cual los elementos de Y ya son elementos de
X y no se agrega nada nuevo al unirlos.
Ejemplo 4 Consideremos ahora un ejemplo numérico. Si W = {x ∈ R : 0 < x ≤ 10} y V = {x ∈ R : 5 ≤ x ≤
15} entonces W ∪ V = {x ∈ R : 0 < x ≤ 15}. Notemos que los números reales que están entre 5 y 10 pertenecen
tanto a W como a V .
Analicen si son válidas las expresiones A ⊆ (A ∪ B) y B ⊆ (A ∩ B) cualesquiera sean los conjuntos A y B.

En particular, estudien qué sucede con la (A ∪ B) si A ⊆ B . Y qué conjunto es A ∪ ∅ para cualquier conjunto
A.
Intersección de conjuntos. Esta operación nos permite construir un conjunto que contenga los elementos que tengan
en común los dos conjuntos originales.
Definición 2 El conjunto cuyos elementos pertenecen a A y a B al mismo tiempo, se llama la intersección entre
A y B y se nota A ∩ B. Simbólicamente, se escribe así:
A ∩ B = {x : x ∈ A y x ∈ B}
Con los conjuntos X = {1, @, manzana, naranja}, Y = {manzana, naranja} y Z = {@, ]} tenemos:
X ∩ Y = {manzana, naranja}
Y ∩Z =∅
X ∩ Z = {@}
Ejemplo 5 Con W y V , como en el Ejemplo 4, se tiene que W ∩ V = {x ∈ R : 5 ≤ x ≤ 10}.
Analicen si es cierto que las expresiones (A ∩ B) ⊆ A y (A ∩ B) ⊆ B son válidas cualesquiera sean A y B.

Determinen qué conjunto es A ∩ B si A ⊆ B y qué conjunto es A ∩ ∅ cualquiera sea el conjunto A.
Diferencia de conjuntos. Esta operación consiste en “removerle” a un conjunto A los elementos que sean, a su vez,
elementos de un conjunto B.
Definición 3 El conjunto que se obtiene al quedarse con los elementos de A que no están en B se llama la
diferencia entre A y B y se nota A \ B. Simbólicamente, se escribe de la siguiente manera:
A \ B = {x : x ∈ A pero x ∈
/ B}
Por ejemplo, X \ Y = {1, @} y X \ Z = {1, manzana, naranja}. Notemos que ] ∈ Z pero ] ∈

/ X. Esto no tiene
importancia, porque al escribir X \ Z estamos diciendo “el conjunto de los elementos de X que no están en Z”; el
hecho que Z tenga un elemento que no esté en X no afecta esta operación.
Álgebra A. Vectores de Rn . 25
Por último, definimos un conjunto formado por los elementos que se encuentran fuera de un conjunto dado A.
Esto da lugar a un nuevo conjunto llamado complemento de A, el cual se nota Ac . Pero, ¿qué significa “afuera”?
Por ejemplo, ¿qué hay afuera de Y = {manzana, naranja}? Esto depende de cuál es el universo en el que estamos
trabajando. Si trabajamos con el universo de todas las frutas, entonces Y c es el conjunto de todas las frutas que no
son la manzana y la naranja. Si tomamos el universo dado por el conjunto X = {manzana, naranja, 1, @} entonces
Y c = {1, @}. Por lo tanto, el complemento de un conjunto siempre es en relación al conjunto universal que estamos
considerando.
Definición 4 El complemento de un conjunto A respecto del universo U es el conjunto de elementos de U que
no están en A. Simbólicamente, se representa de la siguiente manera:
Ac = U \ A
Ejemplo 6 Si U = N, entonces se tiene que:
{x ∈ N : x es un número par}c = {x ∈ N : x es un número impar}.
¿Qué hicimos en el apartado 1.1?
Repasamos las nociones de pertenencia de un elemento en relación con un conjunto (∈) y de inclusión de un conjunto
en otro (⊆).
Introdujimos el conjunto R2 de pares ordenados de números reales (y lo identificamos con un plano), el conjunto
R3 de ternas ordenadas de números reales (y lo identificamos con el espacio 3-dimensional) y generalizamos estos
conjuntos a las n-uplas ordenadas de números reales, llamado Rn .
Definimos las operaciones usuales que hacemos con conjuntos: unión de conjuntos (∪), intersección de conjuntos
(∩), diferencia de conjuntos (\) y complemento de un conjunto respecto del conjunto universal (Ac ).

1.2 Vectores de Rn
En este apartado estudiaremos los vectores. Es probable que tengan la idea intuitiva de que un vector es una flecha,
al menos gráficamente. Será de gran utilidad tener presente esta noción para comprender la definición matemática
de este concepto.
La definición formal de vector.

La suma de vectores y el producto de un vector por un escalar.
Las propiedades fundamentales de estas operaciones.

1.2.1 La noción de vector
Seguramente ustedes ya han utilizado flechas (segmentos orientados) para representar cantidades físicas, como
fuerzas aplicadas sobre un cuerpo o dirección de trayectorias. Una flecha queda determinada por su origen (donde
comienza) y su extremo (donde termina). Con estos datos, la flecha obtiene una dirección (la recta sobre la cual está
contenida), sentido (dónde empieza y dónde termina) y módulo (la longitud de la flecha). Análogamente, si se elige
el origen de la flecha, y especifica su dirección, sentido y módulo, entonces se obtiene el extremo de la misma.
~ y sus elementos son la
Definición 5 El segmento orientado de origen A y extremo B se llama vector AB
dirección (recta que contiene a los puntos A y B), el sentido (desde A hacia B) y el módulo (la distancia entre
los puntos A y B).
Cuando se dibujan flechas sobre la hoja de papel se están dibujando vectores en R2 , en el sentido que su origen y su
extremo son puntos de un plano. Al señalar un avión que está pasando por el cielo, podemos pensar que estamos
representando un vector con origen en nuestro hombro y extremo en nuestro dedo índice. Este vector “pertenece” a
R3 , ya que son necesarias tres coordenadas para dar la ubicación del hombro y el dedo índice en el espacio. Los
vectores que consideraremos en esta materia serán “vectores en Rn ”, en el sentido que su origen y extremo estarán
dados por puntos de Rn .
Figura 1.5: Vectores en R2 y R3 .
Tengamos en cuenta que la dirección, el sentido y el módulo de un vector son propiedades intrínsecas del mismo; es
decir, son independientes del punto origen del vector. El origen y el extremo de un vector dependen de su posición
relativa con respecto a un sistema de coordenadas cartesianas, mientras que la dirección, el sentido y el módulo,
no. En este libro nos importa estudiar las características propias de los vectores, independientemente de dónde
estén ubicados en el sistema de referencia. Por este motivo, consideramos que todos los vectores de igual dirección,
sentido y módulo son equivalentes; es decir, para nuestros propósitos es equivalente estudiar cualquiera de ellos. Sin
embargo, tenemos en cuenta que de todos los vectores de Rn equivalentes a uno dado, el más sencillo de describir
es el que tiene su origen en el origen de coordenadas (0, 0, . . . , 0) ∈ Rn , pues de esta manera, para especificar un
vector alcanza con dar su extremo.
Importante En este libro, trabajamos exclusivamente con vectores ~
v cuyo origen es el origen de coordenadas
(0, . . . , 0) ∈ Rn . Es decir que, al indicar el vector ~v = (x1 , x2 , . . . , xn ) en Rn nos estamos refiriendo al vector
con origen en el punto (0, 0, 0, ..., 0) ∈ Rn y extremo en el punto (x1 , x2 , . . . , xn ).
En particular, el origen de coordenadas también da lugar a un vector: el vector nulo (no tiene longitud, ni dirección,
ni sentido). Este vector es el único para el cual su origen y extremo coinciden y se nota ~0. Observemos que en R2 el
vector nulo es ~0 = (0, 0) y en R3 es ~0 = (0, 0, 0). Cuando escribamos ~0, nos referiremos siempre al vector nulo del
Rn en el que estemos trabajando en ese momento.
Hay dos operaciones fundamentales a tener en cuenta durante el trabajo con vectores: “sumar dos vectores” y
“escalar un vector por un número real”. Estas operaciones tienen un significado en función del contexto en el cual se
las utiliza (a veces geométrico y a veces algebraico). Por ejemplo, si hay dos fuerzas aplicadas sobre un cuerpo y
los vectores ~v y w
~ especifican la dirección y magnitud de cada una de las fuerzas, necesitamos determinar cuál es
la fuerza resultante. En este caso, será la suma de los vectores anteriores (Figura 1.6). También, si necesitáramos
mover más rápido el cuerpo tendríamos que hacer el doble de fuerza en la misma dirección de ~v ; en este caso, el
vector que representa esta “duplicación de fuerza” será el obtenido al escalar en 2 el vector ~v . De igual manera, si
necesitamos contrarrestar una fuerza para que el cuerpo permanezca inmóvil, deberemos hallar una fuerza de la
misma intensidad pero de sentido opuesto. Esto corresponderá al vector opuesto a ~v , que se obtiene de escalar a este
vector por −1 (Figura 1.6). Estas operaciones de suma de vectores y producto de un vector por un escalar son la
base de la teoría que estudiaremos a lo largo del libro.
F 2F
F1 F1 + F2
-F
F2 F
Figura 1.6: Representación de fuerzas con vectores.
1.2.2 Vectores en el espacio n-dimensional
En este apartado, formalizaremos las nociones de “sumar vectores” y “escalarlos por un número real” sugeridas
anteriormente. En primer lugar trabajamos con vectores en R2 y R3 para desarrollar la intuición de su definición y
sus propiedades.
A un vector en R2 lo llamamos un vector en el plano, y escribimos ~v ∈ R2 . Por lo tanto, ~v queda determinado por
un punto (x, y) del plano. Usaremos la notación ~v = (x, y) para referirnos al vector de origen (0, 0) y extremo
(x, y).
Definición 6 Dados dos vectores ~ ~ ∈ R2 , se define otro vector ~v + w
v, w ~ ∈ R2 . Este nuevo vector es llamado la
suma de ~v y w
~ (o vector suma). Si ~v = (x1 , x2 ) y w
~ = (y1 , y2 ) entonces:
~v + w
~ = (x1 + y1 , x2 + y2 )
Gráficamente, el vector suma de los vectores ~v y w

~ es el vector cuyo extremo es el punto al que se llega partiendo
de (0, 0) al recorrer primero el vector ~v y, luego, desde el extremo de ~v , el vector w,
~ o viceversa. Esto se conoce
como la regla del paralelogramo dado que el vector suma coincide con la diagonal del paralelogramo de lados ~v y
w
~ (Figura 1.7).
Figura 1.7: Suma de vectores en R2 .
v = (2, −5) y w
Ejemplo 7 Si ~ ~ = (−3, −2) entonces:
~ = (2, −5) + (−3, −2) = (2 − 3, −5 − 2) = (−1, −7)

~v + w
Existe otro medio de obtener nuevos vectores: escalarlo a partir de uno dado. Esto remite a las ideas de; “alargarlo”,
“acortarlo” o “invertirlo”. Suponemos que multiplicar un vector por el número 2 duplicará su tamaño; multiplicarlo
por 12 , lo reducirá a la mitad; y multiplicarlo por −1, lo invertirá, es decir, le cambiará el sentido (Figura 1.8). Esta
operación de multiplicación se llama producto de un vector por un escalar y está definida analíticamente de la
siguiente manera.
v = (x1 , x2 ) y λ ∈ R entonces el producto del vector ~v por el escalar λ es el vector
Definición 7 Si ~
λ~v = (λx1 , λx2 )
v = (2, −5) y λ = 3 entonces

Ejemplo 8 Si ~
λ~v = 3(2, −5) = (3,2, 3.(−5)) = (6, −15)
Figura 1.8: Multiplicación de un vector por un escalar en R2 .

Observación 3 En la teoría de vectores, a los números reales se los conoce como escalares pues se utilizan para
escalar los vectores de la manera recién descripta.
Observación 4 Notemos que las operaciones de suma de vectores y producto por escalar están definidas
coordenada a coordenada. Esto quiere decir que, para hallar la suma del vector ~v con el vector w,
~ debemos hacer
las sumas entre las respectivas coordenadas de estos vectores: la primera coordenada de ~v con la primera de w
~
y la segunda de ~v con la segunda de w.
~ De igual manera sucede con el producto de un vector por un escalar.
Estas operaciones tienen las siguientes propiedades:

1. ~v + (w
~ + ~u) = (~v + w)
~ + ~u
2. ~v + w
~ =w
~ + ~v
3. Si λ ∈ R, λ(~v + w)
~ = λ~v + λw
~
4. Si λ1 ∈ R y λ2 ∈ R, (λ1 + λ2 )~v = λ1~v + λ2~v y (λ1 λ2 )~v = λ1 (λ2~v )
5. ~0 + ~v = ~v
6. 1.~v = ~v
7. ~v + (−1)~v = ~0
8. 0.~v = ~0
Como mencionamos al principio de la sección, la suma de vectores y el producto de vectores por escalares son las
operaciones fundamentales en R2 que nos permitirán trabajar durante el desarrollo del libro. Proponemos, ahora,
explorar algunas propiedades geométricas de estas operaciones. Miren el siguiente Experimento1.
Experimento 1 Dados los vectores ~ ~ = (−1, 4) en R2 :

v = (3, 2) y w
1. Grafíquenlos en el plano.
~ ~v − w,
2. Calculen y grafiquen los puntos ~v + w, ~ 21 ~v y 2w
~ −~v , 2w, ~ − 12 ~v .
3. Representen, en un mismo gráfico, los puntos −2~v , −~v , ~0, ~v , 2~v . ¿Qué notan? ¿Qué características tienen
los puntos de la forma k.~v con k ∈ Z cualquiera? ¿Y los puntos λ.~v con λ ∈ R cualquiera?

Notemos que el efecto de multiplicar un vector por −1 invierte el sentido del vector. Se nota −~v en lugar de (−1)~v .
Esta notación tiene sentido ya que ~v + (−1)~v = ~0. ¿Cómo se calcula en general ~v − w?
~ Gráficamente, primero se
calcula −w
~ (invirtiendo el sentido del vector) y, luego, se suma ~v con −w
~ usando la regla del paralelogramo. La
resta de dos vectores tiene una interpretación muy importante que veremos en la próxima sección (Experimento 4).
En el siguiente Experimento 2, veremos el efecto de sumar el mismo vector a varios vectores.
Experimento 2 Consideren en R2 el vector ~t = (4, 2) y el triángulo cuyos vértices son los extremos de
~v = (−4, 1), w
~ = (−3, 6) y ~u = (−1, 7).
1. Grafiquen todos los vectores en el plano.
2. Grafiquen, con la misma escala, el triángulo cuyos vértices son los extremos de ~v + ~t, w
~ + ~t y ~u + ~t y el
triángulo cuyos vértices son los extremos de ~v − ~t, w
~ − ~t y ~u − ~t. ¿Qué efecto geométrico produce sumar
el vector ~t a los puntos de R2 ? ¿Y que sucede al restar el vector ~t?
3. Grafiquen, con la misma escala, el triángulo cuyos vértices son los extremos de 2~v , 2w
~ y 2~u y el triángulo
cuyos vértices son los extremos de 12 ~v , 12 w
~ y 12 ~u. ¿Qué efecto geométrico produce multiplicar por 2? ¿Y
por 12 ?

Para trabajar en el espacio R3 se procede de manera idéntica al caso de R2 . En este caso, cada vector ~v ∈ R3 queda
determinado por las coordenadas de su extremo (considerando su origen en el (0, 0, 0)) y se hará referencia al
“vector ~v = (x, y, z)” (Figura 1.9). Las operaciones de suma de vectores y producto de un vector por un escalar se
definen de forma análoga a las operaciones con vectores en el plano, pero extendiéndolas a una coordenada más.
Figura 1.9: Vectores en R3 .
v = (x1 , x2 , x3 ) ∈ R3 , w
Definición 8 Si ~ ~ = (y1 , y2 , y3 ) ∈ R3 y λ ∈ R, se define la suma de los vectores ~v y w
~
y el producto de ~v por el escalar λ de la siguiente manera:
~v + w
~ = (x1 + y1 , x2 + y2 , x3 + y3 )
λ~v = (λx1 , λx2 , λx3 )
v = (1, 2, −5), w
Ejemplo 9 Si ~ ~ = (3, −2, 0) y λ = −4 entonces:
~ = (1, 2, −5) + (3, −2, 0) = (1 + 3, 2 − 2, −5 + 0) = (4, 0, −5) y
~v + w
λ~v = (−4).(1, 2, −5) = ((−4),1, (−4),2, (−4).(−5)) = (−4, −8, 20).

Gráficamente, el efecto de la multiplicación de un vector por un escalar es el mismo que en el caso del plano (alarga,
acorta y/o invierte). Por otro lado, la suma de los vectores ~v y w
~ conserva la misma interpretación: es el vector a
cuyo extremo se arriba partiendo de (0, 0, 0) al recorrer, primero, el vector ~v y, luego, desde el punto extremo de ~v ,
el vector w.
~ De esta manera, la regla del paralelogramo también puede ser utilizada para interpretar la suma de dos
vectores en el espacio, pensando a los vectores como incluidos en el plano que los contiene; es decir, identificando
dicho plano con R2 (Figura 1.10).
Figura 1.10: Suma de vectores y producto de un vector por un escalar en R3 .
Como es de esperar, todos los conceptos introducidos para R2 y R3 se pueden extender a cualquier Rn de idéntica
manera. Las operaciones para vectores en Rn , se definen de forma completamente análoga a los casos n = 2 y
n = 3.
v = (x1 , x2 , . . . , xn ) ∈ Rn , w
Definición 9 Si ~ ~ = (y1 , y2 , . . . , yn ) ∈ Rn y λ ∈ R entonces:
~ = (x1 + y1 , x2 + y2 , . . . , xn + yn ) ∈ Rn
~v + w
λ~v = (λx1 , λx2 , . . . , λxn ) ∈ Rn
Ejemplos 10
(1, 0, 2, 0) + (−1, −1, 2, −3) = (1 − 1, 0 − 1, 2 + 2, 0 − 3) = (0, −1, 4, −3) en R4 .

(−2).(2, 4, 6, −3, 1) = (−4, −8, −12, 6, −2) en R5 .
5(1, 2, 3, . . . , n) + (1, 1, 1, . . . , 1) = (6, 11, 16, . . . , 5.n + 1) en Rn .

La noción gráfica que debe interiorizarse sigue siendo la misma: la multiplicación por escalar estira, acorta y/o
invierte el vector, y la suma de vectores responde a recorrer un vector y, a continuación, el otro (aunque ya no
puedan visualizar este hecho). Todas las propiedades y conclusiones de los experimentos que hicimos en el caso
n = 2 valen para todos los n ∈ N.
Introdujimos la noción de vector de Rn y nos concentramos en trabajar con vectores con origen en ~0.
~ en Rn y vimos que el resultado es un nuevo vector ~v + w,
Definimos la suma de dos vectores ~v y w ~ cuyo extremo
es la suma lugar a lugar de las coordenadas de los extremos de los vectores ~v y w.
~ Gráficamente, es el vector que
coincide con la diagonal del paralelogramo de lados ~v y w.
~
Definimos el producto de un vector ~v por un escalar (número real) λ y vimos que el resultado es un nuevo vector λ~v
cuyo extremo es la multiplicación lugar a lugar de las coordenadas del extremo de ~v con λ. Gráficamente, el resultado
es un vector “escalado” por λ.
Observamos que el vector ~v − w,
~ es un vector cuya dirección, sentido y módulo es el mismo el vector de origen el
extremo de w
~ y extremo el extremo de ~v .

1.3 Producto escalar de vectores

Una de las aplicaciones más importantes de la teoría de vectores se desarrolla en el estudio de la Geometría. En esta
sección estudiaremos las nociones matemáticas relacionadas con las herramientas de medición más importantes de
esta rama: la regla y el transportador; es decir, vamos a introducir una forma de medir longitudes y ángulos. Esta
tarea la realizaremos a través del concepto de producto escalar de vectores.
El producto escalar de vectores.

La norma (módulo) de un vector.
La distancia entre puntos de Rn .
El ángulo que forman dos vectores.
Cuando dos vectores son ortogonales (perpendiculares).

1.3.1 Producto escalar, norma y distancia
~ ∈ Rn , le asocia un número real que condensa

El producto escalar es una operación que, a cada par de vectores ~v , w
información relevante sobre la relación geométrica entre ambos vectores. La definimos a continuación.
Definición 10 Sean ~ ~ = (y1 , . . . , yn ) vectores de Rn . Se define el producto escalar o
v = (x1 , . . . , xn ) y w
producto interno entre ~v y w
~ como el número real:
~v · w
~ = x1 y1 + · · · + xn yn
Ejemplos 11
El producto escalar entre los vectores (2, −1) y (3, 3) de R2 es:
(2, −1) · (3, 3) = 2,3 + (−1)3 = 6 − 3 = 3
El producto escalar entre los vectores (1, 1, 3) y (−1, 3, −4) de R3 es:
(1, 1, 3) · (−1, 3, −4) = 1(−1) + 1,3 + 3(−4) = −1 + 3 − 12 = −10
El producto escalar entre los vectores (1, 2, 3, . . . , n) y (1, 1, 1, . . . , 1) de Rn es:
(1, 2, 3, . . . , n) · (1, 1, 1, . . . , 1) = 1,1 + 2,1 + 3,1 + · · · + n,1 = 1 + 2 + 3 + · · · + n
A diferencia de las operaciones vistas en la Sección 1.2, el producto escalar es una operación entre vectores cuyo
resultado no es un vector, sino un número (de allí su nombre).
El producto escalar de vectores nos permitirá hacer cálculos de longitudes, distancias y ángulos. En efecto,
consideremos el producto escalar de un vector de R2 consigo mismo. Si ~v = (x1 , x2 ) entonces:
~v · ~v = x1 x1 + x2 x2 = x21 + x22
Realicen el siguiente experimento.

Álgebra A. Producto escalar de vectores. 33
Experimento 3 Consideren el triángulo de vértices (0, 0), (x1 , 0) y (x1 , x2 ), para algunos x1 , x2 > 0
genéricos (Figura 1.11). Luego:
1. Noten que dicho triángulo es rectángulo y que el módulo de ~v = (x1 , x2 ) es exactamente la longitud de
la hipotenusa.
2. Calculen el módulo de ~v utilizando el Teorema de Pitágoras.

Figura 1.11: El triángulo de vértices (0, 0), (x1 , 0) y (x1 , x2 ).
√
El resultado del experimento anterior da cuenta de que el módulo de ~v es exactamente ~v · ~v . ¿Qué sucede con
~ ∈ R3 ? Se puede mostrar con argumentos similares que el módulo de un vector en R3 es exactamente
un vector w
√
~ En el caso general de vectores de Rn , el módulo de un vector se lo conoce como norma del vector, y se
~ · w.
w
define:
√
v ∈ Rn , se define la norma del vector ~v como el número real ||~v || =
Definición 11 Si ~ ~v · ~v . Es decir, si
p
~v = (x1 , . . . , xn ) entonces ||~v || = x21 + · · · + x2n .
Por lo tanto, teniendo a disposición el producto escalar tenemos una manera de medir el módulo o norma de los
vectores.
Ejemplos 12 Calculemos algunas normas.

p √ √
||(2, −5)|| = 22 + (−5)2 = 4 + 25 = 29
p √ √
||(−1, 3, −2)|| = (−1)2 + 32 + (−2)2 = 1 + 9 + 4 = 14.
√ √
||(1, 1, 1, 1, 1)|| = 12 + 12 + 12 + 12 + 12 = 5.

Habíamos comentado en la sección anterior que la resta de vectores ~v − w

~ tenía una importante interpretación
geométrica. Realicen el siguiente Experimento 4.
Experimento 4 Sean ~ ~ = (y1 , y2 ) en R2 .

v = (x1 , x2 ) y w
1. Comprueben que, gráfica y analíticamente, se verifica la igualdad ~v = ~v − w
~ + w.
~
2. Interpreten, gráficamente, la igualdad anterior agrupándola de la siguiente manera: ~v = (~v − w)
~ + w.
~
¿Qué pueden concluir de la dirección del vector ~v − w?
~ ¿Qué pueden concluir de la normal de vector
~v − w?
~ Miren la Figura 1.12.

Figura 1.12: La interpretación gráfica de la resta de dos vectores.
Definición 12 Si P y Q son puntos de Rn , se define la distancia de P a Q como el número real d(P, Q) =
||~v − w||,
~ donde ~v es el vector cuyo extremo es P y w
~ es el vector cuyo extremo es Q. Esto es, si P = (x1 , . . . , xn )
p
y Q = (y1 , . . . , yn ) entonces d(P, Q) = (x1 − y1 )2 + · · · + (xn − yn )2 .
Ejemplos 13
La distancia del punto (2, −5) al punto (−3, −3) en R2 es:
d((2, −5), (−3, −3)) = ||(2, −5) − (−3, −3)||

= ||(2 + 3, −5 + 3)||
= ||(5, −2)||
p
= (5)2 + (−2)2
√
= 29.
La distancia del punto (1, 1, 1) al punto (−1, 2, 1) de R3 es:
d((1, 1, 1), (−1, 2, 1)) = ||(1, 1, 1) − (−1, 2, 1)||

= ||(2, −1, 0)||
p
= (2)2 + (−1)2 + (0)2
√
= 5.
La distancia del punto (1, 2, 3, . . . , n) al punto (1, 1, 1, . . . , 1) en Rn es:
d((1, 2, 3, . . . , n), (1, 1, 1, . . . , 1)) = ||(1, 2, 3, . . . , n) − (1, 1, 1, . . . , 1)||

= ||(0, 1, 2, 3, . . . , n − 1)||
p
= 12 + 22 + 33 + · · · + (n − 1)2 .

Figura 1.13: Utilización de la teoría de vectores para calcular la distancia entre puntos.
A continuación enumeramos algunas propiedades del producto escalar.
1. ~v · w ~ · ~v (es conmutativo)
~ =w
2. ~u · (~v + w)
~ = ~u · ~v + ~u · w
~ (distribuye respecto de la suma de vectores)
3. (λ~v ) · w
~ = λ(~v · w)
~ = ~v · (λw)
~ (si algún vector está multiplicado por un escalar, este puede “sacarse fuera”
del producto interno).
~ = (1, 2) en R2 :
v = (3, −4) y w
Experimento 5 Dados ~
1. Calculen
||~v ||, ||w||,
~ ||~v + w||,
~ ||~v || + ||w||,
~ ||2~v || y || 12 ~v ||.
2. ¿Qué relación hallaron entre ||~v || y ||2~v ||? ¿Y entre ||~v || y || 21 ~v ||?
3. ¿Qué relación hallaron entre ||~v + w||
~ y ||~v || + ||w||?
~ ¿Cuál es más grande que el otro? Esto sucede
siempre y es conocido como desigualdad triangular.

1.3.2 Ángulo entre vectores y ortogonalidad
Con lo desarrollado hasta aquí, ya tenemos una traducción matemática de la noción de “regla”, es decir, como
podemos medir longitudes y distancias. Como se mencionó al inicio de esta sección, el producto escalar también
nos provee la noción de “transportador”, que nos permitirá calcular ángulos entre vectores (no nulos).
¿A qué nos referimos cuando hablamos del ángulo entre dos vectores de R2 ? A que, de los dos ángulos que quedan
determinados por los vectores, consideramos el más pequeño de los dos; es decir, el que está entre 0 y π (Figura
1.14 lado izquierdo). Si se tienen dos vectores en R3 entonces también se tiene determinado un ángulo entre ellos:
el ángulo de menor amplitud al cual hay que girar uno de los vectores alrededor de su origen hasta que quede
superpuesto con el otro vector. Notemos que este recorrido de un vector hacia el otro en realidad sucede en el plano
que contiene a ambos (Figura 1.14 lado derecho). En general, dos vectores en cualquier espacio Rn están contenidos
en un plano, por lo cual medir ángulos de vectores de cualquier dimensión es lo mismo que medirlos en R2 .
Definición 13 Sean ~ ~ ∈ Rn no nulos. Se define el ángulo entre ~v y w
v, w ~ como el único ángulo θ entre 0 y π tal
que:
~v · w~
cos(θ) =
||~v ||||w||
~
Ejemplos 14
(1,0)·(0,1)
El ángulo entre los vectores (1, 0) y (0, 1) en R2 es aquel ángulo θ entre 0 y π tal que cos(θ) = ||(1,0)||.||(0,1)||
.
π
Pero (1, 0) · (0, 1) = 0, por lo que θ = 2
. O sea, los vectores (1, 0) y (0, 1) son perpendiculares.
El ángulo entre los vectores (1, 2, 3) y (1, 0, −1) en R3 es aquel ángulo θ entre 0 y π tal que
(1, 2, 3) · (1, 0, −1) −2 1

cos(θ) = = √ √ = −√
||(1, 2, 3)||.||(1, 0, −1)|| 14 2 7
Tenemos entonces que θ = arc cos(− √17 ), que equivale aproximadamente a 112o .

Figura 1.14: El ángulo entre dos vectores.
Observación 5 Observemos cómo la expresión para hallar el ángulo entre los vectores depende únicamente
del producto escalar (pues la norma también está definida a partir del mismo). El hecho que esta fórmula,
efectivamente, calcula el ángulo entre los dos vectores es una consecuencia del Teorema del Coseno.
Como el coseno siempre es un número entre −1 y 1, uno puede deducir de la fórmula del ángulo entre dos
vectores que |~v · w|
~ ≤ ||~v ||.||w|| ~ ∈ Rn . Esta desigualdad se conoce como desigualdad
~ para cualesquiera ~v , w
de Cauchy-Schwarz.
Por otro lado, de la fórmula del ángulo entre dos vectores se deduce otra expresión para el producto escalar entre
~ ∈ Rn y θ es el ángulo entre ambos entonces:
vectores. Si ~v , w
~v · w
~ = ||~v ||||w||
~ cos(θ)
Por lo tanto, si uno tiene por datos la norma de los vectores y el ángulo entre ellos, puede calcular de manera
directa su producto escalar. Esta fórmula nos ofrece un criterio para decidir si dos vectores son perpendiculares.
π
~ ∈ R2 son perpendiculares u ortogonales si el ángulo entre ellos es
Recordemos que dos vectores ~v , w 2. Pero
como cos( π2 ) = 0, entonces deducimos de esta fórmula que ~v · w
~ = 0. Por otro lado, como el único ángulo en el
π
intervalo (0, π) que anula al coseno es 2 entonces, si ~v · w
~ = 0, quiere decir, nuevamente por la fórmula de arriba,
π
que θ = 2; o sea, ~v y w
~ son ortogonales. Por lo tanto, tenemos la siguiente definición que caracteriza a los vectores
perpendiculares.
Definición 14 Dos vectores ~ ~ ∈ Rn se dicen ortogonales si ~v · w

v, w ~ = 0.
Ejemplos 15
Los vectores (2, −5) y (−3, −3) no son ortogonales pues (2, −5) · (−3, −3) = 9.
Los vectores (1, −2) y (4, 2) son ortogonales pues (1, −2) · (4, 2) = 0.
El vector (−1, 1, 1) es ortogonal al vector (−1, −2, 1) y también al vector (1, 1, 0).

Experimento 6 Realicen las siguientes búsquedas:

1. Encuentren tres vectores distintos de R2 que sean ortogonales a (2, 3). ¿Qué relación encuentran entre los
vectores hallados?
2. Encuentren todos los vectores de R2 que son ortogonales a (2, −2) y tienen norma 1.
3. Encuentren dos vectores no nulos de R3 ortogonales a (1, 2, 1) que no sean paralelos entre sí.
4. Encuentren tres vectores distintos de R3 que sean ortogonales a (1, 2, 1) y (1, −3, 0) simultáneamente.
¿Qué relación cumplen entre sí?

Definimos el producto escalar entre dos vectores. Su resultado es un número real que contiene información de la
relación entre los vectores involucrados.
Interpretamos la raíz cuadrada del producto escalar de un vector con él mismo como el módulo de dicho vector.
√ p
Definimos la norma del vector ~v = (x1 , . . . , xn ) de Rn como ||~v || = ~v · ~v = x21 + · · · + x2n .
Definimos la distancia entre dos puntos P = (x1 , . . . , xn ) y Q = (y1 , . . . , yn ) en Rn como la norma del vector
p
cuyo extremo es P − Q. O sea, d(P, Q) = (x1 − y1 )2 + · · · + (xn − yn )2 .
v ·w
~ de Rn como el único ángulo θ entre 0 y π tal que cos(θ) =
Definimos el ángulo entro dos vectores ~v y w ||~
~ ~
v ||||w||
~
.
~ en Rn son ortogonales sí, y solo sí, ~v · w
Determinamos que dos vectores ~v y w ~ = 0.

2. Rectas y planos
En este capítulo utilizaremos el contenido que desarrollamos en el capítulo 1 para estudiar rectas y planos en el
espacio. La importancia de estudiar dichos objetos se debe a que, desde el punto de vista algebraico, las rectas
y los planos son casos particulares de conjuntos de vectores que tienen propiedades relevantes en relación a la
suma de vectores y al producto de un vector por un escalar. Por este motivo, a estos objetos no se los considera
simplemente un “conjuntos de puntos” sino un espacio de vectores o espacios lineales. Las propiedades de estos
espacios de vectores, que estudiaremos en más generalidad en el capítulo próximo, son la base del Álgebra Lineal.
2.1 Rectas
Las rectas son los espacios lineales más sencillos, dado que poseen una sola dirección. Si bien nos concentraremos
en rectas en el espacio, todas las definiciones son válidas para espacios n-dimensionales.
La ecuación vectorial de la recta.

Cómo determinar si dos rectas son paralelas o perpendiculares.
La ecuación implícita de una recta en R2 .
Cómo determinar si un punto pertenece a una recta y cómo pasar de la ecuación vectorial a la implícita, y viceversa.

2.1.1 ¿Cómo describir una recta?
Es usual que se enseñe a describir una recta en el plano por medio de una ecuación de la forma y = mx + b, donde
m (la pendiente) y b (la ordenada) son números reales dados. Formalmente, esta ecuación está diciendo que la recta
es precisamente el conjunto {(x, y) ∈ R2 : y = mx + b}. Esta manera de describir una recta se basa, entonces, en
establecer una “relación entre las coordenadas de sus puntos”. Por ejemplo, si la ecuación de la recta es y = 3x + 2
entonces el punto (1, 5) pertenece ella, ya que 5 = 3,1 + 2.
Lo curioso es que, si no nos hubieran enseñado a describir a las rectas de esta manera, probablemente no hubiésemos
ideado este tipo de descripción. Imaginemos que estamos en una habitación en penumbras y hay un rayo láser
que la atraviesa de punta a punta en alguna dirección. ¿Cómo podemos describir la recta que determina el haz?
Supongamos que tenemos una vara de madera de 1 metro de largo y que queremos representar el haz por medio de
la vara, en el sentido que queremos ubicar la vara sobre la recta del haz. Para esto, podemos acercar la vara hasta
que corte el rayo y después “enderezarla” para que coincida con este. O mejor aún, podemos enderezar primero la
vara para que quede paralela al rayo y después, sin cambiar la dirección que tiene, desplazarla hasta superponerla
con el rayo. Esta última manera se puede se puede traducir al lenguaje de vectores: utilizamos un vector para
determinar la dirección de la recta (“enderezar la vara” para hacerla paralela al haz) y, después, utilizar otro vector
para determinar por dónde pasa la recta (“trasladar la vara” hasta que quede superpuesta con el haz). La descripción
de una recta identificando su dirección y un punto por el que pasa, se conoce como ecuación vectorial de la recta.
2.1.2 La ecuación vectorial de la recta
Para describir una recta vectorialmente, necesitamos un vector ~v que nos brinde la dirección de la recta y un vector
w
~ que traslade la recta hasta un punto por el cual queremos que pase. Recordemos que todos los múltiplos t~v de
~v (con t ∈ R) forman una recta que tiene la dirección de ~v . Esta recta pasa por el origen de coordenadas, pues el
vector ~v tiene su origen allí. Por lo tanto, esta recta es paralela a la que describiremos y solo nos resta desplazarla en
el sentido del vector w.
~
Definición 15 Una ecuación vectorial para la recta L contenida en Rn con dirección ~
v ∈ Rn y que pasa por el
punto P ∈ Rn es:
t~v + w,
~
~ ∈ Rn es el vector de extremo P , ~v se llama un vector director de la recta y t ∈ R. Una ecuación

donde w
vectorial para la recta L nos brinda una manera de describir los puntos de la recta, y lo hacemos de la siguiente
manera:
L = {X ∈ Rn : X = t~v + w,
~ t ∈ R}.
Importante La igualdad X = t~
v+w
~ utilizada en la definición anterior debe interpretarse como “el punto X es
el extremo del vector t~v + w”.
~ Este abuso de notación aparecerá muy seguido en el texto y esta justificado desde
la identificación natural que hay entre vectores de Rn con origen en ~0 ∈ Rn y puntos de Rn .
Como planteamos, t~v es la ecuación de una recta con dirección ~v que pasa por el origen de coordenadas. Si
recordamos la interpretación de la suma de vectores, observemos que al sumar el vector w
~ a cada punto de la recta,
lo estamos trasladando en esa dirección (Figura 2.1). En particular, el ~0 va a parar al w.
~ Gráficamente, alcanza con
imaginarnos que tomamos con el pulgar y el índice la recta por el origen, la levantamos y la apoyamos en el extremo
de w,
~ sin cambiarle la dirección.
Álgebra A. Rectas. 41
Figura 2.1: Traslado de una recta que pasa por el origen.
Ejemplos 16
La recta L = {X ∈ R2 : X = t(1, 2) + (3, 3), t ∈ R} es una recta del plano con dirección (1, 2) que pasa por
el punto (3, 3).
La recta L0 = {X ∈ R3 : X = t(−1, 0, 3) + (−2, 2, 7), t ∈ R} es una recta con dirección (−1, 0, 3) y que
pasa por el punto (−2, 2, 7).

Recordemos que en la definición de ecuación vectorial dijimos “Una ecuación vectorial para la recta...” y no “La
ecuación vectorial para la recta...”. Esto se debe a que hay infinitas ecuaciones vectoriales que pueden describir la
misma recta. Por un lado, del vector director solo nos importa la dirección que nos provee; ademas ni su sentido, ni
su módulo alteran esta dirección. De este modo, las ecuaciones t~v + w
~ y t(5~v ) + w representan la misma recta
(aquí 5 puede ser reemplazado por cualquier número real distinto de 0). Por otro lado, el vector w
~ es trasladar la
recta de manera que el punto de la recta que, originalmente, tocaba el origen de coordenadas es “reubicado” en el
extremo de w.
~ Pero dado que una recta se extiende infinitamente en ambas direcciones, es lo mismo trasladar este
punto que toca el origen a cualquier otro punto de la recta (Figura 2.2). Por lo tanto, la elección de w
~ para desplazar
a la recta tampoco es única.
Figura 2.2: Diferentes traslaciones que determinan la misma recta.

Ejemplo 17 Las rectas L = {X ∈ R3 : X = t(2, 1, −1) + (1, 3, 2), t ∈ R}, L0 = {X ∈ R3 : X =
s(4, 2, −2) + (1, 3, 2), s ∈ R} y L00 = {X ∈ R3 : X = k(−6, −3, 3) + (3, 4, 1), k ∈ R} son iguales. Observen
que, si bien los vectores directores de L y L0 son distintos, uno es múltiplo del otro, por lo cual determinan la misma
dirección. Por otro lado, el vector director de L00 también es múltiplo de los vectores directores de L y L0 , por lo cual
determina la misma dirección que estas, y además pasa por el punto (3, 4, 1) que pertenece a L y L0 .
¿Cuándo un punto pertenece a una recta? Si queremos saber si el punto (3, −2) pertenece a la recta L = {X ∈
R2 : X = t(2, 1) + (5, −1), t ∈ R}, ya vimos que la interpretación geométrica de esta ecuación significa que
la recta tiene dirección (2, 1) y pasa por el punto (5, −1). ¿Cuál es su interpretación algebraica? La ecuación
X = t(2, 1) + (5, −1) establece que los puntos de la recta “son de la forma” t(2, 1) + (5, −1), para t un número
real; o, aquello que es lo mismo, son de la forma (2t + 5, t − 1) –teniendo presente las definiciones de producto de
un vector por un escalar y de suma de vectores–. Esto quiere decir que: un punto (x, y) ∈ R2 pertenece a la recta L
si y solo si existe un número real t tal que simultáneamente x = 2t + 5 e y = t − 1. Cuando queremos que dos
ecuaciones se verifiquen simultáneamente, las escribimos abarcadas por una llave “{” de la siguiente manera:

 x = 2t + 5
 y =t−1
En nuestro caso, (3, −2) pertenecerá a L si podemos encontrar un t ∈ R tal que:


 3 = 2t + 5
 −2 = t − 1
3−5
Al despejar t de la primera ecuación nos queda: t = 2 = −1. Esto determina que, si existe dicho t entonces
tiene que ser el −1 (de lo contrario no se verificaría la primera ecuación). Lo que nos resta verificar es si con
t = −1 se verifica la segunda ecuación (pues buscamos un t que verifique ambas ecuaciones simultáneamente).
Pero −2 = −1 − 1, por lo cual, con t = −1 se verifican ambas ecuaciones y podemos concluir que (3, −2) ∈ L.
¿Qué sucede ahora con el punto (−1, 0)? ¿Pertenece a L? En este caso buscamos un t ∈ R tal que:

 −1 = 2t + 5
 0=t−1
Para que sea válida la segunda ecuación debemos tener t = 1. Pero si reemplazamos con t = 1, en la primera
ecuación obtenemos −1 = 2,1 + 5 = 7, lo cual es una contradicción (pues −1 6= 7). En este caso, no existe ningún
t ∈ R verificando ambas condiciones simultánemanete, por lo que (−1, 0) ∈
/ L.
Dados dos puntos P, Q ∈ Rn analicen cuál debe ser la dirección de la recta que pasa por ellos, por qué punto
debe pasar y si es única la escritura de suecuación vectorial.
¿Cómo se puede expresar la ecuación de una recta en R3 o Rn en general? Lo que debemos hacer es análogo a lo
que hicimos en R2 . Observen el siguiente ejemplo.
Ejemplo 18 Supongamos que queremos determinar si (1, 2, 1) ∈ R3 pertenece a la recta L = {X ∈ R3 : X =
t(1, 3, −1) + (2, 5, 4), t ∈ R}. Los puntos de L son de la forma (t + 2, 3t + 5, −t + 4), por lo que (1, 2, 1) ∈ L si y
solo si se verifican simultáneamente las siguientes tres ecuaciones:




 1=t+2

2 = 3t + 5


 1 = −t + 4

Al despejar t de la primera ecuación, se tiene t = −1. Si reemplazamos t = −1 en la segunda ecuación, vemos

que efectivamente 2 = 3(−1) + 5; pero, si reemplazamos esta misma información en la última ecuación, obtenemos
1 = −(−1) + 4 = 5, lo cual es absurdo. Por lo tanto, no existe t ∈ R que haga que se verifiquen simultáneamente las
tres ecuaciones y concluímos que (1, 2, 1) ∈
/ L. Por el contrario, (1, 2, 5) ∈ L como pueden verificar por su cuenta.
El procedimiento para rectas en Rn es completamente análogo.

¿Cuáles rectas son paralelas? ¿Cuáles perpendiculares? La ecuación vectorial de la recta permite decidir cuando
dos rectas son paralelas o perpendiculares. En efecto, para determinar esto solo se considera la dirección de la recta
(no por donde pase), por lo cual solo debemos verificar cuál es el ángulo entre sus vectores directores (cuestión
que ya aprendimos a hacer en el capítulo anterior). Tengamos en cuenta que, para que dos rectas sean paralelas,
sus vectores directores deben ser paralelos, pero como son vectores con origen en ~0 entonces esto indica que son
múltiplos.
Definición 16 Dos rectas L y L0 son paralelas si los vectores directores de (cualquiera de) sus ecuaciones
vectoriales son múltiplos uno del otro; y son perpendiculares si dichos vectores directores son ortogonales.
Ejemplos 19
Las rectas L = {X ∈ R3 : X = t(−7, 5, 5) + (0, 0, 2), t ∈ R} y L0 = {X ∈ R3 : X = s(14, −10, −10) +

(3, 3, 0), s ∈ R} son paralelas (sus vectores directores son múltiplos).
Las rectas L̃ = {X ∈ R3 : X = t(2, −3, −2) + (3, 0, 1), t ∈ R} y L̃0 = {X ∈ R3 : X = s(2, 2, −1) +
(3, −1, 5), s ∈ R} son perpendiculares (sus vectores directores son ortogonales).

2.1.3 Ecuación implícita de una recta en R2
Más allá de la naturalidad de describir una recta por medio de su ecuación vectorial, en muchas ocasiones, es
conveniente tener descriptos sus puntos por medio de la relación entre sus coordenadas. En este apartado veremos
cómo describir rectas de R2 de esta forma. Para rectas en R3 debemos esperar hasta el tema intersecciones de plano.
Sabemos que en R2 una recta queda determinada por una relación de la forma y = 3x + 2. A esta ecuación podemos
escribirla de manera equivalente como −3x + y = 2 (simplemente despejamos todas las coordenadas de un lado
y dejamos los números del otro). La manera de describir una recta por medio de este tipo de ecuaciones se llama
ecuación implícita de la recta.
Definición 17 Una ecuación implícita para la recta L en R2 es una relación de la forma ax + by = c, con
a, b, c ∈ R, de manera que un punto (x, y) ∈ L si y solo si sus coordenadas verifican dicha ecuación. La relaciones
de esta forma se llaman lineales. La recta L queda definida entonces por L = {(x, y) ∈ R2 : ax + by = c}.
Ejemplos 20
La recta de ecuación y = 3x + 5 tiene por ecuación implícita −3x + y = 5. También, 3x − y = −5 y

−6x + 2y = 10 son ecuaciones implícitas para esta recta. En el primer caso, hemos multiplicado a ambos lados
de la ecuación original por −1; en el segundo, por 2. Esto se debe a que multiplicar una igualdad a ambos lados
por un número no nulo no cambia la relación entre las variables involucradas.

Una ecuación implícita para la recta {X ∈ R2 : X = t(1, 2) + (3, 3), t ∈ R} es 2x − y = 3. Es posible
verificar esto al graficar la recta.

Observación 6 Si bien la ecuación implícita de una recta en R2 consta de una ecuación, en dimensiones mayores
se necesita más de una ecuación para describir una recta. Por ejemplo, en R3 se necesitan dos ecuaciones para
describir una recta (veremos en el próximo apartado que una sola ecuación en R3 describe un plano, no una
recta).
¿Por qué se necesitan más ecuaciones para describir implícitamente un recta en Rn con n ≥ 3? Que un
conjunto de puntos verifiquen una ecuación es poner una restricción a esos puntos. Cuanto más restricciones
pongamos, menos será la cantidad de puntos que las verifiquen. En los espacios de vectores, una restricción
disminuye la dimensión en 1; esto quiere decir que, si ponemos una restricción (ecuación) a los puntos de
R2 (un espacio de 2 dimensiones), obtenemos un espacio que tiene una sola dimensión: una recta. Si en
cambio ponemos una restricción a los puntos de R3 (espacio de 3 dimensiones), obtenemos un espacio con 2
dimensiones: un plano. Si agregamos ahora una restricción más (2 ecuaciones en total) entonces obtenemos un
espacio de otra dimensión menos: una recta.
Una de las ventajas de tener una recta descripta en forma implícita es que verificar la pertenencia de un punto a la
recta es mucho más sencillo. Efectivamente, como la ecuación implícita es simplemente una relación que cumplen
las coordenadas de los puntos de la recta, un punto que cumpla dicha relación estará en la recta, y un punto que no la
cumpla, no. Por ejemplo, para verificar si (3, −2) pertenece a la recta L0 de ecuación x + 2y = −1, solo debemos
reemplazar x = 3 e y = −2 en dicha ecuación y ver si se verifica la igualdad. En este caso, 3 + 2.(−2) = −1,
por lo que concluimos cual (3, −2) ∈ L0 . También, (−1, 0) pertenece a L0 , ya que −1 + 2,0 = −1. Por otro lado,
/ L0 pues 1 + 2,1 = 3 6= −1.
(1, 1) ∈
2.1.4 ¿Cómo hallar la ecuación vectorial a partir de la implícita? ¿y viceversa?
Como se pudo haber notado (o sospechado), para hacer ciertas cosas es conveniente trabajar con la ecuación vectorial,
y para hacer otras, con la implícita. Por ejemplo, la ecuación vectorial es más fácil para describir geométricamente la
recta, mientras que, para chequear la pertenencia de un punto a la recta, es mejor trabajar con la ecuación implícita.
Por este motivo, es importante que sepamos cómo pasar de una a otra. Lo hacemos con un ejemplo.
Consideremos nuevamente la recta L = {X ∈ R2 : X = t(2, 1) + (5, −1), t ∈ R}. Vimos que un punto
(x, y) ∈ L si y solo si:

 x = 2t + 5
 y =t−1
Para escribir una ecuación implícita para L debemos hallar una relación lineal entre sus coordenadas. Aunque no
sea del todo evidente, estas ecuaciones muestran una relación lineal entre x e y; sólo que lo están haciendo por
medio de t. Es decir, nos dicen cómo depende linealmente tanto x de t como y de t. A partir de estas dependencias
de t nuestro trabajo es hallar cómo depende linealmente x de y (algo asi como “eliminar al intermediario”). Esto se
obtiene al despejar t de una ecuación y reemplazarlo en la otra. En este caso, al despejar t de la ecuación segunda,
nos queda t = y + 1; y, al reemplazar t por y + 1 en la ecuación primera, obtenemos x = 2(y + 1) + 5 = 2y + 7.
Por lo tanto, despejando convenientemente, nos queda la relación lineal x − 2y = 7. Esta es la ecuación implícita
de la recta L. Es decir, L = {(x, y) ∈ R2 : x − 2y = 7}.
Ejemplo 21 Hallemos la ecuación implícita de L = {X ∈ R2 : X = t(−1, 1) + (2, 3), t ∈ R}. Los puntos de L
son de la forma (−t + 2, t + 3) con t ∈ R. Es decir:


 x = −t + 2
 y =t+3
Al despejar t de la primera ecuación encontramos que t = −x + 2. Al reemplazar esta información en la segunda

ecuación tenemos y = (−x + 2) + 3 = −x + 5. De aquí, pasando la x al lado izquierdo obtenemos x + y = 5, una
ecuación implícita para L.
¿Cómo hallamos ahora la ecuación vectorial de una recta dada en forma implícita? Lo hacemos nuevamente con un
ejemplo. Supongamos que tenemos la recta L0 de ecuación x + 2y = −1. De aquí despejamos x, y obtenemos que
x = −2y − 1; es decir, si la segunda coordenada es y entonces la primera debe ser −2y − 1, para cualquier y ∈ R.
Por lo tanto, vemos que los puntos de la recta L0 son de la forma (−2y − 1, y), con y ∈ R. Tal vez hayan notado
que estamos cerca, en caso de que tengan dificultades en este punto puede cambiar la variable “y” por la variable “t”
para que sea más evidente por donde estamos yendo. Reescribiéndolo de esta forma, observamos que los puntos
de la recta L0 son de la forma (−2t − 1, t) con t ∈ R. Este vector tiene la misma forma a la que llegamos luego
de agrupar todos los términos de la ecuación vectorial dentro de un mismo vector. Por lo tanto, lo que debemos
hacer ahora es “desandar” esta expresión para escribirla como un múltiplo de un vector (el vector director) más
otro vector (que traslada la recta al punto por el que pasa). Y la manera de hacerlo es muy sencilla. En primer lugar
escribimos (−2t − 1, t) como suma de dos vectores: uno cuyas coordenadas están multiplicadas por t y otro cuyas
coordenadas son solo números. En este caso:
(−2t − 1, t) = (−2t, t) + (−1, 0) .

| {z } | {z }
coord. con t coord. con números
En segundo lugar, “sacamos” el t por fuera del primero de estos vectores de manera que (−2t, t) = t(−2, 1). Por lo
tanto, obtenemos:
(−2t − 1, t) = t(−2, 1) + (−1, 0),
y esta es una ecuación vectorial de L0 (con vector director (−2, 1) y punto de paso (−1, 0). En la expresión anterior
¿qué hubiese sucedido si despejábamos y en función de x en lugar de x en función de y? Pues en este caso,
−1−x
como y = 2 , vemos que los puntos de L son de la forma (x, −1−x
2 ) con x ∈ R. Al descomponer este vector,
observamos que:
−1 − x 1 x 1 1
x, = x, − − = x 1, − + 0, − ,
2 2 2 2 2
y obtenemos la ecuación vectorial s(1, − 21 ) + (0, − 12 ), s ∈ R. Por supuesto, esta ecuación define la misma recta
L. Notemos que los vectores directores, en ambos casos, son múltiplos uno del otro, y se puede verificar que
el punto (−1, 0) puede escribirse como s(1, − 12 ) + (0, − 12 ) (así como el punto (0, − 12 ) puede escribirse como
t(−2, 1) + (−1, 0)).
1
Ejemplo 22 Encontremos la ecuación vectorial de la recta L definida por la ecuación 3x + 2
y = −1. Al despejar y
en función de x, vemos que y = 2(−1 − 3x) = −2 − 6x. Por lo tanto, los puntos de L son de la forma (x, −2 − 6x)
con x ∈ R. Reescribiendo este vector convenientemente tenemos (x, −2 − 6x) = x(1, −6) + (0, −2). Por lo tanto,
una ecuación vectorial para L es t(1, −6) + (0, −2).
Definimos la ecuación vectorial de una recta en Rn a partir de una dirección (vector director) y de un punto de paso
(un vector que traslada la recta al dicho punto).
Aprendimos cómo determinar que dos rectas sean paralelas o perpendiculares en función de los vectores directores de
sus ecuaciones vectoriales.
Definimos la ecuación implícita de una recta en R2 como una relación lineal entre las coordenadas de los puntos de la
recta. Esta relación determina completamente cuáles puntos forman parte de la recta y cuáles no.
Estudiamos cómo determinar cuándo un punto pertenecía a una recta y cómo pasar de la ecuación vectorial a la
implícita, y viceversa.

Álgebra A. Planos. 47
2.2 Planos
En este apartado se estudiarán planos en el espacio. ¿Cuál es la diferencia fundamental entre un plano y una recta?
Seguramente, ningún estudiante tendrá problema en distinguir entre ambos conceptos, pero contestar esta pregunta
podría requerir tiempo para pensar su respuesta. La diferencia fundamental entre un plano y una recta es que una
recta solo “contiene” una dirección, mientras que el plano contiene infinitas. Gráficamente, si estamos parados
en un punto de una recta y nos queremos desplazar sobre ella, solo tenemos dos opciones: ir a la derecha o ir a
la izquierda (de donde estamos). En cambio, si estamos en un plano, podemos movernos en cualquier dirección:
derecha, izquierda, adelante, atrás o una combinación de las anteriores (por ejemplo, dos pasos a la derecha y 3
pasos hacia atrás). Pero, ¿es posible sobre un plano movernos en cualquier dirección? En realidad, no. Porque, por
ejemplo, no podemos movernos hacia arriba (nos iríamos del plano). Mientras que en el espacio, sí tenemos esta
posibilidad (derecha, izquierda, adelante, atrás, arriba y abajo).
¿Qué es entonces lo que diferencia la recta, el plano y el espacio? Los grados de libertad; es decir, la cantidad
de direcciones independientes en las que nos podemos mover. La recta tiene un solo grado de libertad, pues solo
tenemos una dirección en la cual movernos (depende el sentido que escojamos será a la derecha o a la izquierda). El
plano tiene dos grados de libertad, ya que además de derecha-izquierda podemos movernos adelante-atrás. ¿Qué
sucede con los movimientos en diagonal? Como mencionamos anteriormente, son combinación de movimientos en
la dirección derecha-izquierda y adelante-atrás, por lo cual no son nuevos grados de libertad: no son independientes
de derecha-izquierda y adelante-atrás. Por supuesto, el espacio tiene tres grados de libertad.
La ecuación vectorial de un plano en R3 .

La ecuación implícita de un plano en R3 .
Cómo determinar si un punto pertenece a un plano y cómo pasar de la ecuación vectorial a la implícita y viceversa.

2.2.1 La ecuación vectorial del plano
El concepto que hay detras del procedimiento para formar una ecuación vectorial para un plano es la misma que
para la recta. Para describir un plano, primero determinamos su “inclinación” y después lo trasladamos hasta el
punto por donde esperamos que pase. En el caso de las rectas, usamos un vector que nos dé la dirección de la recta.
En el caso de los planos, necesitamos dos vectores (que no sean múltiplos) para dar la inclinación del plano. Desde
el punto de vista geométrico, al elegir dos vectores que no son múltiplos queda determinado un único plano que
contiene a ambos (Figura 2.3). Desde el punto de vista algebraico, elegir dos vectores representa determinar en qué
dirección serán los grados de libertad que tiene ese plano. Por ejemplo, el plano xy tiene sus grados de libertad en el
eje x y el eje y (y, por lo tanto, podemos movernos en las infinitas combinaciones de movimientos sobre el eje x y
el eje y). Como el eje x consta de todos los múltiplos de (1, 0, 0) y el eje y del (0, 1, 0) entonces podemos pensar
a estos vectores como directores del plano xy. Si bien estos vectores son perpendiculares, esto no es, en general,
necesario. Por ejemplo, los vectores (1, 2, 0) y (−1, 1, 0) también determinan el plano xy.
Figura 2.3: Dos vectores (no múltiplos) determinan un único plano.
Definición 18 Una ecuación vectorial del plano Π contenido en Rn con vectores directores ~ ~ ∈ Rn y que
v, w
pasa por el punto P ∈ Rn es:
L : t~v + sw
~ + ~u,
donde ~u ∈ Rn es el vector de extremo P y t, s ∈ R. Una ecuación vectorial para el plano Π permite describir los
puntos del plano, y lo hacemos de la siguiente manera:
Π = {X ∈ R3 : X = t~v + sw
~ + ~u, t, s ∈ R}.
Ejemplos 23
La ecuación t(1, 1, 2) + s(−1, 3, 7) + (2, 0, 0) con t, s ∈ R determina un plano de vectores directores (1, 1, 2)
y (−1, 3 − 7) y que pasa por el punto (2, 0, 0).
La ecuación t(−1, 5, 2) + s(2, −10, −4) + (1, 1, 3) con t, s ∈ R no es la ecuación vectorial de un plano ya que
(2, −10, −4) = −2(−1, 5, 2); es decir, los vectores directores son múltiplos y, por lo tanto, no determinan dos
grados de libertad. En este caso, esta ecuación describe los puntos de una recta de vector director (−1, 5, 2) que
pasa por el punto (1, 1, 3). Además describe a dicha recta de manera redundante, ya que sabemos que podemos
utilizar un único vector director para hacerlo.

Al igual que con las rectas, un plano posee infinitas ecuaciones vectoriales; pero en este caso, la variedad de
ecuaciones que uno puede construir es mucho mayor. Realicen el siguiente experimento.
Experimento 7 Consideren el plano Π = {X ∈ R3 : X = t~ ~ + ~u, t, s ∈ R} que aparece en la

v + sw
Figura 2.4. Luego, calculen gráficamente:
1. el plano {X ∈ R3 : X = t(2~v ) + sw
~ + ~u, t, s ∈ R}.
2. el plano {X ∈ R3 : X = t(2~v ) + s−w
~ + ~u, t, s ∈ R}.
3. el plano {X ∈ R3 : X = t(~v + w) ~ + ~u, t, s ∈ R}.
~ + s−2w

Figura 2.4: El plano de ecuación vectorial t~v + sw

~ +~
u.
Observación 7 Vemos como resultado del Experimento 7 que, a diferencia del caso de las rectas, en el que los
vectores directores de distintas ecuaciones vectoriales resultan múltiplos entre sí, ahora los vectores directores
de dos ecuaciones vectoriales del plano pueden no estar relacionados de una manera tan directa.
Al igual que con las rectas, {X ∈ R3 : X = t~v + sw,

~ t, s ∈ R} es un plano que pasa por el origen de coordenadas,
y sumarle ~u tiene la interpretación gráfica de levantar el plano por el origen y moverlo, sin cambiarle la inclinación,
hasta apoyar el origen de coordenadas en el extremo de ~u.
¿Cuándo un punto pertenece a un plano? El razonamiento es exactamente el mismo que para las rectas. Supongamos
que queremos saber si el punto (1, 3, −2) pertenece al plano Π = {X ∈ R3 : X = t(1, 2, 1) + s(0, 1, −1) +
(2, 5, −1), t, s ∈ R}. Interpretamos que esta fórmula establece que los puntos del plano Π son de la forma
t(1, 2, 1) + s(0, 1, −1) + (2, 5, −1) para t y s números reales. Es decir, son de la forma (t + 2, 2t + s + 5, t − s − 1)
con s, t ∈ R. Esto nos advierte que un punto (x, y, z) ∈ R3 , pertenece al plano Π si y solo si existen números reales
t, s tales que simultáneamente x = t + 2, y = 2t + s + 5 y z = t − s − 1. Esto lo podemos escribir de la siguiente
manera: 


 x=t+2

y = 2t + s + 5


 z =t−s−1

Por lo tanto, (1, 3, −2) pertenecerá a Π si podemos encontrar un t, s ∈ R tales que:




 1=t+2

3 = 2t + s + 5


 −2 = t − s − 1

De la primera ecuación despejamos t = −1. Al reemplazar en la segunda ecuación y al despejar s, nos queda s = 0.
Finalmente, al reemplazar por t = −1 y s = 0 en la última ecuación se tiene, −2 = −2, lo cual es correcto. Por lo
tanto, (1, 3, −2) ∈ Π, ya que hallamos t, s ∈ R que verifican las ecuaciones de arriba, simultáneamente.
2.2.2 Ecuación implícita de un plano en R3
Cómo comentamos en la observación de la página 44, un plano se puede describir a través de una única ecuación
que relacione linealmente sus coordenadas.
Definición 19 Una ecuación implícita para el plano Π en R3 es una relación lineal ax + by + cz = d con
a, b, c, d ∈ R de manera que un punto (x, y, z) ∈ Π si y solo si sus coordenadas verifican dicha ecuación. Lo
notamos Π = {(x, y, z) ∈ R3 : ax + by + cz = d}.
Ejemplos 24
El plano xy tiene por ecuación implícita la ecuación z = 0. Observemos que la característica que tienen en
común los puntos de dicho plano es, precisamente, que la cooordenada z es nula.
El plano cuyos vectores directores son (1, 0, 1) y (1, 1, 0), tiene ecuación implícita x − y − z = 0.

Comprobar la pertenencia de puntos a un plano descripto por una ecuación implícita es también más sencillo que si
viene dado por una ecuación vectorial, ya que solo debemos corroborar que se verifique la ecuación. Por ejemplo, si
Π = {(x, y, z) ∈ R3 : 2x − 3z = −7}, entonces (1, 2, 3) ∈ Π, pues 2,1 − 3,3 = −7. Por otro lado, (1, 0, 0) ∈
/Π
pues 2,1 − 3,0 = 2 6= −7.
2.2.3 ¿Cómo hallar la ecuación vectorial a partir de la implícita, y viceversa?
El procedimiento es el mismo que para las rectas, solo que se suma una variable más con la cual debemos
trabajar. Tomemos un ejemplo, considerando de nuevo el plano Π = {X ∈ R3 : X = t(1, 2, 1) + s(0, 1, −1) +
(2, 5, −1), t, s ∈ R}. En el mismo, vimos que un punto (x, y, z) estaba en Π si y solo si:



 x=t+2

y = 2t + s + 5


 z =t−s−1

Al igual que en el caso de las rectas, estas ecuaciones brindan una relación lineal entre las variables x, y, z, solo
que lo están haciendo por medio de s y t. Nuestro objetivo, entonces, es desenmascarar esta relación quitando s y
t, Al despejar t y s en función de nuestras coordenadas. Por ejemplo, de la primera ecuación despejamos t y nos
queda t = x − 2. En la segunda ecuación, al reemplazar este nuevo dato, nos queda y = 2(x − 2) + s + 5, de
donde despejamos s, y obtenemos s = y − 2x − 1. Una vez despejadas s y t en función de las coordenadas, solo
nos resta reemplazar estos datos en la última ecuación para obtener z = (x − 2) − (y − 2x − 1) − 1, a partir de
la cual conseguimos la ecuación z = 3x − y − 2. Al agrupar para que quede en forma implícita, hallamos que
Π = {(x, y, z) ∈ R3 : −3x + y + z = −2}.
Ejemplos 25
Consideremos el plano Π = {X ∈ R3 : X = t(1, 0, 1) + s(−2, 2, 3) + (1, −3, −1), t, s ∈ R}. Entonces, los
puntos (x, y, z) ∈ Π verifican las siguientes relaciones:



 x = t − 2s + 1

y = 2s − 3


 z = t + 3s − 1

De la primera ecuación obtenemos que t = x + 2s − 1. Al reemplazar el valor de t en la tercera ecuación,

se tiene que z = x + 2s − 1 + 3s − 1 = x + 5s − 2. Si despejamos s de esta última ecuación, obtenemos:
z−x+2
s= 5
. Por último, al reemplazar el valor de s en la segunda ecuación, se tiene que y = 2 z−x+2
5
− 3, de lo
cual concluimos que − 25 x − y + 25 z = 11
5
. Esta es una posible ecuación implícita para el plano Π. Podemos
simplificarla, multiplicando esta última igualdad por 5, es decir, −2x − 5y + 2z = 11. Esta también constituye
una ecuación implícita para el plano Π.
Al considerar la ecuación vectorial t(1, 2, −1) + s(−2, −4, 2) + (0, 0, 1), observamos que, como los vectores
directores son uno múltiplo del otro, dicha ecuación no define un plano. Hagamos el pasaje a la forma implícita y
veamos qué ocurre en este caso. Tenemos las siguientes relaciones entre las coordenadas de un punto cualquiera
que verifica la ecuación dada: 



 x = t − 2s

y = 2t − 4s


 z = −t + 2s + 1

En la primera ecuación obtenemos t = x + 2s. Luego, al reemplazaar esta última igualdad en la segunda y
tercera ecuación, resulta y = 2(x + 2s) − 4s = 2x y z = −(x + 2s) + 2s + 1 = −x + 1, respectivamente. En
este caso, tenemos las siguientes dos ecuaciones:

 y = 2x
 z = −x + 1
Observemos que estas dos ecuaciones no pueden reducirse a una sola pues tanto y como z dependen de x de
manera independiente. Si quisiéramos despejar x de la primera ecuación y reemplazarla en la segunda, de manera
y
de quedarnos solo con la ecuación z = 2
+ 1, entonces estaríamos perdiendo información, ya que sabríamos
cómo depende z de y pero ignoraríamos cómo depende y de x. Por lo tanto, las dos ecuaciones son independientes
y no pueden reducirse a una sola.

¿Cómo hallamos ahora la ecuación vectorial de un plano dado en forma implícita? Lo hacemos con un ejemplo.
Supongamos que tenemos el plano Π0 = {(x, y, z) ∈ R3 : x + 2y − z = −1}. De aquí obtenemos que
x = −2y + z − 1. Es decir, la ecuación nos indica que, dados y, z ∈ R, el punto (x, y, z) ∈ Π0 si y solo si
x = −2y + z − 1. Por lo tanto, los puntos del plano Π0 son de la forma (−2y + z − 1, y, z) con y, z ∈ R.
Nuevamente, debemos “descomponer” este vector para escribirlo como un múltiplo de un vector director, más un
múltiplo de otro vector director, más otro vector que indica el punto por el que pasa. En primer lugar escribimos
(−2y + z − 1, y, z) como suma de tres vectores: uno cuyas coordenadas están multiplicadas por y, otro cuyas
coordenadas estén multiplicadas por z y otro cuyas coordenadas son solo números. En este caso:
(−2y + z − 1, y, z) = (−2y, y, 0) + (z, 0, z) + (−1, 0, 0)

| {z } | {z } | {z }
coord. con y coord. con z coord. con números
Luego, “sacamos” y por fuera del primero de estos vectores y z por fuera del segundo y, de esta manera, obtenemos:
(−2y + z − 1, y, z) = y(−2, 1, 0) + z(1, 0, 1) +(−1, 0, 0),

| {z } | {z }
(−2y,y,0) (z,0,z)
la cual es una ecuación vectorial para Π0 . Así mismo, podemos reemplazar las variables y y z en esta expresión para
escribir Π0 = {X ∈ R3 : X = t(−2, 1, 0) + s(1, 0, 1) + (−1, 0, 0), t, s ∈ R}.
Estudien cómo se modifica la ecuación del plano si en vez de comenzar despejando la variable x se hubiese
despejado la variable y o la z.
Ejemplo 26 Consideremos el plano Π = {(x, y, z) ∈ R3 : −3x + 7y + z = 0}. Despejamos, por ejemplo, la
variable z de esta última ecuación y obtenemos z = 3x − 7y. Así, un punto (x, y, z) pertenece a Π si y solo si verifica
que (x, y, z) = (x, y, 3x − 7y) = (x, 0, 3x) + (0, y, −7y) = x(1, 0, 3) + y(0, 1, −7). De esta forma, obtenemos la
ecuación implícita t(1, 0, 3) + s(0, 1, −7) para Π.
Los planos admiten otra forma de descripción, además, de la ecuación vectorial y la implícita, esta es: la ecuación
normal que desarrollaremos en el próximo apartado.
Definimos la ecuación vectorial del plano en R3 a partir de dos direcciones distintas (vectores directores) y un punto
de paso (un vector que traslada el plano a dicho punto).
Definimos la ecuación implícita de un plano en R3 como una relación lineal entre las coordenadas de los puntos del
plano. Esta relación determina completamente cuáles puntos forman parte del plano y cuáles no.
Estudiamos cómo determinar cuando un punto pertenece a un plano y cómo pasar de la ecuación vectorial a la
implícita, y viceversa.

2.3 La ecuación normal de un plano
Veamos otra forma vectorial de describir un plano: la ecuación normal. En este caso, necesitaremos utilizar nuestra
herramienta de medición introducida en el capítulo anterior: el producto escalar.
La ecuación normal de un plano y su relación con la ecuación implícita del mismo.

El producto vectorial entre vectores de R3 .

2.3.1 La ecuación normal
Primero veamos una analogía, imaginemos que tenemos una placa plana de vidrio con una sopapa (un palo con
ventosa) pegada a (Figura 2.5 lado izquierdo). Supongamos que la placa es “infinita”, de manera que podemos
pensarla como un plano de R3 . Todos los puntos de la placa tienen una propiedad en común respecto de la sopapa:
si pensamos que el lugar donde la sopapa está pegada a la placa es el origen de coordenadas, entonces cada punto de
la placa (visto como el extremo de un vector), es perpendicular al vector determinado por la sopapa (Figura 2.5 lado
derecho). De hecho, esta propiedad es definitoria del plano, en el sentido que un punto está en la placa si y solo si es
perpendicular a la ventosa. Es decir, podemos describir (el plano dado por) la placa como “el conjunto formado
por todos los puntos perpendiculares (al vector dado por) la sopapa”. ¿Cómo escribir esta propiedad formalmente?
Sabemos que dos vectores son perpendiculares si su producto escalar es 0. Si llamamos Π al plano determinado por
~ al vector determinado por la sopapa, entonces escribimos:
la placa y N
~ ·X
Π = {X ∈ R3 : N ~ = 0}.
Figura 2.5: Placa de vidrio con sopapa pegada.

Álgebra A. La ecuación normal de un plano. 53
~ que es perpendicular al plano se llama una normal del plano. La forma de describir un plano como el
Un vector N
conjunto de vectores ortogonales a una dirección normal dada, se llama la ecuación normal del plano y se sintetiza
~ ·X
escribiendo N ~ = 0, donde X ∈ R3 . Esta ecuación está diciendo “considero los X ∈ R3 que son perpendiculares
~ ”.
aN
En nuestra deducción de la ecuación normal del plano motivada por la analogía anterior, hemos asumido en un
momento que la intersección entre la placa y la sopapa justamente sucedía en el origen de coordenadas. ¿Qué
sucede si tenemos un plano que no pasa por el origen de coordenadas? En este caso, no es verdad que el plano sea
el conjunto de puntos perpendiculares a un vector normal a él. Esto sucede ya que la perpendicularidad se mide
por medio del producto escalar de vectores, y las propiedades de dicho producto valen para vectores con origen en
(0, 0, 0) ∈ R3 . Una manera de resolver esto consiste en trasladar el plano hasta que pase por el origen (esto no altera
la inclinación del plano ni la de la normal) y así, entonces, plantear la ecuación normal para planos que introdujimos.
Figura 2.6: Traslado de un plano al origen.
Si Π0 es ahora un plano que no pasa por el origen, digamos que pasa por un punto P 6= ~0, entonces se puede
trasladar el plano Π0 al origen desplazándolo por medio del vector −P~ (Figura 2.6). Los puntos de este nuevo plano
~ es una normal de Π0 , la frase “el plano Π0
trasladado son de la forma X − P , donde X ∈ Π0 . Por lo tanto, si N
~ ”, se puede
es el conjunto de puntos de R3 tales que, luego de trasladar Π0 al origen, resultan perpendiculares a N
expresar de la siguiente manera:
~ · (X
Π0 = {X ∈ R3 : N ~ − P~ ) = 0}.
~ · (X
En este caso, lo que se conoce como ecuación normal del plano es la fórmula N ~ − P~ ) = 0. Cuando P = ~0,
obtenemos la ecuación normal del plano por el origen que vimos antes. Estonos lleva a la siguiente definición:
Definición 20 Una ecuación normal de un plano Π es:
~ · (X
N ~ − P~ ) = 0,
~ es una normal del plano (un vector perpendicular a él) y P es un punto de Π (cualquiera).
donde N
Ejemplos 27
El plano xy consta de todos los puntos que son perpendiculares al eje z. Por lo tanto, podemos pensar que son los
puntos (x, y, z) que verifican que (x, y, z) · (0, 0, 1) = 0.
| {z }
~
N
El plano Π = {X ∈ R3 : X = t(1, 0, 1) + s(1, 1, 0) + (1, 2, 0), t, s ∈ R} al trasladarlo al origen (por ejemplo,
por medio del vector −(1, 2, 0)) es el plano = {X ∈ R3 : X = t(1, 0, 1) + s(1, 1, 0), t, s ∈ R}. Es fácil
ver que el vector (−1, 1, 1) es perpendicular a los vectores (1, 0, 1) y (1, 1, 0) simultáneamente y, por lo tanto,
a todos los puntos del plano trasladado al origen Π − (1, 2, 0). Así, el vector (−1, 1, 1) resulta ser un vector
normal de dicho plano. Por lo tanto, una ecuación normal para Π es (−1, 1, 1) · ((x, y, z) − (1, 2, 0)) = 0.

¿Cuándo son dos planos paralelos?¿Cuándo es un plano perpendicular a una recta? La noción de “normal de un
plano” nos ofrece una manera muy sencilla de contestar estas preguntas. El estudiante podrá interpretar gráficamente
estas definiciones.
Definición 21 Dos planos Π y Π0 son paralelos si sus vectores normales son múltiplos uno del otro. Un plano Π
es perpendicular a una recta L si el vector normal de Π es múltiplo del vector director de L.
¡La ecuación normal y la ecuación implícita son lo mismo! Anteriormente cuando hablamos de la ecuación implícita
del plano, la presentamos como una manera de describir los puntos del espacio que verifican ciertas restricciones
(ecuaciones). Pero ahora podemos ver que, en realidad, la ecuación implícita de un plano se desprende precisamente
~ · (X
de la ecuación normal. En efecto, solo basta reescribir la ecuación N ~ − P~ ) = 0 en toda su extensión. Es decir,
~ = (a, b, c), un punto genérico X = (x, y, z) y un punto fijo del
si para un plano Π escribimos su vector normal N
plano P = (α, β, γ) entonces, teniendo en cuenta la definición de producto escalar, la ecuación normal del plano se
convierte en:
(a, b, c) · ((x, y, z) − (α, β, γ)) = 0,
que no es otra cosa que:

ax + by + cz = aα + bβ + cγ.
En esta última ecuación, aα + bβ + cγ es simplemente un número real, por lo que ¡obtenemos una ecuación implícita
para el plano!
Observación 8 Veamos que los coeficientes que acompañanan a las coordenadas x, y, z en una ecuación
implícita del plano son siempre las coordenadas de una normal de dicho plano.
Ejemplos 28
Consideremos el primer ítem de los Ejemplos 27. Vimos que la ecuación normal del plano xy es (x, y, z) ·
(0, 0, 1) = 0. al desarrollar el producto escalar obtenemos que x · 0 + y · 0 + z · 1 = 0. Es decir, hallamos la
ecuación implícita z = 0 para el plano xy.
En el segundo ítem de los Ejemplos 27, una ecuación normal para Π era (−1, 1, 1) · ((x, y, z) − (1, 2, 0)) = 0.
Nuevamente, si hacemos el producto escalar, obtenemos que (−1, 1, 1) · ((x, y, z) − (1, 2, 0)) = (−1, 1, 1) ·
(x − 1, y − 2, z) = −x + 1 + y − 2 + z = 0. Luego obtenemos la ecuación implícita −x + y + z = 1 para Π.

Entonces la ecuación normal del plano nos provee una manera de interpretar geométricamente la ecuación implícita
de un plano. Recuperar la normal de un plano y su ecuación normal, a partir de una ecuación implícita, es sencillo. En
efecto, supongamos por ejemplo que tenemos el plano Π = {(x, y, z) ∈ R3 : 3x + 2y − z = 4}. Inmediatamente
~ = (3, 2, −1), por la Observación 8. Además, como 4 debe coincidir con −N
hallamos que N ~ · P entonces:
(3, 2, −1) · (α, β, γ) = 4,

| {z }
P
de donde 3α + 2β − γ = 4. Es decir, P debe ser un punto que verifica esta ecuación; por ejemplo: P = (0, 1, −2).
Álgebra A. La ecuación normal de un plano. 55
Por lo tanto, una ecuación normal para Π es:
(3, 2, −1) · ((x, y, z) − (0, 1, −2)) = 0.
Observación 9 Observen que tuvimos mucha libertad al elegir el punto P (podíamos elegir cualquiera cuyas
coordenadas verificaran la ecuación dada). Esto se debe a que en la ecuación normal de un plano, el punto P
puede ser tomado como cualquier punto del plano, ya que el objetivo es trasladar el plano al origen y no nos
importa de qué manera (Figura 2.7).
Figura 2.7: Diferentes maneras de trasladar un plano desde el origen para obtener el mismo plano.
La ecuación implícita de un plano se puede deducir a partir de su ecuación normal. La misma permite describir
al plano como un conjunto de puntos perpendiculares a una dirección. Deduzcan, a partir de esta premisa, la
ecuación de una recta en R2 y comprueben que toda recta en el plano que pasa por el origen de coordenadas
puede describirse como el conjunto de los puntos perpendiculares a una dirección perpendicular a ella.
2.3.2 El producto vectorial de vectores de R3
A esta altura, ya hemos notado que es conveniente calcular la normal de un plano (pues a partir de ella encontramos
una descripción muy sencilla del mismo). Si el plano está dado en forma vectorial, entonces la normal es un vector
que es perpendicular al plano que los vectores directores generan (y que pasa por el origen). En particular, es
ortogonal a los dos vectores directores simultáneamente. En esta apartado, introduciremos una herramienta para
hallar un vector de R3 que sea perpendicular a otros dos vectores dados. Esto es, si ~v , w
~ ∈ R3 no son paralelos,
entonces definiremos otro vector ~u ∈ R3 , llamado el producto vectorial entre ~v y w,
~ cuya propiedad principal es
que es perpendicular tanto a ~v como a w.
~ Esto nos permitirá calcular automáticamente la normal de un plano dado
en forma vectorial. A diferencia de las demás operaciones entre vectores, el producto vectorial sólo está definido
para vectores de R3 .
Definición 22 Sean ~ ~ ∈ R3 . El producto vectorial entre los vectores ~v = (x1 , x2 , x3 ) y w
v, w ~ = (y1 , y2 , y3 ), es
el vector ~u ∈ R3 definido por:
~u = (x2 y3 − x3 y2 , x3 y1 − x1 y3 , x1 y2 − x2 y1 ).
Se nota ~u = ~v × w.
~
Por ejemplo, (1, 2, 0) × (−1, 3, −2) = (2.(−2) − 0,3, 0.(−1) − 1.(−2), 1,3 − 2.(−1)) = (−4, 2, 5). Si ahora
chequeamos la ortogonalidad de este vector con los originales encontramos que:
(1, 2, 0) · (−4, 2, 5) = −4 + 4 + 0 = 0 y
(−1, 3, −2) · (−4, 2, 5) = 4 + 6 − 10 = 0,
Se verifica que, efectivamente, el nuevo vector hallado es perpendicular a los dos originales: la propiedad fundamental
del producto vectorial.
Es claro que la fórmula que define el producto vectorial es algo complicada, y tratar de memorizar qué término va
en cada lugar parece una pérdida de tiempo. Por esta razon, proporcionamos la siguiente “regla” para recordar cómo
formar el producto vectorial. Esta regla se basa en un “movimiento” que aparecerá muchas veces en la teoría (por lo
cual es una buena idea ir introduciéndolo). El movimiento puede verse en la Figura 2.8:
Figura 2.8: Movimiento elemental para calcular el producto vectorial.
El procedimiento para calcular el producto vectorial ~v × w

~ es el siguiente.
1. Escribir el vector w
~ debajo del vector ~v , de manera que la primera coordenada (y por consiguiente, la segunda
y tercera) de cada uno queden alineadas en la misma columna.
2. Tapar la primera columna (es decir, las primeras coordenadas de cada vector) y realizar el movimiento
introducido con el cuadrado determinado por las otras coordenadas. Este número es la primera coordenada
del vector ~v × w.
~
3. Ocultar la segunda columna (las segundas coordenadas de cada vector) y realizar el movimiento introducido
con el cuadrado determinado por las otras coordenadas. El opuesto de este número es la segunda coordenada
del vector ~v × w.
~
4. Tapar la tercera columna (las terceras coordenadas de cada vector) y realizar el movimiento introducido con
el cuadrado determinado por las otras coordenadas. Este número es la tercera coordenada del vector ~v × w.
~
La Figura 2.9 muestra un ejemplo de cómo es el procedimiento descripto.
- - -
Figura 2.9: Cálculo del producto vectorial entre (1, 2, 0) y (6, 3, 5).
2.3.3 Nuevo cálculo de la ecuación implícita a partir de la vectorial, y viceversa
Ahora que pudimos interpretar la ecuación implícita de un plano a partir de su ecuación normal, y teniendo a mano
la noción de producto vectorial de vectores, tenemos una forma mucho más sencilla y directa de pasar de la ecuación
Álgebra A. Intersección de subespacios de R3 . 57
implícita a la vectorial, y viceversa. En efecto, realicen los siguientes experimentos.
Experimento 8 Consideren un plano Π = {X ∈ R3 : X = t~ ~ + ~u, t, s ∈ R} dado en forma

v + sw
vectorial. Luego:
Hallen la normal del plano Π utilizando el producto vectorial entre los vectores ~v y w.
~
Formen la ecuación implícita de Π, a partir de su ecuación normal, utilizando ~v × w
~ y el extremo de ~u
(que es un punto por donde pasa Π).

Experimento 9 Consideren un plano Π0 = {(x, y, z) ∈ R3 : ax + by + cz = d}, dado en forma implícita.
Luego:
~ del plano Π0 y algún punto P por el que pase dicho plano (hay muchos).
Hallen la normal N
~ (hay muchos).
Encuentren (“a ojo” o haciendo una cuenta) algún vector ~v ortogonal a N
Usen el producto vectorial para hallar un vector w ~ y a ~v simultáneamente.
~ ortogonal a N
~ × ~v y el vector de extremo P .
Formen la ecuación vectorial de Π0 con vectores directores ~v y N

Observación 10 Tengamos en cuenta que, en este último experimento, los vectores directores hallados son
ortogonales. Por supuesto, esto no es un requerimiento para una ecuación vectorial del plano, aunque es muchas
veces preferible que las direcciones tengan esta propiedad. De todas maneras, al calcular la ecuación vectorial
de esta forma (utilizando el producto vectorial), lo que intentamos hacer es mecanizar el procedimiento.
El nombre espacio lineal proviene de que estos espacios tienen la propiedad que, cada vez que dos puntos
pertenecen al espacio, entonces la (única) recta que pasa por ellos también pertenece a dicho espacio. El
lector interesado puede comprobar este hecho de manera directa utilizando ecuaciones vectoriales de las rectas
(repasen lo escrito en la sección “Para pensar.” de la página 42).
Definimos la ecuación normal del plano que permite describirlo como todos los puntos perpendiculares a una dirección
dada. A partir de esta ecuación, obtenemos inmediatamente la ecuación implícita del plano.
Definimos el producto vectorial entre vectores de R3 , cuyo resultado es un vector de R3 perpendicular a los vectores
originales, simultáneamente.

2.4 Intersección de subespacios de R3

En este apartado, calcularemos intersecciones entre rectas y planos en R3 . Esto nos va a permitir, en particular,
introducir la ecuación implícita de una recta en R3 (la recta determinada por la intersección de dos planos). Es
importante destacar que la intersección de dos subespacios lineales vuelve a ser un subespacio lineal, por lo que la
dicha intersección se puede describir vectorial o implícitamente como lo venimos haciendo, en este capítulo.
Interpreten que la intersección de subespacios lineales es nuevamente un espacio lineal, a partir de la propiedad
que poseen los espacios lineales: si dos puntos pertenecen al espacio entonces toda recta que los atraviesa
también.
Como calcular la intersección:

• de dos planos.
• de un plano y una recta.
• entre dos rectas de R3 .
La clasificación de rectas del espacio.

2.4.1 Intersección de planos
Sabemos que existen tres posibles resultados al buscar la intersección de dos planos:
1. se “atraviesan” a lo largo de una recta,
2. no se intersecan (pues son paralelos) o
3. son el mismo plano (y su intersección es el mismo único plano).
Estas posibilidades pueden verse en la Figura 2.10. Vamos a estudiar cómo hallar la intersección en cada uno de
estos planos según como aparezcan descriptos.
Figura 2.10: Posibilidades de intersección de dos planos en R3 .
Intersección de planos dados en forma implícita La manera más sencilla de calcular la intersección de dos planos es
si ambos vienen descriptos por su ecuación implícita.1 Supongamos que tenemos los planos Π = {(x, y, z) ∈ R3 :
2x − 3y + 2z = 2} y Π0 = {(x, y, z) ∈ R3 : x − 2y − z = 0}. La interpretación de los puntos de la intersección
entre ambos es directa: si los puntos de Π son los (x, y, z) ∈ R3 que verifican 2x − 3y + 2z = 2 y los de Π0 los
que verifican x − 2y − z = 0, entonces, para estar en ambos planos, deben corroborarse ambas ecuaciones a la vez.
Es decir, buscamos los (x, y, z) ∈ R3 tales que:

 2x − 3y + 2z = 2
 x − 2y − z = 0
Entonces, ¿cuáles son los puntos en Π ∩ Π0 ? Como mencionamos anteriormente, sabemos que dicha intersección
tiene tres posibles formas de concretarse, o bien formarán una recta, o bien serán el mismo plano, o bien no habrá
ninguno punto en común entre los dos planos. La manera de resolver estas ecuaciones simultáneas es la misma que
ya utilizamos anteriormente para resolver otras situaciones análogas. El objetivo es despejar una variable en una
ecuación y, luego, reemplazarla en la otra (cuál y de qué ecuación, es indistinto). En este caso, podemos despejar
x de la segunda ecuación y obtener x = 2y + z. Al reemplazar x por 2y + z en la primera ecuación, obtenemos
2(2y + z) − 3y + 2z = 2; o lo que es lo mismo: y + 4z = 2. De esta última ecuación, despejamos de nuevo una
variable en función de la otra (esta ecuación solo tiene las variables y y z). Por ejemplo, y = 2 − 4z. Con esto,
1 Esto será evidente cuando estudiemos la resolución de sistemas de ecuaciones lineales en la segunda parte del libro.
observamos que y depende de z (y solo de z). ¿Qué sucede con x? Ya habíamos visto que x = 2y + z; pero ahora
tenemos más información que cuando despejamos x: sabemos que y = 2 − 4z. Por lo tanto, reemplazamos y por
este valor en la ecuación x = 2y + z para hallar: x = 2(2 − 4z) + z = 4 − 7z. De esta manera, vemos que x
también depende solo de z. Lo que hemos hallado, entonces, es que se verifica:

 x = 4 − 7z
 y = 2 − 4z
Es decir que los puntos en Π ∩ Π0 son de la forma (4 − 7z, 2 − 4z, z) para z ∈ R cualquiera. Ahora, desarmamos
el vector como ya hicimos anteriormente: escribiéndolo como suma de un vector con todas sus coordenadas
multiplicadas por z y otro con solo números:
(4 − 7z, 2 − 4z, z) = (4, 2, 0) + (−7z, −4z, z) = (4, 2, 0) + z(−7, −4, 1).
¡Esta es precisamente la ecuación vectorial de una recta en R3 ! Su vector director es (−7, −4, 1) y su punto de
paso el (4, 2, 0). Esto nos indica que los planos Π y Π0 se intersecan efectivamente y que la recta encontrada está
compuesta por los puntos que están en ambos planos. Este es el resultado que debemos esperar siempre que los
planos no sean paralelos.
En el ejemplo anterior, al resolver el sistema de dos ecuaciones lineales simultáneas, se obtuvieron dos
ecuaciones en las que tanto x como y dependen del valor de z. Analicen cómo se modifica esta solución si se le
agrega una tercera ecuación al sistema.
¿Qué sucede si Π y Π0 fuesen paralelos? Por ejemplo, si Π = {(x, y, z) ∈ R3 : x + y + z = 1} y Π0 = {(x, y, z) ∈

R3 : 2x + 2y + 2z = 7} entonces al formar el sistema:

 x+y+z =1
 2x + 2y + 2z = 7
vemos que al despejar x en la primera ecuación tenemos x = 1 − y − z; y al reemplazar en la segunda se tiene

2(1 − y − z) + 2y + 2z = 7, de lo que se deduce 2 = 7, lo cual es absurdo. Esto quiere decir que no existen puntos
que satisfagan las ecuaciones de ambos planos simultáneamente; o sea, Π ∩ Π0 = ∅ pues los planos son paralelos.
¿Qué sucede si Π y Π0 fuesen el mismo plano? Por ejemplo, si Π = {(x, y, z) ∈ R3 : x − y + 2z = −1} y
Π0 = {(x, y, z) ∈ R3 : −3x + 3y − 6z = 3} entonces al formar el sistema:

 x − y + 2z = −1
 −3x + 3y − 6z = 3
observamos que al despejar x en la primera ecuación tenemos x = −1 + y − 2z; y al reemplazar en la segunda se

tiene −3(−1 + y − 2z) + 3y − 6z = 3, a partir de lo cual deducimos 3 = 3. Es decir que, si la primera ecuación se
verifica (o sea, x = −1 + y − 2z), entonces la segunda ecuación se verifica automáticamente. En otras palabras,
la segunda ecuación no impone nuevas restricciones sobre las coordenadas x, y, z: si se verifica la restricción
que aporta la primera ecuación, la de la segunda ecuación también se correborará. Es posible chequear que, si
hubiésemos despejado alguna variable de la segunda ecuación y reemplazado en la primera, hubiéramos obtenido el
mismo resultado. Por lo tanto, ambas restricciones son la misma restricción. Esto nos indica que las ecuaciones
implícitas de Π y Π0 son ecuaciones implícitas del mismo plano, por lo que Π = Π0 .
Estamos en condiciones de explicar cómo es una ecuación implícita de una recta en R3 . Ya mencionamos que
necesitamos dos ecuaciones; ¡y estas son precisamente las ecuaciones de dos planos dados en forma implícita
cuya intersección es dicha recta! En efecto, si retomamos el primer ejemplo de la carilla 54, vemos que si
Π = {(x, y, z) ∈ R3 : 2x − 3y + 2z = 2} y Π0 = {(x, y, z) ∈ R3 : x − 2y − z = 0}, entonces su intersección
era la recta L = {X ∈ R3 : X = t(−7, −4, 1) + (4, 2, 0), t ∈ R}. Y los puntos de L eran precisamente los que
satisfacían las ecuaciones de los dos planos simultáneamente. Este sistema de dos ecuaciones simultáneas es lo que
llamaremos una ecuación implícita para la recta L. Se expresa de la siguiente manera:

 2x − 3y + 2z = 2
L:
 x − 2y − z = 0
Como sabemos, las ecuaciones implícitas no son únicas y uno tiene, en general, libertad para elegir qué planos
“intersecar” para determinar la ecuación implícita. Por ejemplo, la recta recién descripta también se podría obtener
como intersección de los planos 5x − 7y + 7z = 6 y 21x − 44y − 29z = −4, con lo cual otra ecuación implícita
para dicha recta es: 
 5x − 7y + 7z = 6
L:
 21x + 44y + 29z = 172
Ejemplo 29 Veamos cómo podemos hacer para encontrar esta segunda ecuación implícita para la recta L = {X ∈
3
R : X = t(−7, −4, 1) + (4, 2, 0), t ∈ R}. Tenemos que encontrar dos planos (distintos) que contengan a dicha
recta simultáneamente. En primer lugar, para asegurarnos de que un plano contenga a L, tomamos como uno de los
vectores directores del mismo a un vector director de L (por ejemplo, al (−7, −4, 1)) y pedimos que dicho plano
contenga a un punto cualquiera de la recta (por ejemplo, el (4, 2, 0)). Un posible plano es Π1 = {X ∈ R3 : X =
t(−7, −4, 1) + s(0, 1, 1) + (4, 2, 0), t, s ∈ R}. Notemos que el vector (0, 1, 1) fue elegido arbitrariamente con la
única condición de que no sea múltiplo de (−7, −4, 1). La ecuación implícita Π es 5x − 7y + 7z = 6. En segundo
lugar, el otro plano que necesitamos lo construimos de la misma manera, pero teniendo en cuenta que no es posible
definir el mismo primer plano que ya contruimos. Es decir, debemos asegurarnos que el segundo vector director que
elegimos no determine el mismo plano Π. Una manera de hacerlo de forma segura, es tomando un vector perpendicular
al (−7, −4, 1) y al (0, 1, 1), al mismo tiempo; por ejemplo, el producto vectorial (−7, −4, 1) × (0, 1, 1) = (−5, 7, −7).
En este caso, obtenemos el plano de ecuación vectorial t(−7, −4, 1) + s(−5, 7, −7) + (4, 2, 0). Al calcular su ecuación
implícita, se obtiene 21x − 44y − 29z = −4. Por lo tanto, como queríamos mostrar:

 5x − 7y + 7z = 6
L:
 21x − 44y − 29z = −4
Ahora, si bien aquí hemos hallado una ecuación implícita para L por medio de dos planos perpendiculares que se
cortan en L, en general, esto no es necesario. De igual manera, podíamos haber construido un segundo plano que no
sea perpendicular al primero, eligiendo de manera arbitraria el segundo vector director. Si la casualidad es tal que
esta elección en realidad nos devuelve el mismo plano Π, entonces solo debemos volver a sugerir otro vector director
(esperando que la nueva elección no determine el mismo plano otra vez).
¿Cómo calcular la intersección si uno de los planos está dado en forma vectorial? Supongamos ahora que tenemos
los planos Π = {(x, y, z) ∈ R3 : 2x − 3y + 2z = 2} y Π0 = {X ∈ R3 : X = t(2, 1, 0) + s(2, 2, −2) +
(0, −1, 2), t, s ∈ R} y queremos encontrar Π ∩ Π0 . Ya conocemos una manera de resolver esto: hallamos la
ecuación implícita del plano Π0 y, luego, calculamos la intersección como explicamos al comienzo del capítulo.
Pero, ¿si no queremos calcular la ecuación implícita de Π0 ? Como lo venimos haciendo, lo único que debemos tener
presente es qué nos están diciendo estas formas de representar los planos: la ecuación implícita nos impone una
relación que deben verificar las coordenadas de los puntos del plano, mientras que la ecuación vectorial nos dice
“qué forma tienen los puntos del plano”. Recordando lo que hicimos en el apartado anterior (2.3), los puntos de Π0
son de la forma (2t + 2s, t + 2s − 1, −2s + 2) con t, s ∈ R. Por lo tanto, los puntos en Π ∩ Π0 deben ser de esta
forma y, además, sus coordenadas x, y, z deben verificar 2x − 3y + 2z = 2. Pero la forma que tienen los puntos de
Π0 indican precisamente que la coordenada x es de la forma 2t + 2s, la y de la forma t + 2s − 1 y la z de la forma
−2s + 2. Por lo tanto, pedir que estas coordenadas verifiquen la ecuación implícita de Π es pedir que:
2(2t + 2s) − 3(t + 2s − 1) + 2(−2s + 2) = 2.

| {z } | {z } | {z }
x y z
Si desarrollamos esta ecuación, obtenemos t−6s+7 = 2, a partir de lo cual tenemos t = 6s−5. Lo que sucedió aquí
es que, originalmente, en la ecuación dada por la forma vectorial de Π0 , las variables s y t eran independientes, en el
sentido que no dependía una de otra. Pero al pedir a los puntos de Π0 que además verifiquen la ecuación implícita de
Π, hemos descubierto que ahora las variables s y t ya no pueden ser independientes: deben estar relacionadas por
una ecuación. En conclusión, de todos los puntos de Π0 (que son de la forma (2t + 2s, t + 2s − 1, −2s + 2)), los que
además están en Π son los que verifican t = 6s − 5. Por lo tanto, los puntos de Π ∩ Π0 son los puntos de la forma:
(2(6s − 5) + 2s, (6s − 5) + 2s − 1, −2s + 2) = (14s − 10, 8s − 6, −2s + 2).
Ahora ya sabemos qué hacer en este caso: reescribimos este vector convenientemente como:
s(14, 8, −2) + (−10, −6, 2),
que es una ecuación vectorial de la recta Π ∩ Π0 .

¿Qué sucede en el caso de planos paralelos o el mismo plano? Vamos a descubrirlo en el siguiente experimento.
Experimento 10 Consideren los planos Π = {(x, y, z) ∈ R3 : 2x − y + z = 13}, Π0 = {X ∈ R3 :

X = t(0, 1, 1) + s(1, 0, −2) + (−3, 1, 0), t, s ∈ R} y Π00 = {X ∈ R3 : X = k(2, 2, −2) + l(−1, 1, −3) +
(5, 0, 3), k, l ∈ R}. Luego:
1. Calculen Π ∩ Π0 utilizando el procedimiento anterior. ¿Qué obtuvieron? Recuerden el resultado que
obtuvieron cuando calcularon la intersección de planos paralelos dados en forma implícita.
consiguieron cuando calcularon la intersección de planos iguales dados en forma implícita.

¿Cómo calcular la intersección si ambos planos están dados en forma vectorial? En esta instancia, ya sabemos cómo
encarar este problema. Lo resolvemos con un ejemplo sin ahondar mucho en detalles. Si Π = {X ∈ R3 : X =
t(1, 0, −1) + s(0, 1, 1) + (0, 0, 3), t, s ∈ R} y Π0 = {X ∈ R3 : X = k(1, 0, 0) + l(0, 1, −2) + (1, 0, 1), k, l ∈ R},
entonces los puntos de Π son de la forma (t, s, −t+s+3) para algún s, t ∈ R y los de Π0 de la forma (k+1, l, −2l+1)
para algunos k, l ∈ R. Por lo tanto, los puntos que estén en ambos planos a la vez deben ser de ambas formas a la
vez. Esto es, deben existir s, t, k, l ∈ R tales que (t, s, −t + s + 3) = (k + 1, l, −2l + 1). De aquí, obtenemos el
siguiente sistema de ecuaciones: 


 t=k+1

L: s=l


 −t + s + 3 = −2l + 1

Luego, al reemplazar la primera y segunda ecuación en la tercera, obtenemos que −k − 1 + l + 3 = −2l + 1

y, por lo tanto, k = 3l + 1. Así, los puntos que pertenecen a la intersección de ambos planos son de la forma
(3l + 2, l, −2l + 1) = (3l, l, −2l) + (2, 0, 1) = l(3, 1, −2) + (2, 0, 1). Es decir, la intersección de Π y Π0 es la
recta de ecuación l(3, 1, −2) + (2, 0, 1). Observemos que, de la segunda y tercera ecuación, podemos encontar una
relación similar entre s y t; más precisamente, t = 3s + 2. Al reemplazar esta información en (t, s, −t + s + 3),
obtenemos la misma recta. Nuevamente, dejamos para deducir en un experimento qué sucede con estas cuentas en
el caso de planos paralelos o iguales.
Experimento 11 Consideren los planos Π = {X ∈ R3 : X = t(2, 1, −4)+s(−1, 0, 1)+(2, 0, −3), t, s ∈
R}, Π0 = {X ∈ R3 : X = k(−3, − 12 , 2) + l(1, 1, −3) + (1, 3, −1), k, l ∈ R} y Π00 : r(0, 1, −2) +

j(−3, −1, 5) + (1, 0, −2). Luego:
alcanzaron cuando calcularon la intersección de planos paralelos dados en forma implícita.
consiguieron cuando calcularon la intersección de planos iguales dados en forma implícita.

2.4.2 Intersección de un plano y una recta
¿Cómo calcular la intersección de un plano y una recta en R3 ? Sabemos que las posibilidades son:
1. la recta interseca al plano en un punto (y la intersección es ese único punto),
2. la recta es paralela al plano (y la intersección es vacía) o
3. la recta está contenida dentro del plano (y la intersección es exactamente toda la recta).
Estas opciones pueden verse en la Figura 2.11. Nuevamente, analizamos en cada caso dependiendo de como estén
descriptos el plano y la recta. Como los desarrollos son análogos a los que hicimos en el apartado anterior, (2.4.1),
solo mostraremos con ejemplos la resolución, sin hacer mucho hincapié en los detalles.
Figura 2.11: Posibilidades de intersección de un plano y una recta en R3 .

Otra vez, la manera más simple de calcular intersecciones de subespacios es cuando estos vienen dados por
ecuaciones implícitas: solo debemos juntar sus ecuaciones. Supogamos, entonces, que tenemos el plano Π =
{(x, y, z) ∈ R3 : 2x − 3y + 2z = 2} y la recta cuyas ecuaciones implícitas son:

 x + y − 2z = 0
 2x − 4y = 1
Los puntos de Π ∩ L son entonces los que verifican:




 2x − 3y + 2z = 2

x + y − 2z = 0


 2x − 4z = 1

Ahora, resolveremos este sistema de ecuaciones simultáneas. De la segunda ecuación podemos despejar x para
hallar que x = 2z − y. Al reemplazar en la primera ecuación obtenemos 2(2z − y) − 3y + 2z = 2; es decir,
−5y + 6z = 2. De aquí, encontramos que y = − 2−6z
5 . Con esta información, podemos “actualizar” la primera
ecuación que hallamos x = 2z − y y obtener x = 2z − (− 2−6z 4 2

5 ) = 5 z + 5 . Finalmente, reemplazamos estas dos
ecuaciones en la última ecuación y obtenemos 2( 45 z + 25 ) − 4z = 1; es decir, − 12

5 z +
4
5 = 1. Despejamos z y
1
conseguimos z = − 12 . Y como ya hallamos que x = 45 z + 2
5 e y = − 2−6z
5 , entonces, x =
1
3 e y = − 12 . Aquí
vemos que el único punto que pertenece a la intersección Π ∩ L es el punto ( 13 , − 12 , − 12
1
). O sea, en este caso, la
recta atraviesa el plano.
¿Qué sucede en los otros posibles casos de intersección? Lo dejamos para averiguarlo en los siguientes experimentos.
Experimento 12 Consideren el plano Π = {(x, y, z) ∈ R3 : x + y + z = 1} y las rectas L = {X ∈ R3 :
X = t(1, −1, 0) + (1, 0, 1), t ∈ R} y L0 = {X ∈ R3 : X = s(2, 1, −1) + (2, 0, 1), s ∈ R}. Luego, calculen:
1. Π ∩ L
2. Π ∩ L0
utilizando el procedimiento anterior. ¿Qué obtuvieron? ¿Cómo interpretan dicho resultado?
¿Qué sucede si ahora la recta viene dada en forma vectorial? Aquellos que ya hayan dominado la técnica para la
intersección de planos, no tendrán dificultad en seguir el mismo razonamiento para este caso. Los orientamos en el
siguiente experimento.
Experimento 13 Consideren el plano Π = {(x, y, z) ∈ R3 : x + y + z = 1} y la recta L = {X ∈ R3 :
X = t(1, 3, −1) + (2, 2, 0), t ∈ R}. Luego:

1. Escriban la “forma” que tienen los puntos de L (en función de t ∈ R).
2. Reemplacen x, y, z en la ecuación implícita de Π utilizando la forma de los puntos de L hallada en el
punto anterior. ¿Cuál es la interpretación de este reemplazo?
3. Para el t obtenido en el punto anterior, reemplácenlo en la ecuación vectorial de L para encontrar el punto
donde se intersecan el plano y la recta.

A esta altura, no tendrán problemas en reconocer o interpretar los resultados de los procedimientos para los casos en
los que la recta sea paralela al plano o esté incluída en el mismo.
Si el plano viene dado en su forma vectorial, pueden comprobar que no importa si es la forma de los puntos de
L que introducimos en las ecuaciones Π o, como en este caso, la forma de os punto de Π que introducimos en
las ecuaciones de L. En ambos casos lo que se pide es verificar que las dos ecuaciones se verifiquen en forma
simultánea. De esta forma se garantiza que se buscan los puntos en los dos subespacios: la recta y el plano.
Finalmente, el caso en el que tanto la recta como el plano vienen dados en forma vectorial, solo debemos “igualar”
la forma de sus puntos. Por ejemplo, si Π = {X ∈ R3 : X = t(1, 1, 0) + s(1, 0, 1) + (0, 1, 2), t, s ∈ R} y
L = {X ∈ R3 : X = k(1, 3, −1)+(2, 2, 0), k ∈ R}, entonces, buscamos t, s, k ∈ R tales que (t+s, t+1, s+2) =
(k + 2, 3k + 2, −k). A partir de aquí, obtenemos el siguiente sistema de ecuaciones de donde despejamos s, t, k



 t+s=k+2

t + 1 = 3k + 2


 s + 2 = −k

En la segunda ecuación conseguimos t = 3k + 1 y, de la tercera ecuación, s = −2 − k. Luego, al reemplazar estos

valores en la primera ecuación, deducimos que 3k + 1 − 2 − k = k + 2. De esta última igualdad, podemos despejar
k y obtener k = 3. Luego, al reemplazar este valor de k en (k + 2, 3k + 2, −k), hallamos que la intersección entre
la recta y el plano es el punto (5, 11, −3).
Analicen qué se espera obtener si la recta es paralela al plano o si está contenida en él.
2.4.3 Intersección de rectas
Analicemos los posibles resultados de la intersección entre dos rectas en el espacio. Dichas rectas podrían:
1. cortarse en un punto,
2. no cortarse (lo que en este caso no implica que sean necesariamente paralelas) o
3. ser la misma recta.
La Figura 2.12 muestra estas posibles situaciones.
Figura 2.12: Posibilidades de intersección de rectas en R3 .
Veamos todas las posibles formas de describir a estas rectas. Supongamos que L es la recta dada por las ecuaciones
implícitas x + 2z = 1 y y − z = 1; L0 es la recta dada por las ecuaciones x + y + 3z = 6 y 2x − 3y + z = −13;
L00 la recta de ecuación vectorial t(1, −4, 2) + (3, 1, 0) y L000 la recta de ecuación vectorial s(2, −1, 1) + (−3, 3, 0).
Entonces, L ∩ L0 es el conjunto de soluciones (x, y, z) ∈ R3 del siguiente sistema de cuatro ecuaciones:



 x + 2z = 1


 y−z =1



 x + y + 3z = 6


 2x − 3y + z = −13.

Álgebra A. Distancias y ángulos entre rectas y planos. 65
Es la primera vez que nos encontramos con tantas ecuaciones. Si las pensamos como restricciones, nos están
indicando que, para que haya al menos un punto en la intersección de ambas rectas, deben verificarse muchas
condiciones, lo cual, en principio, parecería díficil que suceda. En realidad, dada la espacialidad de R3 , esto tiene
sentido. Si bien en R2 dos rectas casi siempre se cortan (con la única excepción que sean paralelas), en R3 es mucho
más fácil encontrarse con rectas que no se toquen. ¿Cómo se resuelve entonces un sistema de cuatro ecuaciones?
Pues como lo venimos haciendo. Ya vimos en el apartado anterior que, cuando tenemos tres ecuaciones, en general,
quedan despejadas todas las variables y conseguimos un punto como la solución del sistema. En general, aquí
pasará lo mismo con las primeras tres ecuaciones que utilicemos, pero no debemos perder de vista que, el punto que
encontremos con estas tres ecuaciones, también debe satisfacer la cuarta ecuación (que aún no hemos utilizado).
Resolvemos entonces el sistema. De la primera ecuación obtenemos que x = 1 − 2z, y de la segunda ecuación,
y = z + 1. Luego reemplazamos estos resultados en la tercera ecuación, consiguiendo 2 + 2z = 6; con lo cual
z = 2. Así, también, despejamos x = −3 e y = 3. Finalmente, debemos chequear que estos valores que alcanzamos
verifican la última ecuación: 2 · (−3) − 3 · 3 + 2 = −13. Por lo tanto, concluimos que la intersección de ambas
rectas es el punto (−3, 3, 2).
Para los otros casos se procede de manera análoga a cómo lo venimos haciendo.
A diferencia de lo que pasa para las rectas en el plano, dos rectas en el espacio que no se tocan no son necesariamente
paralelas (como sí era el caso entre planos o entre un plano y una recta). Por esta razón, existe la siguiente
clasificación de rectas en R3 .
Definición 23 Sean L y L0 dos rectas en R3 . Entonces, L y L0 se dicen:
Concurrentes: si su intersección no es vacía.

Paralelas: si no son concurrentes y son paralelas.
Coincidentes: si son concurrentes y paralelas.
Alabeadas: si no son concurrentes ni paralelas.
Estudiamos cómo calcular la intersección de:

1. dos planos.
2. de un plano y una recta.
3. dos rectas de R3 .
Vimos cómo se clasifican dos rectas en: R3 en concurrentes, coincidentes, paralelas o alabeadas.

2.5 Distancias y ángulos entre rectas y planos

Dado que ya sabemos calcular intersecciones, estamos en condiciones de aprender a medir distancias y ángulos
entre espacios lineales.
Cómo calcular:
1. el ángulo entre dos rectas, entre una recta y un plano y entre dos planos.
2. la distancia entre un punto y una recta y entre un punto y un plano.
3. la distancia entre dos planos, entre dos rectas y entre una recta y un plano.

2.5.1 Ángulos entre rectas
¿Cómo medir el ángulo entre dos rectas? Tengamos en cuenta tres puntos. Observemos la situación como se muestra
en la Figura 2.13, lado izquierdo. En primer lugar, dos rectas determinan dos ángulos entre ellas, uno más pequeño
y otro más grande. Vamos a considerar que el ángulo entre dos rectas es el más pequeño entre ambos; es decir,
aquel que está entre 0 y π2 . Por otro lado, medimos el ángulo entre dos rectas cualesquiera, aunque no se corten.
Por ejemplo, para nosotros, dos rectas paralelas distintas forman un ángulo de 0. Cabe destacar, entonces, que no
es necesario que las rectas se corten para poder medirles el ángulo. Es posible pensar que, si fuera necesario,
trasladamos una de las rectas (sin cambiarle la dirección) hasta que interseque a la otra.
Figura 2.13: Ángulo entre dos rectas.
Entonces, dado que el ángulo depende de la dirección de la recta, ¿alcanza con definir el ángulo entre dos rectas
como el ángulo entre los vectores directores de las rectas? No, pero casi. Observemos la Figura 2.13, lado derecho.
Observemos que el ángulo entre las rectas no coincide con el ángulo entre los vectores directores. Esto sucede
ya que es posible elegir infinitos vectores directores, pero, mientras que en la recta no importa el sentido, en los
vectores directores sí. Entonces veamos que, en este caso, el ángulo se obtiene midiendo el ángulo entre uno de los
vectores directores y el inverso del otro.
Definición 24 Sean L, L0 ∈ R3 y supongamos que ~ ~ un vector director para L0 .
v es un vector director para L y w
~ entonces el ángulo entre L y L0 , el cual se denota ∠(L, L0 ), es ángulo más
Si llamamos θ al ángulo entre ~v y w,
π
pequeño entre θ y π − θ; es decir, el ángulo que está entre 0 y 2 de estos dos.
Independientemente de esta definición, es importante recordar como hacemos para medir ángulos entre rectas: en
primer lugar, buscamos el ángulo más pequeño entre ambas rectas (y para calcularlo, debemos elegir convenien-
temente los vectores directores de ambas; o, en su defecto, elegir vectores directores al azar) y, en segundo lugar,
estimar si se forma un ángulo menor al considerar el opuesto de uno de los vectores directores. Veamos esto con un
par de ejemplos:
Ejemplos 30
1. Para calcular el ángulo que forman las rectas L = {X ∈ R2 : X = t(1, 2) + (3, −3), t ∈ R} y L0 = {X ∈
R2 : X = s(3, 0) + (2, 5), s ∈ R} de R2 debemos, primero, calcular el ángulo entre los vectores (1, 2) y (3, 0).

3
Este es arc cos 3√ 5
≈ 63,43o . Como este ángulo es menor a π2 entonces este es precisamente ∠(L, L0 ).
2. Para calcular el ángulo que forman las rectas L = {X ∈ R3 : X = t(−1, 2, 0) + (1, 2, −3), t ∈ R} y
L0 = {X ∈ R3 : X = s(−5, −4, 2) + (2, 2, 9), s ∈ R} de R3 debemos, primero, calcular el ángulo entre los
3
≈ 101, 5o . Como este ángulo es mayor a π2 entonces

vectores (−1, 2, 0) y (−5, −4, 2). Este es arc cos − 15
∠(L, L0 ) es aproximado por 180o − 101, 5o = 78, 5o .

También podemos medir ángulos entre dos planos y entre una recta y un plano. Veremos que el cálculo se reduce al
mismo que para medir ángulos entre rectas. Por un lado, la Figura 2.14, lado derecho, muestra que el ángulo formado
entre dos planos es el mismo que el ángulo determinado por las rectas con direcciones normales de dichos planos.
Por otro lado, la Figura 2.14, lado izquierdo, muestra que el ángulo entre una recta L y un plano Π puede calcularse
π
restando a 2 el ángulo entre L y la recta con dirección normal a Π. Tenemos entonces la siguiente definición.
Figura 2.14: Medición ángulos entre planos y entre rectas y planos.
~,N
Definición 25 Sean L una recta y Π, Π0 planos en R3 . Sean N ~ 0 vectores normales a Π, Π0 respectivamente.
1. El ángulo ∠(L, Π) entre la recta L y el plano Π es π ~, t ∈

− ∠(L, L0 ), donde L00 = {X ∈ R3 : X = tN
2
R}.
~ , t ∈ R} y
2. El ángulo ∠(Π, Π0 ) entre los planos Π y Π0 es ∠(L0 , L00 ), donde L0 = {X ∈ R3 : X = tN
~ 0 , s ∈ R}.
L00 = {X ∈ R3 : X = sN
Ejemplos 31
1. Calculemos el ángulo que forman la recta L de ecuación vectorial t(1, 2, −1) + (0, 0, 2) y el plano Π =
{(x, y, z) ∈ R3 : 2x − y − 3z = 2}. Por la definición, el ángulo ∠(L, Π) es el ángulo π
2
− ∠(L, L0 ), donde
~ yN
L0 es la recta de ecuación vectorial sN ~ es un vector normal al plano. Si miramos la ecuación implícita de Π,
sabemos que una normal para Π es (2, −1, −3). Por lo tanto, para hallar ∠(L, L0 ), debemos calcular el ángulo

entre los vectores directores (1, 2, −1) y (2, −1, −3). Dicho ángulo es arc cos 2√321 ≈ 70, 89o . Como este
ángulo es menor a π
2
, entonces ∠(L, L0 ) ≈ 70, 89o . Por lo tanto, ∠(L, Π) ≈ 90o − 70, 89o = 19, 11o .
2. Calculemos ahora el ángulo entre los planos Π = {(x, y, z) ∈ R3 : x + y + 3z = 0} y Π0 = {X ∈ R3 : X =
t(0, 2, −1) + s(−3, 1, 1) + (2, −2, 5), t, s ∈ R}. Por definición, ∠(Π, Π0 ) = ∠(L, L0 ), donde L, L0 son las
rectas, que pasan por el origen, cuyos vectores directores son las normales de Π, Π0 respectivamente. Por un lado,
un vector normal para Π es (1, 1, 3). Por otro lado, un vector normal para Π0 es (0, 2, −1)×(−3, 1, 1) = (3, 3, 6).

El ángulo entre (1, 1, 3) y (3, 3, 6) es arc cos 3√ 24
66
≈ 10, 02o . Como este ángulo es menor a π2 , entonces
∠(Π, Π0 ) ≈ 10, 02o .

2.5.2 Distancia de un punto a una recta
Hemos vimos que el producto escalar nos brinda una manera de medir la distancia entre dos puntos. Ahora bien,
veamos cómo proceder para medir distancias en otras situaciones. Comencemos calculando la distancia entre un
punto y una recta. ¿Qué significa la distancia entre un punto y una recta? Si imaginamos un deportista de velocidad
llegando a la meta en una carrera, ¿a qué nos referimos cuando decimos “el corredor está a 10 m. de la línea de
llegada? A la menor distancia entre el corredor y la línea de llegada, y, dicha distancia se recorre cuando medimos
la posición del corredor en forma perpendicular respecto de la línea de llegada. Por lo tanto, al pensar en la posición
del corredor como un punto sobre la pista de carrera y la línea de llegada como una recta, la distancia de este punto
a esta recta es la menor distancia entre el punto y todos los puntos de la recta, entonces deducimos que, además,
esta distancia se recorre cuando medimos la distancia en forma perpendicular a la recta. Estudiemos los siguientes
casos, teniendo presente estas nociones.
Comencemos por el caso de R2 . Supongamos que tenemos la recta L = {X ∈ R2 : X = t(2, −3) + (0, 5), t ∈ R}
y el punto P = (1, −3). Es necesario medir la distancia del punto P al punto de la recta que se encuentra
“perpendicular” a la recta a lo largo de P . Entonces calculamos auxiliarmente la recta L0 que es perpendicular a L
y que pasa por el punto P . De esta manera, el punto de la recta que se encuentra más cerca de P es Q = L0 ∩ L
(Figura 2.15). Por lo tanto, la distancia de P a la recta L es la distancia de P a Q (Q es el punto de L más cercano a
P ). Resuelvan este problema a través del siguiente experimento.
Figura 2.15: Cálculo de la distancia de un punto a una recta en R2 .
Experimento 14 Con L y P recién definidos, sigan los siguientes pasos para hallar la distancia de L a P :
1. Encuentren la recta L0 perpendicular a L que pase por el punto P .

2. Hallen L0 ∩ L, el cual es un punto Q.
3. Calculen d(P, Q). Ésta es la distancia de L a P .

¿Cómo hacemos para calcular ahora la distancia de un punto P ∈ R3 a una recta L en el espacio? Aquí la situación
es un poco más complicada, aunque el procedimiento es exactamente el mismo al utilizado para el cálculo de la
distancia de un punto a una recta en R2 . ¿Cómo calcular el punto de L que se encuentra más cercano al punto P ?
No es difícil ver que la distancia se establece sobre el segmento que une P con una dirección perpendicular a L,
exactamente igual que el caso de R2 . Es posible entonces intentar armar una recta perpendicular a L que pase por P .
El problema con este acercamiento es que hay infinitas rectas que son perpendiculares a L y pasan por P . Esto se
debe a que hay muchas direcciones perpendiculares a una dada en R3 (a diferencia de R2 , que solo hay una). En
realidad, uno debería armarse la “recta perpendicular a L que pase por P y que corte L”. De todas formas, este
procedimiento que acabamos de describir es más complicado que el caso de R2 , y en el espacio hay una forma más
directa de calcular el punto de L más cercano a P .
Figura 2.16: Distancia de un punto a una recta en R3 .
Al observar la Figura 2.16, consideramos el plano perpendicular a L que pasa por P . Esto es fácil, ya que dicho
plano podemos representarlo por medio de la ecuación normal, ¡y la normal del plano puede ser escogida como el
vector director de L! Resuelvan este problema en el Experimento 15.
Experimento 15 Sean L = {X ∈ R3 : X = t(1, 2, −3) + (0, 1, 5), t ∈ R} y P = (1, 0, 1).
1. Hallen el plano Π perpendicular a L que pasa por P .5

2. Encuentren Q = L ∩ Π.
3. Calculen d(P, Q) para hallar la distancia de L a P .

2.5.3 Distancia de un punto a un plano
De la misma forma que para el caso de las rectas, si quisiéramos medir la distancia de un punto a un plano, como
por ejemplo la distancia de una mosca que se encuentra volando en una habitación a una de las paredes de la misma,
estaremos pensando en la menor distancia entre la mosca y la pared, y se recorre cuando consideramos la dirección
perpendicular al plano determinado por la pared (Figura 2.17).
Figura 2.17: Cálculo de la distancia de un punto a un plano en R3 .

Trabajemos con un ejemplo. Sean Π = {X ∈ R3 : X = t(2, 2, −1) + s(5, 0, −3) + (2, 0, 0), t, s ∈ R} y
P = (−1, −2, 4), busquemos la distancia más corta entre un punto del plano y P . Si vemos la Figura 2.17, notamos
que nos alcanza con considerar la recta L perpendicular a Π que pasa por P . Resuelvan el problema en el siguiente
experimento.
Experimento 16 Sean Π y P como recién definidos.
1. Hallen la recta L perpendicular a Π que pasa por P .

2. Encuentren Q = L ∩ Π.
3. Calculen d(P, Q) para hallar la distancia de Π a P .

Observemos que este caso es inverso al caso de la distancia de un punto a una recta en R3 , ya que aquí
construimos una recta para hallar el punto del plano más cercano a P y, en el caso anterior, construimos un
plano para encontrar el punto de la recta más cercano a P . Esto se debe a que, en R3 , una recta complementa a
un plano y un plano complementa a una recta, porque un plano contiene 2 direcciones y la recta (perpendicular)
contiene la dirección que le falta para “ser” todo el espacio (y lo mismo al revés). Por este motivo hay un único
plano perpendicular a una recta que pasa por P y una única recta perpendicular a un plano que pasa por
P . Precisamente por esta razón, no era conveniente calcular la distancia de un punto P a una recta L en el
espacio buscando la recta perpendicular a L que pase por P (porque hay infinitas opciones y solo una nos
sirve).
2.5.4 Distancia entre rectas y planos
Finalmente, abordaremos el problema de medir distancias entre dos rectas, dos planos o una recta y una plano. Así
como vimos que medir distancias entre una recta y un punto, o un plano y un punto se reduce a medir la distancia
entre puntos (el punto dado y el punto más cercano de la recta o el plano), el cálculo de la distancia entre dos rectas,
dos planos o una recta y un plano, puede reducirse al cálculo de la distancia entre un punto y una recta o un punto y
un plano. En lugar de explicar cada uno de estos casos, dejaremos que ustedes los deduzcan por su cuenta en los
experimentos que siguen. Antes de avanzar, cabe destacar algunas consideraciones. Por un lado, cuando estimamos
la distancia entre dos subespacios (recta y recta, recta y plano o plano y plano), si dichos subespacios se intersecan,
entonces la distancia es obviamente 0 (si se tocan, están “pegados” y no hay distancia entre ellos). Por lo tanto, al
calcular distancia entre dos planos, es bueno verificar primero si los planos son paralelos; si no lo son, sabemos que
indefectiblemente se cortarán en una recta y, en particular, se tocarán y estarán a distancia 0 (y no es necesario hacer
ningún cálculo más). Lo mismo al buscar la distancia entre un plano y una recta (debemos chequear si son paralelos;
de lo contrario se tocan y la distancia es 0). En el caso de la distancia entre dos rectas del espacio, vayamos con un
poco más de cuidado. Es indispensable verificar si se intersecan o no, pero sabemos que, aún cuando no se toquen,
podrían no ser paralelas (y ser alabeadas). Observen en los experimentos que ambos casos se abordan de modo
diferente, por lo que habrá que clasificar ambas rectas antes de resolver su distancia.
Experimento 17 Consideren los planos Π = {X ∈ R3 : X = λ(−2, 1, 1)+µ(0, −3, 4)+(5, −1, 0), λ, µ ∈
R} y Π0 = {(x, y, z) ∈ R3 : 7x + 8y + 6z = −2}.
1. Verifiquen que Π y Π0 son paralelos.
2. Construyan una recta L perpendicular a ambos planos y calculen P = L ∩ Π y Q = L ∩ Π0 .
3. Calculen d(P, Q). ¿Qué representa en este problema el número d(P, Q)?
4. ¿Es importante saber qué recta perpendicular a Π y Π0 construyeron? Expliquen este hecho geométrica-
mente.

Experimento 18 Consideren las rectas L1 = {(x, y, z) ∈ R3 : 2x − y − z = 4, 4x − y − 2z = 9} y
L2 = {X ∈ R3 : X = λ(1, 0, 2) + (1, 2, −3), λ ∈ R}.

1. Prueben que L1 y L2 son paralelas.
2. Hallen un plano Π perpendicular a L2 que pase por P = (1, 2, −3) y determinen Q = L1 ∩ Π.
3. Calculen d(P, Q). ¿Qué representa el número d(P, Q) en este problema?

Experimento 19 Sean Π el plano de ecuación x + y + z = 1 y L la recta L = {X ∈ R3 : X =
λ(−1, 0, 1) + (1, 1, 2), λ ∈ R}.

1. Prueben que L es paralela a Π.
2. Hallen una recta L0 ortogonal a Π que pase por P = (1, 1, 2) y determinen Q = L0 ∩ Π.
3. Calculen d(P, Q). ¿Qué representa el número d(P, Q) en este problema?

Experimento 20 Consideren las rectas L1 = {(x, y, z) ∈ R3 : x − y − z = 1, x − 2y + z = −2} y
L2 = {X ∈ R3 : X = λ(2, −3, 0) + (0, 0, −1), λ ∈ R}.

1. Prueben que L1 y L2 son alabeadas.
2. Construyan dos planos paralelos Π1 y Π2 tales que Π1 contenga a L1 y Π2 contenga a L2 . Sugerencia:
encuentren vectores directores para L1 y L2 y úsenlos como vectores directores de los plano Π1 y Π2 .
3. Calculen d(Π1 , Π2 ). ¿Qué representa el número d(Π1 , Π2 ) en este problema?

Estudiamos cómo calcular:

1. el ángulo entre dos rectas, entre una recta y un plano y entre dos planos.
2. la distancia entre un punto y una recta.
3. la distancia entre un punto y un plano.
4. la distancia entre dos planos, entre dos rectas y entre una recta y un plano.

2.6 Proyecciones y simetrías

Finalmente, nos abocaremos a proyectar puntos sobre rectas y planos y, también, a calcular la “imagen simétrica"de
un punto respecto de otro punto, de una recta o de un plano.
Cómo calcular el simétrico de un punto respecto de otro punto, una recta o un plano.
Cómo calcular la proyección ortogonal de un punto sobre una recta o un plano.

2.6.1 Simetrías
Simetría es una palabra que se encuentra presente en todas las ramas de la matemática y puede tener un significado
distinto en cada caso. Sin embargo, en la teoría de espacios lineales, esta noción refiere a la situación más natural de
la palabra: es como la imagen que refleja un espejo. Por ejemplo, si hubiese una mosca frente al espejo (no apoyada
en él), entonces, la imagen de la mosca “del otro lado del espejo” sería su simétrico respecto del espejo. Ahora bien,
formalmente, si tenemos un punto en R3 y un plano (que podemos pensarlo como si fuera un espejado) entonces el
simétrico del punto respecto del plano (el espejo) es aquél punto (del otro lado del plano) que marcaría el reflejo
de dicho punto. Vamos a ver que es posible calcular el simétrico de un punto respecto de otro punto, y de rectas
también. Debemos proceder siempre de la misma manera: el punto, recta o plano actuarán como espejos y nos
interesará saber qué punto es el que está “del otro lado”, en el sentido simétrico de la definición. Veamos cómo
formalizar estas nociones.
Comencemos analizando la situación que más se parece a nuestra realidad tridimensional: el simétrico de un punto
en el espacio respecto de un plano. En este caso, deseamos encontrar cuál es el punto “del otro lado del plano”
que sería la imagen simétrica del punto original, pensando al plano como espejado. Por ejemplo, consideremos el
plano xy (de ecuación z = 0) y el punto (1, 2, 3). ¿Cuál es la imagen reflejada de (1, 2, 3) respecto del plano xy?
Seguramente, no tendrán problemas en hallar la respuesta correcta: (1, 2, −3); este es el punto que naturalmente se
encuentra “del otro lado” del plano xy (Figura 2.18, lado izquierdo). Si ahora cambiamos la inclinación del espejo
para que esté en la dirección del plano Π : x + 2y + 3z = 0 ¿Cuál es el simétrico del (1, 2, 3) respecto de Π? Al
analizar la situación geométricamente, observamos que se trata del punto (−1, −2, −3) (Figura 2.18, lado derecho).
¿Qué hicimos en ambos casos? Pues nos dimos cuenta que, si formamos la recta entre un punto y su simétrico
respecto de un plano, entonces esta recta es perpendicular al plano. Pero además, la distancia del simétrico al plano
debe ser la misma que la del punto original al plano. Esto es lo que debe tenerse presente al momento de análizar la
definición, que se presenta luego de la Figura.
Definición 26 Sean P ∈ R3 y Π un plano. El simétrico de P con respecto a Π es el único punto Q ∈ R3
distinto de P que verifica que el segmento que une a ambos puntos es perpendicular al plano y, además, la
distancia de cada uno de dichos puntos al plano es la misma.
Observación 11 Observemos que si P ∈ Π, entonces, su simétrico con respecto a Π es el mismo punto P .
Ya contamos con todas las herramientas necesarias para calcular un simétrico. Observemos el método para encontrar
un simétrico de forma detallada en el siguiente ejemplo.
Ejemplo 32 Consideremos el plano Π = {(x, y, z) ∈ R3 : x + y + z = 1} y el punto (1, 1, 0). Queremos encontrar
el simétrico de dicho punto con respecto a Π. Luego, calculamos la recta L que es perpendicular al plano y que pasa por
Álgebra A. Proyecciones y simetrías. 73
Figura 2.18: El simétrico de un punto respecto de un plano.
el punto (1, 1, 0). A partir de la ecuación de Π, deducimos que la normal del plano es el vector (1, 1, 1). Por lo tanto,
una ecuación vectorial para L es t(1, 1, 1) + (1, 1, 0), t ∈ R. Para calcular d(P, Π) debemos obtener R = L ∩ Π; y,
entonces, resolvemos la ecuación t + 1 + t + 1 + t = 1, de la que conseguimos t = −1/3. Así, el punto de intersección
entre la recta y el plano es R = ( 23 , 32 , − 13 ). Ahora, d(P, Π) = d(P, R) = √1 .
3
Finalmente, Q = (x, y, z) es el (único)
punto de L distinto de P que verifica d(Q, Π) = √1 . Como Q ∈ L, entonces, Q es de la forma (t + 1, t + 1, t) para
3
cierto t ∈ R. Observemos que d(Q, Π) = d(Q, R), por lo que buscamos la solución a:
r
2 2 1 1
(t + 1 − )2 + (t + 1 − )2 + (t + )2 = √ ,
3 3 3 3
o lo que es lo mismo:
1 2 1
3(t + ) = .
3 3
Las dos soluciones de esta ecuación cuadrática son t = 0 y t = − 23 . El caso t = 0 nos devuelve el punto P . El caso
t = − 23 nos devuelve el simétrico de P respecto de Π: Q = 13 , 13 , − 23 .

Existe otra manera (más sencilla) de calcular el simétrico. Solo debemos darnos cuenta de que el punto medio entre
un punto P y su simétrico respecto del plano Π es, necesarimente, un punto del plano Π (justamente, esto es lo
que indica el hecho que la distancia de cada uno de estos puntos al plano sea la misma). Por lo tanto, otra posible
manera de calcular el simétrico en esta situación es la siguiente.
Experimento 21 Sean P = (1, 2, 3) y Π = {(x, y, z) ∈ R3 : x + 2y + 3z = 0} (definidos como recién).
Luego:
1. Hallen la recta L perpendicular a Π que pasa por P .
2. Hallen el punto R = L ∩ Π.
3. Sabiendo que R es el punto medio entre P y su simétrico Q, hallen Q.

¡Observemos que esta manera de calcular el simétrico de P no involucra el cálculo de distancias!
Ejemplo 33 Con los datos del ejemplo anterior, vimos que la recta L de ecuación vectorial t(1, 1, 1) + (1, 1, 0)
es perpendicular al plano Π y pasa por (1, 1, 0) y que L ∩ Π es R = ( 32 , 23 , − 13 ). Como sabemos que R debe ser
P +R
precisamente el punto medio entre (1, 1, 0) y su simétrico Q = (x, y, z) podemos plantear Q = 2
; es decir:

1+x
 = 23
 2


1+y
2
= 23


 z = −1,

2 3
de donde x = 13 , y = 1
3
y z = − 23 . Luego, el simétrico de P respecto de Π es el punto Q = ( 13 , 13 , − 23 ).
En R2 , el caso análogo al del encontrar el simétrico de un punto respecto de un plano, es el de encontrar el simétrico
de un punto respecto de una recta. Esto se debe a que, si viviéramos en dos dimensiones, los espejos serían segmentos
(en lugar de planos como en el espacio tridimensional). Veamos un ejemplo. Consideremos en R2 el punto (3, 4).
¿Cuál es el simétrico de (3, 4) respecto del eje x? Nuevamente, no tendremos problemas en convencernos que la
respuesta correcta es el punto (3, −4): este es el punto que naturalmente se encuentra “del otro lado” del eje x
(Figura 2.19, lado izquierdo). ¿Y el simétrico del (3, 4) respecto de la recta de ecuación vectorial t(1, 1)? Al mirar la
Figura 2.19, lado derecho, vemos que se trata del (4, 3). Lo que sucede en este caso es idéntico al caso del simétrico
de un punto respecto de un plano. La definición es también idéntica.
Figura 2.19: El simétrico de un punto respecto de una recta en R2 .
Definición 27 Dado un punto P ∈ R2 y una recta L ⊂ R2 , el simétrico de P respecto de L es el (único) punto
Q ∈ R2 distinto de P , tal que el segmento que une P con Q es perpendicular a L y la distancia de cada uno de
ellos a L es la misma.
Como sucedía con los simétricos respecto de un plano, si P ∈ L, entonces, su simétrico con respecto a L es el
mismo punto P . También podemos calcular el simétrico de P respecto de L como apuntamos en el Experimento 16;
esto es, teniendo presente que el punto medio entre P y su simétrico es, necesariamente, un punto de la recta L. Si
han comprendido los procedimientos hasta aquí desarrollados, no tendrán problema en reproducirlos en este caso
más sencillo.
Ejemplo 34 Consideremos la recta L = {X ∈ R3 : X = t(1, −1) + (0, 2), t ∈ R} y el punto P = (1, 3), y
calculemos el simétrico Q de dicho punto con respecto a L. En primer lugar, recordemos que un punto y su simétrico
pertenecen a una misma recta que resulta perpendicular a L. Comenzamos, entonces, buscando una ecuación de la recta
L0 que es perpendicular a L y pasa por (1, 3). Luego, elegimos un vector director que sea perpendicular al vector director
de L; por ejemplo, una posibilidad es tomar el vector (1, 1). Una ecuación vectorial para L0 es, entonces, s(1, 1) + (1, 3).
Al calcular la intersección entre ambas rectas, vemos que L ∩ L0 = {(0, 2)}. Por lo tanto, si Q = (x, y), entonces, debe
x+1 y+3
verificarse 2
=0y 2
= 2, a partir de lo cual concluimos que (x, y) = (−1, 1).
A partir de los conceptos estudiados, analicen con respecto a qué objeto se puede calcular el simétrico de un
punto en R, cómo se lo define y qué calculos son necesarios.
También, es posible definir el simétrico de un punto P respecto de otro punto Q, para R2 o R3 (en realidad, la
definción vale para cualquier Rn ). Como los conceptos y procedimientos son prácticamente los mismos, no surgirán
problemas para hallar esta definición natural.
Definición 28 Sean P, Q ∈ Rn . El simétrico de P respecto de Q es el (único) punto R ∈ Rn distinto de P tal
que R está en la recta determinada por P y Q y la distancia de R a Q es la misma que la distancia de P a Q.
Al igual que en los casos anteriores, el punto R queda determinado por la propiedad tal que el punto medio entre R
y P es precisamente Q.
Ejemplos 35
1. Hallemos el simétrico del punto P = (1, 2) respecto del punto Q = (−3, 1) en R2 . Si R = (x, y) representa a
dicho simétrico, entonces, debe verificar que P +R = Q; es decir, 1+x , 2+y

2 2 2
= (−3, 1). De aquí, despejamos
fácilmente: x = −7 e y = 0. Luego, R = (−7, 0).
2. Hallemos ahora el simétrico del punto P = (0, −1, 4) respecto del punto Q = (2, −3, −2) en R3 . Si R =
(x, y, z) representa a dicho simétrico, entonces debe verificar 0+x , −1+y , 4+z

2 2 2
= (2, −3, −2). De aquí,
despejamos: x = 4, y = −5 y z = −8. Luego, R = (4, −5, −8).

Finalmente, podemos definir el simétrico de un punto P ∈ R3 respecto de una recta en R3 .

Definición 29 Dado un punto P ∈ R3 y una recta L ⊂ R3 que no contiene a P , el simétrico de P respecto de
L es el (único) punto Q ∈ R3 distinto de P tal que el segmento que une P con Q es perpendicular a L y la
distancia de cada uno de ellos a L es la misma. Si P ∈ L entonces P es su mismo simétrico.
Observemos que la definición anterior es prácticamente la misma que la del simétrico respecto de una recta en R2 .
Esto no es casualidad: dados el punto P y la recta L, si P ∈
/ L, entonces existe un único plano que contiene a P y a
L. El simétrico de P va a estar, necesariamente, contenido en este plano, por lo cual, estaremos trabajando en un
plano (que podemos identificar con R2 ). Una posible manera de calcular el simétrico R del punto P , respecto de la
recta L, es la siguiente:
1. Construir el plano Π perpendicular a L que pase por P .
2. Calcular el punto Q = Π ∩ L.
3. Construir la recta L0 que une P con Q.
4. Hallar el punto de L0 , distinto de P , que se encuentre a la misma distancia de Q que P .
También, como en los casos anteriores, el punto R queda determinado por la siguiente propiedad: el punto medio
entre R y P es Q = Π ∩ L. Esta suele ser una manera más directa (y más inmediata) de arribar al resultado.
Ejemplo 36 Hallemos el simétrico del punto P = (−3, −1, 1) respecto de la recta de ecuación vectorial t(1, 1, −1) +
(2, 0, −1). Primero, construimos el plano Π perpendicular a L que pase por P : una ecuación implícita para este plano
es x + y − z = −5. A continuación, calculamos Q = Π ∩ L: es un punto de la forma (t + 2, t, −t − 1) tal que
(t + 2) + t − (−t − 1) = −5. De aquí, despejamos t = − 83 . Por lo tanto, Q = − 32 , − 38 , 53 . Finalmente, si llamamos

R = (x, y, z) al simétrico buscado, entonces debe verificar P +R

2
= Q; es decir,

−3 + x −1 + y 1 + z 2 8 5
, , = − ,− ,
2 2 2 3 3 3
Por lo tanto, x = 53 , y = − 13 y z = 73 , y hallamos que R = 5

, − 13 ,7

3 3 3 3
.
2.6.2 Proyección ortogonal de puntos sobre rectas y planos
¿Qué significa “proyectar” un punto sobre una recta o un plano? La idea es sencilla: retomemos el ejemplo de una
mosca en una habitación (oscura, ahora) en la cual encendemos una linterna y apuntamos hacia la mosca. La sombra
de la mosca caerá sobre la pared que la mosca tiene detrás. Dicha sombra es una proyección de la mosca sobre
la pared. Supongamos que la mosca es un punto y la pared es un plano: la sombra representa la proyección del
punto sobre el plano. Pero, ¿está bien definida esta proyección? No, pues depende de dónde estemos sosteniendo
nosotros la linterna. Es decir, la proyección de un punto sobre una recta o un plano depende desde donde lo estemos
proyectando. En este libro solo estudiaremos el caso de proyecciones que se hagan de manera perpendicular a la
recta o al plano. Este tipo de proyecciones se llaman, naturalmente, proyecciones ortogonales.
¿Cómo calcular la proyección ortogonal? Supongamos que tenemos un punto P ∈ R3 y un plano Π ⊂ R3 .
Queremos proyectar P sobre Π de manera ortogonal. Esto significa que pretendemos que la recta L determinada por
el punto P y el punto desde donde estamos proyectando (donde estaríamos sosteniendo la linterna) sea perpendicular
al plano (Figura 2.20). Entonces, la proyección ortogonal de P sobre Π sería la intersección L ∩ Π (tengamos en
cuenta que la recta L estaría representando el haz de luz de la linterna). Sin embargo, observemos que la recta
L construida es, exactamente, la recta perpendicular a Π que pasa por el punto P . Por lo tanto, para calcular la
proyección ortogonal de P sobre Π, no necesitamos saber dónde está ubicada la linterna, pues alcanza con saber
que está ubicada en una posición cuyo haz es perpendicular a Π.
Figura 2.20: Proyección ortogonal sobre un plano.
Al igual que en el ejemplo de cómo calcular el simétrico de un punto, la situación de proyectar un punto P ∈ R2
sobre una recta L ⊂ R2 es completamente análoga a la de proyectar un punto sobre un plano. No presentará
problemas comprender que se trata del punto Q que se encuentra en la intersección de L y la recta L0 , perpendicular
a L, que pasa por P . ¿Se pueden proyectar puntos sobre rectas en R3 ? Claro que sí: es posible proyectar puntos
sobre cualquier espacio lineal. ¿Cómo sería la proyección ortogonal de un punto P ∈ R3 sobre una recta L ⊂ R3 ?
Debemos pedir que la incidencia del haz de luz de la linterna sea perpendicular a la recta. Notemos que esta
última premisa dice dos cosas: por un lado, el haz debe incidir sobre la recta; y por otro lado, la incidencia debe
ser perpendicular. Como sabemos, en R3 hay infinitas direcciones perpendiculares a una recta. En los apartados
anteriores, vimos que, la manera más fácil de hallar una dirección perpendicular a una recta L que corte tanto
a L como a P , es considerar el plano Π perpendicular a la L que pase por el punto P . De esta forma, el punto
Q = Π ∩ L será, efectivamente, la proyección ortogonal de P sobre L.

Les presentamos la siguiente definición general de proyección ortogonal.
Definición 30 Sea P ∈ Rn y sea S una recta o plano de Rn . La proyección ortogonal de P sobre S es el punto
Q de S que se encuentra más cercano a P .
Observación 12 ¡Tengamos presente que ya estuvimos calculando proyecciones ortogonales antes! De hecho,
todas estas construcciones que acabamos de hacer, precisamente, dan cuenta que la proyección ortogonal entre
un punto y una recta o un plano es, en definitiva, el punto de la recta o el plano, respectivamente, que más cerca
se encuentra del punto. Esta es la manera más “económica” de definir este concepto.
Hemos visto, en el apartado 2.5, que la distancia entre un punto P y una recta L (o un plano Π), era la distancia entre
el punto P y el punto Q ∈ L (o Q ∈ Π) más cercano a P . Por lo tanto, el punto Q que calculábamos era exactamente
la proyección ortogonal de P sobre L (o sobre Π). Esto lo desarrollamos en los siguientes experimentos:
Experimento 14: la distancia de un punto P a una recta L en R2 se calculaba como d(P, Q) donde Q = L∩L0 ,
donde L0 era la recta perpendicular a L que pasa por el punto P . Por lo tanto, Q es la proyección ortogonal
de P sobre L.
Experimento 15: la distancia de un punto P a una recta L en R3 se calculaba como d(P, Q) donde Q = L ∩ Π,
donde Π era el plano perpendicular a L que pasa por el punto P . Por lo tanto, Q es la proyección ortogonal
de P sobre L.
Experimento 16: la distancia de un punto P a un plano Π en R3 se calculaba como d(P, Q) donde Q = L0 ∩Π,
donde L0 era la recta perpendicular a Π que pasa por el punto P . Por lo tanto, Q es la proyección ortogonal
de P sobre Π.
Ejemplos 37
1. Calculemos la proyección ortogonal del punto P = (1, −3) sobre la recta L = {X ∈ R2 : X = t(2, −3) +
(0, 5), t ∈ R}. Buscamos primero la recta L0 que es perpendicular a L y que pasa por el punto P : una ecuación
vectorial para L0 es s(3, −2) + (1, −3). La proyección ortogonal de P sobre L será, entonces, Q = L ∩ L0 .
Buscamos esta intersección. En segundo lugar, planteamos (2t, −3t + 5) = (3s + 1, −2s − 3); es decir:

 2t = 3s + 1
 −3t + 5 = −2s − 3
Resolviendo este sistema de ecuaciones simultáneas, hallamos que s = 13

5
y que t = 22
5
. Reemplazando por
44 41

este valor de s en s(3, −2) + (1, −3), obtenemos Q = 5 , − 5 (el mismo resultado al que llegamos si
22
reemplazamos t = 5
en t(2, −3) + (0, 5)).
2. Calculemos ahora la proyección ortogonal del punto P = (1, 0, 1) sobre la recta L = {X ∈ R3 : X =
t(1, 2, −3) + (0, 1, 5), t ∈ R}. En primer lugar, buscamos el plano Π que es perpendicular a L y que pasa por
el punto P : una ecuación implícita para Π es x + 2y − 3z = −2. La proyección ortogonal de P sobre L será,
entonces, Q = L ∩ Π. En segundo lugar, hallamos esta intersección. Planteamos:
t +2(2t + 1) − 3(−3t + 5) = −2
|{z} | {z } | {z }
x y z
⇒ 14t − 13 = −2
11
⇒ t= 14
11 18 37

Reemplazando por este valor de t en t(1, 2, −3) + (0, 1, 5), obtenemos Q = , ,
14 7 14
.
3. Finalmente, calculemos la proyección ortogonal del punto P = (−1, −2, 4) sobre el plano Π = {X ∈ R3 :
X = t(2, 2, −1) + s(5, 0, −3) + (2, 0, 0), t, s ∈ R}. En primer lugar, buscamos la recta L que es perpendicular
a Π y que pasa por el punto P : una ecuación vectorial para L es r(−6, 1, −10) + (−1, −2, 4). La proyección
ortogonal de P sobre Π será, entonces, Q = L ∩ Π. En segundo lugar, buscamos la intersección. Para facilitar
las cuentas, hallemos una ecuación implícita para Π: una normal es (2, 2, −1) × (5, 0, −3) = (−6, 1, −10)
(esta cuenta ya la habíamos hecho para calcular el vector director de L), por lo que la ecuación normal para Π
(utilizando como punto de P el (2, 0, 0)) nos queda:
(−6, 1, −10) · (x, y, z) = (−6, 1, −10) · (2, 0, 0)

⇒ −6x + y − 10z = −12
Luego, los puntos de L ∩ Π son los de la forma (−6r − 1, r − 2, −10r + 4) que verifican
−6 −6r − 1 +(r − 2) − 10(−10r + 4) = −12

| {z } | {z } | {z }
x y z
⇒ 137r − 36 = −12
24
⇒ r= 137
Por lo tanto, Q = − 281 250 308

137
, − 137 , 137
.

Estudiamos el concepto de punto simétrico a otro punto de Rn respecto de puntos, rectas y planos.
Aprendimos cómo calcular la proyección ortogonal de puntos sobre rectas y planos.

3. Espacios vectoriales
En este capítulo analizamos cómo se generalizan las nociones de espacios lineales para vectores de Rn . Los
espacios vectoriales son el objeto principal de estudio del Álgebra Lineal. Los ejemplos abundan en todas las ramas
de la matemática.
En este libro, solo daremos una breve introducción centrados exclusivamente en espacios vectoriales que viven
dentro de Rn ; conocidos como subespacios de Rn .
En este capítulo estudiaremos...
1. Subespacios de Rn .
2. Combinaciones lineales de vectores.
3. Dependencia lineal de un conjunto de vectores.
4. Generadores, bases y dimensión de subespacios.

3.1 Subespacios de Rn
En el capítulo 1, estudiamos que las propiedades de los espacios de vectores no dependen de su ubicación, sino de
sus características propias (la pendiente de la recta, la inclinación del plano). Por esta razón, la teoría de espacios
vectoriales se desarrolla exclusivamente para espacios de vectores que pasen por el origen. Algebraicamente, esto
tiene, además, la ventaja de contar con el elemento nulo de la suma: el vector ~0.
Importante En esta unidad, todos los espacios lineales que aparecen pasan por el origen.
Desde el punto de vista algebraico, la propiedad característica que tienen las rectas y los planos que pasan por el
origen es que son cerrados por suma de vectores y producto de un vector por un escalar. Esto quiere decir que, si ~v
yw
~ son vectores cuyos extremos pertenecen a una recta L o a un plano Π, entonces el vector ~v + w
~ y todos los
vectores λ~v , para cualquier λ ∈ R, también pertenecen a L o a Π. La manera de generalizar la noción de espacio
lineal a Rn es la siguiente: se trata de un conjunto de vectores de Rn tal que, al sumar dos vectores del conjunto, el
resultado es nuevamente un vector del conjunto y, al multiplicar un vector del conjunto por un escalar cualquiera, el
resultado es nuevamente un vector del conjunto. Observemos que, dado que la suma y producto por escalar están
definidos considerando que el origen de los vectores es el origen de coordenadas, entonces el vector nulo ~0 deberá
pertenecer necesariamente a dicho conjunto.
Definición 31 Un subespacio de Rn es un conjunto de vectores S ⊂ Rn que tiene las siguientes características:
1. ~0 ∈ S,
~ ∈ S entonces ~v + w
2. si ~v , w ~ ∈Sy
3. si ~v ∈ S y λ ∈ R cualquiera entonces λ~v ∈ S.
Retomamos lo dicho anteriormente: la suma de vectores del subespacio vuelve a ser un vector del subespacio y el
producto de un vector del subespacio por un escalar cualquiera, también es un vector del subespacio. Consideremos
el conjunto S ⊂ R5 de vectores cuya última coordenada es 0. Afirmamos que S es un subespacio. En efecto, el
vector (0, 0, 0, 0, 0) ∈ S, pues su última coordenada es 0. Además, si (a, b, c, d, 0), (p, q, r, s, 0) ∈ S, entonces
(a, b, c, d, 0) + (p, q, r, s, 0) = (a + p, b + q, c + r, d, s, 0 + 0) ∈ S, pues su última coordenada sigue siendo 0. Por
último, si (a, b, c, d, 0) ∈ S y λ ∈ R, entonces λ(a, b, c, d, 0) = (λa, λb, λc, λd, λ0) = λa, λb, λc, λd, 0) ∈ S. Por
lo tanto, S es efectivamente un subespacio.
Proponemos realizar el siguiente experimento para comprobar que las rectas y los planos que pasan por el origen
tienen estas propiedades:
Experimento 22 Consideren una recta L de ecuación vectorial X = t~

v y un plano Π de ecuación vectorial
X = sw
~ + r~u.
1. Muestren que si P y Q son puntos de L y λ ∈ R, entonces P + Q y λP también.
2. Muestren que si P y Q son puntos de Π y λ ∈ R, entonces P + Q y λP también.

3.2 Combinación lineal

Cuando una recta pasa por el origen podemos hallar una ecuación vectorial de la forma X = t~v , donde ~v es un
vector director. Ahora, P ∈ L si existe un t ∈ R tal que P = t~v (aquí estamos pensando en el extremo de ~v ). Es
decir, P está en la recta si P es múltiplo del vector director ~v . ¿Qué sucede en el caso de un plano Π, que pasa por
el origen, dado en forma vectorial? Si escribimos una ecuación vectorial para Π de la forma X = t~v + sw
~ entonces,
para ver si P ∈ Π, observamos si existían t, s ∈ R tales que P tuviese la forma t~v + sw.
~ Es decir, P ∈ Π sí, y solo
sí, es la suma de múltiplos de los vectores directores del plano. En espacios de mayor dimensión, la idea de que un
punto pertenezca o no a un subespacio es la misma: el punto P está en el subespacio S si y solo si P es suma de
múltiplos de vectores directores de S.
¿Qué significa, entonces, “vectores directores” de un subespacio y “suma de múltiplos de los vectores directores”?
Vamos a cambiar ciertos nombres y definiciones cuando trabajemos en el contexto más general. Cuando ~v es un
vector director de una recta L, diremos que ~v genera L; y cuando w,
~ ~u son vectores directores de un plano Π,
diremos que generan el plano Π. ¿Y cómo lo hacen? De la manera que venimos viendo: los puntos de L son
múltiplos de ~v y los puntos de Π son suma de múltiplos de w
~ y ~u. Esta noción de “suma de múltiplos” de w
~ y ~u se
llama combinación lineal de w
~ y ~u y se define en general como sigue:
v1 , . . . , v~r ∈ Rn . Una combinación lineal de los vectores ~v1 , . . . , v~r es un vector w
Definición 32 Sean ~ ~ de la
Álgebra A. Dependencia lineal. 81
forma:
~ = λ1~v1 + · · · + λr ~vr
w
para algunos λ1 , . . . , λr ∈ R.
¿Cómo hacemos para determinar si un vector es combinación lineal de otros? Pensemos la respuesta a partir de un
ejemplo. Supongamos que queremos saber si el vector (1, 2, 3) ∈ R3 es combinación lineal de los vectores (1, 0, 2)
y (−1, 1, −5). Esto sucederá sí, y solo sí, existen escalares λ, µ ∈ R tales que:
(1, 2, 3) = λ(1, 0, 2) + µ(−1, 1, −5) = (λ − µ, µ, 2λ − 5µ)
Es decir, λ y µ deben verificar: 



 λ−µ=1

µ=2


 2λ − 5µ = 3

De las dos primera ecuaciones despejamos µ = 2 y λ = 3. Nos resta, entonces, chequear si con estas igualdades se
verifica la última ecuación:
2λ − 5µ = 2,3 − 5,2 = −4 6= 3
Por lo tanto, concluimos que (1, 2, 3) no es combinación lineal de los vectores (1, 0, 2) y (−1, 1, −5).
Veamos, entonces, cómo reescribimos la ecuación vectorial de un plano utilizando la noción de combinación lineal.
Al repasar lo que hicimos anteriormente, observamos que si el plano está generado por los vectores ~v y w
~ (es decir,
son vectores directores del plano), entonces P ∈ Π si y solo si P es combinación lineal de ~v y w.
~ Esto quiere decir
que Π es exactamente el conjunto de los puntos que se obtienen de hacer todas las posibles combinaciones lineales
entre ~v y w.
~ Esto nos lleva a la siguiente definición:
v1 , . . . , v~r ∈ Rn . El conjunto de todas las combinaciones lineales de los vectores ~v1 , . . . , v~r
Definición 33 Sean ~
se nota:
h~v1 , . . . , v~r i
Es decir, los vectores que pertenecen al conjunto h~v1 , . . . , v~r i son aquellos que se pueden escribir como combi-
nación lineal de los vectores ~v1 , . . . , ~vr .
El conjunto h~v1 , . . . , v~r i es un subespacio. El estudiante interesado puede comprobar esto verificando que, tanto la
suma como el producto por escalar de vectores de h~v1 , . . . , v~r i, también pertenece a h~v1 , . . . , v~r i (es decir, también
es combinación lineal de los vectores ~v1 , . . . , v~r ).
3.3 Dependencia lineal

Cuando un vector ~v es combinación lineal de vectores ~v1 , . . . , ~vr , sucede que ~v depende linealmente de estos vectores:
“depende”, porque es combinación de ellos y, “linealmente”, pues la combinación es lineal. Cuando tenemos un
conjunto de vectores {v1 , . . . , vr }, podríamos preguntarnos si alguno de ellos depende linealmente de los otros. En
un ejemplo de la capítulo anterior, trabajamos con la ecuación vectorial X = t(−1, 5, 2) + s(2, −10, −4) + (1, 1, 3),
y vimos que dicha ecuación no determina un plano (pues los vectores directores son múltiplos). En realidad,
determina una recta ya que, como (2, −10, −4) = −2(−1, 5, 2), se puede reescribir (t − 2s)(−1, 5, 2) + (1, 1, 3) y,
aquí, t − 2s es un número real cualquiera (no importa que utilicemos dos parámetros para escribirlo; podríamos usar
solo uno). Si esta ecuación está describiendo una recta, entonces trabajar con ella hace las cosas más complicadas,
ya que estamos empleando dos vectores directores (y dos parámetros), mientras que para describir la recta solo
necesitamos uno. Pero justamente, lo que sucede en este caso es que los vectores (−1, 5, 2) y (2, −10, −4) son
linealmente dependientes (uno es múltiplo del otro). En general, cuando describimos subespacios, buscamos la
manera más económica de hacerlo; y esta es, precisamente, que los vectores que usemos “como directores” sean
linealmente independientes: si no lo fueran, entonces, uno de ellos sería combinación lineal de los otros y sería
necesario para describir al subespacio. La definición formal de independencia lineal es la siguiente:
Definición 34 Un conjunto de vectores {v1 , . . . , vr } se dice linealmente dependiente si existen λ1 , . . . , λr ∈ R
no todos nulos tales que λ1 v1 + · · · + λr vr = 0. Es decir, son linealmente dependientes si existe una combinación
lineal no trivial (no todos los λi = 0) que da el vector ~0. Por lo tanto, el conjunto es linealmente independiente si
la única combinación lineal de los {v1 , . . . , vr } que da 0 es la que tiene a todos los coeficientes de la combinación
lineal nulos.
Analicen la definición de dependencia lineal y vean que es equivalente a expresar que un vector puede ser
escrito como combinación lineal de otros.
Queremos saber si un conjunto de vectores es o no linealmente dependiente. En el siguiente ejemplo veremos la

técnica que permite determinar esto. Consideremos el conjunto:
{(1, 2, 3), (1, 0, 2), (−1, −6, −5)} ⊂ R3 .
Este conjunto será linealmente independiente si, y solo si, la única combinación lineal entre todos sus vectores
–que da como resultado el vector nulo– es aquella que tiene todos los coeficientes de la combinación nulos.
Analicemos, entonces, cómo son las combinaciones lineales de estos vectores que dan como resultado el vector
nulo. Consideremos una combinación lineal genérica igualada al vector nulo:
λ(1, 2, 3) + µ(1, 0, 2) + ν(−1, −6, −5) = ~0
Esto es lo mismo que escribir:
(λ + µ − ν, 2λ − 6ν, 3λ + 2µ − 5ν) = (0, 0, 0)
Es decir: 


 λ+µ−ν =0


 2λ − 6ν = 0



3λ + 2µ − 5ν = 0
De la ecuación segunda obtenemos λ = 3ν. Al reemplazar en la primera ecuación, despejamos µ = −2ν.

Finalmente, reemplazando estas dos informaciones en la tercera ecuación obtenemos 3(3ν) + 2(−2ν) − 5ν = 0.
Es decir, 0 = 0. Al haber utilizado todas las ecuaciones, solo nos quedan las restricciones λ = 3ν y µ = −2ν.
Aquí, la variable ν es libre y puede tomar cualquier valor (no hay restricción sobre ella). Esto nos dice que, sin
importar quién es ν, mientras que, para un ν elegido arbitrariamente, se cumpla λ = 3ν y µ = −2ν, entonces se va
a verificar que la combinación lineal de los vectores originales como resultado el vector nulo. Por ejemplo, tomando
ν = 1, nos queda λ = 3 y µ = −2, y hallamos que:
3(1, 2, 3) − 2(1, 0, 2) + (−1, −6, −5) = (0, 0, 0)

Álgebra A. Generadores, base y dimensión. 83
Este desarrollo nos indica que el conjunto {(1, 2, 3), (1, 0, 2), (−1, −6, −5)} es linealmente dependiente: hallamos
una combinación lineal del vector nulo donde no todos los coeficientes son nulos (de hecho, ninguno lo es). Entonces,
¿cuándo es un conjunto linealmente independiente? Cuando la solución del sistema de ecuaciones simultáneas da
como resultado λ = 0, µ = 0 y ν = 0 como única solución.
3.4 Generadores, base y dimensión

Para describir un subespacio Rn , se hace de la misma manera que para planos y rectas. Básicamente se utilizan dos
formas: por ecuaciones o por generadores.
Descripción por ecuaciones Describir un subespacio de Rn por ecuaciones es como describir una recta o un
plano por ecuaciones implícitas: damos una relación lineal entre las coordenadas de los puntos que pertenecen al
subespacio. Por ejemplo, un posible subespacio de R4 :
T = {(x1 , x2 , x3 , x4 ) ∈ R4 : x1 + 2x2 = 0, x2 + 3x3 − x4 = 0}
Este subespacio queda, entonces, determinado por todos los vectores de R4 cuyas coordenadas verifican estas
ecuaciones simultáneamente. ¿Cómo se puede describir por ecuaciones el subespacio S introducido en la página
80? Simplemente, de la siguiente manera:
S = {(x1 , x2 , x3 , x4 , x5 ) ∈ R5 : x5 = 0}
Descripción por generadores La otra manera es describir al subespacio exhibiendo generadores del mismo. Recor-
demos que un subespacio T es, simplemente, un conjunto de vectores que tiene las propiedades 1-3 introducidas en
el apartado 3.1. Un conjunto de generadores de T es un conjunto finito de vectores {v1 , . . . , vr } tal que, cualquier
vector de T , puede escribirse como combinación lineal de v1 , . . . , vr (de la misma forma como cualquier punto de
un plano se podía escribir como combinación lineal de sus vectores directores).
Definición 35 Sea T ⊂ Rn un subespacio. Un conjunto de generadores para T es un conjunto finito
{v1 , . . . , vr } ⊂ Rn tal que T = hv1 , . . . , vr i.
Al considerar, nuevamente, al subespacio S ⊂ R5 conformado por todos los vectores de R5 cuya última coordenada
es 0. Afirmamos que el conjunto (de cuatro vectores):
{(1, 0, 0, 0, 0), (0, 1, 0, 0, 0), (0, 0, 1, 0, 0), (0, 0, 0, 1, 0)}
es un sistema de generadores de S. Esto significa que debemos verificar que todos los vectores de S se pueden
escribir como combinación lineal de los vectores (1, 0, 0, 0, 0), (0, 1, 0, 0, 0), (0, 0, 1, 0, 0), (0, 0, 0, 1, 0) y, además,
que todos los vectores de h(1, 0, 0, 0, 0), (0, 1, 0, 0, 0), (0, 0, 1, 0, 0), (0, 0, 0, 1, 0)i están en S (recuerden que dos
conjuntos A y B son iguales si y solo si A ⊂ B y B ⊂ A simultáneamente). Por un lado, los vectores de S tienen
la forma (a, b, c, d, 0) con a, b, c, d ∈ R. Pero,
(a, b, c, d, 0) = a(1, 0, 0, 0, 0) + b(0, 1, 0, 0, 0) + c(0, 0, 1, 0, 0) + d(0, 0, 0, 1, 0),
es una combinación lineal de los vectores del conjunto en consideración. Esto muestra que:
S ⊂ h(1, 0, 0, 0, 0), (0, 1, 0, 0, 0), (0, 0, 1, 0, 0), (0, 0, 0, 1, 0)i.
Por otro lado, cualquier combinación lineal de los vectores (1, 0, 0, 0, 0), (0, 1, 0, 0, 0), (0, 0, 1, 0, 0), (0, 0, 0, 1, 0)
tiene su última coordenada 0, pues:
α(1, 0, 0, 0, 0) + β(0, 1, 0, 0, 0) + γ(0, 0, 1, 0, 0) + δ(0, 0, 0, 1, 0) = (α, β, γ, δ, 0)

Esto muestra que h(1, 0, 0, 0, 0), (0, 1, 0, 0, 0), (0, 0, 1, 0, 0), (0, 0, 0, 1, 0)i ⊂ S. Concluimos, entonces, que S =
h(1, 0, 0, 0, 0), (0, 1, 0, 0, 0), (0, 0, 1, 0, 0), (0, 0, 0, 1, 0)i, como queríamos ver.
¿Cómo pasamos de la descripción por generadores a la descripción por ecuaciones y viceversa? De la misma manera
que hicimos para pasar de la ecuación implícita a la vectorial de una recta o un plano. Consideremos el subespacio:
T = {(x1 , x2 , x3 , x4 ) ∈ R4 : x1 + 2x2 = 0, x2 + 3x3 − x4 = 0} ⊂ R4
Los vectores de T son aquellas 4-uplas (x1 , x2 , x3 , x4 ) que verifican:


 x + 2x = 0
1 2
 x + 3x − x = 0
2 3 4
Al despejar x1 en la primera ecuación, obtenemos x1 = −2x2 ; y despejando x4 en la segunda ecuación, x4 =

x2 + 3x3 (notemos que aquí no pudimos reemplazar por el valor despejado en la primera ecuación pues no aparece
el x1 en la segunda ecuación). Como no hay más ecuaciones, toda la información que pudimos extraer es que x1
depende de x2 y que x4 depende de x2 y x3 . Por lo tanto, los puntos de T son aquellos vectores de R4 de la forma
(−2x2 , x2 , x3 , x2 + 3x3 ). Este vector lo escribimos de la siguiente manera:
x2 (−2, 1, 0, 1) + x3 (0, 0, 1, 3)
Como x2 y x3 no tienen restricciones, entonces son libres, y los vectores de T son las combinaciones lineales de los
vectores (−2, 1, 0, 1) y (0, 0, 1, 3). Es decir, T = h(−2, 1, 0, 1), (0, 0, 1, 3)i.
Si ahora queremos describir por ecuaciones el subespacio h(−2, 1, 0, 1), (0, 0, 1, 3)i, simplemente debemos plantear
que los puntos del subespacio son las combinaciones lineales de ambos vectores. Es decir, los puntos de este
subespacio son de la forma:
λ(−2, 1, 0, 1) + µ(0, 0, 1, 3)
con λ, µ ∈ R. Al desarrollar esta última expresión, obtenemos:
λ(−2, 1, 0, 1) + µ(0, 0, 1, 3) = (−2λ, |{z}

λ , µ , λ + 3µ)
|{z} |{z} | {z }
x1 x2 x3 x4
Es decir, podemos escribir: 



 x1 = −2λ



 x
2 =λ


 x3 =µ



 x
4 = λ + 3µ
En este caso, al igual que en el pasaje hecho para rectas y planos, debemos hallar la relación entre las coordenadas
x1 , x2 , x3 , x4 eliminando los parámetros λ y µ. Por ejemplo, como x2 = λ, entonces, la primera ecuación queda
x1 = −2x2 . Y al reemplazar estos despejes en la cuarta ecuación nos queda x4 = x2 + 3x3 . Por lo tanto, hemos
usado todas las ecuaciones y hemos hallado las dos ecuaciones x1 = −2x2 y x4 = x2 + 3x3 .
3.4.1 Bases
Nuevamente, consideremos el subespacio S = {(x1 , x2 , x3 , x4 , x5 ) ∈ R5 : x5 = 0}. Como vimos

{(1, 0, 0, 0, 0), (0, 1, 0, 0, 0), (0, 0, 1, 0, 0), (0, 0, 0, 1, 0)} era un sistema de generadores para S. Proponemos realizar
el siguiente experimento para hallar otros posibles conjuntos de generadores para S.
Experimento 23 Muestren que cada uno de los siguientes conjuntos es un sistema de generadores para S.
1. {(1, 0, 0, 0, 0), (0, 2, 0, 0, 0), (0, 0, 3, 0, 0), (0, 0, 0, 4, 0)}.
2. {(1, 0, 0, 0, 0), (1, 1, 0, 0, 0), (1, 1, 1, 0, 0), (1, 1, 1, 1, 0)}.
3. {(1, 0, 0, 0, 0), (0, 1, 0, 0, 0), (0, 0, 1, 0, 0), (0, 0, 0, 1, 0), (1, 2, 3, 4, 0)}.

¿Qué sucede en el punto 3. del experimento 24? Tanto en el desarrollo de la explicación como en los puntos 1. y 2.,
vemos que S se puede generar usando cuatro vectores; pero el ítem 3. indica que también podemos hacerlo con
cinco. En este caso, sucede que es que el último vector es combinación lineal de los otros, con lo cual no aporta
ninguna información nueva. Sin embargo, también es un sistema de generadores de S, pues todo elemento de S es
combinación lineal de esos cinco vectores y todo vector que sea combinación lineal de esos cinco vectores está en
S. Si trabajamos con un subespacio, lo más conveniente es tenerlo descripto de la manera más sencilla posible. Es
decir, ¿por qué usar cinco vectores si podemos describirlo con cuatro? Esta es precisamente la noción de base de un
subespacio: un sistema de generadores del subespacio lo más pequeño posible. ¿Qué significa “lo más pequeño
posible”? Que no haya ningún vector “de más” en el sistema: que con el resto de los vectores del sistema “nos
alcanza”. Y un vector “está de más” en un sistema de generadores si lo podemos generar con los otros vectores del
sistema; vale decir, si es combinación lineal de los otros. La definición forma del base es, entonces, la siguiente:
Definición 36 Sea S un subespacio de Rn . Un conjunto de vectores {v1 , . . . , vr } es una base de S si es un
sistema de generadores de S y es linealmente independiente.
Observemos que si un conjunto de vectores tiene menos vectores que una base, entonces, no puede ser un
sistema de generadores, y si tiene más vectores que una base entonces no puede ser linealmente independiente.
Se puede ver que los conjuntos de generadores de los ítems 1. y 2. del Experimento 23 son bases del subespacio S
(es decir, son conjuntos linealmente independientes). Por el contrario, como observamos, el conjunto de generadores
del ítem 3. no es una base. Sin embargo, notemos que, si removemos el último vector del sistema, obtenemos una
base de S. Esto siempre se le puede hacer a un sistema de generadores: remover sus vectores hasta quedarnos con
un conjunto linealmente independiente. Esto se llama extraer una base del sistema de generadores. Lo que sucede es
que, si X es un sistema de generadores de un subspacio T 6= {~0} que no es base, entonces alguno de sus vectores es
combinación lineal de los otros. Por lo tanto, podemos remover este vector al conjunto X y este nuevo conjunto más
pequeño, seguirá generando al subespacio T (porque, al haber removido un vector que es combinación lineal de los
otros, no perdimos información). Este procedimiento podemos continuarlo hasta obtener un conjunto linealmente
independiente que genere T (y, por ende, sea una base de T ).
Observen por qué el procedimiento anterior siempre termina en un conjunto linealmente independiente. Analicen
cómo son los conjuntos generados por un solo vector.
De manera análoga, si tenemos un conjunto Y de vectores de un subespacio T , que es linealmente independiente,

entonces podemos extenderlo a una base; es decir, podemos agregarle vectores de T al conjunto Y de manera que,
a medida que vamos agregando nuevos vectores, el conjunto siga siendo linealmente independiente. Este proceso
podemos continuarlo hasta conseguir un sistema de generadores de T (y por lo tanto, una base de T ).
El procedimiento anterior siempre termina en un conjunto de generadores del suvbespacio. Analicen las posibles
formas en las que no es posible continuar con el proceso.
Tal como establecimos, hallar bases de subespacios es muy importante, ya que las bases proveen las maneras más
fáciles de describir a los subespacios. Miren una de las ventajas de trabajar con bases en el siguiente ejemplo:
Ejemplo 38 Consideren un subespacio S ⊂ Rn y sea B = {v1 , . . . , vr } una base de S. Sabemos que, como B es
un sistema de generadores, entonces todo vector de S es combinación lineal de elementos de B. Pero como B es una
base, demostramos que esta combinación lineal es única. Es decir, existe una sola manera de combinar linealmente los
vectores de B para lograr un vector w
~ ∈ S dado. En efecto, supongamos que hubiese dos maneras de expresar a w
~ como
combinación lineal de los elementos de B:
~ = λ1 v~1 + · · · + λr v~r y w
w ~ = µ1 v~1 + · · · + µr v~r .
Al igualar ambas ecuaciones, tenemos:
λ1 v~1 + · · · + λr v~r = µ1 v~1 + · · · + µr v~r ,
y al pasar todos lo términos de la derecha a la izquierda, obtenemos:
(λ1 − µ1 )v~1 + · · · + (λr − µr )v~r = ~0.
Esto es una combinación lineal de los elementos de B que da ~0 y, como B es un conjunto linealmente independiente,
entonces la única posibilidad es que todos los coeficientes λ1 − µ1 , . . . , λr − µr sean 0 (recuerden la definición 34
dada en la página 82). Por lo tanto, λ1 = µ1 , λ2 = µ2 ... λr = µr y concluimos que las dos combinaciones lineales que
en principio parecían distintas, en realidad, son la misma.
Por supuesto, hay infinitas bases que podemos construirnos para un subespacio (como hay infinitas posibilidades de
crear un sistema de generadores o de elegir vectores directores de un plano). Tengamos en cuenta que las bases que
construimos para el subespacio S de vectores de R5 con la última coordenada nula siempre tienen cuatro vectores.
Podríamos preguntarnos si esto es casualidad o no. Es decir, si tenemos dos bases B y B 0 para un subespacio S,
¿tienen la misma cantidad de vectores siempre? La respuesta es sí. Dos bases del mismo subespacio de Rn tienen
siempre la misma cantidad de vectores. Este número se llama dimensión del subespacio S. En nuestro ejemplo,
podemos decir que S tiene dimensión 4.
La noción de dimensión es muy útil también para trabajar con espacios vectoriales. Por ejemplo, si sabemos que S
tiene dimensión 4, entonces, ya podemos concluir que un conjunto que no tenga exactamente cuatro vectores no
puede ser base de S. También, si se tienen dos subespacios T, L ⊂ Rn de la misma dimensión, tales que uno está
contenido en el otro (por ejemplo, L ⊂ T ), entonces concluimos que son iguales.
La palabra “dimensión” en el contexto de la teoría de subespacios está fuertemente ligada a nuestra noción de
esta palabra en la vida cotidiana. Por ejemplo, sabemos que nuestro espacio (de tres grados de libertad) es
tridimensional; y tenemos, seguramente, la idea de que un plano tiene dos dimensiones y una recta, una sola. Y
esto es precisamente lo que sucede con esta definición de dimensión. Puede probarse que toda base de un plano
tiene dos vectores y, por lo tanto, todos los planos tienen dimensión 2. Por ejemplo, el plano xy en R3 tiene por
posible base al {(1, 0, 0), (0, 1, 0)}. De la misma manera, el espacio R3 tiene dimensión 3, con posible base
{(1, 0, 0), (0, 1, 0), (0, 0, 1)}. Estas bases que parecen tan naturales de considerar se las conoce como bases
canónicas.
¿Qué hicimos en el capítulo 3?
Definimos algebraicamente la noción de subespacio vectorial de Rn a partir de sus propiedades relacionadas con la
suma de vectores y el producto por un escalar.
Estudiamos las nociones de combinación lineal de vectores y de dependencia lineal de vectores.
Definimos las nociones de sistema de generadores, de base y de dimensión de un subespacio vectorial.

4. Cónicas
En este capítulo estudiaremos una familia de curvas de R2 , llamadas cónicas. Su nombre proviene de que dichas
curvas se obtienen al cortar un cono en el espacio con distintos tipos de planos. Los conjuntos de puntos que
determinan estas curvas no forman espacios lineales (como rectas y planos que desarrollamos en el capítulo 2),
sino que son curvados. En este sentido, no guardan relación con propiedades de la suma y producto por escalar de
vectores. Además, las ecuaciones que las definen no son lineales (veremos que tienen las coordenadas elevadas al
cuadrado). En la segunda parte del libro, retomaremos el estudio de espacio lineales.
4.1 Curvas cónicas
Una sección cónica o curva cónica es una curva que se obtiene al intersecar un cono con un plano que no pasa por
el vértice del cono. Según la inclinación del plano, se obtienen distintas curvas: elipse, circunferencia, parábola e
hipérbola.
Qué es un cono y qué ecuación lo define.

Cuáles son las curvas cónicas.

4.1.1 ¿Qué es un cono?
Es el conjunto de puntos que se muestra en la Figura 4.1, lado izquierdo. Notemos que, a diferencia de lo que
comúnmente se considera un cono (como un cono de helado), en nuestra definición, se contemplan dos “conos
de helados” que se tocan por los vértices. Llamemos informalmente a las mitades del cono, semicono superior
y semicono inferior. La manera algebraica de definir un cono es por medio de una ecuación. Los puntos de la
curva cumplen que las coordenadas de sus puntos, al reemplazarse en la ecuación dan un resultado verdadero. Tal
como adelantamos arriba, esta ecuación no es lineal, como las que vimos en los capítulos anteriores, sino que es
cuadrática: aparecen las coordenadas elevadas al cuadrado.
Figura 4.1: El cono x2 + y 2 − z 2 = 0.
Definición 37 Un cono en R3 es el conjunto de puntos (x, y, z) ∈ R3 que verifican la ecuación:
x2 + y 2 − z 2 = 0.
En lo que sigue, notaremos al cono con la letra C. O sea, C = {(x, y, z) ∈ R3 : x2 + y 2 − z 2 = 0}.
Cabe destacar que el punto (0, 0, 0) pertenece al cono, y se lo llama vértice del cono. Observemos también que el
cono contiene infinitas rectas (Figura 4.1, lado derecho). Justamente, es posible darse cuenta que el cono es, en
realidad, la unión de estas infinitas rectas y que todas ellas se tocan solo en el vértice. Estas rectas reciben el nombre
de generatrices.
4.1.2 Corte del cono con distintos planos planos
En el capítulo 2, cortamos dos planos no paralelos de R3 (es decir, los intersecamos), al hacer esto obtenemos una
recta. Ahora veremos qué sucede al cortar el cono con distintos tipos de planos, obtendremos distintos tipos de
curvas. ¿Qué tipos de planos utilizaremos para cortar? Consideremos todos los posibles planos pero que no pasen
por el vértice del cono. Imaginemos que empezamos con un plano horizontal y vamos inclinándolo hasta hacerlo
vertical; y vayamos viendo las curvas que vamos obteniendo al intersecar.
Por un lado, cortemos al cono con un plano horizontal (es decir, paralelo al plano xy). Si lo hacemos a la altura del
vértice (vale decir, el plano z = 0), solo obtenemos el vértice del cono (esto no nos brinda mucha información).
Entonces, cortemos con el plano Π que está a “altura” 1, es decir, el plano de ecuación z = 1. La manera de calcular
la intersección entre C y Π es la misma que vimos antes. Los puntos en ambos objetos son los que verifican las
ecuaciones de C y las ecuaciones de Π simultáneamente. Por lo tanto, buscamos (x, y, z) ∈ R3 tales que:

 x2 + y 2 − z 2 = 0
 z=1
p
Al reemplazar la segunda ecuación en la primera, obtenemos x2 +y 2 −12 = 0 o, lo que es lo mismo, x2 + y 2 = 1.
Esta es la ecuación de una circunferencia de radio 1 contenida dentro del plano Π. Si ahora cortamos con el plano
p
Π0 de ecuación z = 2, obtenemos que los puntos de la intersección entre C y Π0 verifican x2 + y 2 = 2, que es la
ecuación de una circunferencia de radio 2 pensada dentro del plano Π0 . En general, al cortar con el plano Πk de
ecuación z = k (con k ∈ R cualquiera), obtenemos una circunferencia de radio |k| dentro de dicho plano (Figura
4.2). Si en cualquiera de estos ejemplos, identificamos el plano Πk con R2 , entonces, todos estos círculos son
Álgebra A. Curvas cónicas. 91
circunferencias centradas en el (0, 0) de radio |k|. Como solo nos importa la forma de estas curvas cónicas, vamos a
estudiar,en general, circunferencias no necesariamente centradas en el origen. Las circunferencias, entonces, son un
tipo de curvas cónicas.
Figura 4.2: La circunferencia como una sección del cono.
Consideremos ahora un plano horizontal con altura positiva en el eje z, e inclinémoslo levemente de manera que
siga atravesando todas las generatrices de C y que lo haga solo del lado positivo de las z; es decir, que corte solo
el semicono superior de C. El conjunto de puntos que se halla en la intersección entre el cono y este plano forman
una elipse (Figura 4.3). Las elipses admiten una ecuación que las hacen fácilmente identificables pero, en este caso
(y en los que siguen), no haremos la deducción de la ecuación a partir del sistema de ecuaciones que determina la
intersección, porque involucran una serie de pasos técnicos que no nos interesan considerar a esta altura. Las elipses,
entonces, son un tipo de curvas cónicas.
Figura 4.3: La elipse como una sección del cono.
Consideremos un plano que no pase por el vértice del cono y que sea paralelo a alguna directriz. La curva determinada
por la intersección de un plano como este y el cono, es una parábola (Figura 4.4). Seguramente, la parábola es la
cónica más familiar para el estudiante. En este libro la estudiaremos desde un punto de vista más amplio. Entonces,
decimos que las parábolas son un tipo de curvas cónicas.
Figura 4.4: La parábola como una sección del cono.
Finalmente, cortemos el cono con un plano que no pase por su vértice y que interesecte a ambos semiconos del
cono pero que no sea paralelo a ninguna generatriz. La curva que queda determinada por esta intersección, se llama
hipérbola (Figura 4.5), y a diferencia de las otras cónicas que veremos, posee dos ramas. Esto implica que es una
curva desconectada: para recorrerla completamente en algún momento debemos “saltar” hacia la otra rama. Las
hipérbolas son el último tipo de curvas cónicas.
Figura 4.5: La hipérbola como una sección del cono.
4.2 La circunferencia
Vimos que una circunferencia se obtiene al cortar un cono con un plano horizontal. En este apartado vamos estudiar
cómo definirla como lugar geométrico (es decir, como los puntos que verifican cierta propiedad de distancia respecto
de otro/s punto/s o recta/s), y analizaremos en detalle las propiedades de estas curvas.
Cómo definir la circunferencia como lugar geométrico de puntos.

Las propiedades principales de este tipo de curvas.

4.2.1 La circunferencia como lugar geométrico
La siguiente definición de circunferencia les resultará conocida.

Álgebra A. La circunferencia. 93
Definición 38 Una circunferencia es un conjunto que consta todos los puntos de R2 que están a una distancia
fija, r, de un punto dado P . El punto P recibe el nombre de centro de la circunferencia y la distancia r, el radio.
Figura 4.6: La circunferencia de centro P y radio r.
Esta manera de definir circunferencia se conoce como “dar la circunferencia como lugar geométrico”. Notemos que
el radio r de una circunferencia siempre es un número positivo, ya que está representando una distancia, y no puede
haber distancias negativas.
Veamos esta definición aplicada a un centro y un radio particulares:
Ejemplo 39 Supongamos que queremos encontrar a todos los puntos del plano que están a una distancia de 4 unidades
del punto Q = (3, −1). Si llamamos P = (x, y) a un punto cualquiera que se encuentra a una distancia de 4 unidades
del punto Q, podemos plantear la siguiente igualdad:
p
d(Q, P ) = (x − 3)2 + (y + 1)2 = 4.
Si elevamos ambos miembros de la igualdad al cuadrado, resulta:
(x − 3)2 + (y + 1)2 = 42
Es decir,
(x − 3)2 + (y + 1)2 = 16
La expresión que obtuvimos es la que define el lugar geométrico de los puntos del plano que se encuentran a 4 unidades
de distancia del punto Q = (3, −1); es decir: la ecuación de la circunferencia de centro Q = (3, −1) y radio r = 4.
A partir del ejemplo anterior, podemos pensar en escribir una fórmula que defina el lugar geométrico de todos los
puntos del plano que se encuentran a una distancia r de un punto fijo llamado centro Q = (x0 , y0 ). El razonamiento
es análogo al del ejemplo. Tomemos un punto genérico de la circunferencia P = (x, y). Podemos plantear que la
distancia entre el punto P y Q debe ser siempre igual a r. Es decir:
p
d(Q, P ) = (x − x0 )2 + (y − y0 )2 = r
Cuando elevamos al cuadrado ambos miembros de la igualdad resulta:
(x − x0 )2 + (y − y0 )2 = r2
Esta es la ecuación canónica de la circunferencia de centro Q = (x0 , y0 ) y radio r.

En muchas situaciones nos encontraremos con ecuaciones distintas a la canónica que, sin embargo, describen
circunferencias. Veamos esta fórmula x2 + y 2 + Dx + Ey + F = 0, a pesar de no corresponderse a simple vista
con las fórmulas que hemos trabajado hasta ahora los puntos que cumplen esta igualdad son los puntos de una
circunferencia.
En la ecuación x2 + y 2 + Dx + Ey + F = 0 (1), restamos F en ambos miembros y completamos cuadrados en el

primero obtenemos:
D2 E2 D2 E2
x2 + Dx + + y 2 + Ey + = + −F
4 4 4 4
y, por tanto,
D 2 E 2 D2 + E 2 − 4F
x+ + y+ =
2 2 4
D 2 +E 2 −4F
Definiendo G = 4 , la última ecuación queda escrita como:
D 2 E 2
x+ + y+ =G
2 2
√
Como esta última ecuación 0 ≤ G (pues G es suma de cuadrados), entonces, podemos considerar r = G, y obtener:
D 2 E 2
x+ + y+ =r
2 2
Entonces hemos transformado la ecuación (1) en la ecuación canónica de un círculo de centro (− D E
2 , − 2 ) y radio r.
Cuando ningún punto satisface la fórmula (1), por ejemplo como en el caso x2 + y 2 + 4 = 0, para evitar tener que
considerar diferentes casos, decimos que el vacío (que es el conjunto solución de la ecuación anterior) es un círculo
degenerado.
Denominamos a las fórmulas de la forma:
x2 + y 2 + Dx + Ey + F = 0
ecuación general de una circunferencia.

Veamos un caso particular de esta ecuación:
Ejemplo 40 Tomemos la siguiente fórmula x2 + y 2 + 2x − 6y + 9 = 0. Como lo hicimos antes, al completar
cuadrados obtenemos x2 + 2x + 1 + y 2 − 6y + 9 = 1, pues lo único que tuvimos que hacer fue sumar en ambos
miembros 1 y reordenar el primer miembro. Esta última expresión puede reescribirse (x + 1)2 + (y − 3)2 = 1, con lo
cual tenemos que esta ecuación describe una circunferencia de centro (−1, 3) y radio r = 1.
Estudiamos a la circunferencia como lugar geométrico de puntos, es decir, como el conjunto de puntos que distan de
otro punto (el centro) en cierta magnitud (radio).
Introdujimos las ecuaciones canónicas y generales de una circunferencia.

4.3 La elipse
Ya hemos mencionado que la elipse es la cónica que se obtiene cortando al cono con un plano que no pasa por su
vértice y que corta a todas las generatrices. Al igual que la circunferencia, la elipse puede definirse como lugar
geométrico.
Álgebra A. La elipse. 95
Cómo definir la elipse como lugar geométrico de puntos.

Los elementos principales de las elipses: focos, semiejes, excentricidad, ecuación cartesiana.

Importante En este libro, solo trabajaremos con elipses cuyos focos se encuentran sobre una recta paralela al
eje x o al eje y.
4.3.1 La elipse como lugar geométrico
Recuerden que la circunferencia tiene la propiedad definitoria de constar de los puntos del plano que distaban del
centro en una magnitud determinada. Como lugar geométrico, la elipse tiene una propiedad similar pero en lugar de
estar referida a su centro, está referida a dos puntos llamados focos. La propiedad definitoria es la siguiente:
Definición 39 Sean F1 , F2 ∈ R2 dos puntos fijos. Una elipse E asociada a F1 y F2 es el conjunto de puntos
de R2 tales que la suma de sus distancias a F1 y F2 es una magnitud constante. Es decir, hay un número real
positivo k ∈ R fijo tal que E = {P ∈ R2 : d(P, F1 ) + d(P, F2 ) = k}.
Para comprender qué implica esta definición, busquemos el lugar geométrico de los puntos para los cuales la suma
de sus distancias a F1 = (5, 0) y a F2 = (−5, 0) es igual a 26.
Figura 4.7: La elipse de focos F1 y F2 .
Decimos que P = (x, y), es un punto de dicho lugar geométrico. Entonces, tenemos que sumar las distancias de F1
a P y de F2 a P, es decir:
d(P, F1 ) + d(P, F2 ) = 26
p
Dado que la fórmula de la distancia entre dos puntos es d(P, Q) = (xp − xq )2 + (yp − yq )2 , entonces para los
puntos en cuestión tenemos:
p p
(x − 5)2 + (y − 0)2 + (x + 5)2 + (y − 0)2 = 26
Lo cual, al “distribuir los cuadrados” nos da:
p p
x2 − 10x + 25 + y 2 + x2 + 10x + 25 + y 2 = 26
Luego de despejar y “elevar al cuadrado”, obtenemos:
p p
x2 − 10x + 25 + y 2 = 26 − x2 + 10x + 25 + y 2
p p
( x2 − 10x + 25 + y 2 )2 = (26 − x2 + 10x + 25 + y 2 )2
p
x2 − 10x + 25 + y 2 = 676 − 52 x2 + 10x + 25 + y 2 + x2 + 10x + 25 + y 2
Al dejar solamente la raíz en el miembro derecho y, nuevamente, “elevando al cuadrado”:
p
x2 − 10x + 25 + y 2 − 701 − (x2 + 10x + y 2 ) = −52 x2 + 10x + 25 + y 2
p
−2(10x + 338) = −52 x2 + 10x + 25 + y 2
p
10x + 338 = 26 x2 + 10x + 25 + y 2
p
(10x + 338)2 = (26 x2 + 10x + 25 + y 2 )2
p
100x2 + 6760x + 114244 = (26 x2 + 10x + 25 + y 2 )2
100x2 + 6760x + 114244 = 676x2 + 6760x + 16900 + 676y 2
Al despejar las variables en el miembro izquierdo obtenemos:
−576x2 − 676y 2 = −97344
Al dividir ambos miembros por −97344 queda:
x y2
+ =1
169 144
es decir,
x2 y2
+ =1
132 122
4.3.2 La ecuación de la elipse
En el apartado anterior, vimos cómo podemos describir una elipse a través de una ecuación. Para esta deducción
partimos de la definición de la elipse como lugar geométrico (tal como hicimos para la circunferencia) y llegamos a
una fórmula.
Nuevamente, consideremos una elipse genérica alrededor del origen como hicimos en el apartado anterior (Figura
4.7), aunque no necesariamente con el semieje mayor sobre el eje x (podría estar sobre el eje y). Es decir, los focos
equidistan del origen pero pueden estar sobre el eje x o el eje y. Además, sigamos representando a a y b como
la longitud del semieje sobre el eje x y sobre el eje y, respectivamente (alguno de ellos será el mayor y el otro el
menor). Entonces, la ecuación canónica de la elipse de centro (0, 0) es:
x2 y2
+ = 1.
a2 b2
Tengamos en cuenta cómo en la ecuación aparecen explícitamente las longitudes de los semiejes mayor y menor
(sean cuales sean). Más aún, el valor a, que corresponde a la longitud del semieje sobre el eje x, aparece dividiendo
la variable x y el valor b, que corresponde a la longitud del semieje sobre el eje y, a la variable y.
Entonces, en en el caso que vimos más arriba, a = 13 y b = 12. Es decir que, el lugar geométrico de los puntos
para los cuales la suma de sus distancias al punto F1 = (5, 0) y al punto F2 = (−5, 0) es igual a 26 es la elipse de
x2 y2
centro (0, 0) con ecuación 132 + 122 = 1.
A partir de este caso, es muy sencillo obtener la ecuación canónica de una elipse que no esté necesariamente centrada
en el origen. En efecto, si “trasladamos” su centro a cualquier punto (x0 , y0 ), siendo los ejes de la elipse paralelos a
los ejes x e y respectivamente, la ecuación resulta:
(x − x0 )2 (y − y0 )2
+ = 1,
a2 b2
esta es llamada ecuación canónica de la elipse de centro (x0 , y0 ).

Apliquemos esta última ecuación a algunos casos particulares:
Ejemplos 41
1. La elipse E1 de focos F1 = (−3, 0) y F2 = (3, 0) y longitud de semieje mayor igual a 5 tiene su centro en el
origen de coordenadas y puede verse en la Figura 4.8, lado izquierdo.
2. La elipse E2 de focos F1 = (−1, 1) y F2 = (5, 1) y longitud de semieje mayor igual a 7 puede verse en la
Figura 4.8, centro. El centro de esta elipse es el punto (2, 1).
3. La elipse E3 de focos F1 = (−6, −2) y F2 = (−6, 8) y longitud de semieje mayor igual a 10 puede verse en la
Figura 4.8, lado derecho. El centro es el punto (−6, 3) y el semieje mayor es perpendicular al eje y (a diferencia
de los dos ejemplos anteriores).

Figura 4.8: Las elipses de los Ejemplos 41.
Observación 13 Cabe destacar que para definir una elipse, no alcanza con dar los focos. Además, debemos
brindar algún otro parámetro (como, por ejemplo, la longitud del semieje mayor). Una manera sencilla de
observar esto es considerar el caso F1 = F2 (en el que la elipse es realmente una circunferencia). En ese caso,
saber los focos no determina la circunferencia: debemos especificar su radio.
¿Cómo podemos hallar los elementos de la elipse a partir de sus focos y semieje mayor? Veamos cómo encontrar
B1 , B2 , y por ende b, a partir de F1 , F2 y a. Observermos la Figura 4.7. Como B1 es un punto de la elipse entonces
d(B1 , F1 ) + d(B1 , F2 ) = 2a. Pero, como d(B1 , F1 ) = d(B1 , F2 ), se cumple que 2d(B1 , F1 ) = 2a; es decir,
d(B1 , F1 ) = a. Además, como el triángulo de vértices O,B1 y F1 es rectángulo, el Teorema de Pitágoras asegura
que:
d(B1 , F1 )2 = d(B1 , O)2 + d(O, F1 )2
Es decir, a2 = b2 + c2 . Concluimos que a es la hipotenusa del triángulo rectángulo de catetos de longitud b y c. De

esta igualdad podemos entonces calcular el valor de b. Entonces, B1 , B2 serán los puntos que se encuentran sobre la
recta perpendicular a la recta que contiene a F1 y F2 que están a distancia b del centro de la elipse (el punto medio
entre F1 y F2 ).
Experimento 24
1. Vuelvan a ver los Ejemplos 41 e interpreten cómo fueron dibujadas las elipses E1 , E2 y E3 , a partir de
los focos y longitud del semieje mayor.
2. Supongan que les brindan como dato el centro de la elipse y la longitud de los semiejes mayor y menor.
Hallen la ubicación de los focos.

4.3.3 Excentricidad de una elipse

c
Vimos en el párrafo anterior que a2 = b2 + c2 . En particular, tengamos en cuenta que a > c; por lo que a < 1. Este
cociente tiene un nombre.
c
Definición 40 El cociente a se denomina la excentricidad de la elipse. Se nota e = ac .
Observemos que la excentricidad de la elipse siempre es un número menor a 1. ¿Qué nos dice la excentricidad
de la elipse? Recordemos que c es la distancia de los focos al origen y a la longitud del semieje mayor (es decir,
la distancia del punto donde la elipse corta al eje x al origen). Cuanto más cerca estén los focos de este punto de
intersección más parecidos serán c y a y, por lo tanto, la excentricidad será más cercana a 1. Como resultado la
elipse será más “chata” o “aplastada”. Mientras que más lejos estén estas magnitudes, la excentricidad será más
pequeña (acercándose a 0) y la elipse será más “redondeada”. La situación extrema es, por supuesto, cuando c = 0,
en cuyo caso los focos están en el origen, por lo cual la elipse es en realidad una circunferencia. La excentricidad
mide entonces qué tan lejos está la elipse de ser una circunferencia, donde los valores más cercanos a 0 indican que
es muy parecida, y los valores cercanos a 1 que no (Figura 4.9).
Figura 4.9: La excentricidad de la elipse.
Ejemplos 42 Hallemos las excentricidades de las elipses del Ejemplo 41.

√
1. Para la elipse E1 teníamos a = 5 y c = d(F1 , O) = 32 + 02 = 3. La excentricidad de esta elipse es, entonces:
c
e= a
= 35 .
2. Para E2 , teníamos que el centro era (2, 1), a = 7 y
p
c = d((2, 1), (−1, 1)) = (2 − (−1))2 + (1 − 1)2 = 3
c
Por lo tanto, la excentricidad de la elipse es e = a
= 37 .
p
3. En E3 , la elipse tiene como centro al punto (−6, 3), a = 10 y c = d((−6, 3), (−6, −2)) = (−6 − (−6))2 + (3 − (−2))2 =
5
5. La excentricidad en este caso es e = 10
= 12 .
¿Cuál de estas elipses es más achatada? ¿Cuál más redondeada?
Observación 14 Recordando la observación de la página 103, vemos que el Experimento 24 establece que una
elipse también queda determinada por las longitudes de los semiejes, siempre y cuando especifiquemos el punto
medio entre ambos focos.
Ejemplos 43 Vamos a hallar las ecuaciones canónicas de las elipses del Ejemplo 41.
1. Según la fórmula hallada en el párrafo anterior, podemos construirnos la ecuación de una elipse si conocemos las
longitudes de sus semiejes mayor y menor. En el caso de la elipse E1 , ya sabemos que a = 5, por lo que solo nos
resta hallar b. Pero vimos que siempre vale a2 = b2 + c2 , donde c es la distancia de los focos al centro de la
elipse. En este caso, c = 3; por lo tanto, b2 = a2 − c2 = 52 − 32 = 25 − 9 = 16. Luego, concluimos que la
x2 y2
ecuación canónica de la elipse E1 es 1 = 25
+ 16
. De todas formas, mostraremos cómo pueden obtenerse.
2. En el caso de E2 , tenemos que a = 7 y c = 3, por lo que b2 = a2 − c2 = 40. Aquí tenemos otro centro: el
(2, 1). Por lo tanto, la ecuación canónica de E2 es:
(x−2)2 (y−1)2
1= 49
+ 40
.
(x+6)2 2
3. Finalmente, para E3 se tiene a = 10 y c = 4, por lo que b2 = a2 −c2 = 84. La ecuación es: 1 = 10
+ (y−3)
84
.

Otra manera de representar una elipse por medio de ecuaciones es lo que se conoce como ecuación general de la
elipse. Esta tiene la forma αx2 + βy 2 + γx + δy + = 0, donde α, β, γ, δ, ∈ R. Aquí, los coeficientes no guardan
relación directa con los elementos de la elipse (como sí sucede en el caso de la ecuación canónica). Para hallar la
ecuación general a partir de la ecuación canónica solo debemos desarrollar los términos que aparecen elevados al
cuadrado y “pasar” todos los términos de un lado de la igualdad. Por ejemplo, consideremos la elipse de ecuación
(x−2)2 (y−1)2
canónica 49 + 40 = 1. Al desarrollar, tenemos:
(x − 2)2 (y − 1)2
1 = + =
49 40
x2 − 4x + 4 y 2 − 2y + 1
= + =
49 40
40x2 − 160x + 49y 2 − 98y + 209

=
1960
Al pasar, el 1960, multiplicando al otro lado de la igualdad, y luego ese mismo número restando nuevamente,
obtenemos la ecuación general:
40x2 − 160x + 49y 2 − 98y + 209 − 1960 = 0
El pasaje de la ecuación general a la canónica es un tanto más laborioso. Antes de hacer un ejemplo, comentemos
el procedimiento que utilizaremos: se llama “completar cuadrados” y es el procedimiento inverso a desarrollar el
cuadrado de la suma de dos términos. Si tenemos una expresión de la forma x2 + 4x + 4, es equivalente a (x + 2)2 .
Pero si tenemos la expresión x2 + 4x, no podemos hacer lo mismo (ya que nos falta el término 4 sumado para
poder escribir la igualdad con el cuadrado de una suma). En estos casos, haremos lo siguiente sumamos el 4 que
necesitamos para poder armar el cuadrado de una suma y luego le restamos el mismo 4 para no cambiar la expresión
(pues equivaldría a sumar 0). Con el 4 que agregamos, podemos ahora armar el cuadrado de x + 2 y nos queda un
−4 suelto afuera. Es decir, escribiremos:
x2 + 4x = x2 + 4x + (4 − 4) = (x2 + 4x + 4) − 4 = (x + 2)2 − 4
Este procedimiento es lo que se conoce como “completar cuadrados”. Veamos ahora con un ejemplo cómo calcular
la ecuación canónica a partir de la ecuación general. Consideremos la elipse de ecuación general 64x2 + 100y 2 −
256x − 200y − 1244 = 0. Como para la ecuación canónica vamos a buscar expresiones de la forma (x − α)2 e
(y − β)2 , entonces completaremos cuadrados entre las x, por un lado, y las y, por el otro. Además, queremos que
estas variables aparezcan con coeficiente 1. Por lo tanto, reescribimos la ecuación general de la elipse de la siguiente
manera:
64(x2 − 4x) + 100(y 2 − 2y) = 1244
Aquí agrupamos las x, por un lado, y las y, por otro lado. También sacamos factor común en cada grupo para dejar
que los coeficientes de las variables x e y sean 1, y pasamos el término independiente 1244 hacia el otro lado de la
igualdad (para que la fórmula se asemeje a la ecuación canónica de la elipse). Ahora, podemos completar cuadrados
dentro de cada paréntesis:
x2 − 4x = x2 − 4x + 4 − 4 = (x − 2)2 − 4
y 2 − 2y = y 2 − 2y + 1 − 1 = (y − 1)2 − 1
Por lo tanto, obtenemos:
1244 = 64(x2 − 4x) + 100(y 2 − 2y) =

= 64((x − 2)2 − 4) + 100((y − 1)2 − 1) =
= 64(x − 2)2 − 256 + 100(y − 1)2 − 100
De aquí, despejamos:
64(x − 2)2 + 100(y − 1)2 = 1600
64(x − 2)2 + 100(y − 1)2

⇒ =1
1600
64(x − 2)2 100(y − 1)2

⇒ + =1
1600 1600
(x − 2)2 (y − 1)2
⇒ + =1
25 16
Esta es la ecuación canónica de la elipse.
Estudiamos a la elipse como lugar geométrico de puntos. Es decir, como el conjunto de puntos para los que la suma
de las distancias a los focos de la elipse es constante.
Definimos los semiejes mayor y menor de la elipse, y vimos que la constante antes citada es dos veces la longitud del
semieje mayor.
Definimos la excentricidad de la elipse.
Introducimos la ecuación canónica y la ecuación general de una elipse.

Álgebra A. La hipérbola. 101
4.4 La hipérbola
La hipérbola es la única cónica que no es conexa; ya que consta de dos ramas desconectadas. En este apartado la
analizaremos en detalle.
Cómo definir la hipérbola como lugar geométrico de puntos.

Los elementos principales de las hipérbolas: focos, semiejes, excentricidad, asíntotas y ecuación canónica.

4.4.1 La hipérbola como lugar geométrico
Los elementos asociados a una hipérbola son los mismos que los asociados a una elipse (semiejes mayor y menor,
focos, excentricidad). En particular, la hipérbola también se define a partir de dos focos.
Pero antes de entrar en esos detalles analicemos la siguiente situación: busquemos la ecuación que describa los
puntos tales que la diferencia de sus distancias a dos puntos F1 = (5, 0) y F2 = (−5, 0), es igual a 6. La idea es
muy similar a la que desarrollamos para la elipse. Llamemos P = (x, y), entonces:
d(P, F1 ) − d(P, F2 ) = 6
Al desarrollar la distancia y usar las coordenadas de los puntos tenemos:
p p
(x − 5)2 + (y − 0)2 − (x − (−5))2 + (y − 0)2 = 6
p p
x2 − 10x + 25 + y 2 − x2 + 10x + 25 + y 2 = 6
Al despejar y tomar cuadrados en ambos miembros obtenemos:
p p
( x2 − 10x + 25 + y 2 )2 = (6 + x2 + 10x + 25 + y 2 )2
p
x2 − 10x + 25 + y 2 = 36 + 12 x2 + 10x + 25 + y 2 + x2 + 10x + 25 + y 2
Es decir,
p
−20x − 36 = 12 x2 + 10x + 25 + y 2
p
(−10x − 18)2 = (6 x2 + 10x + 25 + y 2 )2
100x2 + 360x + 324 = 36x2 + 360x + 900 + 36y 2
al despejar:
64x2 − 36y 2 = 576
Dividimos ambos miembros por 576, y obtenemos:
x2 y2
− =1
32 42
4.4.2 La ecuación de la hipérbola
En el apartado anterior, desarrollamos una de las formas de presentar la ecuación de la hipérbola.

En primer lugar, consideremos una hipérbola genérica centrada del origen, como en el problema que acabamos de
resolver. Podemos representar la situación con el gráfico siguiente:
Figura 4.10: La hipérbola de focos F1 y F2 .
Aquí, los focos F1 y F2 están ubicados sobre el eje de las x, equidistantes del origen de coordenadas O = (0, 0), y
las magnitudes a y b tienen un sentido menos claro que la elipse. Sin embargo, nos permiten relacionar la fórmula
con la ubicación de los focos sobre el eje a partir de la fórmula c2 = a2 + b2 , donde c es la distancia del centro de la
hipérbola a los focos. Entonces, la ecuación canónica de la hipérbola de centro (0, 0) es:
x2 y2
2
− 2 = 1.
a b
Observemos como, al igual que en el caso de la elipse, las longitudes de los semiejes aparecen dividiendo precisa-
mente a la variable correspondiente al eje sobre el que descansan. Si ahora la hipérbola tiene centro en un punto
C0 = (x0 , y0 ) y sus focos están sobre una recta paralela al eje x, entonces su ecuación es:
(x − x0 )2 (y − y0 )2
2
− = 1.
a b2
Por otro lado, si la hipérbola tiene centro en un punto C0 = (x0 , y0 ) y sus focos están sobre una recta paralela al eje
y, entonces su ecuación es:
(y − y0 )2 (x − x0 )2
− = 1.
b2 a2
Importante En este libro, solo trabajaremos con hipérbolas cuyos focos se encuentran sobre una recta paralela
al eje x o al eje y.
Apliquemos estas ecuaciones en algunos casos particulares:
Ejemplos 44
1. La hipérbola H1 de focos F1 = (−5, 0) y F2 = (5, 0) y longitud de semieje mayor igual a 4 tiene su centro en
el origen de coordenadas y puede verse en la Figura 4.11, lado izquierdo. Para esta hipérbola, los focos están
sobre una recta paralela al eje x y con centro en el origen, tenemos a = 4, b2 = c2 − a2 = 52 − 42 = 9. Por lo
x2 y2
tanto, la ecuación canónica de la misma es 1 = 16
− 9
.
2. La hipérbola H2 de focos F1 = (−3, 1) y F2 = (7, 1) y longitud de semieje mayor igual a 2 puede verse en
Álgebra A. La hipérbola. 103
la Figura 4.11, centro. El centro de esta hipérbola es el punto (2, 1), y también tiene sus focos sobre una recta
paralela al eje x. Como además a = 2 y b2 = c2 − a2 = 52 − 22 = 21, entonces la ecuación canónica es
(x−2)2 (y−1)2
1= 4
− 21
.
3. La hipérbola H3 de focos F1 = (2, −6) y F2 = (2, 4) y longitud de semieje mayor igual a 3 puede verse en la
Figura 4.11, lado derecho. El centro es el punto (2, −1) y el semieje mayor es perpendicular al eje y (a diferencia
de los dos ejemplos anteriores). Como a = 3 y b2 = c2 − a2 = 52 − 9 = 16 entonces la ecuación canónica de
(y−2)2 (x+1)2
H3 es 1 = 9
− 16
.

Figura 4.11: Las hipérbolas de los Ejemplos 44.
Al igual que en el caso de la elipse, podemos desarrollar los cuadrados de la ecuación canónica para obtener una
expresión de la forma αx2 + βy 2 + γx + δy + = 0, con α, β, γ, δ, ∈ R. Pero a diferencia de la ecuación
general de la elipse, los signos de los coeficientes α y β serán necesariamente opuestos. Esto se debe a que en la
ecuación canónica de una elipse, uno de los paréntesis tiene signo positivo y el otro negativo. Esta característca es,
en particular, lo que nos indica si una ecuación general de la forma αx2 + βy 2 + γx + δy + = 0, corresponde a una
elipse o una hipérbola (sólo debemos comparar los signos de los coeficientes que multiplican a x y a y). Por ejemplo,
(x−2)2 2
ecuación general de la hipérbola de ecuación canónica 16 − (y+1)
9 = 1 es 9x2 − 16y 2 − 36x + 32y − 124 = 0.
Les presentamos un experimento para que, a través del mismo, muestren cómo obtener una ecuación de la otra.
Experimento 25 Utilicen el procedimiento de “completar cuadrados”, deriven la ecuación general 9x2 −

(x−2)2 (y+1)2
16y 2 − 36x + 32y − 124 = 0 para la elipse de ecuación canónica 16 − 9 = 1.
Observación 15 Al igual que en la elipse, para definir una hipérbola no nos alcanza con brindar los focos:
debemos dar algún otro parámetro (como longitud de algún semieje).
4.4.3 La excentricidad de la hipérbola

c
Como la distancia c de los focos al centro de la hipérbola es mayor que a, entonces el cociente a es mayor que 1.
Esta es la noción de excentricidad en este caso.
Definición 41 El cociente ac se denomina la excentricidad de la hipérbola. Se nota también e = ac .
Por lo tanto, la excentricidad de la hipérbola siempre es un número mayor a 1. ¿Cuál es la interpretación de la

excentricidad en este caso? Pues también nos da información sobre la forma de la hipérbola: más “abierta” o más
“cerrada”. Por ejemplo, si e es muy grande entonces la hipérbola tiene sus curvas más cerradas, mientras que si e es
más cercano a 1, tiene sus curvas más abiertas (Figura 4.12).
Figura 4.12: La excentricidad de la hipérbola.
Ejemplos 45 Vamos a hallar las excentricidades de las hipérbolas de los Ejemplos 44.
√
1. Para la hipérbola H1 , teníamos a = 4 y c = d(F1 , O) = 52 + 02 = 5. La excentricidad de esta hipérbola es,
entonces, e = 45 .
2. Para H2 , teníamos que el centro era (2, 1), a = 2 y
p
c = d((−3, 1), (2, 1)) = (−3 − 2)2 + (1 − 1)2 = 5
c
Por lo tanto, la excentricidad de la hipérbola es e = a
= 52 .
3. En H3 , la hipérbola tiene como centro al punto (2, −1), a = 3 y
p
c = d((2, −6), (2, −1)) = (2 − 2)2 + (−6 − (−1))2 = 5
La excentricidad en este caso es e = 53 .

4.4.4 Asíntotas de la hipérbola
La hipérbolas son las únicas cónicas que tienen asíntotas. Recuerden que una asíntota de una curva es una recta
a la que la curva se acerca indefinidamente. Ya que no presuponemos que el estudiante tenga conocimiento de la
noción de límite, solo mencionaremos que las ramas de una hipérbola de centro (x0 , y0 ) y longitud de semiejes a y
b se acercan indefinidamente a las rectas L1 y L2 de ecuaciones y = ab x + (y0 − ab x0 ) y y = − ab x + (y0 − ab x0 ),
respectivamente (Figura 4.13). Aquí, ± ab es la pendiente de la recta y y0 − ab x0 es la ordenada al origen de la recta.
También podemos representar estas rectas de manera implícita como hicimos en el capítulo 2:
b
L1 = {(x, y) ∈ R2 : ax − y = ab x0 − y0 }
L2 = {(x, y) ∈ R2 : − ab x − y = ab x0 − y0 }
Estas rectas son las asíntotas de la hipérbola.
Álgebra A. La parábola. 105
Figura 4.13: Las asíntotas de la hipérbola.
Ejemplos 46 Hallemos las asíntotas de las hipérbolas de los Ejemplos 44.
1. Para H1 , de centro en el origen, teníamos a = 4 y b = 3. Por lo tanto, las asíntotas de H1 son las rectas y = 34 x
e y = − 43 x.
√
2. H2 tiene su centro en (2, 1) y a = 2 y b = 21. Por lo tanto, las asíntotas de H2 son las rectas y =
√ √ √ √ √ √
21
2
x + (1 − 21) e y = − 221 x + (1 − 21). De manera implícita: {(x, y) ∈ R2 : 221 x − y = 1 − 21}
√ √
y {(x, y) ∈ R2 : − 221 x − y = 1 − 21}.
3. Finalmente, H3 tiene su centro en (2, −1) y a = 3 y b = 4. Sus asíntotas son {(x, y) ∈ R2 : 4
3
x − y = 35 } y
{(x, y) ∈ R2 : − 43 x − y = 53 }.

Estudiamos la hipérbola como lugar geométrico de puntos: es decir, como el conjunto de puntos para los que el
módulo de la diferencia de las distancias a los focos de la hipérbola es constante.
Definimos los semiejes mayor y menor de la hipérbola y vimos que la constante, antes citada, es dos veces la longitud
del semieje mayor.
Definimos la excentricidad de la hipérbola y las asíntotas, y aprendimos a calcularlas.
Introducimos la ecuación canónica y la ecuación general de una hipérbola.

4.5 La parábola
La parábola es seguramente la curva cónica más conocida ya que este tipo de curvas, se estudian extensamente
en la escuela secundaria. Por este motivo, solo introduciremos los elementos propios de esta curva que no suelen
estudiarse allí.
Cómo definir la parábola como lugar geométrico de puntos.

Los elementos principales de las parábolas: foco, directriz y ecuación canónica.

4.5.1 La parábola como lugar geométrico
A diferencia de las cónicas ya estudiadas, donde la definición como lugar geométrico dependía parcialmente de la
ubicación de dos focos, en la parábola depende de una recta L y un punto F no perteneciente a L. Veamos esto en
una situación particular. Encontremos el lugar geométrico de los puntos que equidistan del punto F = (0, 2) y la
recta l cuya ecuación es y = −2.

Para esto llamemos P = (x, y) a un punto genérico del lugar geométrico en cuestión. A diferencia de las situaciones
desarrolladas para elipse e hipérbola acá tenemos dos fórmulas para distancias: una para distancias entre dos puntos
y otra para distancias entre un punto y una recta. Sin embargo, el punto a destacar es que ambas distancias deben ser
iguales. En la situación que estamos analizando, la distancia de cualquier punto genérico (x, y) del plano a la recta
de ecuación y = −2, es la distancia entre los puntos (x, y) y (x, −2). Entonces:
p p
(x − 0)2 + (y − 2)2 = (x − x)2 + (y − (−2))2
En esta ecuación, del lado izquierdo tenemos la distancia del foco (0, 2) al punto genérico (x, y) y, del lado derecho,
la distancia de ese mismo punto genérico al punto más cercano de la recta y = −2, que tiene coordenadas (x, −2).
Al elevar y desarrollar al cuadrado ambos miembros obtenemos:
x2 + y 2 − 4y + 4 = y 2 + 4y + 4
x2 = 8y
Es decir, el lugar geométrico de los puntos del plano que equidistan de (0, 2) y de la recta y = −2 satisfacen la
ecuación x2 = 8y.
Definición 42 Sea F ∈ R2 y sea L ⊂ R2 una recta que no pase por F . La parábola T asociada a F y L es el
conjunto de puntos de R2 que equidistan del punto F y de la recta L. Es decir, T = {P ∈ R2 : d(P, F ) =

d(P, L)}.
Recordemos que d(P, L), representa la distancia del punto P a la recta L (concepto que estudiamos en el capítulo
2). El punto F se llama foco de la parábola y la recta L, directriz de la parábola. El vértice de la parábola es el punto
medio del segmento perpendicular a la directriz que pasa por el foco. Se encuentra a igual distancia del foco que de
la directriz.
Figura 4.14: La parábola de foco F y directriz L.
Importante Al igual que para las otras cónicas, en este libro solo trabajaremos con parábolas cuya directriz sea
paralela al eje x o al eje y.

Observación 16 Como en el caso de la hipérbola, las parábolas tienen un eje de simetría, que consiste en la
recta perpendicular a la directriz que pasa por el vértice y el foco.
4.5.2 Ecuación canónica de la parábola
La ecuación que conocemos de la parábola (con directriz horizontal) y = ax2 + bx + c, se puede despejar para
obtener:
ax2 + bx − y + c = 0
y que se la conoce como la ecuación general de la parábola. Ya que esta ecuación es familiar, nos concentraremos
en la ecuación canónica. Representemos, entonces, una parábola genérica asociada a F y L, de manera que L sea
paralelo al eje y, que el foco esté sobre el semieje positivo de las x y que el vértice de la parábola sea el origen de
coordenadas (Figura 4.14). Sea p la distancia del punto F a la recta L, de modo que F resulta ser el punto ( p2 , 0). Si
P = (x, y) es un punto de la parábola, entonces, debemos tener que d(P, F ) = d(P, L). Pero,
r
p 2 p
d(P, F ) = x− + y 2 y d(P, d) = x + ,
2 2
de donde: r
p 2 p
x− + y2 = x + .
2 2
Si elevamos ambos miembros al cuadrado obtenemos:
p 2 p
x− + y 2 = (x + )2 ,
2 2
de donde:
p2 p2
x2 − px + + y 2 = x2 + px +
4 4
es decir;
p2 p2
x2 + y 2 − x2 = px + + px − .
4 4
Entonces, encontramos la ecuación y 2 = 2px que se la conoce como la ecuación canónica de la parábola con
vértice en el origen. Tengamos en cuenta que el parámetro p, que es la distancia entre el foco y la directriz, es el
que lleva la propiedad definitoria de las características de la parábola. También, es posible observar, que podemos
1 2
reescribir esta ecuación canónica como x = 2p y , cuya forma es la misma de la ecuación que conocemos de la
escuela secundaria, salvo el hecho que tiene intercambiadas las variables x e y (pues estamos considerando una
parábola “acostada”).
Esta ecuación canónica con vértice en el origen corresponde entonces a una parábola con la directriz paralela al eje
y y foco perteneciente al semieje positivo de las x. Las ecuaciones canónicas con vértice en el origen para casos
más generales de directriz y foco son las siguientes:
Si el foco esta a la “derecha” de la directriz (paralela al eje y) entonces la ecuación es y 2 = 2px.
Si el foco esta a la “izquierda” de la directriz (paralela al eje y) entonces la ecuación es y 2 = −2px.
Si el foco esta “arriba” de la directriz (paralela al eje x) entonces la ecuación es x2 = 2py.
Si el foco esta “abajo” de la directriz (paralela al eje x) entonces la ecuación es x2 = −2py.
Observación 17 La variable que aparece elevada al cuadrado es la que nos dice a qué eje es paralela la
directriz.
También, al igual que el caso de la circunferencia, la elipse o la hipérbola, si el vértice de la parábola no está en
el origen de coordenadas, sino que está en el vértice (x0 , y0 ), entonces la ecuación canónica es la misma que la
ecuación para parábolas con vértice en el origen pero reemplazando x por x − x0 e y por y − y0 , respectivamente.
Por ejemplo, la ecuación canónica de una parábola con vértice (x0 , y0 ), directriz paralela al eje x y foco en el
semieje positivo de las y es:
(x − x0 )2 = 2p(y − y0 )
Cabe destacar que, de esta ecuación, deducimos la ecuación general que conocemos de la parábola. En efecto, si
desarrollamos esta ecuación obtenemos:
x2 − 2xx0 + x20 = 2py − 2py0 . Al reordenar los términos:,
x20

1 2 x0
y= x − x+ − y0 .
2p p 2p
x20
Esta ecuación es de la forma y = ax2 + bx + c mediante las identificaciones a = 1
2p , b = − xp0 y c = 2p − y0 .
Observemos que, al igual que las ecuaciones canónicas de la elipse y la hipérbola, la ecuación canónica de una
parábola contiene la información de todos sus elementos. En efecto, aparecen las coordenadas del vértice (x0 , y0 ) y el
valor p nos permite deducir la ubicación del foco y la directriz. Por ejemplo, si la ecuación es (x−x0 )2 = 2p(y −y0 ),
entonces sabemos que la directriz es paralela al eje x, por lo que el foco debe ser el punto (x0 + p2 , y0 ) y la directriz
p
debe ser la recta de ecuación x = x0 − 2 (miren la Figura 4.14).
Experimento 26 De manera análoga a como fue hecho en el apartado busquen los focos y la directriz a
partir de las otras posibles ecuaciones canónicas de las parábolas:

(y − y0 )2 = −2p(x − x0 ).
(x − x0 )2 = 2p(y − y0 ).
(x − x0 )2 = −2p(y − y0 ).

¿Cómo hacemos para obtener la ecuación canónica de una parábola? Lo mostramos en varios ejemplos. En primer
lugar, supongamos que tenemos la parábola y = 14 x2 − 2x + 6 y hallamos la ecuación canónica. Nuevamente, la
idea es “completar cuadrados”.
y = 14 x2 − 2x + 6
⇒ y − 6 = 14 x2 − 2x
⇒ y − 6 = 14 (x2 − 8x)
Completamos cuadrados dentro del paréntesis:
y − 6 = 41 [(x2 − 8x + 16) − 16]

⇒ y − 6 = 14 [(x − 4)2 − 16]
⇒ y − 6 = 14 (x − 4)2 − 4
⇒ y − 6 + 4 = 41 (x − 4)2
⇒ y − 2 = 14 (x − 4)2
⇒ 4(y − 2) = (x − 4)2
Hemos arribado, entonces, a la expresión canónica de la parábola. De aquí, inmediatamente vemos que el vértice es
el punto (4, 2). Sabemos que, como el valor 4 es el que multiplica a la expresión (y − 2) (que no está elevada al
p
cuadrado), entonces 2p = 4. Luego, p = 2 y, por ende, 2 = 1 es la distancia entre el foco y el vértice y entre el vértice
y la directriz. Como la variable que está elevada al cuadrado es la x entonces, sabemos que la directriz será paralela al
eje x. Por lo tanto, para hallar las coordenadas del foco simplemente hacemos F = (4, 2 + p2 ) = (4, 2 + 1) = (4, 3)
p
y la ecuación de la directriz nos queda, y = 2 − 2 = 2 − 1 = 1.
Ahora bien, supongamos que queremos hallar la ecuación de la parábola cuyo foco es F = (−6, −4) y cuya
directriz es la recta de ecuación x = −2. Sabemos que el vértice se encuentra en la recta perpendicular a la directriz
que contiene al foco, a igual distancia del foco que de la directriz. Las rectas perpendiculares a x = −2 son las
de la forma y = λ, para cualquier λ ∈ R. Como queremos que pase por F entonces debe ser y = −4. Esta recta
interseca a la directriz en (−2, −4), por lo que el vértice es el punto medio entre (−2, 4) y F ; es decir, el vértice de
la parábola es (−4, −4). Para hallar p, utilizamos que la distancia del foco (o la directriz) al vértice es p2 . Como
d((−4, −4), (−6, −4)) = 2 entonces, p = 4. Por lo tanto, 2p = 8 y, como el foco está en el semieje negativo de las
x, la ecuación canónica de esta parábola es (y + 4)2 = −8(x + 4).
Observación 18 El pasaje de ecuación general a ecuación canónica, y viceversa, se realiza de idéntica manera
al procedimiento desarrollado para circunferencias, elipses e hipérbolas.
4.5.3 Excentricidad de la parábola (y del resto de las cónicas)
Anteriormente las excentricidades que medimos eran la razón entre la longitud de los semiejes y la distancia de los
focos al origen (para una curva centrada en el origen de coordenadas). Por un lado, consideramos como el semieje
de la parábola al segmento perpendicular a la directriz, que une la directriz con el origen de coordenadas (Figura
p
4.14). Ya vimos que la longitud de este segmento es 2 (donde p es la distancia de la directriz al foco). Por otro lado,
p
la distancia del foco al origen también es 2. Por lo tanto, la excentricidad de la parábola es 1, cualquiera sea la
parábola. Ahora podemos precisar un poco mejor qué mide realmente la excentricidad. Observen la Figura 4.15. Allí
se muestra como va cambiando la forma de la curva a medida que aumenta la excentricidad. La excentricidad mide
como es la curvatura de la curva cónica, en relación a la de una circunferencia. La única cónica con excentricidad 0
es la misma circunferencia, lo cual nos indica que es la curvatura “perfecta” (la curva siempre “va doblando” el
mismo ángulo en cada paso cuando la recorremos). La excentricidad también nos permite clasificar las cónicas. En
efecto, si es 0 entonces es una circunferencia. Si está estrictamente entre 0 y 1, entonces la curva es necesariamente
una elipse. Si es exactamente 1 entonces es una parábola; y si es mayor estricto que 1, es una hipérbola.
Figura 4.15: El cambio de las cónicas a medida que crece la excentricidad.

Estudiamos a la parábola como lugar geométrico de puntos: o sea, como el conjunto de puntos que se encuentran a la
misma distancia de un punto (el foco) y una recta (la directriz) dados.
Introducimos las ecuaciones canónicas de una parábola general.

II
Parte 2
5 Ecuaciones lineales, matrices y determinantes

113
5.1 Sistemas de ecuaciones lineales
5.2 Matrices
5.3 Resolución y clasificación de sistemas de ecuaciones lineales
5.4 La teoría de matrices
5.5 Determinantes
6 Transformaciones lineales . . . . . . . . . . . . . . . 167

6.1 La transformación lineal
6.2 Imagen y núcleo
6.3 Interpretación geométrica del efecto de una transformación
lineal
6.4 Composición e inversa de transformaciones lineales
7 Números complejos . . . . . . . . . . . . . . . . . . . . 195

7.1 ¿Qué son los números complejos?
7.2 El plano complejo
7.3 Ecuaciones cuadráticas
7.4 Formas polar y exponencial
7.5 Resolución de ecuaciones generales
8 Polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
8.1 ¿Qué es un polinomio?
8.2 División de polinomios
8.3 Raíces
8.4 Factorización de polinomios
9 Experimentos resueltos . . . . . . . . . . . . . . . . . 235
10 Bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
5. Ecuaciones lineales, matrices y determinantes
En este capítulo estudiaremos cómo resolver eficientemente sistemas de ecuaciones lineales. Los sistemas de
ecuaciones lineales aparecen naturalmente en una inmensa cantidad de contextos, no solo en las teorías de las
ciencias exactas, sino también en otras ramas que van desde la Biología hasta la Economía.
La resolución de los sistemas de ecuaciones lineales se puede mecanizar mediante el uso de la teoría de matrices y
de determinantes, que son herramientas muy potentes del Álgebra Lineal. En particular, en este marco se puede
desarrollar software eficiente para resolver sistemas lineales muy complejos.
5.1 Sistemas de ecuaciones lineales

Comencemos identificando y clasificando los posibles sistemas de ecuaciones lineales y mecanizando su resolución.
Qué es un sistema de ecuaciones lineales.

Cómo resolver sistemas de ecuaciones lineales.
Cómo se clasifican los sistemas de ecuaciones lineales de acuerdo a la existencia de su/s solución/es.

5.1.1 ¿Qué es un sistema de ecuaciones lineales?
Vimos en el capítulo 2 que una ecuación que involucra las variables x, y se dice lineal si es de la forma ax + by = c
para ciertos a, b, c ∈ R. Esto es: cada variable aparece multiplicada por un número real, estos términos sumados y
esta suma igualada a otro número real. La misma idea vale para ecuaciones de tres variables x, y, z. En general,
tenemos la siguiente definición.
Definición 43 Una ecuación lineal en las variables x1 , . . . , xn es una relación de la forma:
a1 x1 + · · · + an xn = b,
donde a1 , . . . , an , b ∈ R. A las variables x1 , . . . , xn también se las llama las incógnitas de la ecuación y a los
números a1 , . . . , an que aparecen multiplicando a las variables se los llama coeficientes de la ecuación.
Cuando hablamos de resolver una ecuación lineal estamos intentando encontrar números c1 , . . . , cn que verifiquen
la ecuación; es decir, que al reemplazar xi con ci se obtenga la igualdad a1 c1 + · · · + an cn = b. En este caso,
decimos que c1 , . . . , cn son solución de la ecuación. Cabe destacar que importa el orden en el que escribimos los
ci , ya que no es lo mismo reemplazarlos en cualquier variable (pues los ai no son en general iguales). Por este
motivo conviene escribirlo como una n-upla (c1 , . . . , cn ) ∈ Rn y decir que el vector (c1 , . . . , cn ) es solución de la
ecuación. Por ejemplo, la ecuación implícita de un plano es una ecuación lineal que nos dice qué puntos (x, y, z) de
R3 pertenecen al plano (estos puntos son la solución de dicha ecuación implícita).
Como su nombre lo indica, un sistema de ecuaciones lineales es una colección de ecuaciones lineales que nos
interesa resolver simultáneamente. Vale decir, estamos buscando vectores (c1 , . . . , cn ) ∈ Rn que verifiquen varias
ecuaciones al mismo tiempo. Por ejemplo, la ecuación implícita de una recta en R3 es precisamente un sistema de
dos ecuaciones lineales, y los puntos de la recta son exactamente los puntos (x, y, z) ∈ R3 que son solución de
ambas ecuaciones simultáneamente. Definamos este concepto en general.
Definición 44 Un sistema de m ecuaciones lineales en las variables x1 , . . . , xn es una colección de m ecuacio-
nes lineales que queremos resolver simultáneamente. Se escribe:




 a11 x1 + · · · + a1n xn = b1


 a21 x1 + · · · + a2n xn

= b2
.. .. . .. .. ..



 . . · · · .. . . .


 a x + ··· + a x = bm
m1 1 mn n
donde a1 , . . . , an , b ∈ R. Nuevamente, nos referimos a las variables x1 , . . . , xn como las incógnitas del sistema
y a los números aij como los coeficientes del sistema. Los números bi se llaman los coeficientes libres del
sistema (son los que no acompañan a ninguna variable).
Pero, ¿qué es esta notación con tantos subíndices? Aunque no lo parezca a primera vista, es la manera más sencilla
de escribir un sistema de ecuaciones lineales de manera general. En efecto, cuando teníamos una sola ecuación en n
variables podíamos simplemente escribir:
a1 x1 + · · · + an xn ,
donde el subíndice i en el número ai indicaba que dicho número se encontraba multiplicando a la variable xi . Si
ahora tenemos un sistema de dos ecuaciones, entonces la variable xi va a estar multiplicada por un número ai en la
primera ecuación y por un número bi en la segunda ecuación. En este caso, podemos escribir el sistema como:

 a x + ··· + a x = d1
1 1 n n
 b x + ··· + b x = d
1 1 n n 2
Si hubiera tres ecuaciones podríamos usar ai , bi , ci . ¿Pero qué haríamos si hubiera cincuenta ecuaciones? Como no
alcanzan las letras del abecedario, deberíamos utilizar otros símbolos para representar a los coeficientes. Pero aún
cuando hiciéramos esto, ¿cómo podemos especificarle al lector que el símbolo @ corresponde a los coeficientes de
la ecuación 37 (ó cualquiera de ellas)? La manera más sencilla, entonces, es no utilizar distintas letras (o símbolos)
para los coeficientes de cada ecuación, sino usar la misma letra (o símbolo) para todas las ecuaciones pero agregando
un nuevo subíndice numérico que aclare cuál es la ecuación a la que pertenece dicho coeficiente. Por lo tanto, cuando
escribimos a36 estamos diciendo que este es el número que multiplica a x6 en la ecuación número 3. En general, el
Álgebra A. Sistemas de ecuaciones lineales. 115
primer subíndice de aij indica el número de ecuación a la que nos estamos refiriendo y el segundo subíndice indica
a qué variable está multiplicando. Por lo tanto, el coeficiente aij es el número que multiplica a xj en la i-ésima
ecuación. Observemos que, por este motivo, el subíndice i se mueve entre 1 y m y el subíndice j, entre 1 y n.
5.1.2 Resolución de sistemas de ecuaciones lineales
Como habrán notado, ¡ya estuvimos resolviendo sistemas de ecuaciones lineales! Las ecuaciones implícitas de las
rectas y los planos forman un sistema de ecuaciones lineales (a veces de una sola ecuación), cuya solución son
precisamente los puntos de la recta o el plano correspondiente. Además, cuando buscamos la intersección entre dos
rectas, dos planos o una recta y un plano, lo que estamos haciendo es armarnos un sistema de ecuaciones lineales
cuya solución, justamente, sean los puntos que se hallan en la intersección. El procedimiento que estudiamos para
resolver sistemas de ecuaciones lineales en capítulos anteriores, consistía en despejar una incógnita de una ecuación
y reemplazarla en la ecuación siguiente, donde con la nueva información, podíamos despejar otra incógnita para
seguir reemplazando en las siguientes ecuaciones. Existen otras “estrategias” que ahora vamos a analizar. Todas
estas maneras de resolver un sistema de ecuaciones lineales se dice que son “a mano” o “por la fuerza bruta”, ya que
uno ataca el problema de la manera que se le ocurre (que puede no ser necesariamiente eficiente). En el siguiente
apartado, vamos a simplificar los procedimientos para resolver este tipo de ecuaciones y hacerlos eficientes.
Vamos a mostrar las diferentes maneras de encarar la búsqueda de la solución por medio de un ejemplo. Supongamos
que tenemos el sistema de dos ecuaciones y dos incógnitas:

 x + 2y = 5
 2x − 3y = −1
Si utilizamos la estrategia que usamos en la primera parte del, podemos despejar x de la primera ecuación y obtener
x = 5 − 2y. Reemplazando esta nueva información en la segunda ecuación obtenemos 2(5 − 2y) − 3y = −1; es
11
decir, 10 − 7y = −1. Por lo tanto, depejando y se tiene y = 7 y, reemplazando esta información en x = 5 − 2y,
13
obtenemos x = 7 . Concluimos que el sistema tiene una única solución: el vector ( 13 11
7 , 7 ). Este método se suele
llamar método de sustitución.

Abordemos ahora el problema de otra manera. Como la variable x aparece en ambas ecuaciones (podría no aparecer
en alguna), al despejarla en ambas ecuaciones simultáneamente, obtenemos:

 x = 5 − 2y
 x = −1+3y
2
Este es el mismo sistema (sólo hemos reordenado los términos). Como la primera ecuación nos dice que x es igual a
una “cosa” y la segunda que x es igual a otra “cosa”, entonces en particular, las “cosas” deberían ser iguales entre
−1+3y
sí. Por lo tanto, debe suceder que 5 − 2y = 2 . Si pasamos el 2 del denominador de la fracción de la derecha
multiplicando a la izquierda, tenemos 10 − 4y = −1 + 3y. Al mover los números para un lado y las “y’s” para el
11
otro, tenemos 11 = 7y; de donde y = 7 , como habíamos hallado con el otro método. Nuevamente, al reemplazar
esta información en x = 5 − 2y o en x = −1+3y2 , nos da x = 13
7 . Este método se suele llamar método de igualación.
Finalmente, veamos una última estrategia de resolución. Es probable que no sea la primera en la que pensemos,
pero, sin embargo, es la más importante para nuestro propósito, ya que la usaremos para desarrollar una manera
mecánica de resolver sistemas de ecuaciones lineales. Comencemos nuevamente con nuestro sistema:

 x + 2y = 5
 2x − 3y = −1
Esta estrategia se basa en la siguiente observación trivial: si a = 5 y b = 7, entonces a + b = 5 + 7 = 12.

Siguiendo esta idea, dado que x + 2y = 5 y que 2x − 3y = −1, entonces si sumamos x + 2y con 2x − 3y nos dará
5 + (−1) = 4. Es decir:
(x + 2y) + (2x − 3y) = 4
Pero (x+2y)+(2x−3y) = 3x−y, por lo cual, sumando la primera ecuación del sistema con la segunda obtenemos
una nueva ecuación 3x − y = 4. ¿Y qué relación tiene esta ecuación con las originales? Igual al caso donde a = 5 y
b = 7 forzaban a que a + b = 12, lo que dice x + 2y = 5 y 2x − 3y = −1 es que, necesariamente, 3x − y = 4.
Es decir, si x + 2y = 5 y 2x − 3y = −1, entonces, 3x − y = 4. ¿Por qué nos interesa tener esta información?
Porque al “sumar dos ecuaciones” obtenemos una nueva ecuación que es válida y que puede tener un formato más
sencillo para poder despejar las variables. Por ejemplo, despejando y de esta última ecuación hallada, tenemos
y = 3x − 4, que es mucho más ameno que despejar y de las ecuaciones originales (donde aparecen necesariamente
fracciones). Pero hay algo más que podemos hacer para obtener todavía una ecuación más sencilla. Y, nuevamente,
está basada en una observación trivial: si a = 5 entonces 2a = 2,5 = 10. En este caso, como x + 2y = 5 entonces
2(x + 2y) = 2,5 = 10; es decir, 2x + 4y = 10. Otra vez, hallamos otra ecuación que sigue siendo válida para
cualquier solución de la ecuación original (en el sentido de que si un vector (x, y) ∈ R2 es solución del sistema,
entonces también debe verificar esta nueva ecuación que construimos a partir de las originales). Tengamos en cuanta,
de todas formas, que esto es cierto si estamos multiplicando a una ecuación por un número distinto de 0 (multiplicar
una ecuación por 0 a ambos lados, simplemente, “mata” la ecuación). Al igual que el caso de la suma de ecuaciones,
multiplicar una ecuación por un número no nulo puede simplificar la ecuación y hacernos más fácil la tarea de
3
despejar variables: por ejemplo, la ecuación 10 x + 56 y = −2 puede simplificarse mucho al multiplicarla por 30.
Pero, en definitiva, es una combinación de ambas operaciones (sumar ecuaciones y multiplicarlas por un número no
nulo) que nos va a ayudar a resolver el sistema de manera más directa. En efecto, comencemos multiplicando la
primera ecuación por −2 para obtener −2x − 4y = −10. Ya dijimos que esta ecuación tiene que ser cierta (ya que
las originales lo eran). Y ahora, sumemos esta nueva ecuación con la segunda ecuación original:
(−2x − 4y) + (2x − 3y) = −10 − 1
Es decir, −7y = −11 (los términos que contienen a la variable x se cancelaron en la suma). De aquí, despejamos
11
muy sencillamente que y = 7 . ¿Qué es lo que hicimos? Primero multiplicamos por −2 la primera ecuación para
hacer que aparezca un −2 multiplicando a la x. Esto lo hicimos con la intención de que, al sumarle luego la segunda
ecuación, la variable x desaparezca (ya que aparece acompañada de un 2 en dicha ecuación). De esta manera, hemos
despejado y, operando con las ecuaciones. ¿Se les ocurre qué operaciones podríamos aplicarle a las ecuaciones del
sistema para eliminar la variable y en lugar de la x? Una posibilidad es multiplicar la primera ecuación por 3 y la
segunda ecuación por 2.Así, la variable y aparece con coeficiente 6 en la primera nueva ecuación y con coeficiente
−6 en la segunda. Al sumarlas, se cancelarán y podremos despejar x. Este método se lo suele llamar método de
eliminación y será el que utilizaremos para mecanizar el proceso de resolución de ecuaciones. A continuación, lo
desarrollaremos más en detalle.
Como vimos más arriba, si tenemos un sistema de ecuaciones lineales y hacemos algunas operaciones sobre sus
ecuaciones (multiplicarlas por algún número y sumarlas o restarlas entre sí) obtenemos nuevas ecuaciones que son
válidas.
Importante Cualquier ecuación que se pueda obtener de las ecuaciones de un sistema con las operaciones recién
descriptas, es una ecuación válida, en el sentido que las soluciones de la ecuación original deben verificar también
estas nuevas ecuaciones.
Si empezamos a armar nuevas ecuaciones, que en principio serán más sencillas que resolver que las originales,
tendremos muchas ecuaciones que se irán agregando (las originales más las nuevas que vamos armando). La
pregunta es ¿son necesarias considerar todas? Si revisamos el ejemplo que resolvimos utilizando el método de
eliminación, luego de armar la nueva ecuación, la sumamos a la segunda ecuación del sistema original (para poder
11
despejar y) y, luego, usamos la primera ecuación para reemplazar por y = 7 y despejar x. Observemos que no
volvimos a usar la segunda ecuación después de hacer la suma de ecuaciones. Es decir, terminamos resolviendo el
sistema: 
 x + 2y = 5
 −7y = −11
En general, esto es lo que vamos hacer: ir reemplazando las “viejas” ecuaciones por “nuevas” ecuaciones más
sencillas, de manera de transformar el sistema original que teníamos en otro sistema (con nuevas ecuaciones), y que
este nuevo sistema tenga la misma cantidad de ecuaciones (o menor) y, además, que las soluciones de este nuevo
sistema sean las mismas que las del sistema original. Cuando dos sistemas de ecuaciones lineales tienen las mismas
soluciones se dice que son equivalentes. Por la misma definición, es igual resolver cualquiera de los dos sistemas
(ambos dan idénticas soluciones). Lo que vamos a hacer, entonces, es ir construyendo sistemas equivalentes al
original que sean más sencillos de resolver. En resumen:
Dos sistemas de ecuaciones lineales que tienen las mismas soluciones se llaman equivalentes (podemos
elegir cualquiera de los dos para resolver).
Multiplicar una ecuación por un número real no nulo deja un sistema equivalente al original (en el sentido
que reeplazamos una ecuación por la ecuación que se obtiene de la original multiplicando a ambos lados
por el mismo número no nulo).
Sumar dos ecuaciones y reemplazar alguna de las ecuaciones originales que sumamos por dicha suma deja
un sistema equivalente al original (por ejemplo, si sumamos las ecuaciones i y j, podemos reemplazar la
ecuación i por esta nueva ecuación obtenida de la suma entre las ecuaciones i y j).
¿Se les ocurre alguna otra operación entre ecuaciones que no altere las soluciones? Hay una que es tan obvia que a
veces se nos puede pasar:
¡Intercambiar la posición de dos filas en el sistema de ecuaciones deja un sistema equivalente!
Es decir, al escribir la ecuación i en el lugar donde estaba escrita la ecuación j y escribir la ecuación j donde estaba
escrita la ecuación i, deja un sistema equivalente (así como el sistema no cambia si lo escribimos en la computadora,
en una hoja de papel o pizarrón). Esta operación natural será sumamente útil a la hora de mecanizar el proceso de
resolución en los próximos apartados.
Observación 19 Destacamos que dos sistemas equivalentes no tienen porqué tener las misma cantidad de
ecuaciones. Por ejemplo, si a un sistema le agregamos una ecuación que resulte de la suma de dos ecuaciones
anteriores, entonces, el nuevo sistema sigue siendo equivalente al original (pues la ecuación que agregamos
se deduce de los anteriores, por lo que no es realmente una nueva restricción) pero tiene una ecuación más
que el original. Cuando nosotros hablamos de conseguir sistemas equivalentes “que tengan la misma cantidad
de ecuaciones que el original” pensamos en simplificar el procedimiento para resolver el sistema (por eso
reemplazamos ecuaciones y no solo las agregamos). Algo mejor aún que mantener la cantidad de ecuaciones
original es reducir dicha cantidad. ¡Y esto se puede hacer en muchos casos! Por ejemplo, consideren el siguiente
sistema: 


 2x + 5y = −1

−x + 3y = 4


 −5x + 4y = 13

Multipliquemos la primera ecuación por −1 y la segunda ecuación por 3:




 −2x − 5y = 1

−3x + 9y = 12


 −5x + 4y = 13

Ahora, reemplacemos la segunda ecuación por la suma de las primeras dos:




 −2x − 5y = 1

−5x + 4y = 13


 −5x + 4y = 13

¡Hemos obtenido una ecuación que ya teníamos! Y esto lo hicimos “operando” con las primeras dos ecuaciones.
Esto nos indica que la tercera ecuación en realidad no era una nueva restricción del sistema, sino que ya
estaba contemplada en las dos primeras ecuaciones. En este sentido, la tercera ecuación original “está de más”
y podríamos removerla. Para pensarlo más analíticamente, podemos seguir haciendo operaciones entre las
ecuaciones para “eliminarla”. En efecto, multipliquemos ahora la segunda ecuación por −1:



 −2x − 5y = 1

5x − 4y = −13


 −5x + 4y = 13

Si ahora reemplazamos la última ecuación por la suma de las ecuaciones 2 y 3, obtenemos:




 −2x − 5y = 1

5x − 4y = −13



 0=0
Aquí vemos que, efectivamente, podemos hacer desaparecer la última ecuación (notar que una ecuación de la
forma @=@, donde @ representa cualquier fórmula no indica ningún tipo de restricción, ya que siempre algo es
igual a sí mismo). En este caso, podemos olvidarnos de esta expresión 0 = 0 y quedarnos con el sistema:

 −2x − 5y = 1
 5x − 4y = −13
Un tipo importante de sistemas de ecuaciones lineales son los que tienen todas sus ecuaciones igualadas a 0.
Definición 45 Un sistema de ecuaciones lineales se dice que es homogéneo si todas las ecuaciones del sistema
se encuentran igualadas a cero.
Estos sistemas están relacionados con las soluciones de todos los sistemas de ecuaciones lineales (no necesariamente
homogéneos). No entraremos en detalle de esta relación aquí. Simplemente mencionaremos que los sistemas lineales
homogéneos siempre tienen al (0, 0, . . . , 0) como solución.
5.1.3 Clasificación de sistemas de ecuaciones lineales
Cuando buscábamos intersecciones entre subespacios lineales, en algunas ocasiones los objetos estudiados no se
cortaban: plano paralelos, plano y recta paralelos, rectas paralelas o alabeadas. Desde el punto de vista algebraico, lo
que sucedía con los sistemas de ecuaciones lineales que se armaron para buscar la intersección, es que al resolverlos,
nos devolvían una inconsistencia que era indicativa de que no había solución simultánea para las ecuaciones del
sistema. La primera clasificación entre sistemas de ecuaciones lineales es si tienen o no solución. Un sistema de
ecuaciones lineales que no tiene solución se llama un sistema incompatible. Por supuesto, la expresión proviene
del hecho de que las ecuaciones que forman parte del sistema son incompatibles entre ellas (no “compatibilizan”
en ningún punto). Por el contrario, los sistemas que admiten al menos una solución se llaman entonces sistemas
compatibles. Vimos también que cuando buscamos la intersección de un plano y una recta no paralelos entonces
la intersección es un punto solo. En este caso, algebraicamente despejamos todas las variables y obtenemos el
punto en cuestión. Por otro lado, cuando buscamos la intersección de dos planos no paralelos, dicha intersección
es necesariamente una recta (y, algebraicamente, obtenemos una ecuación vectorial para esa recta). En particular,
había infinitos puntos en la intersección (todos los puntos de la recta). Desde el punto de vista algebraico, esto
quería decir que había infinitos puntos que eran solución del sistema de ecuaciones lineales que armamos para
estudiar la intersección (que consistía en las ecuaciones implícitas de los planos involucrados). Por lo tanto,
hay una clasificación más específica para los sistemas compatibles: tienen una única solución o tienen infinitas
soluciones. En el primer caso, los sistemas de ecuaciones lineales que tienen una única solución se llaman sistemas
compatibles determinados, y los que tienen infinitas, sistemas compatibles indeterminados. Por supuesto, el término
“determinado” proviene del hecho que la solución a dicho sistema está completamente determinada: hay una sola. Por
el contrario, un sistema compatible indeterminado tiene solución (pues es compatible) pero no está unívocamente
determinada: hay infinitas. A continuación, resumimos esta clasificación.
Definición 46 Un sistema de ecuaciones lineales se dice que es:
Compatible determinado: si tiene una única solución.

Compatible indeterminado: si tiene infinitas soluciones.
Incompatible: si no tiene soluciones.
Observación 20 Por lo visto a partir de la definición 45, los sistemas homogéneos no pueden ser incompatibles:
o tienen como única posible solución el vector nulo, o tiene infinitas soluciones
La única manera de clasificar un sistema es resolverlo. Y ya tenemos mucha experiencia resolviendo sistemas de
ecuaciones: la que adquirimos en el capítulo 2.
En los siguientes ejemplos vamos a mostrarles cómo clasificar y hallar las soluciones de un sistema de ecuaciones.
Si bien en estos casos no se está representando rectas o planos, el procedimiento algebraico es el mismo, por lo que
podrán seguir los razonamientos y entender los resultados.
Ejemplos 47 Vamos a clasificar distintos tipos de sistemas de ecuaciones lineales (en compatibles determinados,
compatibles indeterminados e incompatibles).

1. Consideremos el sistema: 


 2x − 3y + 2z = 2

x + y − 2z = 0


 2x − 4z = 1

De la segunda ecuación podemos despejar x = 2z − y. Al reemplazar en la primera ecuación, obtenemos

−5y + 6z = 2, de donde y = − 2−6z
5
. Podemos actualizar el despeje original de x con esta nueva información:
x = 45 z + 52 . Finalmente, reemplazamos los despejes de x e y en la última ecuación para obtener − 12
5
z+ 4
5
= 1.
1
Despejamos z y conseguimos z = − 12 . Al reemplazar esta información en los despejes de x e y, obtenemos
1
x= 3
ey = − 12 . Por lo tanto, el único vector solución de este sistema es ( 31 , − 12 , − 12
1
). Concluimos que el
sistema es compatible determinado.
2. Consideremos ahora el sistema: 


 x − y + 3z = 0

x + y − 2z = 0



 2x + z = 0
Este sistema es homogéneo, por lo que seguro es compatible. Debemos determinar si es determinado (única
solución (0, 0, 0)) o indeterminado. De la tercera ecuación, despejamos z = −2x. Al reemplazar esta información
en la segunda: 5x + y = 0, de donde y = −5x. Finalmente, si reemplazamos estos despejes en la primera
ecuación: x − (−5x) + 3(−2x) = 0; es decir, 0 = 0. Como no hay más restricciones para imponer, entonces la
variable x queda libre, por lo que un vector de la forma (x, −5x, −2x) es solución del sistema, para cualquier
x ∈ R. Por ejemplo, (1, −5, −2) verifica las tres ecuaciones. El sistema es compatible indeterminado.
3. Consideremos finalmente el sistema: 


 x + 2z = 1


 y−z =1

 x + y + 3z = 6





 2x − 3y + z = −4.
De la primera ecuación, x = 1 − 2z y, de la segunda, y = 1 + z. Si reemplazamos esta información en la tercera

ecuación, hallamos 2 + 2z = 6, de donde z = 2. Por lo tanto, x = −3 e y = 3. Debemos verificar que el vector
(−3, 3, 2) es solución también de la última ecuación; pero 2(−3) − 3,3 + 2 = −13 6= 4. Por lo tanto, el sistema
es incompatible.

Introducimos los sistemas de ecuaciones lineales y estudiamos métodos “a mano” para resolverlos de manera directa.
Definimos lo que significa que dos sistemas sean equivalentes (que tengan las mismas soluciones) y vimos algunas
operaciones que se pueden realizar sobre las ecuaciones de un sistema para obtener otros sistemas equivalentes al
original.
Clasificamos los sistemas de ecuaciones lineales en compatibles determinados (poseen una única solución), compati-
bles indeterminados (poseen infinitas soluciones) e incompatibles (no poseen solución).

Álgebra A. Matrices. 121
5.2 Matrices
Vamos ahora a estudiar cómo mecanizar el problema de clasificar y/o resolver sistemas de ecuaciones lineales.
Las matrices de coeficientes reales.

Cómo utilizar matrices para clasificar y resolver sistemas de ecuaciones lineales usando el método de triangulación.

5.2.1 ¿Qué es una matriz?
A grandes rasgos, una matriz es un “arreglo rectangular de números” como en el siguiente caso:
 
2 4 −1 − 12
 √ 
2 −5 
 
 0 3
 
−12 52 0 1
Este arreglo tiene tres filas y cuatro columnas. En cada cruzamiento entre una fila y una columna hay un número,
que se llama entrada (no pueden quedar “huecos” vacíos). Por lo tanto, una matriz de n filas y m columnas siempre
tiene nm entradas. En este caso, tenemos 12 entradas. La manera de especificar una entrada determinada es dando
su ubicación en el arreglo, es decir, a qué fila y columna pertenece. En este ejemplo, la entrada 1 − 2 (primera fila,
segunda columna) es el número 4 y la entrada 3 − 3 (tercera fila, tercera columna), es el número 0. Si recordamos
lo visto en el apartado anterior, esta manera de especificar una entrada en una matriz es la misma que utilizamos
para especificar un coeficiente en un sistema de ecuaciones lineales. Esto, por supuesto, no es casualidad. Entonces,
¿cómo podemos escribir genéricamente una matriz de n filas y m columnas? De la siguiente manera:
 
a11 a12 a13 ··· a1m−1 a1m
 
 a21 a22 a23 ··· a2m−1 a2m 
 
.. .. .. .. ..
 
 

 . . . . . 

 
 an−11 an−12 an−13 · · · an−1m−1 an−1m 
 
an1 an2 an3 ··· anm−1 anm
Aquí, el símbolo aij representa la entrada i − j; es decir, el número en la i-ésima fila y j-ésima columna (como
hacíamos para los coeficientes de los sistemas lineales). Como hay n filas y m columnas entonces i toma los valores
entre el 1 y el n, y j los valores entre 1 y m. Una matriz de n filas y m columas se llama, abreviadamente, una
matriz de n × m. En este libro solo estudiaremos matrices donde las entradas son número reales. El conjunto de
todas las matrices de n × m con entradas reales se nota Rn×m y comenzaremos a escribir A ∈ Rn×m para decir
que A es una matriz de n filas y m columnas.
Ejemplo 48 Al pensarlas como “arreglos rectangulares”, las matrices pueden tener muchas formas. El ejemplo que
dimos antes el resultado es un rectángulo “acostado”; es decir, de más columnas que filas. Pero podemos tener una
matriz con la forma de un rectángulo “parado”: por ejemplo, la siguiente matriz de 4 filas y 2 columnas:
 
4 −1
 √ 
 3 2 
 
 
 5 
 2 0 
 
0 −3
También, una matriz puede tener una única fila (o una única columna). En el primer caso, la matriz se parece a un vector
(sin las comas entre los coeficientes); y en el segundo caso, a un vector parado:
 
3
 
 −5 
 
2 .
2 1 −3 3 0 
 
 0 
 
7
La matriz de la derecha se encuentra en R1×5 y la de la derecha en R4×1 . Finalmente, un tipo especial de matriz es la
matriz cuadrada: las que tienen igual cantidad de filas que de columnas. Más adelante veremos que este tipo de matrices
son muy importantes en la teoría de sistemas de ecuaciones lineales.
Analicen qué representan las matrices de R1×1
5.2.2 ¿Cómo se relacionan las matrices con los sistemas lineales?
De forma muy sugerente, la especificación de entradas de una matriz es la misma que la de los coeficientes de un
sistema de ecuaciones lineales, por lo que no debería sorprendernos que lo que haremos será ubicar a los coeficientes
del sistema en una matriz (respetando su ubicación como coeficiente) y trabajar directamente (y solamente) con
la matriz. Retomemos el ejemplo utilizado en el apartado anterior para resolver un sistema de ecuaciones lineales
usando el método de eliminación. 
 x + 2y = 5
 2x − 3y = −1
En esa ocasión, multiplicamos la primera ecuación por −2 y, después, la sumamos a la segunda ecuación para
obtener una ecuación que no tuviera la incógnita x (la eliminamos). Si lo pensamos gráficamente sucede lo siguiente:
después de multiplicar la primera ecuación por −2 obtenemos el sistema equivalente:

 −2x − 4y = −10
 2x − 3y = −1
Ahora bien, cuando sumamos, lo que hacemos es sumar los coeficientes correspondientes a las x, por un lado,
primero, a los correspondientes a las y, por otro, y a los coeficientes libres, por otro.
−2x + (−4)y = −10

+ ↓ ↓ ↓
2x + (−3)y = −1 .
↓ ↓ ↓
0x + (−7)y = −11
Cabe destacar que, en realidad, en este esquema geométrico de la suma de las ecuaciones, no estamos realmente
utilizando las incógnitas x e y, solo los coeficientes que las acompañan. Esto se debe a que, dentro de cada ecuación,
hemos escrito a los términos que contienen la variable x “a la izquierda” y los que contienen a las variable y “a la
derecha”; por lo cual se podría simplemente decir: “sumemos entre sí los términos que se encuentran en la columna
de la izquierda (en cada ecuación) y entre sí lo que se encuentran en la columna de la derecha (en cada ecuación)”.
De la misma forma, si tuviéramos un sistema con dos ecuaciones y tres incógnitas x, y, z. A cada ecuación, la
vamos a escribir de manera que el término de las x lo ubicaremos siempre primero (de izquierda a derecha), seguido
del de las y y, por último, el de las z. Entonces, cuando sumemos las ecuaciones, alcanza con sumar el primero
coeficiente de la primera ecuación con el primero de la segunda (y el resultado va a ser el coeficiente que acompañe
a la incógnita x en la nueva ecuación), el segundo coeficiente de la primera ecuación con el segundo de la segunda
(que será el coeficiente que acompañe al de las y en la nueva ecuación) y el tercero de la primera con el tercero de la
segunda (el coeficiente que acompañe a z). Por supuesto, “del otro lado del igual” sumamos los coeficientes libres
entre sí. Por ejemplo, si queremos sumar las ecuaciones del sistema:

 −x + 3y − 4z = 1
 2x − 2y + z = −2
podemos olvidarnos de las variables y escribir:
−1 + 3 + (−4) = 1
+ ↓ ↓ ↓ ↓
2 + (−2) + 1 = −2 ,
↓ ↓ ↓ ↓
1 + 1 + (−3) = −1
de donde obtenemos que la nueva ecuación es x + y − 3z = −1. Esta manera de ver la suma de ecuaciones pone en
evidencia la relación entre los sistemas lineales y las matrices: para resolver un sistema lineal podemos utilizar el
método de eliminación (que consiste en multiplicar las ecuaciones por números no nulos y sumar las ecuaciones
entre sí); y si acomodamos las variables en orden, no necesitamos representar las incóngnitas para hacer estas
operaciones, nos alcanza con los coeficientes. Por lo tanto, podemos condensar la información de un sistema de
ecuaciones lineales en una matriz, la matriz de los coeficientes del sistema, y trabajar más cómodamente solo con
estos números. Veamos esto en un ejemplo. Consideremos nuevamente el sistema:

 x + 2y = 5
 2x − 3y = −1
Aquí tenemos a la variable x ubicada en la primera posición (empezando desde la izquierda) de todas las ecuaciones.
Al considerar todas las ecuaciones al mismo tiempo podemos decir que las x están en la primera columna del
sistema. Por otro lado, las y quedan necesariamente en la segunda ecuación del sistema, y los coeficientes libres en
una tercera columna (del otro lado del igual). Por lo tanto, podemos asignarle a este sistema la siguiente matriz
ampliada:  
1 2 5
 
2 −3 −1
Aquí, la barra | que separa la segunda y tercera columna de la matriz está marcando que la columna a la derecha
corresponde a los coeficientes “del otro lado del igual”; es decir, los que no son coeficientes de ninguna incóngnita.
Esta matriz se llama la matriz ampliada asociada al sistema. El término “ampliada” proviene del hecho de que es
una matriz con los coeficientes del sistema y además con los coeficientes libres (que se anotan del otro lado de la
barra). La matriz sin los coeficientes libres es lo que se conoce como matriz asociada al sistema (a secas). Más
adelante, veremos que la información pertinente del sistema está contenida en la matriz del sistema. ¿Cómo se lee la
matriz ampliada en relación con el sistema de ecuaciones lineales original? Pues como lo armamos:
Cada fila corresponde a cada ecuación del sistema: está formada por los coeficientes que acompañan a las
incógnitas (y los coeficientes libres en el caso de la ampliada).
Las entradas en la misma columna corresponden a los coeficientes de la misma incógnita.
La barra vertical nos está diciendo que las entradas a la derecha de la barra son los que corresponden a los
coeficientes libres del sistema.
Por ejemplo, si nos dan la matriz:  
−3 4 0
 
11 −1 −2
entonces estamos pensando en el sistema:

 −3x + 4y = 0
 11x − y = −2.
De esta manera, podemos ir de la teoría de sistema de ecuaciones lineales a la teoría de matrices, y viceversa. Pero
¿para qué quisimos lograr esto? Porque de esta manera, las operaciones entre las ecuaciones se transforman en
operaciones entre las filas de la matriz. En efecto, multiplicar una ecuación por un número real no nulo equivale
a multiplicar la fila correspondiente a dicha ecuación por este número (donde multiplicar una fila por un número
consiste simplemente en multiplicar por dicho número cada entrada de esa fila únicamente), y sumar dos ecuaciones
corresponde a sumar las dos filas correspondientes a esas ecuaciones (sumando las entradas en la misma columna
entre esas dos filas). De esta manera, queda mecanizado el método de eliminación. Partamos una vez más de la
ecuación: 
 x + 2y = 5
 2x − 3y = −1
La matriz asociada a este sistema es:  

1 2 5
 
2 −3 −1
Cuando resolvemos por eliminación este sistema, primero multiplicamos por −2 la primera ecuación. En este
contexto, debemos multiplicar por −2 la primera fila. Así, obtenemos:
 
−2 −4 −10
 
2 −3 −1
Finalmente, sumamos las dos ecuaciones resultantes y reemplazamos la segunda ecuación por la suma de las
dos ecuaciones que teníamos. En este caso, dicha operación entre ecuaciones corresponde a sumar ambas filas y
reemplazar la fila 2 por esta suma. De esta manera, obtenemos:
 
−2 −4 −10
 
0 −7 −11
En función de los trabajado en el apartado anterior sobre sistemas de ecuaciones equivalentes, esta matriz corresponde
a un sistema de ecuaciones lineales que es equivalente al original. Observemos, de hecho, que la ecuación que se
desprende de la segunda fila de la matriz es precisamente −7y = −11, como habíamos despejado originalmente.
Por lo tanto, el sistema asociado a esta matriz es:

 −2x − 4y = −10
 −7y = −11
que ya vimos que es más fácil de resolver. El procedimiento utilizado recién se puede notar:
   
1 2 5 multiplicar fila 1 por 2 −2 −4 −10
  −−−−−−−−−−−→   −→
2 −3 −1 2 −3 −1
 
reemplazar fila 2 por fila 1+fila 2 −2 −4 −10
−−−−−−−−−−−−−−−−−→  .
0 −7 −11
Por lo tanto, al hacer operaciones de filas en la matriz asociada a un sistema, encontramos otro sistema equivalente
al original. Para terminar con este apartado, vamos a mostrar cómo se puede llevar “hasta el final” esta metodología
de hacer operaciones en las filas de una matriz para resolver completamente el sistema original. Retomemos donde
dejamos la matriz:  
−2 −4 −10
 
0 −7 −11
Ahora, multipliquemos la segunda fila por − 17 :
 
−2 −4 −10
 
11
0 1 7
Mutipliquemos ahora la segunda fila por 4:

 
−2 −4 −10
 
44
0 4 7
y a continuación reemplacemos la primera fila por la suma de ambas filas:

 
−2 0 − 26 7 

44
0 4 7
Finalmente, multiplicamos la primera fila por − 12 y, la segunda, por 41 , para obtener:

 
1 0 13 7 

0 1 11 7
Pero, ¿cuál es el sistema asociado a esta matriz? Simplemente, es el siguiente:


 x = 13
7
 y = 11
7
Es decir, ¡usando operaciones de fila en la matriz ampliada asociada al sistema hemos resuelto completamente el
sistema! La notación del procedimiento que hicimos fue la siguiente:
   
1 2 5 multiplicar fila 1 por 2 −2 −4 −10
 − −−−−−−−−−−→   −→
2 −3 −1 2 −3 −1
 
reemplazar fila 2 por fila 1+fila 2 −2 −4 −10
−−−−−−−−−−−−−−−−−→   −→
0 −7−11
   
mult. fila 2 por − 71 −2 −4 −10 mult. fila 2 por 4 −2 −4 −10
−−−−−−−−−−→  − −−−−−−−→   −→
11 44
0 1 7 0 41 7
   
26 13
reempl. fila 1 por fila 1+fila 2 −2 0 − 7  mult. fila 1 por − 1
2
1 0 7 
−−−−−−−−−−−−−−−→  −−−−−−−−− −→  .
44 y fila 2 por 1 11
0 4 7
4 0 1 7
En el siguiente apartado veremos que en este procedimiento hemos hecho un montón de cuentas y pasos de más de
los que realmente necesitamos (en este ejemplo concreto, con cuatro pasos puede obtenerse la matriz final). Lo
hicimos de esta manera para poner en evidencia las ideas que existen detrás de este método de resolución.
5.2.3 Triangulación de matrices
En este apartado, se establecerán las bases de la mecanización de la resolución de sistemas de ecuaciones lineales,
utilizando matrices. A este proceso se denomina triangulación de la matriz.
Más arriba vimos que la idea para resolver un sistema de ecuaciones lineales era contruir la matriz asociada al
sistema y realizar operaciones entre las filas hasta hallar una matriz que represente un sistema de ecuaciones
equivalente, más sencillo para resolver. Pero ¿qué tanto más sencillo? Al final del apartado anterior, vimos cómo
obtener una matriz con unos “1” en la diagonal, lo que traducido al campo de las ecuaciones, daba directamente las
soluciones. Esta es, obviamente, la ecuación más útil pero a veces, lograr que una matriz tenga esta forma implica
muchos cómputos. Existe una situación intermedia en la que no hay que hacer tantas operaciones de fila pero, sin
embargo, la matriz que obtenemos nos provee un sistema fácil de terminar de resolver. Para ver cuál es, consideren
el siguiente sistema: 


 2x − 3y + 2z = 4

−y + 5z = −13


 3z = −9

Este es un sistema de tres ecuaciones y tres incógnitas x, y, z. Tiene la peculiaridad que, en la segunda ecuación, no
aparece la variable x (o, en realidad, el coeficiente a21 que acompaña a la variable x en la segunda ecuación es 0)
y en la tercera ecuación no aparecen ni la variable x ni la y (los coeficientes a31 y a32 son 0). Notemos que este
sistema puede resolverse por sustitución de manera directa. En efecto, de la última ecuación simplemente podemos
despejar z = −3 y reemplazar esto en la segunda ecuación para obtener −y + 5(−3) = −13, de donde podemos
despejar y = 2. Finalmente, al reemplazar por z = −3 e y = 2 en la primera ecuación, obtenemos 2x − 6 − 6 = 4,
de donde x = 8. ¿Cómo es la matriz (no ampliada) asociada a un sistema de esta forma? En nuestro ejemplo:
 
2 −3 2
 
 0 −1 5 
 
 
0 0 3
Veamos que debajo de la diagonal formada por las entradas a11 , a22 , a33 hay solo ceros. Esta diagonal (de arriba a
la izquierda a abajo a la derecha), se llama diagonal principal de la matriz. Una matriz de esta forma se denomina
matriz triangular, pues debajo de la diagonal queda gráficamente un triángulo de ceros. Llevamos nuestra matriz
del sistema a una matriz triangular, en consecuencia obtenemos un sistema que es muy directo de resolver (como
explicamos recién mediante el método de sustitución). Por este motivo el método de resolución que vamos a
desarrollar se llama triangulación: porque vamos a “triangular” la matriz es decir, llevarla a una matriz triangular.
5.2.4 ¿Cuáles son las operaciones que podemos hacer con las filas de una matriz?
Antes de empezar a triangular matrices debemos tener en claro cuáles son las operaciones que podemos aplicar a las
filas de una matriz de manera tal que, los sistemas asociados a las nuevas matrices, sigan siendo equivalentes al
sistema original. Ya vimos que es posible multiplicar una matriz por un número no nulo y reemplazar una fila por la
suma de otras filas. Vamos a hacer bien precisas y más generales estas operaciones y, además, incluir la posibilidad
de intercambiar ecuaciones. Estas operaciones se llaman operaciones elementales de fila:
Importante Sea A una matriz de n filas y m columnas y llamemos F1 , . . . , Fn las n filas de A (F1 es la primer
fila, F2 la segunda, etc). Las siguientes operaciones en las filas de A no cambian la equivalencia del sistema de
ecuaciones lineales asociado:
1. Intercambiar dos filas. Para cualquier elección de 1 ≤ i, j ≤ n, cambiamos la matriz A por la matriz B
que es igual a A, salvo que en la fila i de B está la fila Fj de A y en la fila j de B está la fila Fi de A.
2. Multiplicar una fila por un número no nulo. Para cualquier número λ ∈ R distinto de cero y cualquier
elección de 1 ≤ i ≤ n, cambiamos la matriz A por la matriz B que es igual a A, salvo que en la fila i de B
aparece la fila Fi de A multiplicada por λ.
3. Cambiar una fila por ella misma más un múltiplo de otra fila. Para cualquier elección de 1 ≤ i, j ≤ n y
cualquier número λ ∈ R, cambiamos A por la matriz B que es igual a A, salvo que en la fila i de B está la
fila que se arma haciendo la cuenta Fi + λFj (es decir, donde antes estaba la fila Fi en A ahora aparece
dicha fila pero sumado λ veces la fila j de A).

Algunos comentarios importantes. En primer lugar, la primera operación que definimos sobre intercambiar dos filas
de la matriz, que no veníamos utilizando, es la que traduce a este contexto la idea de “intercambiar la posición
de las ecuaciones” en el sistema de ecuaciones. En segundo lugar, ya vimos que multiplicar una ecuación por un
número no nulo no alteraba la ecuación. Esto es precisamente lo que dice la segunda operación. Finalmente, la
tercera operación válida para operar con las filas de una matriz es un poco diferente a lo que veníamos haciendo. El
motivo es que la escribimos de una manera más general (para poder ahorrarnos cuentas a futuro). Vamos a explicar
esto: lo que dice la tercera operación es que podemos reemplazar una fila por “ella misma” sumada a un “múltiplo
de otra fila”. Si repasan el sistema que resolvimos al final del apartado anterior, habíamos comenzado multiplicando
la primera fila por −2 para lograr que apareza un −2 en la entrada a11 con el objetivo de que, al sumar luego las
filas F1 y F2 , se eliminara la entrada en la posición a21 (que era un 2). Pero cabe destacar que, en realidad, no nos
importa poner un −2 en el lugar a11 para que quede allí; solo lo ponemos temporalmente para poder eliminar el
2 de a21 (fíjense de hecho que al final del proceso con la matriz terminamos multiplicando la fila 1 por − 12 para
volver a obtener el 1 que teníamos en a11 al principio). Justamente, la tercera operación que acabamos de definir
nos permite la eliminación del a21 sin modificar la fila F1 . En efecto, lo que podemos hacer es reemplazar la fila
F2 por ella misma más −2 veces la fila F1 . Tengamos en cuenta que esta operación solo afecta la fila F2 . Es decir,
estamos reemplazando F2 por F2 − 2F1 . De esta manera, condensamos dos pasos en uno solo. Esta operación es la
más importante de las tres, ya que es la que nos permitirá eliminar entradas para llegar a triangular la matriz).
Para simplificar la escritura del proceso de triangulación de una matriz, vamos a escribir las diferentes operaciones
de la siguiente manera:
Intercambiar las filas Fi y Fj , se nota Fi × Fj .
Multiplicar la fila Fi por λ, se nota λFi .
Reemplazar la fila Fi por Fi + λFj , se nota Fi → Fi + λFj .
Veamos con un ejemplo el proceso de triangulación de una matriz. Consideremos la matriz:
 
1 2 1
 
 1 −1 3 
 
 
−2 −2 6
Ahora, interpreten las operaciones que le vamos haciendo a la matriz para triangularla.
     
1 2 1 1 2 1 1 2 1
  F →F +(−1)F    
 2 2 1   F3 →F3 +2F1 
 1 −1 3  −−−−−−−−−−→  0 −3 2  −−−−−−−−→  0 −3
 
2 
     
−2 −2 6 −2 −2 6 0 2 8
     
1 2 1 1 2 1 1 2 1
1
2 F3 
  F lF    
 2 3   F3 →F3 +3F2 
−− −→  0 −3 2  −−−−→  0 4  −−−−−−−−→  0 4 .

1 1
     
0 1 4 0 −3 2 0 0 14
Y hemos llegado a una matriz triangulada.
A continuación, explicaremos en detalle el procedimiento que hicimos. Recuerden que el objetivo es lograr ceros
debajo de la diagonal principal. En primer lugar, conseguimos los ceros de la primera columna (debajo de la entrada
a11 ), luego, ceros de la segunda columna (debajo de la entrada a22 ) y así, en adelante. Empezamos buscando poner
un 0 en la posición a21 ; para esto, alcanza con restarle a la fila F2 la fila F1 (ya que las entradas en la columna
1 son 1 para las dos filas). Por lo tanto, le sumamos a la fila F2 la fila F1 multiplicada por −1 (esta es la manera
de restar: sumar multiplicando por −1). Observemos que el resto de las filas quedan iguales: solo modificamos la
fila F2 . A continuación, y siguiendo nuestro plan, necesitamos conseguir un 0 en el lugar a31 , donde hay un −2.
Entonces, podemos sumarle a la fila F3 el doble de la fila F1 : F3 → F3 + 2F1 pues 2F1 tiene un 2 en el primer
lugar y sumado al −2 del primer lugar de F3 nos da el 0 buscado. Bien, hemos conseguido ceros debajo de la
primera columna. Ahora debemos buscar el cero debajo de la segunda columna (hay uno solo que ubicar, el del
lugar a32 ). Pero antes de hacer esto, nosotros hicimos un par de operaciones que nos facilitarán las cuentas por
venir. En efecto, la siguiente operación llevada a cabo es multiplicar la fila F2 por 12 . El objetivo es simplificar
los números de la matriz: como todas las entradas de la fila F3 eran múltiplos de 2 podemos dividir todos por 2
y obtener números más pequeños. Además de este ajuste, también hacemos el intercambio de filas F2 y F3 . El
objetivo de este intercambio es dejar un 1 en la posición a22 , de manera tal que nos permita que la última operación,
que ubica un 0 en la posición a32 , sea F3 → F3 + 3F1 . Cabe destacar que si hubiéramos querido conseguir un cero
en dicha posición sin intercambiar las filas, tendríamos que haber utilizado la siguiente operación:
   
1 2 1 1 2 1
  F →F + 1 F  
 3 3 3 2 
 0 −3 2  −−−−−−−−→  0 −3 2  .
 
   
14
0 1 4 0 0 3
Al intercambiar filas, evitamos hacer cuentas con fracciones. Finalmente, conseguimos un 0 en la posición a32 al
reemplazar la última fila por ella misma más tres veces la segunda (observemos que tener un 1 en la posición a22
hace que esta operación sea directa y no involucre fracciones). Tengamos en cuenta que, si bien ya obtuvimos la
1
matriz triangulada, podemos multiplicar la fila 3 por 14 para obtener una matriz con unos (1) en la diagonal (para la
que sería mucho más fácil de resolver el sistema lineal asociado).
En los ejemplos presentados, triangulamos matrices de 2 × 2 y 3 × 3, que son casos de matrices cuadradas. El
proceso de triangulación puede llevarse a cabo para cualquier tipo de matriz (aunque no sea cuadrada), pero el
concepto de qué significa una matriz triangular que no sea cuadrada quizá no esté claro aún. Por esta razón, a
continuación, precisaremos las nociones de triangulación.
Definición 47 Sea A ∈ Rn×m .
La diagonal determinada por las entradas a11 , a22 , etc... se llama diagonal principal de la matriz.
A se dice triangular si solo hay ceros debajo de la diagonal principal; es decir, las entradas aij son 0 para
i > j.
Álgebra A. Resolución y clasificación de sistemas de ecuaciones lineales. 129
Observación 21 La diagonal principal es la diagonal que empieza en la entrada que está en la primera fila y
en la primera columna, y que se mueve hacia la derecha y hacia abajo en cada paso. Si la matriz no es cuadrada,
no va a terminar en la esquina inferior derecha: si A tiene más filas que columnas, la diagonal se “choca con el
piso de la matriz”; si tiene más columnas que filas, se “choca con el paréntesis derecho de la matriz”.
Es importante tener en cuenta que consideramos que una matriz es triangular si tiene los ceros debajo de la diagonal
independientemente de las entradas que tenga en la diagonal o arriba de ella (podría tener ceros (0) en la diagonal
principal, o arriba de ella). Cerramos este apartado, dando ejemplos de triangulación de varios tipos de matrices.
Ejemplos 49 Las siguientes matrices están trianguladas:
1. A ∈ R2×5 dada por:  

4 3 −2 0 −2
A= 
1
0 3 3
−1 − 72
2. B ∈ R4×3 dada por:  
2 1 −3
 
0 −6 − 38 
 
B=



0 0 5 
 
0 0 0
5×5
3. C ∈ R dada por:  
3 1 −2 0 2
 √ 
0 −6 2 π 8
 
 
C = 0
 
0 0 4 4
 
 
0 0 0 13 21
 
0 0 0 0 54

Definimos una matriz con entradas reales.

Analizamos cómo asociar una matriz a un sistema de ecuaciones lineales: la matriz de coeficientes del sistema.
Estudiamos cómo triangular una matriz: llevarla a una matriz triangular (con ceros debajo de la diagonal principal)
utilizando las operaciones de filas permitidas (que no alteran la equivalencia de los sistemas de ecuaciones lineales
asociados a estas matrices).

5.3 Resolución y clasificación de sistemas de ecuaciones lineales
Para resolver y clasificar sistema de ecuaciones lineales, retomemos los aspectos teóricos que acabamos de
desarrollar. Veremos que, para clasificar un sistema, no necesitamos calcular las soluciones: al terminar el proceso
de triangulación de la matriz, será posible determinar de qué tipo se trata.
Cómo resolver y clasificar sistemas de ecuaciones lineales mediante el método de triangulación.

Cómo resolver sistemas con parámetros.

5.3.1 Resolución de sistemas de ecuaciones lineales
A continuación, mostraremos cómo se resuelven algunos sistemas de ecuaciones lineales mediante el método de
triangulación. Comencemos por el siguiente sistema:

 x − x2 − 2x3 = −1
 1


4x1 + 2x2 − x3 = 0


 2x − 5x + 3x = −2

1 2 3
Construimos la matriz ampliada asociado al sistema:

 
1 −1 −2 −1
 
−1
 
 4 2 0 
 
2 −5 3 −2
Luego, triangulamos:
     
1 −1 −2 −1 1 −1 −2 −1 1 −1 −2 −1
    F lF  
 F2 →F2 −4F1   2 3 
 4 2 −1 0  −−−−−−−−→  0 −7 4  −−−−→  0 −3
 
6 7 0 
  F3 →F3 −2F1    
2 −5 3 −2 0 −3 7 0 0 6 −7 4
 
1 −1 −2 −1
 
F →F +2F2 
−−3−−−3−−−→ −3

 0 7 0 
 
0 0 7 4
El sistema asociado a esta matriz triangulada es:

 x − x2 − 2x3 = −1
 1


−3x2 + 7x3 = 0



 7x = 4
3
De la última ecuación podemos despejar x3 = 47 . Si reemplazamos esta igualdad en la segunda ecuación, obtenemos
−3x2 + 7( 74 ) = 0; donde podemos despejar x2 = 43 . Finalmente, reemplazando en la primera ecuación los valores
4 4 4 8 31
hallados para x2 y x3 , obtenemos x1 − 3 −2· 7 = −1; donde x1 = −1 + 3 + 7 = 21 . Por lo tanto, el sistema es
31 4 4
compatible determinado y su única solución es ( 21 , 3 , 7 ).
Consideremos ahora el siguiente sistema:

 x + x2 − 2x3 + x4 = −2
 1


3x1 − x2 + x3 + 5x4 = 3


 x − x + x + 2x = 2

1 2 3 4
Construimos la matriz ampliada asociado al sistema y triangulamos:

   
1 1 −2 1 −2 1 1 −2 1 −2
   
 F2 →F2 −3F1 
 3 −1 1 5 3  −−−−−−−−→  0 −4 9  −→
 
7 2
  F3 →F3 −F1  
1 −1 1 2 2 0 −2 3 1 4
   
1 1 −2 1 −2 1 1 −2 1 −2

F2 lF3 
  
 F3 →F3 −2F2 
−−−−→  0 −2 −−−−− − −−→ −2

3 1 4   0 3 1 4 
   
0 −4 7 2 9 0 0 1 0 1
Ahora, armamos el sistema asociado a esta matriz triangulada:


 x + x2 − 2x3 + x4 = −2
 1


−2x2 + 3x3 + x4 = 4



 x =1
3
La última ecuación nos dice x3 = 1. Al reemplazar esta información en la segunda ecuación hallamos que
−2x2 + 3 + x4 = 4, donde podemos despejar x4 = 2x2 + 1. Esto nos dice que x4 depende de x2 (por lo que
si conocemos x2 , el valor de x4 quedará determinado de manera unívoca). Finalmente, reemplacemos toda la
información que tenemos en la primera ecuación (es decir, x3 = 1 y x4 = 2x2 + 1) para obtener x1 + 3x2 − 1 = −2.
De aquí, podemos despejar x1 = −3x2 − 2. Lo que hemos conseguido hasta aquí es que x3 = 1, y que tanto x1 y
x4 dependen de x2 de cierta manera. Y como no tenemos más ecuaciones que fuercen a x2 a ser algún número en
particular, esto quiere decir que no hay restricciones sobre esta variable. Es decir, para cualquier x2 ∈ R, mientras
que x1 = −3x2 − 2, x3 = 1 y x4 = 2x2 + 1, el vector (x1 , x2 , x3 , x4 ) será solución del sistema. Vale decir, los
vectores que son solución son de la forma (−3x2 − 2, x2 , 1, 2x2 + 1) para cualquier x2 ∈ R. Notemos que podemos
reescribir a un vector de esta forma como x2 (−3, 1, 0, 2) + (−2, 0, 1, 1), como hacíamos en el capítulo 2 al buscar
la ecuación vectorial de una recta a partir de su ecuación implícita. En general, escribiremos la solución de un
sistema compatible indeterminado de esta manera. Formalmente, el conjunto de soluciones del sistema es entonces
{λ(−3, 1, 0, 2) + (−2, 0, 1, 1) : λ ∈ R}. Por supuesto, se trata de una recta en R4 .
Veamos otro ejemplo. Consideremos ahora el sistema:

 x + x2 + x3 − 2x4 + x5 = 1
 1


x1 − 3x2 + x3 + x4 + x5 = 0


 3x − 5x + 3x + 3x

= 0
1 2 3 5
Armemos la matriz asociada y triangulemos:
   
1 1 1 −2 1 1 1 1 1 −2 1 1
   
 F2 →F2 −F1 
−3 1 0  −−−−−−−−→  0 −4 0 −1  −→
 
 1 1 1 0 3
  F3 →F3 −3F1  
3 −5 3 0 3 0 0 −8 0 6 0 −3
 
1 1 1 −2 1 1
 
F →F −2F2 
−−3−−−3−−−→ −4 0 −1 

 0 0 3
 
0 0 0 0 0 −1
Aquí obtenemos una contradicción en la ecuación asociada a la última fila: 0 = −1. Por lo tanto, el sistema original
es incompatible.
Resolver sistemas de ecuaciones homogéneos es un poco más sencillo que sistemas no homogéneos porque no
hace falta ampliar la matriz con una columna de términos independientes. Esto se debe a que ninguna operación
elemental de filas altera una columna de ceros “0”, y pueden chequearlo ustedes mismos. Veamos entonces como
resolver un sistema homogéneo.

 x + x2 + x3 + x4 = 0
 1


x1 + 3x2 + 2x3 + 4x4 = 0


 2x + x − x = 0

1 3 4
Armamos la matriz (no ampliada) asociada y triangulamos:

     
1 1 1 1 1 1 1 1 1 1 1 1
     
 F2 →F2 −F1   F3 →F3 +F2 
4  −−−−−−−−→  0 3  −−−−−−−→  0
 
 1 3 2 2 1 2 1 3 
  F3 →F3 −2F1    
2 0 1 −1 0 −2 −1 −3 0 0 0 0
El sistema asociado a esta última matriz es:


 x +x +x +x =0
1 2 3 4
 2x + x + 3x = 0
2 3 4
De la segunda ecuación podemos despejar x3 = −2x2 − 3x4 ; y al reemplazar esta igualdad en la primera
ecuación obtenemos x1 + x2 + (−2x2 − 3x4 ) + x4 = 0. Es decir, x1 − x2 − 2x4 = 0. Al despejar, por ejemplo,
x1 = x2 + 2x4 , tenemos que x1 y x3 dependen de x2 y x4 , y estas últimas incógnitas no tiene restricciones. Por
lo tanto, los vectores de R4 que son solución del sistema son de la forma (x2 + 2x4 , x2 , −2x2 − 3x4 , x4 ) con
x2 , x4 ∈ R cualesquiera. Este vector lo escribimos como x2 (1, 1, −2, 0) + x4 (2, 0, −3, 1), por lo que el conjunto
de soluciones es {λ(1, 1, −2, 0) + µ(2, 0, −3, 1) : λ, µ ∈ R}. Observemos que, geométricamente, los vectores que
son solución pertenecen a un plano que pasa por el origen.
Finalmente, consideremos el siguiente sistema:



 −x + 2z = 0



 2x + 2y + 3z = 0


 2y = 0



 x+y+z =0
Y resolvemos por triangulación:

   
−1 0 2 −1 0 2
   
2 −3  F2 →F2 +2F1  0
   
 2 2 1 
  −−−−−−−−→   −→
2 0  F4 →F4 +F1  0
   
 0 2 0 
   
1 1 1 0 1 3
   
−1 0 2 −1 0 2
   
   
F3 →F3 −F2  0 2 1  F4 →F4 + 52 F3  0 2 1 
−−−−−−−1−→   −−−−−−−−→  
F4 →F4 − 2 F2  0 0 −1  0 −1 
   
 0
   
0 0 25 0 0 0
De este modo, hemos arribado a una matriz triangular. Vemos que la última ecuación ha desaparecido (poniendo en
evidencia que era una ecuación que se deducía de las otras, por lo que no introducía nuevas restricciones al sistema).
El sistema asociado a esta última matriz (que sabemos que es equivalente al original) es:



 −x + 2z = 0

2y + z = 0


 −z = 0

De aquí es fácil despejar que la única solución es (x, y, z) = (0, 0, 0).

5.3.2 Clasificando sistemas de ecuaciones lineales
Solo consideraremos sistemas de igual cantidad de ecuaciones que de incógnitas.

Supongamos que tenemos un sistema S, que armamos la matriz asociada (ampliada) al sistema y que la triangulamos.
Trabajemos con el siguiente ejemplo de matriz triangulada:
 
2 7 −1 4
 
A= 0 5 2
 
2 
 
0 0 −8 −7
Por lo que el sistema asociado es: 


 2x + 7y − z = 4

5y + 2z = 2


 −8z = −7

Anteriormente, arribamos a sistemas como este último y observamos que es posible ir despejando las variables
“de abajo hacia arriba” (primero z, después y y finalmente x) de manera de obtener una única solución al sistema.
Estamos en condiciones de hacerlo porque las entradas en la diagonal principal de la matriz son no nulas. Esto nos
permite “pasar dividiendo” cada uno de los coeficientes que multiplican a las incógnitas (si fuesen 0, no podríamos
hacer dicha división). Tengamos en cuenta que no importa cuáles son los términos independientes del sistema; este
despeje siempre se puede hacer. Esto nos indica que la información sobre si el sistema es compatible determinado
está contenida en la matriz no ampliada del sistema. Con lo visto recién podemos arribar a la primera conclusión.
Importante Si tenemos un sistema de ecuaciones lineales de igual cantidad de ecuaciones que de incógnitas
y, al triangular la matriz no ampliada asociada al sistema, todos los términos de la diagonal principal son no
nulos, entonces el sistema es compatible determinado (independientemente de cuales sean los coeficientes
independientes).
De esta manera, es posible clasificar (en parte) un sistema sin necesidad de calcular las soluciones del mismo:
triangulamos la matriz asociada al sistema y vemos si aparece algún 0 en la diagonal principal. Si no aparece
ninguno, el sistema es compatible determinado. Veamos entonces qué podemos decir si aparece un 0 en dicha
diagonal. Supongamos que la matriz triangulada asume alguna de las siguientes formas:
     
0 1 −1 a 2 7 −1 a 2 7 −1 a
     
A1 =  0 2 1 b  A2 =  0 0 1 b  A3 =  0 5 2
     
b 
     
0 0 3 c 0 0 3 c 0 0 0 c
Aquí hemos puesto coeficientes independientes genéricos a, b, c ∈ R. A1 tiene un 0 en la primera entrada de la
diagonal (coeficiente a11 ), A2 tiene un 0 en la segunda entrada de la diagonal a22 y A3 en la última a33 . Observemos
qué sucede en cada caso y analicemos en primer lugar, el caso de A3 . Aquí, el sistema asociado es:



 2x + 7y − z = a

5y + 2z = b



 0=c
Notemos que caben dos posibilidades:

Si c = 0, entonces, la última fila desaparece y nos queda una matriz con una fila menos. En este caso, el
sistema asociado es: 
 2x + 7y − z = a
 5y + 2z = b
b−5y
Si despejamos z de la segunda ecuación obtenemos z = 2 ; y al reemplazar con esta información en
la primera ecuación obtenemos 2x + 7y − b−5y 2 = a. Al reordenar, 2x + 19y b
2 = a + 2 . A partir de esto,
podemos despejar x y hallar x = a2 + 4b − 19y

4 . Y ya no nos quedan más ecuaciones para despejar y. Es decir,
hemos hallado que z depende de y y que x depende de y, pero no hay restricciones para y. Por lo tanto, para
19y b−5y
cada y ∈ R podemos armarnos una solución de la forma ( a2 + b
4 − 4 , y, 2 ), entonces, hay infinitas
soluciones.
Si c 6= 0, entonces, llegamos a una contradicción, lo que nos indica que el sistema no tiene ninguna solución.
Por lo tanto, es incompatible.
Veamos que sucede con el caso de A2 . Tengamos en cuenta que podemos “seguir triangulando” la matriz A2
para obtener un sistema mucho más sencillo que el que nos da directamente. En efecto, haciendo el reemplazo
F3 → F3 − 3F2 , obtenemos:  
2 7 −1 a
 
A2 =  0
 
0 1 b 
 
0 0 0 c − 3b
Aquí nuevamente caben dos posibilidades:
Si c − 3b = 0, entonces, desaparece la última fila y el sistema asociado queda:

 2x + 7y − z = a
 z=b
Al reemplazar por z = b en la primera ecuación, obtenemos 2x + 7y − b = a, a partir de la cual tenemos

−7y+a+b
x= 2 . Nuevamente, y queda a libre elección y el sistema tiene infinitas soluciones.
Si c − 3b 6= 0 entonces el sistema es incompatible.
Finalmente, en el caso de A1 , también podemos seguir triangulando y simplificar la matriz haciendo :
   
0 1 −1 a 0 1 −1 a
   
 F2 →F2 −2F1 
 0 2 1 b  −−−−−−−−→  0 0 3 b − 2a  −→
 
   
0 0 3 c 0 0 3 c
 
0 1 −1 a
 
F3 →F3 −F2 
−− −−−−−→  0 b − 2a

0 3 
 
0 0 0 c − b + 2a
Otra vez, analizamos las dos posibilidades.
Si c − b + 2a = 0, nuevamente perdemos una ecuación y nos quedará una variable libre. Entonces el sistema
tiene infinitas soluciones.
Si c − b + 2a 6= 0, el sistema es incompatible.
Por lo tanto, concluimos lo siguiente:
Importante Si tenemos un sistema de ecuaciones lineales de igual cantidad de ecuaciones que de incógnitas y,
al triangular la matriz no ampliada asociada al sistema, algún término de la diagonal principal es nulo, entonces
el sistema es compatible indeterminado o incompatible. Para saber de cuál de los dos casos se trata, debemos
analizar el sistema teniendo en cuenta los coeficientes independientes.
Por supuesto que, si el sistema original es homogéneo, entonces nunca puede darse una situación de un sistema
incompatible. En este caso, la clasificación es mucho más sencilla.
Importante Si tenemos un sistema de ecuaciones lineales homogéneo de igual cantidad de ecuaciones que de
incógnitas y triangulamos su matriz asociada, se pueden presentar las siguientes situaciones:
Si ninguna entrada de la diagonal principal es nula, entonces, el sistema es compatible determinado.
Si alguna entrada de la diagonal principal es nula, entonces, el sistema es compatible indeterminado.

5.3.3 Sistemas con parámetros
Los sistemas con parámetros son sistemas lineales donde no se conocen todos los coeficientes del sistema; esto es,
uno o más coeficientes no están determinados, ya que son variables. Veamos cómo resolver y clasificar sistemas con
parámetros por medio de varios ejemplos. Comencemos el siguiente sistema:

 x + kx2 + x3 = 0
 1


2x1 + x3 = 0



 2x + kx + kx
1 2 3 = 0
donde k ∈ R. Los coeficientes a12 , a32 y a33 son desconocidos, aunque sabemos que son todos iguales (son iguales
a cierto número real k). Para resolver el sistema, seguimos los mismos pasos que aprendimos: en primer lugar,
armamos la matriz asociada al sistema (que en este caso no hace falta ampliarla pues el mismo es homogéneo) y, en
segundo lugar, triangulamos. Al parámetro k lo tratamos como un número real más:
     
1 k 1 1 k 1 1 k 1
    F lF  
 F2 →F2 −2F1   2 3 
1 −−−−−−−−→ 0 −2k −1  −−−−→ 0 −k k − 2 →
 
2 0
  F3 →F3 −2F1    
2 k k 0 −k k−2 0 −2k −1
 
1 k 1
 
F →F −2F2 
−−3−−−3−−−→ −k k−2 

0
 
0 0 −2k + 3
De esta manera hemos arribado a una matriz triangulada. Como vimos en el apartado anterior, si ninguna entrada en
la diagonal es nula entonces el sistema es compatible determinado, independientemente del resto de las entradas de
la matriz. Las únicas maneras de que se anule una entrada de la diagonal es que −k = 0, que anula la entrada a22 ,
o que −2k + 3 = 0, que anula la entrada a33 . En el primer caso, k = 0, y en el segundo, k = 23 . Por lo tanto, ya
podemos concluir que, salvo para los casos k = 0 y k = 32 , el sistema es compatible determinado. Observemos que
no nos importa que en k = 2 se anula la entrada a23 , pues no está en la diagonal y, por lo tanto, no va a influir en el
tipo de sistema. Con este procedimiento, hemos reducido el problema: ya sabemos el tipo de sistema para todo los
valores reales que puede tener k a excepción de estos dos valores puntuales. Como el sistema es además homogéneo,
3
sabemos que para los casos k = 0 y k = 2 el sistema es compatible indeterminado. Tengamos en cuenta que,
simplemente triangulando la matriz, ya podemos clasificar completamente el sistema para cada posible k ∈ R.
Hallemos las soluciones para cada k. Como el sistema es homogéneo, para los casos en los que el sistema queda
compatible determinado, sabemos que la única solución es (0, 0, 0) ∈ R3 . Solo nos resta exhibir las soluciones para
los k que lo hacen indeterminado.
Si k = 0 entonces el sistema original sería:


 x + x3 = 0
 1


2x1 + x3 = 0



 2x
1 = 0
de donde rápidamente podemos despejar que x1 = 0 y x3 = 0. Como x2 no aparece en las ecuaciones

quiere decir que no hay restricciones para esa variable. Por ende, las soluciones de este sistema es el conjunto
{λ(0, 1, 0) : λ ∈ R}. Notemos que, en este caso, el sistema original con k = 0 nos quedó muy fácil de
resolver. Pero esto no tiene porqué ser siempre así. Por eso, hay una manera más eficiente de encarar el
problema de resolver el sistema para un k determinado. Observemos que, cuando triangulamos el sistema
original, “arrastramos” el k por todas las cuentas, ya que como no sabíamos qué número era, lo tratamos como
un número genérico. Esto quiere decir que la triangulación que hicimos con el parámetro k desconocido vale
para cualquier k ∈ R. Por lo tanto, si reemplazamos el k por un valor determinado a en el sistema y después
lo triangulamos, vamos a obtener exactamente la misma matriz que obtuvimos al triangular con el k, solo
que en lugar de k aparecerá a. Con esto queremos decir que, para resolver el sistema con k = 0, podemos
trabajar con la matriz que obtenemos al reemplazar el valor k por 0 en la triangulación. En este caso, la matriz
triangulada quedaría:
 
1 0 1
 
−2
 
0 0
 
0 0 3
y el sistema asociado: 
 x + x3 = 0
 1


−2x3 = 0



 3x
3 = 0
A partir de esto, podemos hallar el conjunto de soluciones como hicimos anteriormente.

3
Si k = 2 entonces el sistema original queda:

 x + 3 x + x3 = 0
 1 2 2


2x1 + x3 = 0


 2x + 3 x + 3 x

= 0
1 2 2 2 3
mientras que la matriz obtenida al reemplazar el valor de k en la matriz triangulada nos deja:
 
3
1 2 1
 
0 − 23 − 12 
 
 
0 0 0
cuyo sistema asociado es: 

 x + 3x + x = 0
1 2 2 3
 −3x − 1x = 0
2 2 2 3
A partir de esto último queda en evidencia la conveniencia de evaluar el k en la matriz triangulada en lugar del
sistema original. La segunda ecuación nos dice x3 = −3x2 , y al reemplazar en la primera ecuación, hallamos
que x1 = − 29 x2 . Las soluciones en este caso son {t(− 92 , 1, −3) : t ∈ R}.
Sigamos ahora con otro ejemplo. Resolvamos el siguiente sistema:


 x + kx2 − x3 = 1
 1


−x1 + x2 + k 2 x3 = −1


 x + kx + (k − 2)x = 2

1 2 3
Cabe destacar que en este sistema, el parámetro k aparece de varias maneras (sólo, restado por 2 y elevado al
cuadrado). Armamos la matriz ampliada y triangulamos.
   
1 k −1 1 1 k −1 1
   
F2 →F 2 +F 1
 −1 1 k2 −1  −−−−−−−→  0 k2 − 1
   
1+k 0 
  F3 →F3 −F1  
1 k k−2 2 0 0 k−1 1
El sistema ya quedó triangulado sin necesidad de más operaciones. La diagonal se anula en k = 1 y k = −1, por lo
cual, para todo k ∈ R distinto de estos valores, el sistema será compatible determinado. Como este sistema no es
homogéneo, no sabemos a priori si para los casos k = 1 y k = −1, el sistema resulta compatible indeterminado o
incompatible. Debemos analizar cada caso por separado.
Si k = −1 entonces al reemplazar en la matriz triangulada obtenemos:
 
1 −1 −1 1
 
 
 0 0 0 0 
 
0 0 −2 1
cuyo sistema asociado es: 

 x −x −x =1
1 2 3
 −2x = 1
3
De aquí despejamos x3 = − 21 y x1 = 1
2 + x2 . Por lo tanto, las soluciones son de la forma (x1 , x2 , x3 ) =
( 12 + x2 , x2 , − 12 ) = x2 (1, 1, 0) + ( 12 , 0, − 21 ), con x2 ∈ R. Es decir, son el conjunto {t(1, 1, 0) + ( 12 , 0, − 12 ) :
t ∈ R}.
Si k = 1 la matriz queda:  
1 1 −1 1
 
 
 0 2 0 0 
 
0 0 0 1
Tengamos en cuenta que la última ecuación del sistema asociado es 0 = 1, lo cual es un absurdo. Esto quiere
decir que, en este caso, el sistema es incompatible.
A veces podemos encontrar parámetros en los coeficientes independientes. Por ejemplo, resolvamos el sistema:



 x1 + kx2 + 2x3 − x4 = k + 2


 x − 7x + x = −4

2 3 4


 x1 + kx2 − 2x3 = 2


 −4x + k 2 x = −3k − 2

3 4
Armamos y triangulamos la matriz:

   
1 k 2 −1 k+2 1 k 2 −1 k+2
   
 0 1 −7 1 −4 −7 −4
   
 F3 →F3 −F1  0 1 1 
  −−−−−−−→   −→
 1 k −2 0 −4 −k
   
2   0 0 1 
   
2 2
0 0 −4 k −3k − 2 0 0 −4 k −3k − 2
 
1 k 2 −1 k+2
 
−7 −4
 
F4 →F4 −F3  0 1 1 
−− −−−−−→  
−4 −k
 
 0 0 1 
 
2
0 0 0 k −1 −2k − 2
Este sistema solo puede anularse en la entrada a44 si k = 1 o k = −1. Analizamos ambos casos.
Si k = −1,la matriz queda:  
1 −1 2 −1 1
 
−7 −4 
 
 0 1 1
 
−4
 
 0 0 1 1 
 
0 0 0 0 0
Como el término independiente −2k − 2 se anula también en −1 el resultado es que se ha anulado una
ecuación, pero no hemos creado ninguna inconsistencia. Es fácil ver ahora que el sistema es compatible
indeterminado.
Si k = 1 la matriz queda:  
1 1 2 −1 3
 
−7 −4 
 
 0 1 1
 
−4 −1 
 
 0 0 1
 
0 0 0 0 −4
En este caso, el término −2k − 2 no se anula en k = 1 por lo que obtenemos una inconsistencia 0 = −4 en
la última ecuación y el sistema resulta incompatible.
Finalmente, supongamos que queremos clasificar un sistema con dos parámetros como el siguiente:



 (a + 1)x + y + z = 1

x + (a + 1)y + z = b


= b2

 x + y + (a + 1)z
Cabe destacar que será necesario considerar todas las posibilidades para a, b ∈ R por separado y ver cómo
interactuan entre sí en cada caso. Armamos entonces la matriz (ampliada) asociada al sistema y triangulamos.
   
a+1 1 1 1 1 1 a+1 b2
  F lF  
 1 3 
b  −−−−→  1
 
 1 a+1 1 a+1 1 b 
   
1 1 a+1 b2 a+1 1 1 1
 
1 1 a+1 b2
 
F2 →F2 −F1 
−− −−−−−→  −a b − b2  −→

0 a
 
a+1 1 1 1
 
1 1 a+1 b2

F3 →F3 −(a+1)F1 

−−−−−−−−−−−→  0 a −a b−b 2  −→

 
0 −a −a2 − 2a 1 − (a + 1)b2
 
1 1 a+1 b2
 
F3 →F3 +F2 
−− −−−−−→  0 a −a b−b 2  −→

 
0 0 −a2 − 3a 1 − (a + 1)b2 + b − b2
Álgebra A. La teoría de matrices. 139
 
1 1 a+1 b2
 
= 0 −a b − b2
 
a 
 
0 0 −a(a + 3) 1 − (a + 2)b2 + b
La diagonal se anula en a = 0 (en dos lugares) y a = −3, por lo cual ya sabemos que si a no es ninguno de esos
números, entonces, el sistema es compatible determinado. Con esto ya hemos reducido drásticamente el problema a
tres posibilidades para el número a. Para b aún estamos considerando todas las posibles opciones. Estudiemos los
distintos casos para a.
Si a = 0 queda:  
1 1 1 b2
 
b − b2
 
 0 0 0 
 
0 0 0 1 − 2b2 + b
Para que el sistema sea compatible debe suceder (al mismo tiempo) b − b2 = 0 y −2b2 + b + 1 = 0. Como
b − b2 = (1 − b)b y −2b2 + b + 1 = −2(b + 12 )(b − 1), entonces, el sistema es compatible solo si b = 1.
Como nos queda una única ecuación (no nula) y tres incógnitas, en este caso, el sistema es (compatible)
indeterminado.
Si a = −3 queda:  
1 1 −2 b2
 
−3 b − b2
 
 0 3 
 
0 0 0 b2 + b + 1
Para que el sistema sea compatible debe suceder b2 + b + 1 = 0. Pero b2 + b + 1 > 0 para todo b ∈ R. Por lo
tanto, en este caso, el sistema es incompatible para todo b.
Arribamos a nuestra respuesta:
El sistema es compatible determinado cuando a 6= 0, −3 y b ∈ R cualquiera.
El sistema es compatible indeterminado cuando a = 0 y b = 1.
El sistema es incompatible cuando a = 0 y b 6= 1, y cuando a = −3 y b ∈ R cualquiera.
Cuando estudiemos “Determinantes”, veremos una manera más directa y mecánica de clasificar sistemas con
parámetros.
Estudiamos cómo resolver sistemas de ecuaciones lineales utilizando el método de triangulación.

Vimos cómo clasificar sistemas de ecuaciones lineales, evaluando la existencia de entradas nulas en la diagonal
principal de la matriz triangulada.
Resolvimos sistemas de ecuaciones lineales con parámetros.

5.4 La teoría de matrices

El conjunto de matrices posee operaciones de suma y multiplicación de matrices y dichas operaciones son también
muy útiles a la hora de resolver sistemas de ecuaciones lineales.
Cómo sumar matrices y multiplicarlas por números reales.

Cómo multiplicar matrices entre sí e interpretar matricialmente los sistemas de ecuaciones.
Cómo calcular la inversa de una matriz inversible y resolver sistemas utilizando la matriz inversa.
El rango de una matriz.

5.4.1 Operaciones con matrices
Así como los vectores de Rn se pueden sumar entre sí y multiplicar por escalares λ ∈ R, las matrices también. Y la
definición es prácticamente la misma: lo hacemos “coordenada a coordenada”.
Definición 48 Sean A, B ∈ Rn×m las matrices:
   
a11 a12 ··· a1m b11 b12 ··· b1m
   
 a21 a22 ··· a2m  b21 b22 ··· b2m
   
 
A=
 .. .. ..

 B=
 .. .. ..


 . . .   . . . 
   
an1 an2 ··· anm bn1 bn2 ··· bnm
y sea λ ∈ R. Definimos la suma entre A y B y la multiplicación de A por λ de la siguiente manera:
 
a11 + b11 a12 + b12 ··· a1m + b1m
 
 a21 + b21 a22 + b22 ··· a2m + b2m
 

• A+B =
 .. .. ..



 . . . 

an1 + bn1 an2 + bn2 ··· anm + bnm
 
λa11 λa12 ··· λa1m
 
 λa21 λa22 ··· λa2m
 

• λA = 
 .. .. ..


 . . . 
 
λan1 λan2 ··· λanm
Es decir, la matriz A + B vuelve a ser una matriz de n filas por m columnas y la entrada ij de esta matriz es la
suma de la entrada ij de la matriz A con la entrada ij de la matriz B. Por otro lado, la matriz λA también vuelve a
ser una matriz en Rn×m cuya entrada ij es la entrada ij de A multiplicada por λ. Es importante remarcar que dos
matrices se pueden sumar solo si tienen el mismo tamaño.
Ejemplos 50
2 3 −1
, ( 0 1 4 ) ∈ R2×3 es:
−1 3 −1
La suma de las matrices −5 0 8
       
2 3 −1 −1 3 −1 2−1 3+3 −1 − 1 1 6 −2
 + = = 
−5 0 8 0 1 4 −5 + 0 0+1 8+4 −5 1 12
2 3

−5 8
El producto de la matriz 1 3 ∈ R4×2 por el número λ = 7 es:
−2 1
     
2 3 7,2 7,3 14 21
     
−5 8 7(−5) 7,8 −35 56
     
7

=
 
=
 


1 3  7,1 7,3  7 21
     
−2 1 7(−2) 7,1 −14 7
Vimos en el capítulo 3, que los subespacios vectoriales en Rn consistían en conjuntos de vectores con la
propiedad que establece que la suma de vectores y el producto de un vector por un escalar daban como
resultado vectores del mismo conjunto. Acabamos de verificar que el conjunto de matrices de n × m también
posee operaciones de suma y producto por escalar. ¿Habrá subconjuntos de matrices que tengan las mismas
propiedades de los subespacios vectoriales de Rn ? ¡La respuesta es sí! Las matrices de Rn×m también poseen
subespacios en este mismo sentido. En realidad, un espacio vectorial genérico es un conjunto de objetos (no
necesariamente vectores de Rn ) con las operaciones de “suma de objetos” y “multiplicación de un objeto por
un escalar” que, además, cumplen ciertas propiedades. Por ejemplo, tomando a las matrices como objetos y
las operaciones que acabamos de definir, se puede mostrar que Rn×m es un espacio vectorial. Si bien en esta
cursada solo estudiamos espacios vectoriales definidos para el caso en el cual los objetos son vectores de Rn ,
la teoría es inmensamente más rica.
Así como existe un vector nulo en Rn , también existe una matriz nula en Rn×m para cada n y m fijos. Esta matriz
se nota 0, y sus entradas son todas 0. Las propiedades de las operaciones de matrices recién introducidas son las
mismas que las de las operaciones para vectores. Las enunciamos a continuación para matrices A, B, C ∈ Rn×m y
λ, λ1 , λ2 ∈ R.
1. A + (B + C) = (A + B) + C
2. A + B = B + A
3. Si λ ∈ R, λ(A + B) = λA + λB
4. Si λ1 ∈ R y λ2 ∈ R, (λ1 + λ2 )A = λ1 A + λ2 A y (λ1 λ2 )A = λ1 (λ2 A)
5. 0 + A = A
6. 1A = A
7. A + (−1)A = 0
8. 0A = 0
Les proponemos corroborar estas propiedades para matrices elegidas al azar (por ejemplo, las matrices en R2×3 del
ejemplo anterior).
5.4.2 Producto de matrices
En este apartado, vamos a definir una manera de multiplicar matrices entre sí, de forma que el resultado de la
multiplicación sea nuevamente una matriz. Por un lado, si bien esta operación guarda alguna correlación con el
producto entre números reales, no comparte la mayoría de las propiedades de la multiplicación que conocemos. Por
ejemplo, no cualesquiera dos matrices pueden ser multiplicadas entre sí (existen ciertas restricciones de tamaño
para poder multiplicar dos matrices). Por otro lado, la matriz que resulta de la multiplicación, no tiene en general
el mismo tamaño que ninguna de ellas. Por último, el producto de matrices no es conmutativo. Por esta razón,
tendremos especial cuidado al trabajar con la multiplicación de matrices.
Comencemos estableciendo cuál es la condición necesaria para poder multiplicar una matriz A con una matriz B.
Lo único que necesitamos es que la cantidad de columnas de A se igual a la cantidad de filas de B, es decir: que
A ∈ Rn×m y B ∈ Rm×r , para algunos n, m, r ∈ N. A partir de la definición de multiplicación de matrices, esta
condición es necesaria.
Definición 49 Sea A ∈ Rn×m y B ∈ Rm×r . Llamemos aij a las entradas de A y bij a las entradas de B.
Entonces, el producto de A con B es la matriz A · B ∈ Rn×r , cuya entrada en el lugar ij es el número
ai1 b1j + ai2 b2j + · · · + aim bmj .
Esto puede parecer muy complicado a primera vista pero en realidad no lo es. Lo explicaremos en detalle. En
primer lugar, lo que nos dice la definición es que el resultado de multiplicar una matriz de tamaño n × m por una de
tamaño m × r, es una matriz de tamaño n × r. Es decir, tiene la misma cantidad de filas que A y la misma cantidad
de columnas que B. ¿Cómo se arma entonces esta matriz de n × r? Progresivamente, primero completando las
entradas de la primera fila, luego de la segunda, y así hasta la última fila. Llamamos cij a las entradas de la matriz
A · B ¿Cómo averiguamos cuál es la entrada cij ? Si vemos la formula de la definición, observamos que es una
combinación de algunas entradas de A y algunas entradas de B. Pero, ¿qué entradas? y ¿qué combinación? Pues,
el primer subíndice de cij nos indica que consideremos la i-ésima fila de A y, el segundo subíndice, la j-ésima
columna de B; y la combinación es simplemente multiplicar la primera entrada de la fila i de A con la primera
entrada de la columna j de B, la segunda entrada de la fila i de A con la segunda entrada de la columna j de B,
y así hasta multiplicar la última entrada de la fila i de A con la última entrada de la columna j de B (las filas de
A y las columnas de B tienen el mismo largo: m). Una vez que hicimos estas multiplicaciones por separado, las
sumamos todas para obtener un único número: ese número es cij . Veamos un ejemplo.
Supongamos que queremos calcular el producto A · B entre las siguientes dos matrices:
 
  −5 2
1 3 −2  
A= B =  −1 7 
  
4 0 5  
2 1
La multiplicación se puede llevar a cabo ya que A tiene tres columnas y B tiene tres filas. Vamos armando las
entradas cij de A · B. Como A tiene dos filas y B dos columnas, entonces A · B ∈ R2×2 . Debemos calcular
c11 , c12 , c21 y c22 . ¿Qué entrada es c11 ? Consideramos la primera fila de A (1 3 − 2) y la primera fila de B
(−5 −1 2). Y ahora, multiplicamos lugar a lugar estas filas/columnas:
(1 3 −2)
(−5 −1 2)
↓ ↓ ↓
(−5) 3(−1) (−2)2
Finalmente, sumamos todos estos números: −5 − 3 − 4 = −12. Por lo tanto, c11 = −12. Vamos a calcular c12 :
tomemos la primera fila de A (1 3 − 2) y la segunda columna de B (2 7 1), y multiplicamos sus entradas
lugar a lugar:
(1 3 −2)
(2 7 1)
↓ ↓ ↓
2 21 −2
Por lo tanto, c12 = 2 + 21 − 2 = 21. Al aplicar el mismo procedimiento, para c21 consideramos la segunda fila de A
(4 0 5) y la primera columna de B (−5 −1 2) y tenemos c21 = 4(−5) + 0(−1) + 5,2 = −10. Finalmente,
c22 = 4,2 + 0,7 + 5,1 = 13. Entonces hemos calculado:
 
−12 21
A·B = 
−10 13
¿Pueden darse cuenta qué estamos haciendo al multiplicar lugar a lugar las entradas de las filas de A con las
columnas de B y después sumarlas? ¿No les recuerda a una operación que hicimos anteriormente con vectores?
¡Sí, el producto escalar de vectores! Si consideramos a las filas y columnas como vectores, entonces, la cuenta
que estamos haciendo es el producto escalar entre una fila/vector de A y una columna/vector de B. Es decir, en
la entrada cij de A · B va el producto escalar entre la fila i de A y la columna j de B (considerando a estas filas
y columnas como vectores). En el ejemplo anterior, c11 = (1, 3, −2) · (−5, −1, 2), c12 = (1, 3, −2) · (2, 7, 1),
c21 = (4, 0, 5) · (−5, −1, 2) y c22 = (4, 0, 5) · (2, 7, 1). Esta es otra manera de recordar cómo se calculan las
entradas de la matriz producto.
Ejemplos 51
−13

2 3 −1
∈ R3×2 y ∈ R2×3 es

El producto entre las matrices 0 4 −5 0 8
2 −2
   
−1 3  −17 −3 25
  2 3 −1  
4 · =
−20
  
0 0 32 
  −5 0 8  
2 −2 14 6 −18
El producto entre las matrices −1 2 2×2 2 3 −1 0 2×4

1 −4 ∈ R y −5 0 2 8 ∈ R es
     
−1 2 2 3 −1 0 −12 −3 5 16
 · = 
1 −4 −5 0 2 8 22 3 −9 −32
Como comentamos al comienzo del apartado, el producto de matrices no tiene las mismas propiedades que el
producto de números reales que conocemos. En primer lugar, no siempre podemos hacer el producto entre dos
matrices cualesquiera (la cantidad de columnas de la primera matriz debe coincidir con la cantidad de filas de
la segunda). En particular, esto nos indica que el producto de matrices no es conmutativo. Es decir, no es cierto
que A · B = B · A pues B · A podría no ser posible de calcular al no cumplirse los requisitos de la cantidad de
columnas de B con las de A. Por ejemplo, si A ∈ R2×4 y B ∈ R4×3 , entonces el producto A · B se puede llevar a
cabo pero el producto B · A no. Pero este no es el único motivo por el que no es conmutativo el producto: puede
suceder que tanto A · B como B · A sean operaciones válidas pero ¡podrían no ser matrices del mismo tamaño!
(mucho menos iguales). Por ejemplo, si A ∈ R3×4 y B ∈ R4×3 , entonces, tanto A · B como B · A, son válidas.
Pero A · B ∈ R3×3 y B · A ∈ R4×4 . Hay además otro motivo por el cual el producto no es conmutativo: podría
suceder que A · B y B · A sean operaciones válidas y que den lugar a matrices del mismo tamaño, pero que de
todas formas A · B 6= B · A. Por ejemplo, si:
   
1 2 1 1
A=  yB = 
3 4 0 0
entonces,    
1 1 4 6
A·B =  yB·A= 
3 3 0 0
Más allá de esto, el producto de matrices sí posee la propiedad distributiva respecto de la suma. Es decir, para
A, B, C ∈ Rn×m se tiene:
(A + B) · C = A · C + B · C
C · (A + B) = C · A + C · B
Es importante remarcar que, cuando hacemos la distribución de C dentro del paréntesis, nos aseguramos de ubicar
a C del mismo lado que estaba fuera del paréntesis. Es decir, si C esta a la derecha del paréntesis (como en la
primera ecuación de arriba), entonces cuando distribuimos C queda multiplicando a A y B a la derecha. Esto por
supuesto es fundamental tenerlo presente ya que, como vimos recién, el producto no es conmutativo. Por este motivo
consideramos dos formulas de distribución (para C multiplicando a derecha y a izquierda por separado).
Para las matrices A ∈ R1×n y B ∈ Rn×1 , de distinto tamaño, estudien los resultados de las multiplicaciones
A · B y B · A.
5.4.3 Matrices cuadradas
Un tipo muy especial de matrices son las matrices cuadradas: aquellas que tienen igual cantidad de filas y de
columnas. Dada esta coincidencia, a una matriz cuadrada de n filas por n columnas se la suele llamar simplemente
matriz cuadrada de tamaño n. Una de las ventajas de trabajar con matrices de Rn×n es que pueden ser siempre
multiplicadas entre sí; y, además, el resultado vuelve a ser una matriz de tamaño n. Entonces cuando se trabaja
con matrices cuadradas, se presenta una situación más parecida a trabajar con números, en el sentido que todas
las operaciones entre matrices vuelven a dar matrices del mismo conjunto. Otra ventaja de estas matrices es que
admiten un elemento neutro para la multiplicación (el equivalente al 1 en los números reales). Esta matriz se llama
matriz identidad y es la matriz cuadrada que tiene todas sus entradas 0 salvo en la diagonal principal, que tiene
todos 1. A continuación, la definimos con mayor precisión.
Definición 50 La matriz identidad de Rn×n , también llamada matriz identidad de n × n, es la siguiente matriz
In de n filas y n columnas:  
1 0 0 ··· 0
 
0 1 0 ··· 0 
 

 
In =  0 0 1 ··· 0 
 
.. .. .. .. 
 


 . . . . 

0 0 0 ··· 1
Para cada n ∈ N hay una matriz identidad de tamaño n. Las primeras cuatros son:
 
  1 0 0
1 0  
I1 = 1 ∈ R I2 =   ∈ R2×2 I3 =  0 1 0  ∈ R3×3
 
0 1  
0 0 1
 
1 0 0 0
 
 
 0 1 0 0 
I4 =   ∈ R4×4
 
 0 0 1 0 
 
0 0 0 1
En general, no especificaremos el tamaño de la matriz identidad que estamos considerando con el subíndice “n”
correspondiente y solamente escribiremos I para respresentarla (el tamaño que tiene quedará claro del contexto en
el que estemos trabajando). Pueden chequear fácilmente que, si I ∈ Rn×n , entonces A · I = A, y que I · A = A
para toda matriz cuadrada de tamaño n. En particular, la matriz identidad conmuta con todas las matrices de n × n.
5.4.4 Matrices inversibles
Todos los números reales, a excepción del 0, tienen un inverso multiplicativo; esto es, para todo x ∈ R distinto de 0,
existe y ∈ R tal que xy = 1. Como sabemos que este número y es único, lo solemos escribir x−1 o x1 . En la teoría

de matrices sucede algo parecido, aunque no para todas las matrices. Para algunas matrices cuadradas A ∈ Rn×n
existe otra matriz del mismo tamaño B ∈ Rn×n tal que A · B = I. Se las conoce como matrices inversibles y
tienen propiedades muy útiles.
Definición 51 Una matriz cuadrada A ∈ Rn×n se dice inversible si existe una matriz B ∈ Rn×n tal que
A · B = I y B · A = I.
Importante Las matrices inversibles son siempre matrices cuadradas.
Que una matriz sea inversible nos brinda mucha información sobre el sistema de ecuaciones lineales asociado. Por
ejemplo, indica que es compatible determinado. También, en algunos casos, permite resolver ecuaciones matriciales
de manera muy efectiva. Ambas situaciones las estudiaremos en los siguientes apartados.
Recién afirmamos que no todas las matrices cuadradas no nulas son inversibles. Por ejemplo, la matriz:
 
1 0
A=  ∈ R2×2
0 0
no tiene inversa. En efecto, una inversa para A debería ser otra matriz B tal que A · B = I. Al no conocer B,

podemos escribir genéricamente B = ac db . Por lo tanto, A · B = I quiere decir:
     
1 0 a b 1 0
 · = 
0 0 c d 0 1
Si calculamos el producto entre A y B tenemos que es ( a0 0b ). Es decir, siempre la segunda fila de A · B es nula
(cualquiera sea B). En particular, ningún producto de A por otra matriz va a dar como resultado un 1 en la posición
a22 . Por lo tanto, no hay manera de multiplicar a A por otra matriz y obtener la identidad. Esto muestra que A no
tiene inversa.
Veamos cómo calcular la inversa de una matriz inversible. Supongamos que queremos encontrar la inversa de la
matriz:  
1 2 −1
 
3×3
−2  ∈ R
 
 1 1
 
2 0 2
En principio no tenemos porqué saber si A es o no inversible. El procedimiento que vamos a llevar a cabo nos
devolverá la inversa de A (si existe) o nos avisará que A no es inversible. A partir de la matriz A, construirnos una
matriz ampliada donde agregamos la identidad del otro lado de la barra. Es decir, consideramos:
 
1 2 −1 1 0 0
 
 1 1 −2 0 1 0 
 
 
2 0 2 0 0 1
Ahora, utilizaremos las operaciones de filas que conocemos para llevar la matriz original a la matriz identidad del
lado izquierdo de la barra (aplicando las mismas operaciones a la matriz identidad del lado derecho de la barra). Las
operaciones de filas que transforman una matriz A en la matriz identidad son exactamente las operaciones de fila
que debemos hacerle a la matriz identidad para tranformarla en la inversa de A. Por este motivo, ampliamos la
matriz original con la identidad: en lugar de tener que ir anotando las operaciones que le vamos a hacer a A para
transformarla en la identidad (para después aplicárselas a I), ¡hacemos todo al mismo tiempo! A continuación, les
mostramos de qué modo.
En primer lugar, hay que llevar la matriz A a la matriz identidad, al igual que al triangular. De hecho, comenzaremos
triangulando la matriz (poniendo ceros debajo de la diagonal) y, luego, agregaremos ceros arriba de la diagonal.
Empezamos triangulando la parte derecha de la matriz:
   
1 2 −1 1 0 0 1 2 −1 1 0 0
   
 F2 →F2 −F1 
 1 1 −2 0 1 0  −−−−−−−−→  0 −1 −1 −1
 
1 0 
  F3 →F3 −2F1  
2 0 2 0 0 1 0 −4 4 −2 0 1
Tengamos presente, cómo hemos aplicado las operaciones de fila a toda la matriz ampliada (también a la identidad
de la derecha).
   
1 2 −1 1 0 0 1 2 −1 1 0 0
   
 F3 →F3 −4F2 
−1 −1 −1 0  −−−−−−−−→  0 −1 −1 −1
 
 0 1 1 0 
   
0 −4 4 −2 0 1 0 0 8 2 −4 1
Aquí ya tenemos la matriz A triangulada. Ahora buscamos los ceros arriba de la diagonal. Para facilitar las cuentas,
nos conviene multiplicar la última fila por 18 .
   
1 2 −1 1 0 0 1 2 −1 1 0 0
  1F  
 8 3 
−1 −1 −1 0  −−−→  0 −1 −1 −1
 
 0 1 1 0 
   
1
0 0 8 2 −4 1 0 0 1 4 − 21 1
8
Así como usábamos la entrada a11 para generar los 0 debajo de la diagonal principal en la primera columna, ahora
utilizaremos la entrada a33 para generar los ceros arriba de la diagonal principal en la tercera columna.
   
5 1 1
1 2 −1 1 0 0 1 2 0 4 − 2 8 
  
 F2 →F2 +F3  3 1 1 
 0 −1 −1 −1 1 − −− −− −−→ 0 −1 0 − 4  −→

0   2 8 
  F1 →F1 +F3 
1
0 0 1 4 − 12 18 0 0 1 1
4 − 12 18
   
1 0 0 − 14 1
2
3
8 1 0 0 − 14 1
2
3
8
  (−1)F  
F →F +2F2  2 
−−1−−−1−−−→ −1 − 34 1 1  −−−−→  0 3
− 12 − 18 
 
 0 0 2 8 1 0 4
   
1
0 0 1 4 − 21 1
8 0 0 1 1
4 − 12 1
8
Finalmente, hemos alcanzado la identidad en el lado izquierdo de la matriz ampliada. Lograr esta transformación
nos muestra que la matriz A es inversible. Y la inversa es precisamente la matriz que aparece del lado derecho de la
matriz ampliada:  
− 14 1
2
3
8
 
3
− 21 − 81 
 
4

 
1
4 − 21 1
8
La manera de saber si hemos llevado a cabo bien las cuentas es chequear si efectivamente esta matriz es la inversa
de A; es decir, chequear que el producto de A por esta matriz da la identidad de R3×3 .
Vayamos a otro ejemplo de este procedimiento para una matriz que no es inversible. Consideremos la matriz:
 
−1 3 5
 
B =  1 0 −4  ∈ R3×3
 
 
2 3 −7
Armamos entonces la matriz ampliada y empezamos a triangular la matriz B dentro de esta matriz:
   
−1 3 5 1 0 0 −1 3 5 1 0 0
   
 F2 →F2 +F1 
 1 0 −4 0 1 0  −−−−−−−−→  0 3 1 1 1 0  −→
 
  F3 →F3 +2F1  
2 3 −7 0 0 1 0 9 3 2 0 1
 
−1 3 5 1 0 0
 
F →F −3F2 
−−3−−−3−−−→ 3 −1

 0 1 1 0 
 
0 0 0 −1 −3 1
Pero aquí debemos deternernos. Si durante el procedimiento aparece una fila de ceros quiere decir que la matriz
no es inversible. La explicación de este fenómeno la brindaremos más adelante, cuando veamos el rango de una
matriz. En conclusión, este procedimiento de ampliar la matriz con la matriz identidad y triangular la matriz original,
devolverá la inversa de la matriz (si existe), o producirá una fila de ceros durante la triangulación (que indica que la
matriz no era inversible en primer lugar).
Experimento 27 Este experimento explica porqué funciona el procedimiento para hallar la inversa que
explicamos recién. Lo aplicamos sobre el primer ejemplo que vimos. La matriz es:
 
1 2 −1
 
A =  1 1 −2  ∈ R3×3
 
 
2 0 2
Si uno no tiene más información o herramientas, la manera más directa y “a mano” de encarar el problema de
hallar la inversa de una matriz es considerar una matriz genérica:
 
a b c
 
B =  d e f  ∈ R3×3
 
 
g h i
y tratar de ver cómo tienen que ser sus entradas para que resulte la inversa de A. Es decir, queremos ver quiénes
tienen que ser a, b, c, d, e, f, g, h, i ∈ R para que A · B = I. Al resolver la cuenta, buscamos que:
     
1 2 −1 a b c 1 0 0
     
 1 1 −2  ·  d e f  =  0 1 0 
     
     
2 0 2 g h i 0 0 1
Les proponemos que calculen el producto de matrices de la izquierda, de manera de obtener una igualdad entre
dos matrices (la de la izquierda, llena de letras, y a la derecha, la identidad). Como dos matrices son iguales si
sus entradas son iguales, entonces igualando entrada a entrada vamos a obtener un sistema de 9 ecuaciones y 9
incógnitas. Por ejemplo, la ecuación correspondiente a la igualación de las entradas a11 es a + 2d − g = 1, y la
correspondiente a la igualación de las entradas a32 es b + h = 0. Analicemos con detenimiento este sistema.
Si bien parece muy grande, en realidad, las únicas ecuaciones que utilizan las incógnitas a, d, g son las tres
ecuaciones correspondientes a la igualación de las entradas de la primera columna de A · B. Lo mismo sucede
con las incógnitas b, e, h (sólo aparecen en las tres ecuaciones correspondientes a la igualación de las entradas
de la segunda columna de A · B) y con c, f, i (tres ecuaciones correspondientes a la tercera columna). Por lo
tanto, este sistema podemos pensarlo como tres sistemas separados de tres ecuaciones y tres incógnitas cada
uno en lugar de concebirlo como un gran sistema de 9 × 9. Pero hay algo más: veamos los tres sistemas que
acabamos de separar. ¿Cómo són las matrices asociadas a estos sistemas? ¿Pueden darse cuenta ahora por qué
funciona el razonamiento? (no es tan directo, requiere pensarlo).
Importante No debe confundirse la escritura de la matriz inversa con la de la matriz transpuesta.

Definición 52 Una matriz A ∈ Rn×m se dice transpuesta cuando resulta de intercambiar las filas con las
columnas de otra matriz. Es decir (At )ij = Aji . Se escribe At .
Veamos algunos ejemplos:
Ejemplos 52   
1 2 −1 1 1 2
   
t
Si A =  1 −2  entonces A =  2
   
1 1 0 
   
2 0 2 −1 −2 2
 
  1 −1
1 3 −2  
Si A =   entonces At = 
 3

5 
−1 5 −4  
−2 4
 
1 2  
 
t
1 3 5
Si A =  3 4  entonces A = 
  
  2 4 6
5 6
5.4.5 Rango de una matriz
En Matemática es muy común asignarle números a objetos que nos brinden información sobre los mismos. Por
ejemplo, la norma de un vector es un número que le asignamos a cada vector y que nos informa sobre su longitud.
Un caso muy importante en la teoría de matrices, tan importante que le dedicamos el próximo apartado entero, es el
determinante de una matriz, que nos dice, entre otras cosas, si las matriz es o no inversible (sin tener que pasar por
el cálculo de la inversa que estudiamos recientemente). En este apartado, vamos a introducir otro de este tipo de
números: el rango de una matriz.
Consideremos el siguiente sistema de ecuaciones lineales homogéneo:



 2x + 5y − z = 0

−x + 3y + 4 = 0


 −5x + 4y + 13 = 0

Veamos qué sucede al tratar de resolverlo por el método de triangulación. La matriz del sistema es:
 
2 5 −1
 
 −1 3 4 
 
 
−5 4 13
Triangulamos:
     
2 5 −1 −1 3 4 −1 2 4
  F lF    
 1 2   F2 →F2 +2F1 
 −1 4  −−−−→  2 5 −1  −−−−−−−−→  0 7  −→
 
3 11
    F3 →F3 −5F1  
−5 4 13 −5 4 13 0 −11 −7
 
−1 2 4
 
F3 →F3 +F2 
−− −−−−−→  0 11 7 

 
0 0 0
El sistema asociado a esta matriz tiene una ecuación menos que el sistema original. Pero, ¿qué nos indica esta fila
de ceros en la matriz (respecto de la matriz en sí)? Pensemos a las filas de la matriz original como vectores. En este
caso, vectores de R3 . Los llamamos ~v1 = (2, 5, −1), ~v2 = (−1, 3, 4) y ~v3 = (−5, 4, 13). Ahora bien, volvamos a
realizar la triangulación de la matriz pero llevando cuenta de las operaciones que estamos haciendo implícitamente
entre estos vectores (representado a la derecha de cada matriz).
   
2 5 −1 ~v1 −1 3 4 ~v
  
F1 lF2 
 2
 −1 3 4  ~v2 −−−−→  2 5 −1  ~v1 −→
  
   
−5 4 13 ~v3 −5 4 13 ~v3
 
−1 2 4 ~v
  2
F2 →F2 +2F1 
−−−−−−−−→  0 7  ~v1 + 2~v2 −→

11
F3 →F3 −5F1  
0 −11 −7 ~v3 − 5~v2
 
−1 2 4 ~v
  2
F3 →F3 +F2 
−−−−−−−→  0 11 7  ~v1 + 2~v2

 
0 0 0 ~v3 − 5~v2 + (~v1 + 2~v2 )
Las operaciones que figuran a la derecha de las matrices van mostrando cómo fueron cambiando las filas, vistas
como vectores, a lo largo de la triangulación. En la matriz triangulada, la interpretación de lo que está en la fila 2 es
que ~v1 + 2~v2 = (0, 11, 7). Y, en particular, la fila 3 dice ~v3 − 5~v2 + (~v1 + 2~v2 ) = (0, 0, 0). Es decir:
~v3 − 3~v2 + ~v1 = ~0 ∈ R3
Si “despejamos” el vector ~v3 en esta ecuación obtenemos que:
~v3 = 3~v2 − ~v1
¡Entonces ~v3 es combinación lineal de los vectores ~v1 y ~v2 ! Cuando triangulamos una matriz y se anula una fila lo
que está sucediendo es que la fila que se anuló es “combinación lineal de las otras filas” (viendo a las filas como
vectores). Y la anulación de una fila de una matriz asociada a un sistema nos indica que la ecuación correspondiente
a dicha fila desaparece (puede removerse sin alterar las soluciones del sistema); es decir, la ecuación removida es
“combinación lineal de las otras ecuaciones” del sistema.
Observemos que saber cuántas filas de la matriz son independientes es de gran utilidad. Este número es lo que se
conoce como rango de una matriz.
Definición 53 Sea A ∈ Rn×m . El rango de A es la cantidad de filas de A linealmente independientes. Se nota
rg(A).
Notemos que rg(A) es un número entero positivo (que solo es cero para la matriz nula). En el ejemplo que vimos
recién, el rango de la matriz asociada al sistema es 2. Veamos algunos otros ejemplos.
Ejemplos 53
1 2 −3
∈ R2×3 es 1 (sus filas son múltiplos).

El rango de −2 −4 6
El rango de ( 12 20 ) ∈ R2×2 es 2 (sus filas son linealmente independientes).
1 0 −1
!
1 −1 0
El rango de 0 1 −1 ∈ R5×3 es 3. (Las filas 1, 2 y 4 son linealmente independientes entre sí.)
0 1 1
1 0 1

Cuando una matriz tiene una fila que es combinación lineal de las otras, dicha combinación podemos encontrarla
utilizando el procedimiento antes descripto (de nombrar a las filas v1 , . . . , vn y seguir las operaciones que vamos
realizando en la triangulación al costado de la matriz). Lo importante de las operaciones elementales de filas es
que no alteran el rango de la matriz. Es decir, el rango de una matriz antes y después de hacerle una operación
elemental de fila es el mismo. Se lo dejamos para mostrar en el próximo experimento.
v1 , ~v2 . . . , ~vk } ⊂ Rn es un conjunto de vectores linealmente indepen-

Experimento 28 Muestren que si {~
diente entonces los siguientes conjuntos también son linealmente independientes.
1. {~v2 , ~v1 , . . . , ~vk }.
2. {~v1 , λ~v2 , . . . , ~vk }, λ ∈ R distinto de cero.
3. {~v1 , ~v2 + λ~v1 , . . . , ~vk }, λ ∈ R.

¿Cuál es la manera de calcular el rango de una matriz? Notemos que, para conocer el rango, solo nos interesa saber
cuántas filas linealmente independientes tiene, no cuáles son ni cuál es la combinación lineal que las relaciona. Por
lo tanto, para calcular el rango de una matriz nos alcanza con triangular la matriz y, cuando obtengamos una
matriz triangular, contar cuántas filas no nulas nos quedan.
Ejemplos 54
Calculemos el rango de A = ( 12 20 ) ∈ R2×2 . Triangulamos:

   
1 2 F2 →F2 −2F1 1 2
  −−−−−−−−→  
2 0 0 −4
! son linealmente independientes, entonces rg(A) = 2.

Como las dos filas de la matriz triangulada
1 0 −1
1 −1 0
Calculemos el rango de B = 0 1 −1 ∈ R5×3 . Triangulamos:
0 1 1
1 0 1
     
1 0 −1 1 0 −1 1 0 −1
     
1 −1 0 0 −1 1 0 −1 1
     
     
 F2 →F2 −F1   F3 →F3 +F2 
−1 −−−−−−−→ 0 −1 −−−−−−−→ 0 0  −→
 
0 1 1 0
  F5 →F5 −F1   F4 →F4 +F2  
     
0 1 1 0 1 1 0 0 2
     
1 0 1 0 0 2 0 0 2
   
1 0 −1 1 0 −1
   
0 −1 1 0 −1 1
   

   
F5 →F5 −F4   F3 ×F4 
−−−−−−−→ 0  −−−−→ 0

0 0 0 2
   
   
0 0 2  0 0 0
   
0 0 0 0 0 0
Por lo tanto, rg(B) = 3.

La cantidad de filas linealmente independientes de una matriz cualquiera de Rn×m es igual a la cantidad de
columnas linealmente independientes de la misma. Por esta razón, el rango puede definirse también como la
cantidad de columnas linealmente independientes.
El rango de matrices cuadradas
El rango es un dato especialmente útil cuando trabajamos con matrices cuadradas. Recordemos que, para hallar
la inversa de una matriz de n × n (si la tuviere), debíamos triangular la matriz hasta convertirla en la identidad
I ∈ Rn×n . Pero acabamos de ver que las operaciones de filas que utilizamos para triangular no alteran el rango de
la matriz. Como el proceso termina en la matriz identidad de n × n, cuyo rango es n, concluimos que, si una matriz
de n × n es inversible, entonces su rango debe ser necesariamente n. De igual manera, si una matriz de n × n tiene
rango n entonces es necesariamente inversible. Para chequear que esto último es válido observemos que, al tener
rango n, todas las filas son linealmente independientes. Por lo tanto, triangulando nunca se nos anulará ninguna fila
y podremos alcanzar una matriz triangular con entradas no nulas en la diagonal principal. A partir de aquí, no es
difícil continuar la triangulación “de la parte de arriba de la matriz” y poner unos (1) en la diagonal, de manera de
obtener la matriz identidad. El estudiante puede hacer un ejemplo concreto, con una matriz de 3 × 3 por ejemplo,
para convencerse que siempre que llegue a una matriz cuadrada triangular sin entradas nulas en la diagonal puede
seguir triangulando hasta obtener la identidad.
El rango es entonces una excelente manera de determinar si una matriz cuadrada es o no inversible sin tener que
hacer muchas cuentas. Por ejemplo, la matriz:
 
−1 2 4
 
 
 0 1 2 
 
2 −4 8
no puede ser inversible, pues la última fila es −2 veces la primera (por lo que el rango de la matriz no es 3; en este
caso, es 2). La matriz:  
1 1 1
 
 
 1 1 1 
 
1 1 1
tampoco es inversible, pues las últimas dos filas son combinación lineal de la primera (son idénticas de hecho). En
este caso, el rango es 1. La matriz:  
−4 2 3
 
 −1
 
12 7 
 
3 10 4
tiene rango 2 (la segunda fila es combinación lineal de las otras dos filas), por lo que tampoco puede ser inversible.
Como último resultado sobre el rango, mencionamos una propiedades que nos puede resultar útil a la hora de
calcularlo: el rango de una matriz no se altera si la multiplicamos por otra matriz que es inversible (a derecha o
izquierda). Es decir, si A, B ∈ Rn×n y B es inversible, entonces, rg(A · B) = rg(A) y rg(B · A) = rg(A). Esto
no es cierto si la matriz B no es inversible. Por ejemplo, si A = ( 11 23 ) y B = ( 10 10 ), entonces, A · B = ( 11 11 ). En
este caso, rg(A) = 2 pero rg(A · B) = 1 (B no es inversible: su rango es 1).
Estudien qué sucede con el rango de la matriz An si A es una matriz inversible. Tengan en cuenta que An
representa la potencia n-ésima de la matriz A.
5.4.6 Forma matricial de un sistema de ecuaciones lineales
La teoría de matrices tiene muchas aplicaciones y puede utilizarse en el Álgebra para interpretar muchas situaciones.
Aquí hemos visto cómo podemos utilizar matrices para resolver sistemas de ecuaciones lineales. Pero podemos
también “enmarcar” la teoría de sistemas de ecuaciones lineales dentro de la teoría de matrices. En consecuencia,
retomemos el sistema que consideramos al principio del capítulo:

 x + 2y = 5
 2x − 3y = −1
Este sistema puede representarse a nivel matricial (haciendo uso del producto de matrices) de la siguiente manera:
     
1 2 x 5
 · = 
2 −3 y −1
En efecto, la matriz de coeficientes es de 2 × 2 y podemos definir una “matriz de las incógnitas ( xy )” de 2 × 1 de

manera tal que sea posible llevar a cabo la multiplicación. El resultado será una matriz de 2 × 1. Si realizamos el
producto, vemos que en el lugar 1 − 1 de la misma irá la entrada x + 2y y, en el lugar 2 − 1, la entrada 2x − 3y.
Como este sistema tiene la primera expresión igualada a 5 y la segunda, a −1, entonces podemos simplemente
5

igualar el producto a “la matriz de términos independientes −1 ”. Y esto es precisamente lo que dice la ecuación
de más arriba. Esta ecuación se conoce como ecuación matricial de un sistema de ecuaciones lineales. Esto siempre
se puede hacer. Por ejemplo, el sistema: 


 −x + 2z = 0



 2x + 2y + 3z = 0
 2y = 0





 x+y+z =0
se representa matricialmente de la siguiente manera:

   
−1 0 2   0
  x  
   

 2 2 3    0
  · y  =  
     
 0 2 0  0
  z  
1 1 1 0
Por otro lado, la ecuación matricial:

     
−3 4 x 0
 · = 
11 −1 y −2
está representando al siguiente sistema: 

 −3x + 4y = 0
 11x − y = −2.
Dada esta identificación, podemos considerar a los sistemas de ecuaciones lineales como ecuaciones con matrices.
Interpretar un sistema de ecuaciones de esta manera es, en general, muy conveniente dado que, por un lado, convierte
un sistema de varias ecuaciones en una única ecuación y, por otro, nos deja a disposición las herramientas algebraicas
que posee la teoría de matrices. Muchas veces, esto nos permitirá usar razonamientos parecidos a los utilizados
cuando resolvemos ecuaciones en los reales. En efecto, si tenemos que resolver la ecuación 5x = 3, entonces
“pasamos dividiendo” el 5 para hallar x = 35 . Esto es posible porque podemos dividir por 5; es decir, 5 tiene inverso.
Consideremos ahora una ecuación matricial:
   
x1
b1
   
 x 2   b2 
   
A·
 ..  =  .. 
  
 .  .
   
xn bn
donde A ∈ Rn×n . Si la matriz A es inversible, entonces, podemos multiplicar a izquierda, a ambos lados de la
igualdad, por la inversa A−1 de A, de forma de obtener:
   
x1 b1
   
 x2  b 
   
−1  2 
A−1 · A · 
 ..  = A ·  .. 

 .  .
   
xn bn
Como A−1 · A = I, entonces obtenemos:

   
x1 b1
   
 x2   b2 
   
  = A−1 ·  
 ..   .. 
 .  .
   
xn bn
Es decir, ¡despejamos la solución como hacíamos en el caso de las ecuaciones reales! Esto nos dice, por un lado,
que si la matriz asociada al sistema es cuadrada e inversible, entonces el sistema es compatible determinado (pues
tiene una única solución que debe ser A−1 B) y, por otro lado, que podemos hallar dicha solución calculando la
inversa A−1 de la matriz y multiplicando a izquierda a la matriz B de términos independientes por esta inversa.
Esto nos ahorra el tener que triangular y despejar “a mano” las soluciones del sistema.
Ejemplo 55 Consideremos el sistema:



 2x − 2y + 2z = 2

x + y − 2z = 0


 2x − 4z = 1

La forma matricial de este sistema es:

     
2 −2 2 x 2
     
−2 · y  = 0
     
1 1
     
2 0 −4 z 1
Llamemos A a esta matriz. Triangulemos A:
     
2 −2 2 1 1 −2 1 1 −2
  F lF    
 1 2   F2 →F2 −2F1 
−2 −−−−→ 2 −2 2  −−−−−−−−→ 0 −4 6  −→
 
1 1
    F3 →F3 −2F1  
2 0 −4 2 0 −4 0 −2 0
   
1 1 −2 1 1 −2

F2 lF3 
  
 F3 →F3 −2F2 
−−−−→ 0 −2 0  −−−−−−−−→ 0 −2

0
   
0 −4 6 0 0 6
1 2 1
!
3 3
−6
Aquí vemos que el rg(A) = 3, por lo que es inversible. La inversa de A es 0 1 −1
2 , por lo que la solución del
1 1 −1
6 3 3
sistema es:        
1 2
2 − 16 2 1
  3 3     2 
A−1 · 0 =  0 − 12  · 0 = − 12 
       
1
       
1 1
1 6 3
− 13 1 0

Estudiamos las operaciones básicas entre matrices: la suma y el producto por escalar.
Introducimos la multiplicación de matrices y vimos sus propiedades más importantes. Particularmente, no es
conmutativa.
Estudiamos las matrices cuadradas e introducimos la matriz identidad.
Definimos qué significa que una matriz cuadrada sea inversible y aprendimos a calcular la inversa de una matriz
inversible (o detectar si la matriz no es inversible).
Definimos el rango de una matriz y vimos su relación con la inversibilidad de la matriz (en el caso que sean cuadradas).
Vimos cómo escribir matricialmente un sistema de ecuaciones lineales y, además, aprendimos a resolver un sistema
cuadrado cuya matriz asociada es inversible.

5.5 Determinantes
A una matriz cuadrada podemos asociarle un número llamado el determinante de la matriz. Esta magnitud es una de
las herramientas más importantes de la teoría de matrices y nos provee muchísima información sobre estas.
Qué es el determinante de una matriz y cómo calcularlo.

Las propiedades del determinante.
Cómo utilizar la información que nos provee el determinante para resolver sistemas de ecuaciones lineales.

5.5.1 ¿Qué es el determinante?
En el apartado anterior, vimos que toda matriz tiene asociado un número llamado rango del que podemos extraer
información de la matriz. El determinante es otro tipo de número que nos da información sobre las matrices
cuadradas. La característica principal (que utilizaremos con más frecuencia) es la siguiente: una matriz es inversible
sí, y solo sí, su determinante es un número distinto de 0. En próxima unidad estudiaremos otras características del
determinante.
Álgebra A. Determinantes. 155
Importante En este apartado, todas las matrices son cuadradas.
El determinante se calcula a partir de una fórmula que involucra sumas y multiplicaciones de las entradas de la
matriz. Esta fórmula no es, en principio, ni sencilla ni natural, pero veremos que, de todas formas, es fácil de calcular
recordando unos pocos procedimientos. Comenzaremos definiéndolo para las matrices más pequeñas primero.
5.5.2 El determinante de una matriz de 2 × 2
Al tener en cuenta que queremos que el determinante sea distinto de cero exactamente para las matrices inversibles,
¿podemos deducir cuál debería ser este número en el caso de matrices de 2 × 2? Consideremos una matriz genérica

A = ac db ∈ R2×2 . Cuando estudiamos rango de matrices cuadradas, vimos que una matriz de n × n es inversible
sí, y solo sí, su rango es n. Por lo tanto, A será inversible si tiene rango 2. Veamos, entonces, cuándo tiene A rango
2. Supongamos primero que a 6= 0. Entonces:
   
a b F2 →F2 − ac F1 a b
  −−−−−−−−→  
c d 0 d − ac b
Para que rg(A) = 2 no tiene que anularse la segunda fila. Es decir, rg(A) = 2 sí, y solo sí, d− ac b 6= 0. Notemos que
d − ac b = ad−bc
a ; y un cociente es 0 si el numerador es cero. Concluimos que rg(A) = 2 sí, y solo sí, ad − bc 6= 0.
Hemos visto que una matriz (para la cual la entrada a11 es no nula) es inversible sí, y solo sí, ad − bc 6= 0.
Justamente, buscábamos un número que caracterice de esta forma la inversibilidad de matrices. Veremos en breve

que, precisamente, ab − bc es el determinante de una matriz de ac db ∈ R2×2 . ¿Qué sucede en caso que la entradad
1 − 1 sea 0? Pues hay dos opciones.
Si c 6= 0 entonces, para triangular, podemos primero intercambiar las filas y después proceder de idéntica
manera:      
a b F1 lF2 c d F2 →F2 − ac F1 c d
  −−−−→   −−−−−−−−→  .
c d a b 0 b − ac d
Luego, A es inversible sí, y solo sí, b − ac d 6= 0. Pero b − ac d = bc−ad

c , por lo que es cero sí, y solo sí,
bc − ad = 0. A su vez, bc − ad = 0 sí, y solo sí, ad − bc = 0. Por lo tanto, para matrices con a = 0 pero
c 6= 0, la misma fórmula ad − bc determina la invertibilidad de la matriz.
Si c = 0, entonces es fácil ver que la matriz no puede tener rango 2, por lo que no es inversible en este caso.
Pero ad − bc = 0d − b0 = 0, por lo que la misma fórmula es coherente con lo que buscamos de ella.

Vimos entonces que, para cualquier matriz ac db ∈ R2×2 se tiene que A es inversible sí, y solo sí, ad − bc 6= 0.
Este número es lo que llamamos el determinante de la matriz A.

Definición 54 El determinante de una matriz ac db ∈ R2×2 es el número det(A) = ad − bc. También se nota

a b .
c d
Observemos que la fórmula del determinante para matrices de 2×2 surge de hacer el mismo “movimiento elemental”
que hacíamos para calcular el producto vectorial de vectores en R3 . Lo transcribimos en la Figura 5.1 nuevamente
para rápida referencia.
Figura 5.1: Movimiento elemental para calcular el determinante de una matriz de 2 × 2.
Estudien cómo se define el determinante de una matriz de dimensión 1 × 1 para que verifique que la matriz es
inversible, sí y solo sí, dicho número no es nulo.
5.5.3 El determinante de una matriz de 3 × 3
En general, hay varias maneras de definir el determinante de una matriz. Por supuesto, todas ellas dan lugar al
mismo número (el determinante de una matriz es único). En este libro estudiaremos la que se llama desarrollo por
filas o columnas y consiste en reducir el problema de calcular el determinante de una matriz de n × n al de calcular
varios determinantes de matrices de (n − 1) × (n − 1). En el caso de una matriz A ∈ R3×3 , veremos que podemos
expresarlo como una combinación de determinantes de “submatrices” de A de tamaño 2 × 2 (para las cuales ya
sabemos calcularlo). ¿Cómo es este procedimiento? Lo mostramos en un ejemplo para la matriz:
 
2 −3 5
 
A= 1
 
3 0
 
−2 7 −1
Lo que primero tenemos que saber es que a cada entrada de la matriz le corresponde un “signo”, + o −,
dependiendo de su ubicación. Esto es lo que debemos considerar mientras hacemos la cuenta del determinante. La
distribución de los signos en una matriz de 3 × 3 es la siguiente:
 
+ − +
 
− + −
 
 
+ − +
¿En qué consiste entonces la fórmula del determinante de una matriz de 3 × 3? Pues primero debemos elegir al azar
una fila o una columna de A. Supongamos que elegimos la fila F1 . Ahora, vamos a ir recorriendo las entradas de la
fila (en alguna dirección que elijamos); por ejemplo, de izquierda a derecha. Comenzamos: la primera entrada es
2. El signo asociado a esta entrada es +. Este signo indica que no debemos cambiarle el signo al número. Lo que
hacemos, a continuación, es “tachar” la fila y la columna en la que está ubicada nuestra entrada actual: en este caso,
como estamos en la posición a11 , debemos tachar la primera fila y la primera columna. Observemos que, al hacer
esto, queda naturalmente una matriz de 2 × 2 en la esquina inferior derecha. En nuestro ejemplo, se trata de 37 −1
0

.
Lo que hacemos, entonces, es multiplicar el número 2 de la entrada a11 (que en este caso no fue modificado por el
signo que le corresponde a la ubicación) por el determinante de esta submatriz menor 37 −10

:

3 0
Cálculo del determinante de A: 2
...
7 −1

Ahora pasamos a la segunda entrada de la fila F1 . En este caso, se trata de un −3. El signo que le corresponde a
esta ubicación es −. Esto nos dice que debemos cambiarle el signo a dicha entrada. Por lo cual, consideraremos el
número 3 para este paso. Ahora, nuevamente, tachamos la fila y la columna a la que pertenece la entrada. Es decir,
tachamos la fila 1 y la columna 2. Nuevamente, obtenemos una submatriz de A de tamaño 2 × 2: aquella que se
forma al quedarnos con las entradas de la matriz que no tachamos (en el mismo orden que aparecen). En nuestro
1 0

ejemplo, es la matriz −2 −1 . Entonces, multiplicamos el número 3 que teníamos en la entrada a12 (le habíamos
cambiado el signo por orden del − que le corresponde a dicha ubicación) por el determinante de esta matriz de
2 × 2, y sumamos este resultado a la cuenta que ya teníamos antes:

3 0 1 0
Cálculo del determinante de A: 2 + 3 ...
7 −1 −2 −1

El último que paso que falta es idéntico a los anteriores. Consideramos la entrada siguiente de la fila, la a13 , que es
el número 5 y no le alteramos el signo pues el que le corresponde a dicha ubicación es +. Tachamos la primera
1 3

fila y la tercera columna y nos queda la submatriz −2 7 . Multiplicamos 5 por el determinante de esta matriz y
sumamos el resultado al cálculo que veníamos haciendo:

3 0 1 0 1 3
Cálculo del determinante de A: 2 + 3 + 5
7 −1 −2 −1 −2

7
Como terminamos de recorrer toda la fila que habíamos elegido, entonces esto concluye el procedimiento. Notemos
que el determinante de A quedó expresado como suma (de múltiplos) de determinantes de tamaño más pequeño.
Solo nos resta calcular estos determinantes:
3 0
7 −1 = 3(−1) − 0,7 = −3
1 0
−2 −1 = 1(−1) − 0(−2) = −1
1 3
−2 7 = 1,7 − 3(−2) = 13
Concluimos entonces que:

3 0 1 0 1 3
det(A) = 2 + 3 + 5 = 2(−3) + 3(−1) + 5,13 = 56
−1 −2 −1 −2

7 7
Observemos que hicimos varias elecciones arbitrarias en este procedimiento: elegimos libremente una fila (también
podríamos haber optado por una columna) para recorrer y, también, en qué sentido recorrerla. La elección que
hicimos se llama desarrollar el determinante por la primera fila. Pero podríamos haber elegido cualquier otra fila o
columna. Esta libertad está justificada pues el mismo procedimiento, realizado para cualquier otra fila y/o columna
y para cualquier recorrido de la misma en cualquier dirección, da el mismo resultado. Como ejemplo, veamos
qué sucedería si hubiéramos desarrollado el determinante por la columna 3 recorriéndola de abajo hacia arriba. En
primer término, consideramos la entrada a33 , que es −1. Como el signo que le corresponde a esta posición es +,
mantenemos el −1. Al tachar la fila 3 y columna 3 nos queda la submatriz 21 −3

3 , por lo que:

2 −3

Cálculo del determinante de A: (−1) ...

1 3
Ahora subimos al lugar a23 , que tiene un 0. Aquí el signo que le corresponde es −, por lo que habría que cambiarle
2 −3

el signo a la entrada. Pero, como es un 0, no hay que hacer nada. La submatriz que obtenemos al tachar es −2 7 ,
por lo cual:
−3 −3

2 2
Cálculo del determinante de A: (−1) + 0 ...
−2

1 3 7
1 3

Finalmente, a la entrada 5 no hay que cambiarle el signo y la submatriz queda −2 7 . Concluimos entonces que:

2 −3 2 −3

1 3
det(A) = (−1)
+0

+5
= (−1)9 + 5,13 = 56.
−2 7 −2 7

1 3
| {z } | {z } | {z }
=9 =20 =13
Les proponemos hacer otros ejemplos (eligiendo otras filas o columnas) para ver que siempre se obtiene el mismo
número. En general, hay elecciones de filas o columnas que hacen las cuentas más sencillas. En efecto, notemos en
este último desarrollo que hicimos (por la última columna) que, cuando estábamos en la posición a23 , tuvimos que
2 −3
hacer 0 −2 7
= 0. Es decir, como la entrada a23 es nula entonces el término correspondiente que le corresponde
al determinante en el desarrollo es 0. En conclusión, si estamos desarrollando el determinante por alguna fila o

columna y en uno de los pasos la entrada es 0, ¡entonces podemos saltearla y seguir con la próxima entrada (no
nula)! En el ejemplo anterior, simplemente podríamos haber calculado:

2 −3

1 3
det(A) = (−1) + 5 = 56
−2 7

1 3
Concluimos, entonces, que, nos conviene siempre desarrollar un determinante por una fila o columna que tenga
muchas entradas nulas. En el ejemplo anterior, también podríamos haber desarrollado por la segunda fila (que
tiene un 0 en la posición a23 ). Como una observación fundamental de este hecho, observemos que es muy sencillo
(casi inmediato) calcular el determinante de las matrices triangulares. Les proponemos descubrirlo en el siguiente
experimento.
Experimento 29 Supongan que tienen una matriz triangular:

 
a11 a12 a13
 
3×3
A= 0 a23  ∈ R
 
a22
 
0 0 a33
¿Por qué fila o columna conviene desarrollar el determinante? ¿Cuál es el resultado que obtienen? ¿Qué pueden
concluir del determinante de las matrices de esta forma?
5.5.4 El determinante de una matriz de n × n
Vamos ahora a generalizar lo hecho para el caso 3 × 3. El procedimiento es exactamente el mismo: elegimos una
fila (o columna), la recorremos en cualquier dirección y vamos multiplicando cada entrada de esa fila (o columna),
modificada por el signo que le corresponde dada su ubicación, por el determinante de la matriz de un tamaño más
pequeño que obtenemos al tachar la fila y columna a la que pertenece la entrada en cuestión. La asignación del signo
en el caso general es la siguiente:  
+ − + ··· ±
 
− + − · · · ∓
 
 
+ − + · · · ±
 
 .. .. .. .. 
 
. . . .
 
± ∓ ± ··· ±
Aquí, el símbolo ± indica que irá un + o un −: será un + si el signo anterior en la fila es un − y será un − si el
signo anterior es un + (lo mismo se puede decir del signo siguiente de la columna; por este motivo, el signo de la
posición a2n aparece como ∓, en lugar de ±, para remarcar que es el signo opuesto). Observemos que, en cada fila
o columna, los signos van alternándose. ¿Cómo recordar esta distribución? El lugar a11 siempre tiene un +, a partir
de ahí ya sea que nos movamos sobre la fila o sobre la columna los signos se alternan.
Otra manera de saber qué signo va en cada lugar es la siguiente regla: el signo que va en la posición aij es “+” si
i + j es un número par y es “−” si i + j es un número impar. Por ejemplo, a la posición a32 le corresponde un “−”
pues 3 + 2 = 5 es impar. La posición a13 le corresponde un “+” pues 1 + 3 = 4 es par. Tengamos en cuenta que a
las entradas de la diagonal siempre le corresponden el signo +.
Antes de mostrar la fórmula general del determinante, hagamos un ejemplo para una matriz de tamaño 4 × 4.
Supongamos que queremos calcular el determinante de la siguiente matriz:
 
2 2 1 −2
 
−3
 
0 4 1
A= 
−1
 
1 1 5
 
0 −2 1 3
Al igual que el caso de matrices de 3 × 3, nos conviene desarrollar por una fila o columna que tenga la mayor
cantidad de entradas nulas. Por ejemplo, podemos elegir la segunda fila. Entonces:

−2 −2

2 1 2 2 2 2 1

det(A) = 3 −1 − 4 + 1 1 −1 .

1 5 1 1 5 1

−2 −2 −2

1 3 0 3 0 1
↑ ↑
cambio cambio
de signo de signo
El determinante de A nos queda entonces en función de determinantes de matrices de 3 × 3. Los calculamos:
2 1 −2
1 −1
= 2 −1
5 1 5
1 3 − −2 3 − 2 −2 1

1 −1 5 = 2(−8) − 13 − 2(−1) = −27
−2 1 3
2 −2
2 1 5 2 −2
3 − −2 3

1 1 5 = 2 −2 = 2,13 − 2 = 24
0 −2 3
2 2 1
1 −1 2 1
= 2 −2 1 − −2 1 = 2(−1) − 4 = −6
1 −1
1

0 −2 1
En el primer determinante desarrollamos por la primera fila y, en los últimos dos, por la primera columna (que
poseía un cero en la posición 3 − 1). Por lo tanto, hemos hallado que:
det(A) = 3(−27) − 4,24 − 6 = −183
Hasta aquí vimos que, cuanto más grande la matriz, más difícil es calcular su determinante. Por ejemplo, en una
matriz de 5 × 5, el procedimiento descompone el determinante en suma de múltiplos de varios determinantes de
4 × 4, y tendremos que calcular estos determinantes de 4 × 4 descomponiendo cada uno en suma de múltiplos
de determinantes de 3 × 3 (que a su vez se descomponen en suma de múltiplos de determinantes de 2 × 2). Más
adelante, estudiaremos algunas propiedades del determinante que nos permitirán simplificar el cálculo del mismo
sin tener que hacer todas estas cuentas.
¿Cómo se define, en general, el determinante de una matriz de n × n? Supogamos, que tenemos A ∈ Rn×n y
llamemos Aij a la submatriz de A de tamaño (n − 1) × (n − 1) que se obtiene al sacar la fila i y la columna j de A
(y dejar el resto de las filas y columnas en su ubicación original). Es decir:

 
  a11 . . . a1j−1 a1j+1 ... a1n
a11 . . . a1j . . . a1n  . .. .. .. 
 .  .. . . . 

 . .. ..  
 . . .    

 a
i−11 . . . ai−1j−1 ai−1j+1 . . . ai−1n 

Aij =  ai1 . . . aij . . . ain  =  .
 

 a 

 . .. ..  . . . ai+1j−1 ai+1j+1 . . . ai+1n 
 ..  i+11
. . 

  .. . .. .. .. 
. . . 

an1 . . . anj . . . ann
 
an1 . . . anj−1 anj+1 . . . ann
Aquí, los aij son las entradas de la matriz A. Entonces, eligiendo la fila 1 para desarrollar, el determinante de A es
el número:
det(A) = a11 det(A11 ) − a12 det(A12 ) + a13 det(A13 ) + · · · ± a1n det(A1n )
El símbolo ± al final dice que el signo + o − será determinado por el tamaño de la matriz: si n es impar, entonces,
será un + y si n es par será un −. Esto se debe simplemente a que estamos modificando cada entrada de la primera
fila teniendo en cuenta el signo que le corresponde por su ubicación. Una manera más formal de decirlo es que la
entrada aij aparece multiplicada por (−1)i+j . Por supuesto, podemos desarrollar por cualquier fila o columna y
obtendremos el mismo resultado. En general, si desarrollamos por la fila k entonces el determinante es la suma de
los términos (−1)k+j akj Akj para todos los j entre 1 y n. Es decir:
det(A) = (−1)k+1 ak1 det(A11 ) + (−1)k+2 ak2 det(A12 ) + · · · + (−1)k+n akn det(Akn )
Escriban la fórmula del determinante si se lo desarrolla por la columna k.
Observación 22 Notemos que el determinante de la matriz identidad (de cualquier tamaño) es 1. También,
al igual que el resultado del Experimento 29, el determinante de una matriz triangular es el producto de las
entradas de la diagonal.
5.5.5 Propiedades del determinante
Vamos a estudiar algunas propiedades del determinante. Esto nos permitirá, en general, simplificar el cálculo de
este número y, a veces, evitarlo completamente. Queremos estudiar ¿cómo cambia el determinante luego de una
operación elemental de fila?
Vimos que el rango de una matriz no se altera al hacer una operación elemental de fila (o columna). En el caso del
determinante, sí se altera y es posible decir exactamente de qué manera.
Intercambio de filas: Si B es la matriz que se obtiene de A al intercambiar las posición de dos filas, entonces,
det(B) = − det(A). Es decir:

a11 ... a1n a11 ... a1n

.. .. .. ..

. .

. .

ai1 ... ain

aj1 ... ajn

.. ..
= − .. ..

. . . .

aj1 ... ajn

ai1 ... ain

.. .. .. ..

. .

. .

an1 ... ann an1 ... ann
Multiplicación de fila por un real no nulo: Si B es la matriz que se obtiene de A al multiplicar una fila por un
λ 6= 0, entonces, det(B) = λ det(A). Es decir:

a ... a1n a ... a1n
11 11
. .. . ..
. .
. . . .

= λ ai1

λai1 ... λain ... ain

. .. . ..
.. ..

.
.

Suma a una fila un múltiplo de otra: Si B es la matriz que se obtiene de A al sumar a una fila un múltiplo de
otra, entonces det(B) = det(A); vale decir, en este caso el determinante no cambia:

a11 ... a1n a
11 ... a1n

.. .. .
. ..

. . . .

= ai1

ai1 + λaj1 ... ain + λajn ... ain

.. .. .
.. ..

. . .

Las mismas propiedades valen si intercambiamos la palabra “fila” por “columna” en los items anteriores.
Calculen el determinante de la matriz λA para λ ∈ R, teniendo en cuenta que todas las entradas de la matriz
λA están multiplicadas por λ..
Estas operaciones pueden utilizarse para simplificar el cálculo del determinante. Por ejemplo, consideren la matriz:
 
14 21 42
 
A = 32 52 90 ∈ R3×3
 
 
18 15 38
Esta matriz tiene números muy grandes y va a ser incómodo hacer cuentas con estos números. Observemos que las
entradas de la primera fila son todos múltiplos de 7. Por lo tanto, podemos utilizar la segunda propiedad enunciada
arriba para escribir:

14 21 42 7,2 7,3 7,6 2 3 6

90 = 32 90 = 7 32

32 52 52 52 90

18 15 38 18 15 38 18 15 38
Ahora, como restar a una fila un múltiplo de otra no altera el determinante, entonces podemos hacer las operaciones
F2 → F2 − 16F1 y F3 → F3 − 9F1 y obtener:

14 21 42 2 3 6

32 52 90 = 7 0 −6

4

−12 −16

18 15 38 0
Este último determinante es más sencillo de calcular; podemos desarrollar por la primera columna y obtener:

2 3 6
−6

4

0 4 −6

= 2 = 2(−64 − 72) = −272
−12 −16

0 −12 −16

Por lo tanto,

14 21 42

90 = 7(−272) = −1904

32 52

18 15 38
Tengamos en cuenta que, en el ejemplo recién visto, apuntamos a conseguir ceros en la primera columna para
poder desarrollar por allí y ahorrarnos cuentas (al solo tener que calcular un determinante de 2 × 2). Una posible
estrategia para calcular el determinante de una matriz puede ser la siguiente: triangular la matriz (utilizando las
operaciones elementales de filas) llevando la cuenta de cómo va cambiando el determinante según la operación
que utilicemos. Como el determinante de una matriz triangular es, simplemente, el producto de las entradas en la
diagonal, solo debemos multiplicar este último determinante por los factores que fueron alterando el determinante
original mientras hacíamos las operaciones de filas. Por ejemplo, en el ejemplo anterior habíamos visto que:

14 21 42 2 3 6

32 52 90 = 7 0 −6

4

0 −12 −16

18 15 38
Por ejemplo, a la última matriz que obtuvimos del ejemplo anterior, podemos hacerle F3 → F3 + 3F2 y obtener el
determinante de una matriz triangular (nuevamente, esta operación no cambia el determinante que teníamos):

14 21 42 2 3 6

32 52 90 = 7 0 4 −6 = 7,2,4.(−34) = −1904

0 0 −34

18 15 38
Ejemplifiquemos cómo fueron los pasos que hicimos para tener presente cómo y cuándo fue cambiando el de-
terminante original. Notaremos con Ai a las matrices que vamos obteniendo en cada paso de la triangulación.
1
Observemos que “sacar el factor 7” de la primera fila de la matriz original equivale a multiplicar por 7 la primer fila
de dicha matriz:
1
7 F1 F →F −16F F →F +3F
A −− −→ A1 −−2−−−2−−−−→
1
A2 −−3−−−3−−−→
2
A3
F3 →F3 −9F1
Como A3 está triangulada, entonces su determinante es el producto de sus entradas en la diagonal. ¿Cómo se
relacionan el determinante que buscamos (el de A) con el de A3 ? Analizamos los pasos que hicimos para triangular
A. El primer paso consistió en multiplicar F1 por 17 . Esto quiere decir, precisamente, que la primera fila de A es
7 veces la primera fila de A1 . Por lo tanto, det(A) = 7 det(A1 ), según nos dice la propiedad del determinante
respecto de esta operación elemental. Por otro lado, a partir de A1 , las operaciones siguientes que hicimos no alteran
el determinante. Por lo tanto, det(A1 ) = det(A2 ) = det(A3 ). Concluimos que det(A) = 7 det(A1 ) = 7 det(A3 ).
Como el determinante de A3 es 2,4.(−34) = −272, entonces, det(A) = −1904.
Hagamos un ejemplo más de cómo calcular el determinante triangulando la matriz. Consideremos la matriz:
 
5 −5 2
 
A = 3 −2 −15 ∈ R3×3
 
 
1 3 6
La triangulamos:
     
5 −5 2 1 3 6 1 3 6
  F lF    
 1 3   F2 →F2 −3F1 
−2 −15 −−−−→ 3 −2 −15 −−−−−−−−→ 0 −11 −33 −→
 
3
    F3 →F3 −5F1  
1 3 6 5 −5 2 0 −20 −28
| {z } | {z } | {z }
A A1 A2
   
1 36 1 3 6
1
− 11 F2 
   
 F3 →F3 −5F2 
−−− −→ 0 1 3 −−−−−−−−→ 0

1 3
− 14 F3    
0 5 7 0 0 −8
| {z } | {z }
A3 A4
Hemos llegado, entonces, a una matriz triangulada y es sencillo ver que su determinante es −8. Analicemos cómo
fue cambiando el determinante durante las operaciones de la triangulación. Veremos que es conveniente empezar
desde atrás.
Como la operación A3 → A4 no altera el determinante, entonces, det(A4 ) = det(A3 ).
Como A2 se obtiene de A3 al multiplicar la fila F2 por −11 y la fila F3 por −4, entonces, det(A2 ) =
(−11)(−4) det(A3 ).
Como las operaciones en A1 → A2 no alteran el determinante, entonces, det(A2 ) = det(A1 ).
Como en A → A1 intercambiamos filas, entonces, det(A) = − det(A1 ).
“Desandando” toda esta información de abajo hacia arriba, obtenemos:
det(A) = − det(A1 ) = − det(A2 ) = −(−11)(−4) det(A3 )

= −(−11)(−4) det(A4 ) = −(−11)(−4)(−8) = 352
Experimento 30 Analicen las siguientes preguntas respecto del determinante:
1. ¿Cuál es el determinante de una matriz que tiene una fila (o columna) de ceros?
2. ¿Cúal es el determinante de una matriz que tiene dos filas (o dos columnas) iguales?
3. ¿Cuál es el determinante de una matriz de n × n que tiene rango menor a n?

Desde un comienzo precisamos que la propiedad que más nos importa del determinante es que el mismo establece
cuándo una matriz es inversible. Lo dejamos anunciado:
Proposición 23 Una matriz A ∈ Rn×n es inversible sí, y solo sí, det(A) 6= 0.
Esto ya lo trabajamos para matrices de 2 × 2. Una manera de convencerse que también es válido para matrices
de cualquier tamaño es la siguiente: en el apartado anterior vimos que, si triangulamos una matriz, entonces el
determinante de la matriz triangulada es modificado por algunos cambios de signo y por productos por números
reales no nulos. Observemos que estas modificaciones no afectan si el determinante es o no 0; es decir, si el
determinante de la matriz original es no nulo, entonces el de la matriz triangulada también; y viceversa. Sabemos
que el determinante de una matriz triangular es el producto de las entradas de la diagonal y, cuando estudiamos
rango, vimos que una matriz es inversible sí, y solo sí, cuando la triangulamos, no le quedan entradas nulas en la
diagonal. Por lo tanto, ¡una matriz es inversible sí, y solo sí, su determinante es no nulo!
4+kk 7

Ejemplo 56 ¿Para que valores de k ∈ R es inversible 3 k 6 ∈ R3×3 ? La matriz es inversible sí, y solo sí, su
3−k 0 k
determinante no es 0. Calculamos el determinante (desarrollando por la columna 2):

4+k k 7

k 6 = −k(3k − 6(3 − k)) + k((4 + k)k − 7(3 − k))

3

3−k 0 k

= −k(9k − 18) + k(k2 + 11k − 21) = k(−9k + 18 + k2 + 11k − 21)

= k(k2 + 2k − 3) = k(k − 1)(k + 3).
Este determinante se anula para k = 0, k = 1 y k = −3. Esto quiere decir que la matriz es inversible para todo k
distinto de esos valores.
La última propiedad que vamos a estudiar del determinante es cómo se comporta respecto de la multiplicación de
matrices.
Proposición 24 Si A, B ∈ Rn×n entonces det(A · B) = det(A) det(B).
Es decir, “el determinante del producto de dos matrices es el producto de los determinantes de dichas matrices”.
Esto tiene muchas consecuencias que les dejamos para que averigüen en el siguiente experimento.
Experimento 31 Sea A ∈ Rn×n . Usando la Proposición 24, respondan las siguientes preguntas.
1. ¿Cuál es el determinante de Ak , la potencia k-ésima de A? Aquí k ∈ N.

2. Si A es inversible, ¿cuál es el determinante de A−1 ? Recuerden que AA−1 = I.
3. Si B ∈ Rn×n no es inversible, ¿qué pueden decir de A · B y de B · A?
4. Si A · B es inversible, ¿qué pueden decir de A y de B?

5.5.6 Utilizando el determinante para clasificar sistemas lineales
Ya sabemos que un sistema de ecuaciones lineales con igual cantidad de ecuaciones que de incógnitas es compatible
determinado sí, y solo sí, su matriz asociada es inversible. Podemos entonces concluir que un sistema de ecuaciones
lineales con igual cantidad de ecuaciones que de incógnitas es compatible determinado sí, y solo sí, su matriz
asociada tiene determinante no nulo. Por lo tanto, para clasificar un sistema, el determinante nos indica de manera
directa si es o no compatible determinado. En caso que el determinante sea nulo, tendremos que estudiarlo de otra
manera para determinar si se trata de un sistema compatible indeterminado o un sistema incompatible.
El determinante es espacialemente útil a la hora de resolver sistemas de ecuaciones lineales con parámetros. En
efecto, consideremos nuevamente el sistema de la página 135:

 x + kx2 + x3 = 0
 1


2x1 + x3 = 0



 2x + kx + kx
1 2 3 = 0
En lugar de triangular este sistema y analizar para qué valor de k se anula alguna entrada de la diagonal, podemos
directamente calcular el determinante (por la segunda columna, por ejemplo):
 
1 k 1
 
det 2 0 1 = −k(2k − 2) − k(1 − 2) = −k(2k − 2 − 1) = −k(2k − 3).
 
 
2 k k
El número −k(2k − 3) se anula para los valores k = 0 y k = − 32 . Por lo tanto, para los valores de k distintos de 0
y − 32 , el sistema es compatible determinado. Observemos qué sencillo fue hallar estos valores de k, sin necesidad
de triangular la matriz con el k como entrada. Por supuesto, debemos aún analizar los casos k = 0 y k = − 32 por
separado para determinar si en esos casos el sistema es incompatible o compatible indeterminado.
Hagamos un último ejemplo. Clasifiquemos nuevamente el sistema con dos parámetros de la página 138 utilizando
determinantes:



 (a + 1)x + y + z = 1

x + (a + 1)y + z = b


= b2

 x + y + (a + 1)z
Ya sabemos que, para que el sistema sea compatible determinado, depende solo de la matriz (no ampliada) asociada
al sistema. Por lo tanto, calculamos el determinante (desarrollando por la primera fila):
 
a+1 1 1
 
det  = (a + 1)((a + 1)2 − 1) − ((a + 1) − 1) + (1 − (a + 1))
 
1 a+1 1 
 
1 1 a+1
= (a + 1)(a2 + 2a) − 2a = a(a + 1)(a + 2) − 2a
= a((a + 1)(a + 2) − 2) = a(a2 + 3a) = a2 (a + 3)

El determinante de la matriz asociada se anula, entonces, en a = 0 y a = −3, por lo que ya podemos concluir que
para los valores de a distintos de estos dos, el sistema es compatible determinado. Por último, nos resta analizar los
casos a = 0 y a = −3 reemplazando en la matriz ampliada asociada:
Caso k = 0 Caso k = −3
   
1 1 1 1 −2 1 1 1
   
−2
   
 1 1 1 b   1 1 b 
   
1 1 1 b2 1 1 −2 b2
En el primer caso, las tres ecuaciones asociadas a la matriz son la misma ecuación. Por lo tanto, para que el sistema
no sea incompatible, lo que está del otro lado de la igualdad (los coeficientes independientes) deben ser iguales. Es
decir, para que el sistema sea compatible indeterminado debe suceder 1 = b = b2 , cuya única solución es b = 1.
Para b 6= 1, el sistema es incompatible. En el segundo caso, ya no es tan inmediato darse cuenta quien tiene que ser
b para que el sistema no sea incompatible. Debemos triangular:
   
−2 1 1 1 1 1 −2 b2
  F lF  
 1 3 
 1 −2 1 b  −−−−→  1 −2 1 b  −→
 
   
1 1 −2 b2 −2 1 1 1
   
1 1 −2 b2 1 1 −2 b2
   
F →F2 −F1   F3 →F3 +F2 
−−2−−−− −−→  0 −3 3 b − b2  −−−−−−−→  0 −3 3 b − b2


F3 →F3 +2F1    
0 3 −3 1 + 2b2 0 0 0 b2 + b + 1
Por lo tanto, el sistema será compatible indeterminado sí, y solo sí, b2 + b + 1 = 0. Pero como este número siempre
es mayor a cero (cualquiera sea el b ∈ R), entonces el sistema es incompatible siempre. De esta manera, arribamos
a las mismas conclusiones que en nuestra resolución original (de la página 139), solo que haciendo menos cuentas.
Definimos el determinante de una matriz cuadrada.

Aprendimos a calcular el determinante de una matriz mediante el desarrollo por filas o columnas.
Estudiamos las propiedades básicas del determinante: su relación con las operaciones elementales de filas (o columnas)
y su relación con la inversibilidad de la matriz.
Utilizamos el determinante para clasificar y resolver sistemas de ecuaciones lineales (con y sin parámetro).

6. Transformaciones lineales
Las transformaciones lineales son un tipo de funciones entre espacios vectoriales, que preservan su geometría
lineal. Las mismas sirven para modelar una gran variedad de operaciones geométricas, tales como rotaciones,
simetrías, proyecciones, etc. En este capítulo estudiaremos su definición, propiedades y aplicaciones.
6.1 La transformación lineal

Comencemos entendiendo la propiedad definitoria de las transformaciones lineales, sus características principales y
la manera de representarlas.
La definición transformación lineal.

Ejemplos de varias transformaciones lineales.
Las propiedades básicas de estas funciones.
La representación funcional y la representación matricial de una transformación lineal.
Cómo construir transformaciones lineales.

6.1.1 ¿Que caracteriza a una transformación lineal?
La idea fundamental de una transformación lineal es que envía un espacio lineal a otro espacio lineal, respetando
las operaciones (de suma y producto por escalar) definidas en estos espacios. Por ejemplo, envía una recta L a
otra recta L0 , pero lo hace de forma tal que, entre otras cosas, si el punto P ∈ L es enviado al punto P 0 ∈ L0 y, el
punto Q ∈ L, a Q0 ∈ L0 , entonces el punto medio entre P y Q es enviado al punto medio entre P 0 y Q0 . ¿Qué
característica de una función nos garantiza tener esta propiedad? Sabemos que el punto medio entre P y Q se
P +Q
calcula 2 . Tengamos en cuenta que, si solicitamos que la función en cuestión envíe “sumas en sumas” (en el
sentido que a un punto P + Q lo envíe a P 0 + Q0 ) y que, además, envíe “múltiplos en múltiplos” (en el sentido que
a un múltiplo λP lo envíe a λP 0 ), entonces tendremos garantizado que el punto medio entre P y Q también sea
P +Q
enviado al punto medio entre P 0 y Q0 . En efecto, 2 = 12 (P + Q), por lo cual es enviado al múltiplo de 1
2 del
0 0
destino de P + Q, que es precisamente P + Q . Estas propiedades de respetar la suma y el producto por escalar
son, entonces, las propiedades características de las transformaciones lineales.
Definición 55 Una función T : Rn → Rm es una transformación lineal si cumple las siguientes dos condiciones:
1. T (λ~v ) = λT (~v ) para todo λ ∈ R y para todo ~v ∈ Rn .
2. T (~v + w)
~ = T (~v ) + T (w) ~ ∈ Rn .
~ para todo ~v , w
Observación 25 Las dos propiedades definitorias de las transformaciones lineales (contenidas en la definición
anterior) pueden expresarse informalmente diciendo que “sacan escalares afuera” y “abren sumas”.
Como una transformación lineal es una función entre un espacio Rn y un espacio Rm , entonces, a cada punto
(x1 , . . . , xn ) ∈ Rn , le asigna un punto (y1 , . . . , ym ) ∈ Rm . Si llamamos T a la transformación lineal, entonces
T (x1 , . . . , xn ) respresenta al punto (y1 , . . . , ym ) (al igual que f (x) suele representar la imagen del punto x por
la función real f ). Al igual que las funciones de valores reales, el espacio de salida Rn se lo llama el dominio
de la transformación lineal y al espacio de llegada Rm , el codominio. Como (y1 , . . . , ym ) depende de quién es
(x1 , . . . , xn ), entonces cada coordenada de (y1 , . . . , ym ) depende de las coordenadas x1 , . . . , xn . Veremos en breve
que esta dependencia es por medio de una relación lineal. Por ejemplo, la función T : R2 → R3 , definida por
T (x1 , x2 ) = (x1 + x2 , 5x2 , 3x1 − 2x2 ), es una transformación lineal entre R2 y R3 . El punto (1, 2) ∈ R2 es
enviado al punto:
T (|{z} 2 ) = (1 + 2 , 5,2 , 3,1 − 2,2) = (3, 10, −1) ∈ R3
1 , |{z}
| {z } |{z} | {z }
x1 x2 x1 +x2 5x2 3x1 −2x2
Ejemplo 57
Si T : R3 → R2 está definida por T (x1 , x2 , x3 ) = (2x1 +x2 −x3 , x1 −4x3 ), entonces T es una transformación
lineal. Veamos que cumple las dos condiciones de la definición. Para saber que saca escalares afuera, veamos
cuánto es T (λ(x1 , x2 , x3 )) para cualquier λ ∈ R:
T (λ(x1 , x2 , x3 )) = T (λx1 , λx2 , λx3 )

= (2λx1 + λx2 − λx3 , λx1 − 4λx3 )
Nuestro objetivo es ver que esta última expresión es igual a λT (x1 , x2 , x3 ). Para ello, saquemos λ de factor
común:
T (λ(x1 , x2 , x3 )) = (2λx1 + λx2 − λx3 , λx1 − 4λx3 )

= λ(2x1 + x2 − x3 ), λ(x1 − 4x3 )
= λ(2x1 + x2 − x3 , x1 − 4x3 )
= λT (x1 , x2 , x3 )
Esto prueba que T cumple la primera condición para ser transformación lineal. Veamos ahora que T también
abre sumas:
T ((x1 , x2 , x3 ) + (y1 , y2 , y3 )) = T (x1 + y1 , x2 + y2 , x3 + y3 )

= 2(x1 + y1 ) + (x2 + y2 ) − (x3 + y3 ), (x1 + y1 ) − 4(x3 + y3 )
= (2x1 + 2y1 + x2 + y2 − x3 − y3 , x1 + y1 − 4x3 − 4y3 )
Debemos comprobar que esta última expresión es igual a T (x1 , x2 , x3 ) + T (y1 , y2 , y3 ). Para ello, agrupemos,
Álgebra A. La transformación lineal. 169
por un lado, las coordenadas con x1 , x2 o x3 y, por el otro, las que tienen y1 , y2 o y3 . Entonces:
T ((x1 , x2 , x3 ) + (y1 , y2 , y3 )) = (2x1 + 2y1 + x2 + y2 − x3 − y3 , x1 + y1 − 4x3 − 4y3 )

= (2x1 + x2 − x3 , x1 − 4x3 ) + (2y1 + y2 − y3 , y1 − 4y3 )
= T (x1 , x2 , x3 ) + T (y1 , y2 , y3 ).
Con esto, hemos terminado de probar que T es una transformación lineal.

Si T : R3 → R2 está ahora definida por T (x1 , x2 , x3 ) = (2x1 + x2 − x3 + 1, x1 − 4x3 ), entonces T no es una
transformación lineal. Por ejemplo, no se cumple la segunda condición: T ((0, 0, 0) + (0, 0, 0)) = T (0, 0, 0) =
(1, 0). Pero T (0, 0, 0) + T (0, 0, 0) = (1, 0) + (1, 0) = (2, 0).
Por último, si T : R3 → R2 está definida por T (x1 , x2 , x3 ) = (2x1 +x2 −x3 , x21 −4x3 ), entonces T tampoco es
una transformación lineal. No se cumple, por ejemplo, la primera condición: T (2(1, 0, 0)) = T (2, 0, 0) = (4, 4),
pero 2T (1, 0, 0) = 2(2, 1) = (4, 2). O sea T (2(1, 0, 0)) 6= 2T (1, 0, 0).

Los siguientes son ejemplos de funciones, estudiadas en la escuela secundaria, que siempre son transformaciones
lineales:
Ejemplo 58
La función nula 0 : Rn → Rm , dada por 0(~v ) = ~0 ∈ Rm para todo ~v ∈ Rn .

La función identidad id : Rn → Rn , dada por id(~v ) = ~v para todo ~v ∈ Rn .
La función lineal con ordenada al origen cero f : R → R, dada por f (x) = ax para todo x ∈ R.

Experimento 32 Muestren que una transformación lineal T : Rn → Rm cumple las siguientes propiedades:
T (~0) = ~0;
T (−~v ) = −T (~v ) para todo ~v ∈ Rn ;
T (~v − w)
~ = T (~v ) − T (w) ~ ∈ Rn ;
~ para todo ~v , w
T (α1~v1 + α2~v2 + · · · + αr v~r ) = α1 T (~v1 ) + α2 T (~v2 ) + · · · + αr T (v~r ) para todo α1 , α2 , · · · , αr ∈ R
y ~v1 , ~v2 , · · · , v~r ∈ Rn .

Observación 26 La última propiedad del experimento anterior dice que las transformaciones lineales mandan
una combinación lineal de los v1 , . . . , vr en la misma combinación lineal en los T (v1 ), . . . , T (vr ) (en el sentido
que los coeficientes son los mismos).
6.1.2 Forma funcional y matricial de una transformación lineal
Analicemos la tranformación lineal T : R3 → R2 del primer ejemplo del apartado anterior con más detalle.
Recordemos la fórmula: T (x1 , x2 , x3 ) = (2x1 + x2 − x3 , x1 − 4x3 ). Esta es la forma funcional de la transformación
lineal (está escrita en forma de función). Recordemos que la base canónica de Rn es la base de este espacio compuesta
por los vectores {(1, 0, 0, . . . , 0, 1), (0, 1, 0, . . . , 0, 1), . . . , (0, 0, 0, . . . , 0, 1)}. En particular, la base canónica de R3
es {(1, 0, 0), (0, 1, 0), (0, 0, 1)}. Veamos qué hace T con los vectores de esta base.
T (1, 0, 0) = (2,1 + 0 − 0, 1 − 4,0) = (2, 1),

T (0, 1, 0) = (2,0 + 1 − 0, 0 − 4,0) = (1, 0),
T (0, 0, 1) = (2,0 + 0 − 1, 0 − 4,1) = (−1, −4).
En general, para un punto (x1 , x2 , x3 ) ∈ R3 cualquiera, tenemos:
T (x1 , x2 , x3 ) = T (x1 (1, 0, 0) + x2 (0, 1, 0) + x3 (0, 0, 1))

= T (x1 (1, 0, 0)) + T (x2 (0, 1, 0)) + T (x3 (0, 0, 1))
= x1 T (1, 0, 0) + x2 T (0, 1, 0) + x3 T (0, 0, 1)
= x1 (2, 1) + x2 (1, 0) + x3 (−1, −4)
= (2x1 , x1 ) + (x2 , 0) + (−x3 , −4x3 )
= (2x1 + x2 − x3 , x1 − 4x3 ).
¿Qué pasó al final? ¡Volvimos a la fórmula original! Es que, al saber lo que hace una transfomación lineal en una
base del dominio, se puede deducir lo que hace con un vector cualquiera. Volveremos sobre esta idea en el siguiente
apartado. Por otra parte, observemos que la última expresión se puede reescribir en forma matricial de la siguiente
manera:  
  x1
2 1 −1  
(2x1 + x2 − x3 , x1 − 4x3 ) =  ·
 x2  .

1 0 −4  
x3
2 1 −1

La matriz A = 1 0 −4 es la matriz asociada a la transfomación lineal T . En sus columnas tiene, en orden, las
imágenes de los vectores de la base canónica. Notemos que, como T va de R3 a R2 , entonces A ∈ R2×3 .
Definición 56 Dada una transformación lineal T : Rn → Rm , existe una única matriz A ∈ Rm×n tal que T
puede escribirse en la forma:  

x1
 . 
 
T (x1 , . . . , xn ) = A ·  .. 
 
xn
o de modo equivalente,
T (~v ) = A · ~v ,
donde el vector ~v = (x1 , . . . , xn ). La representación T (~v ) = A · ~v se llama expresión matricial canónica de

T y a la matriz A se la denomina la matriz de la transformación lineal T . La matriz A tiene en la columna
ei ), con e~i el i-ésimo vector de la base canónica de Rn (es decir, el vector que tiene un 1 en
i-ésima a vector T (~
la coordenada i y 0 en el resto de las coordenadas).
Si ahora consideramos una matriz A ∈ Rm×n y definimos una función T : Rn → Rm por medio de la fórmula:
 
x1
 .. 
 
T (x1 , . . . , xn ) = A ·  . 
 
xn
, entonces es fácil ver que T resulta una transformación lineal. Por lo tanto, a cada transformación lineal le
corresponde una matriz (su matriz asociada canónica) y a cada matriz le corresponde una transformación lineal (la
determinada por la multiplicación de un vector por la matriz). Por lo tanto, la forma funcional y la forma matricial
son maneras equivalentes de representar una misma transformación lineal.
Ejemplos 59
1 1

La matriz asociada a la transformación lineal T (x1 , x2 ) = (x1 + x2 , 5x2 , 3x1 − 2x2 ) es: 0 5 . Por lo tanto,
3 −2
la forma matricial de T es:  

1 1
 
T (~v ) = 0 5  · ~v
 
 
3 −2
La transformación lineal asociada a la matriz 25 03 −1 0 2×4

0 −2 ∈ R tiene por forma funcional a T (x1 , x2 , x3 , x4 ) =
(2x1 − x3 , 5x1 + 3x2 − 2x4 ).

Observación 27 Observemos que, cuando la transformación lineal es dentro del mismo espacio Rn , entonces
la matriz asociada es cuadrada.
6.1.3 Cómo construir transformaciones lineales
Tal como establecimos en el apartado anterior, una transformación lineal queda completamente determinada por los
valores que toma en una base de su dominio. Veamos un ejemplo. Hallemos, si es posible, una transformación lineal
T que vaya de R2 a R3 tal que T (1, 0) = (1, 0, 1) y T (0, 1) = (1, 2, 3). Luego, buscamos la expresión funcional de
T . Dado (x1 , x2 ) ∈ R2 cualquiera, se puede escribir:
(x1 , x2 ) = x1 (1, 0) + x2 (0, 1)
Si aplicamos T a ambos lados de la igualdad, tenemos:
T (x1 , x2 ) = T (x1 (1, 0) + x2 (0, 1))
Como estamos buscando una transformación lineal, entonces debemos requerir que T abra sumas y saque escalares
afuera. Por lo tanto, si abrimos primero la suma y, luego, sacamos los escalares x1 , x2 afuera, obtenemos lo siguiente:
T (x1 , x2 ) = x1 T (1, 0) + x2 T (0, 1)
Dado que T (1, 0) y T (0, 1) son datos, entonces, queda:
T (x1 , x2 ) = x1 (1, 0, 1) + x2 (1, 2, 3) = (x1 , 0, x1 ) + (x2 , 2x2 , 3x2 ) = (x1 + x2 , 2x2 , x1 + 3x2 )
Esta es la forma funcional de una transformación lineal. Observemos que T quedó unívocamente determinada por
los valores T (1, 0) y T (0, 1): la transformación lineal tiene que ser necesariamente T (x1 , x2 ) = (x1 + x2 , 2x2 , x1 +
3x2 ). Esto tiene que ver con que tenemos el dato de cuanto vale T en los vectores de una base. ¿Qué hubiera
sucedido si nos hubieran dado los valores de T en una base que no es canónica? Miren el siguiente ejemplo.
Ejemplo 60 Hallemos, si es posible, una transformación lineal T : R2 → R3 tal que T (1, 1) = (1, 0, 1) y
T (−1, 1) = (1, 2, 3). En este caso, nos dan como dato los valores de la transformación lineal en la base {(1, 1), (1, −1)},
que no es la base canónica. Pero esto no representa inconveniente alguno, ya que podemos realizar el mismo razonamiento
que acabamos de hacer más arriba. Dado (x1 , x2 ) ∈ R2 cualquiera, como {(1, 1), (1, −1)} es base de R2 , se puede
escribir:
(x1 , x2 ) = α1 (1, 1) + α2 (1, −1)
En este caso, hay que trabajar un tanto más pues debemos hallar α1 y α2 . Si desarrollamos la expresión anterior, queda:
(x1 , x2 ) = (α1 , α1 ) + (α2 , −α2 ) = (α1 + α2 , α1 − α2 ).
Si igualamos coordenada a coordenada, obtenemos un sistema de dos ecuaciones y dos incógnitas del que queremos
despejar α2 y α2 : 
α1 + α2 = x1

α1 − α2 = x2

x1 + x2 x1 − x2
Observamos que α1 = y α2 = . Entonces, podemos escribir:
2 2
x1 + x2 x1 − x2
(x1 , x2 ) = (1, 1) + (1, −1).
2 2
Si aplicamos T a ambos lados de la igualdad:
x1 +x2 x1 −x2
T (x1 , x2 ) = 2
T (1, 1) + 2
T (1, −1) =
x1 +x2 x1 −x2
= 2
(1, 0, 1) + 2
(1, 2, 3) =
x1 −x2
x1 +x2
, 0, x1 +x , 2 x1 −x , 3 x1 −x
2
2 2

= 2 2
+ 2 2 2
=
1 1 1 1
x2 , 12 x1 1
+ 23 x1 − 32 x2 =

= x
2 1
+ x
2 2
+ x
2 1
− x , x1
2 2
− + x
2 2
= (x1 , x1 − x2 , 2x1 − x2 )
Y esta es la fórmula de la transformación lineal pedida.
El razonamiento que hicimos en el ejemplo anterior se puede realizar en una transformación lineal T : Rn → Rm
general: si {~v1 , ~v2 , · · · , ~vn } es una base de Rn , entonces todo ~v ∈ Rn se escribe como combinación lineal de la
base:
~v = α1~v1 + α2~v2 + · · · + αn~vn .
Si aplicamos T a ambos miembros y usamos las propiedades definitorias de las transformaciones lineales, obtenemos:
T (~v ) = α1 T (~v1 ) + α2 T (~v2 ) + · · · + αn T (~vn ).
Por lo tanto, para calcular T (~v ), para cualquier ~v ∈ Rn , solo necesitamos conocer T (v1 ), T (v2 ), . . ., T (vn ).
Teorema 28 Si {v1 , v2 , . . . , vn } es una base de Rn y w1 , w2 , . . . , wn son vectores (no necesariamente dis-
tintos) en Rm , entonces hay una única transformación lineal T : Rn → Rm tal que T (v1 ) = w1 , T (v2 ) =
w2 , . . . , T (vn ) = wn .
Tengamos en cuenta que, en el enunciado del teorema anterior, no hay restricciones sobre quienes pueden ser los
w1 , . . . , wn ∈ Rn . Pueden ser vectores cualesquiera. Por ejemplo, hallemos, si es posible, una transformación
lineal T tal que T (1, 0, 0) = (1, 1, 2), T (0, 1, 0) = (−1, 2, 3) y T (2, 2, 1) = (0, 1, 2). Este caso es análogo a la
construcción que realizamos en el ejemplo anterior, dado que {(1, 0, 0), (0, 1, 0), (2, 2, 1)} es una base de R3 . Si
(x1 , x2 , x3 ) ∈ R3 es un elemento cualquiera, entonces:
(x1 , x2 , x3 ) = α1 (1, 0, 0) + α2 (0, 1, 0) + α3 (2, 2, 1)
Les proponemos verificar que se obtiene del siguiente sistema de ecuaciones:




 α1 + 2α3 = x1


 α2 + 2α3 = x2



α
3 = x3
x1 − 2x3 x2 − 2x3
La única solución de este sistema es α1 = , α2 = y α3 = x3 . Por lo tanto,
2 2
x1 − 2x3 x2 − 2x3
(x1 , x2 , x3 ) = (1, 0, 0) + (0, 1, 0) + x3 (2, 2, 1).
2 2
Si aplicamos T a ambos lados, resulta:
x1 −2x3
T (x1 , x2 , x3 ) = 2 T (1, 0, 0) + x2 −2x
2
3
T (0, 1, 0) + x3 T (2, 2, 1) =
x1 −2x3
= 2 (1, 1, 2) + x2 −2x
2
3
(−1, 2, 3) + x3 (0, 1, 2) =
x1 −x2 x1 +2x2 −4x3 2x1 +3x2 −6x3

= 2 , 2 , 2
Esta es la forma funcional de T .

Importante Si los datos no están formulados sobre una base de Rn , pueden pasar varias cosas: o bien no existe
una transformación lineal que verifique los datos pedidos, o bien existe, pero no es es única.
Ejemplos 61
Hallemos, si es posible, una transformación lineal T : R3 → R3 tal que T (1, 0, 0) = (1, 1, 2), T (0, 1, 0) =
(−1, 2, 3) y T (2, 2, 0) = (0, 1, 3). Notemos que {(1, 0, 0), (0, 1, 0), (2, 2, 0)} no es una base de R3 . En efecto,
(2, 2, 0) = 2(1, 0, 0) + 2(0, 1, 0).
Si existiera una transformación lineal que verifique los datos proporcionados debería, por las propiedades de las
transformaciones lineales, preservar esa relación:
T (2, 2, 0) = 2T (1, 0, 0) + 2T (0, 1, 0).
Sin embargo, tenemos:
T (2, 2, 0) = (0, 1, 3) 6= (0, 6, 10) = 2(1, 1, 2) + 2(−1, 2, 3) = 2T (1, 0, 0) + 2T (0, 1, 0).
Concluimos que no existe una transformación lineal verificando los datos proporcionados: las condiciones
impuestas son incompatibles.
Hallemos ahora, y si es posible, una transformación lineal T : R3 → R3 tal que: T (1, 0, 0) = (1, 1, 2),
T (0, 1, 0) = (−1, 2, 3) y T (2, 2, 0) = (0, 6, 10). Observemos que los datos para construir la transformación
lineal, en este caso, son idénticos a los del ejemplo anterior, salvo que, ahora, el vector (2, 2, 0) va a parar al
(0, 6, 10) (en lugar del (0, 1, 3)). Si revisamos el ejemplo anterior, vemos que ahora sí es compatible el valor que
toma (2, 2, 0) con los valores que asumen los otros dos vectores dato. ¿Qué sucede en este caso? El último dato
no nos aporta información ni restricciones sobre la transformación lineal T que estamos buscando. Como vimos
antes, podría determinar que no exista la transformación lineal (si fuese incompatible con las otras), pero si es
compatible, no nos dice nada. Entonces, ¿cómo definimos una T que satisfaga los datos requeridos? La forma
más fácil de definir una transformación lineal es decir qué valores toma en una base. Extendamos, entonces, el
conjunto {(1, 0, 0), (0, 1, 0)} (que son los vectores linealmente independientes de los cuales podemos utilizar los
datos proporcionados) a una base de R3 ; por ejemplo, a la base canónica {(1, 0, 0), (0, 1, 0), (0, 0, 1)}. Dado
que T (1, 0, 0) = (1, 1, 2) y T (0, 1, 0) = (−1, 2, 3), nos falta determinar T (0, 0, 1). Pero el valor de T (0, 0, 1)
lo podemos elegir sin restricciones. Esto indica que existen infinitas posibles transformaciones lineales que
verifiquen lo pedido: las condiciones impuestas son compatibles pero no la determinan de manera única. Por
ejemplo, podemos decidir T (0, 0, 1) = (0, 0, 0). En ese caso, nos quedaría la transformación lineal:
T (x1 , x2 , x3 ) = (x1 − x2 , x1 + 2x2 , 2x1 + 3x2 − x3 ),
.

Aprendimos la idea detrás de la noción de transformación lineal: una función que preserva la estructura de los espacios
lineales.
Trabajamos la definición formal de transformación lineal: “abre sumas” y “saca escalares afuera”.
Conocimos las propiedades básicas de las transformaciones lineales.
Desarrollamos la forma funcional y la forma matricial de una transformación lineal.
Vimos cómo construir transformaciones lineales.

6.2 Imagen y núcleo
Muchas propiedades de una transformación lineal se pueden estudiar a partir de su comportamiento respecto de
ciertos subespacios del dominio o del codominio.
Las definiciones de imagen y de núcleo de una transformación lineal.

La clasificación de transformaciones lineales según sean inyectivas, suryectivas o biyectivas.

6.2.1 Imagen
Consideremos T : Rn → Rm una transformación lineal. Dado ~v ∈ Rn , llamamos al vector T (~v ) ∈ Rm la imagen

de ~v por la transformación lineal T . En general, si S ⊆ Rn es un subconjunto de Rn , podemos calcular T (S), la
imagen de S por T , que se obtiene calculando, “todas juntas”, las imágenes por T de todos los vectores ~v ∈ S. Es
decir,
~ ∈ Rm : w = T (~v ) para algún ~v ∈ S}.

T (S) = {T (~v ) : ~v ∈ S} = {w
T (S) es un subconjunto de Rm . Para verificar si un vector dado w

~ ∈ Rm pertenece a T (S), debemos hallar un
~v ∈ S de modo que w
~ = T (~v ) (en este caso, ~v se llama la preimagen del vector w).
~ Este procedimiento es muy
parecido al que se realiza cuando se busca hallar la imagen de una función.
Definición 57 Si T : Rn → Rm es una transformación lineal, la imagen de T es el conjunto:
Im(T ) = T (Rn ) = {w
~ ∈ Rm : w
~ = T (~v ) para algún ~v ∈ Rn }
La imagen de una transformación lineal es, entonces, el conjunto de todos los valores que puede tomar T .
Experimento 33 Muestren que, si S es un subespacio de Rn , entonces T (S) es un subespacio de Rm .
El experimento anterior nos dice que una transformación lineal manda subespacios en subespacios. En particular,
dado que Rn es un subespacio de sí mismo, entonces Im(T ) = T (Rn ) es un subespacio de Rm .
¿Cómo hallar la imagen de una transformación lineal? Consideremos la transformación lineal T : R3 → R3
definida por T (x1 , x2 , x3 ) = (x1 + x2 , x2 − x3 , 2x1 − 3x2 + x3 ). Por definición, un elemento (y1 , y2 , y3 ) ∈ R3
pertenece a Im(T ) si, y sólo si, se puede escribir como (y1 , y2 , y3 ) = T (x1 , x2 , x3 ) para algún (x1 , x2 , x3 ) ∈ R3 .
Como T (x1 , x2 , x3 ) = (x1 + x2 , x2 − x3 , 2x1 − 3x2 + x3 ), entonces buscamos los (y1 , y2 , y3 ) ∈ R3 tales que:
(y1 , y2 , y3 ) = (x1 + x2 , x2 − x3 , 2x1 − 3x2 + x3 )

Álgebra A. Imagen y núcleo. 175
Pero:
(x1 + x2 , x2 − x3 , 2x1 − 3x2 + x3 ) = (x1 , 0, 2x1 ) + (x2 , x2 , −3x2 ) + (0, −x3 , x3 )
= x1 (1, 0, −2) + x2 (1, 1, −3) + x3 (0, −1, 1)
Entonces, concluimos que (y1 , y2 , y3 ) = x1 (1, 0, −2) + x2 (1, 1, −3) + x3 (0, −1, 1); es decir, (y1 , y2 , y3 ) =
h(1, 0, −2), (1, 1, −3), (0, −1, 1)i = h(1, 0, −2), (1, 1, −3)i, pues (1, 0, −2) − (1, 1, −3) = (0, −1, 1). Por lo
tanto, hemos hallado que Im(T ) = h(1, 0, −2), (1, 1, −3)i.
Podemos dar otra manera de calcular Im(T ). Consideremos la definición de imagen siguiente:
Im(T ) = T (Rn ) = {T (x1 , x2 , x3 ) : (x1 , x2 , x3 ) ∈ Rn }
Sabemos que {(1, 0, 0), (0, 1, 0), (0, 0, 1)} es una base de R3 , y todo vector (x1 , x2 , x3 ) ∈ R3 se escribe como
combinación lineal de esta base de la siguiente manera:
(x1 , x2 , x3 ) = x1 (1, 0, 0) + x2 (0, 1, 0) + x3 (0, 0, 1)
Si aplicamos la transformación lineal a ambos lados, obtenemos:
T (x1 , x2 , x3 ) = x1 T (1, 0, 0) + x2 T (0, 1, 0) + x3 T (0, 0, 1);
es decir, ¡los vectores de la imagen son las combinaciones lineales de {T (1, 0, 0), T (0, 1, 0), T (0, 0, 1)}! Por lo
tanto:
Img(T ) = T (Rn ) = hT (1, 0, 0), T (0, 1, 0), T (0, 0, 1)i
= h(1, 0, −2), (1, 1, −3), (0, −1, 1)i
= h(1, 0, −2), (1, 1, −3)i
Este último procedimiento para calcular la imagen de una transformación lineal se puede realizar en forma general,
a partir de la definición del siguiente teorema:
Teorema 29 Sea T : Rn → Rm , una transfomación lineal. Si B = {~
v1 , ~v2 , . . . , ~vn } es una base de Rn , entonces
{T (~v1 ), T (~v2 ), . . . , T (~vn )} es un sistema de generadores de Im(T ).
Importante Si B = {~
v1 , ~v2 , · · · , ~vn } es una base, entonces {T (~v1 ), T (~v2 ), · · · , T (~vn )} no necesariamente es
una base de Im(T ); los vectores T (~v1 ), . . . , T (~vn ) podrían resultar linealmente dependientes.
Si T : R3 → R2 es una transformaicón lineal, analicen si es posible que dim(Im(T )) = 3. Y, en general, cuál

puede ser la máxima dimensión de la imagen. Estudien esta misma característica si T : R3 → R4
Ejemplo 62 Sean S y W dos subespacios de R3 definidos por S = h(1, 2, −1), (0, 1, 3)i y W = {(x1 , x2 , x3 , x4 ) ∈
R4 : x1 + x2 = 0, x3 − 2x4 = 0}. Hallemos, si existe, una transformación lineal T : R3 → R4 que verifique

T (S) = W . En primer lugar, busquemos la descripción por generadores de T :
V = {(x1 , x2 , x3 , x4 ) ∈ R4 : x1 + x2 = 0, x3 − 2x4 = 0}
= {(x1 , x2 , x3 , x4 ) ∈ R4 : x1 = −x2 , x3 = 2x4 }
= {(−x2 , x2 , 2.x4 , x4 ) ∈ R3 : x2 , x4 ∈ R}
= {x2 (−1, 1, 0, 0) + x4 (0, 0, 2, 1) : x2 , x4 ∈ R}
= h(−1, 1, 0, 0), (0, 0, 2, 1)i
Para definir una transformación lineal T : R3 → R4 , basta especificar los valores que toma en una base del
dominio (en este caso, R3 ). Como queremos asegurarnos que T (S) = W , debemos “manipular” conveniente-
mente las imágenes de los vectores de la base de S. Extendemos la base de S a una base de R3 ; por ejemplo,
B = {(1, 2, −1), (0, 1, 3), (0, 0, 1)} es una posible base de R3 . Ahora, definimos:
T (1, 2, −1) = (−1, −1, 0, 0)
T (0, 1, 3) = (0, 0, 2, 1),
lo cual nos garantiza que T (S) ⊂ W . ¿Qué sucede con T (0, 0, 1)? Dado que (0, 0, 1) ∈
/ S, no hay restricciones para
determinar T (0, 0, 1). Podemos elegir, por ejemplo, T (0, 0, 1) = (0, 0, 0, 1). Dado que:
T (S) = hT (1, 2, −1), T (0, 1, 3)i = h(−1, −1, 0, 0), (0, 0, 2, 1)i = W,
la transformación lineal así definida satisface T (S) = W .
Experimento 34 Consideren una transformación lineal T : R2 → R3 con expresión funcional T (x1 , x2 ) =
(x1 , x2 , x1 + x2 ). Verifiquen que la matriz canónica asociada a T tiene, en sus columnas, a las imágenes por T
de los vectores de a base canónica de R2 .
Observación 30 Notemos que, del experimento anterior, podemos concluir que Im(T ) está generada por los
vectores columna de AT y que dim(Im(T )) = rg(AT ).
6.2.2 Núcleo
Para una transformación lineal T : Rn → Rm y un vector w

~ ∈ Rm , nos interesará averiguar qué vectores ~v ∈ Rn
tienen como imagen a w;
~ es decir, T (~v ) = w.
~ Recordemos que este conjunto se llama la preimagen de w por T , y
se define por:
T −1 (w)
~ = {~v ∈ Rn : T (~v ) = w}.
~
En general, si W ⊆ Rm es un subconjunto de Rm , la preimagen de W por T es el conjunto de vectores ~v ∈ Rn

cuya imagen pertenece a W . Es decir:
T −1 (W ) = {~v ∈ Rn : T (~v ) ∈ W }.
En particular, nos interesará calcular el conjunto de vectores del dominio donde la transformación lineal se anula.
Este conjunto se denomina núcleo de T , y se puede pensar como el “conjunto de ceros” de la función T .
Definición 58 Si T : Rn → Rm es una transformación lineal, el núcleo de T es el conjunto:
N u(T ) = T −1 (~0) = {~v ∈ Rn : T (~v ) = ~0}.
Experimento 35 Comprueben que, si W es un subespacio de Rm , entonces T −1 (W ) es un subespacio de

Rn .
Observemos que, del experimento anterior, dado que {0} es un subespacio de Rm , entonces N u(T ) = T −1 (0) es
siempre un subespacio de Rn .
Álgebra A. Imagen y núcleo. 177
Ejemplo 63 Sea T : R3 → R2 la transformación lineal definida por T (x1 , x2 , x3 ) = (x1 − x2 , x2 − x3 ). Entonces:
N u(T ) = {(x1 , x2 , x3 ) ∈ R3 : T (x1 , x2 , x3 ) = (0, 0)}

= {(x1 , x2 , x3 ) ∈ R3 : (x1 − x2 , x2 − x3 ) = (0, 0)}
(x1 , x2 , x3 ) ∈ R3 : x1 − x2 = 0 , x2 − x3 = 0

=
= {(x1 , x2 , x3 ) ∈ R3 : x1 = x2 , x3 = x2 }
= {(x2 , x2 , x2 ) ∈ R3 : x2 ∈ R}
= h(1, 1, 1)i
Observemos que, para hallar N u(T ), tuvimos que resolver el sistema de ecuaciones:

x1 − x2 = 0

x2 − x3 = 0

que proviene de igualar a cero cada coordenada de la expresión de T . La expresión matricial de este sistema es:
 
x
 1
 
1 −1 0
  · x2 


0 1 −1  
x3
1 −1 0

¡Notemos que la matriz 0 1 −1 es la matriz AT asociada a T !
La situación del ejemplo anterior ocurre en general. Lo enunciamos en la siguiente observación.

Observación 31 Si T : Rn → Rm es una transformación lineal y AT es la matriz canónica asociada a T ,
entonces N u(T ) es el espacio de soluciones del sistema homogéneo AT · ~x = ~0.
Si T : Rn → Rm es una transformación lineal, N u(T ) es un subespacio del dominio e Im(T ) es un subespacio del
codominio; es decir, estos subespacios “viven” en lugares distintos. Sin embargo, hay una relación muy fuerte entre
sus dimensiones:
Teorema 32 [Teorema de la dimensión] Para cualquier transformación lineal T : Rn → Rm , vale que:
dim(N u(T )) + dim(Im(T )) = n
Es decir, la suma de la dimensión del núcleo y la dimensión de la imagen coincide con la dimensión del dominio
de la transformación lineal.
6.2.3 Clasificación de transformaciones lineales
Vamos a estudiar cómo se clasifican las transformaciones lineales según sean suryectivas, inyectivas o biyectivas.
Definición 59 Decimos que una transformación lineal T : Rn → Rm es:
Monomorfismo si es inyectiva, esto es, si verifica que si T (~v ) = T (w)

~ entonces ~v = w.
~
Epimorfismo si es suryectiva, esto es, si Im(T ) = Rm .
Isomorfismo si es biyectiva, es decir, si es monomorfismo y epimorfismo.
Verificar la inyectividad en una función f : Rn → Rm cualquiera puede resultar bastante complicado, pues hay que
verificar que a cada vector de la imagen de f proviene de un único vector del dominio. En otras palabras, la función
~ ∈ Im(f ), f −1 (w)
f es inyectiva si, para cada w ~ tiene un único elemento.
Para las transformaciones lineales, verificar la inyectividad es más simple. Sabemos que toda transformación lineal
T tiene al vector nulo ~0 ∈ Rm en la imagen, y que T (~0) = ~0. Si T es monomorfismo, entonces ~0 ∈ Rn debe ser el
único vector del dominio que llegue a ~0. Es decir, T −1 (0) = N u(T ) debe ser igual al subespacio nulo {~0}. Pero
aún nos faltaría verificar que T −1 (w)
~ tiene un único elemento para el resto de los vectores w
~ en la imagen. La
buena noticia es que, para transfomaciones lineales, esto no es necesario.
Proposición 33 Si T : Rn → Rm es una transformación lineal, entonces T es monomorfismo sí, y solo sí,
N u(T ) = {~0}.
No es difícil demostrar esta proposición. Es claro que, si T es monomorfismo, entonces N u(T ) = {~0}. Para ver la
otra implicación, supongamos que N u(T ) = {~0} pero que existe un vector no nulo w
~ ∈ Rm que es imagen de dos
vectores ~v1 , ~v2 distintos. ¿Qué sucede con el vector ~v1 − ~v2 ? ¿Cuál es su imagen? Usando las propiedades de la
tranformación lineal tenemos:
T (~v1 − ~v2 ) = T (~v1 ) − T (~v2 ) = w ~ = ~0.

~ −w
Es decir, el vector ~v1 − ~v2 ∈ N u(T ). Pero este vector no es el vector nulo, pues estábamos asumiedo que ~v1 y ~v2
eran distintos. Esto contradice que N u(T ) = {~0}, que era una de nuestras hipótesis. Esto prueba la proposición
anterior.
Anteriormente, vimos que si {~v1 , ~v2 , . . . , ~vr } es linealmente independiente, entonces no necesariamente {T (~v1 ),
T (~v2 ),. . ., T (~vr )}, resulta linealmente independiente. Se puede mostrar que, si la transformación lineal es un
monomorfismo, entonces sí se verifica esta condición:
Proposición 34 Si T : Rn → Rm es una transformación lineal. Si T es monomorfismo y {~

v1 , ~v2 , . . . , ~vr } ⊆ Rn
es linealmente independiente, entonces {T (~v1 ), T (~v2 ), . . . , T (~vr )} es linealmente independiente. En particular,
dim(Im(T )) = n.
Observemos que, si T : Rn → Rm es monomorfismo y {~v1 , ~v2 , . . . , ~vn } ⊆ Rn es una base de Rn , entonces

{T (~v1 ), T (~v2 ), . . . , T (~vn )} es una base de Im(T ). Si, además, T es epimorfismo, entonces Im(T ) = Rm . En este
caso, necesariamente, debe ocurrir que n = m y que {T (~v1 ), T (~v2 ), . . . , T (~vn )} es, en realidad, una base de Rn .
Podemos enunciarlo de la siguiente manera:
Proposición 35 Sea T : Rn → Rn una transformación lineal. Entonces T es isomorfismo sí, y solo sí, T manda
bases en bases; es decir, si {~v1 , ~v2 , . . . , ~vn } es una base de Rn , {T (~v1 ), T (~v2 ), . . . , T (~vn )} también es una base de
Rn .
Ejemplos 64
Hallemos, si es posible, una transformación lineal T : R2 → R3 tal que N u(T ) = {(x1 , x2 ) ∈ R2 : 2x1 −x2 =
0} e Im(T ) = h(1, 0, 1)i. Escribamos un sistema de generadores de N u(T ):
N u(T ) = {(x1 , x2 ) ∈ R2 : 2x1 − x2 = 0}

= {(x1 , x2 ) ∈ R2 : 2x1 = x2 }
= {(x1 , 2x1 ) ∈ R2 : x1 ∈ R}
= h(1, 2)i
Definamos la transformación lineal buscada exhibiendo las imágenes por T de una base del dominio. Extendamos
{(1, 2)} a una base de R2 ; por ejemplo, {(1, 2), (0, 1)}. Dado que (1, 2) ∈ N u(T ) y (1, 0, 1) ∈ Im(T ),
podemos decir:
• T (1, 2) = (0, 0, 0)
• T (0, 1) = (1, 0, 1)
Álgebra A. Interpretación geométrica del efecto de una transformación lineal. 179
Sabemos que, entonces, existe una única transfomación lineal que cumple estas asignaciones. Verifiquemos que
se cumplen las condiciones pedidas. Por un lado, tenemos:
Im(T ) = hT (1, 2), T (0, 1)i = h(0, 0, 0), (1, 0, 1)i = h(1, 0, 1)i.
Por otro lado, veamos que N u(T ) = h(1, 2)i. Por definición, (1, 2) ∈ N u(T ) y, entonces, h(1, 2)i ⊆ N u(T ).
¿Puede ocurrir que N u(T ) sea “más grande” que el subespacio h(1, 2)i? Si recordamos el Teorema de la
dimensión (en la página 177), se tiene que dim(N u(T )) + dim(Im(T )) = dim(R2 ) = 2. Dado que
dim(Im(T )) = 1, resulta necesariamente dim(N u(T )) = 1. Por lo tanto, h(1, 2)i = N u(T ).
Hallemos ahora, si es posible, una transformación lineal T : R3 → R3 tal que T sea epimorfismo y N u(T ) =
h(1, 1, 2)i. En este caso, si existiera una tal transformación lineal, debería verificarse, nuevamente, por el Teorema
de la dimensión, que dim(N u(T )) + dim(Im(T )) = 3. Pero en las condiciones pedidas, dim(N u(T )) = 1,
y como T debe ser epimorfismo, Im(T ) = R3 , es decir, dim(Im(T )) = 3. De esta manera, obtendríamos
dim(N u(T )) + dim(Im(T )) = 1 + 3 = 4, lo cual es imposible. Por lo tanto, podemos concluir que no existe
la transformación lineal pedida.

Supongamos que tenemos una transformación lineal T : Rn → Rn ; es decir, con el mismo codominio que dominio.
¿Qué sucede si T es monomorfismo? En este caso, N u(T ) = {~0} o, lo que es equivalente, dim(N u(T )) = 0. El
Teorema de la dimensión nos dice que 0 + dim(Im(T )) = n. Pero como Im(T ) ⊂ Rn y ambos subespacios tienen
la misma dimensión entonces Im(T ) = Rn . Por lo tanto, concluimos que T es epimorfismo. ¿Qué sucede si, ahora,
supiéramos que T es epimorfismo? El mismo razonamiento nos muestra que, entonces, dim(N u(T )) = 0, y esto
quiere decir que T es monomorfismo. Notamos entonces que estas características están muy ligadas entre sí para
transformaciones lineales con el mismo dominio y codominio. Lo enunciamos a continuación:
Proposición 36 Sea T : Rn → Rn una transformación lineal. Entonces son equivalentes, ya que T es:
Monomorfismo.
Epimorfismo.
Isomorfismo.
Introducimos la definición de imagen de una transformación lineal T : Rn → Rm como el conjunto de los vectores
de Rm que provienen de un vector de Rn por T .
Definimos el núcleo de una transformación lineal, que consta de todos los vectores del dominio que son mandados al
0 por la transformación lineal.
Estudiamos la clasificación de transformaciones lineales en epimorfismos (suryectivas), monomorfismos (inyectivas)
e isormofismos (biyectivas) y su relación con el núcleo y la imagen de la transformación.

6.3 Interpretación geométrica del efecto de una transformación lineal
Muchas de las construcciones que estudiamos como proyecciones y simetrías en el capítulo 2 son realmente
tranformaciones lineales. Por otro lado, algunas transformaciones lineales T de R2 en R2 o de R3 en R3 pueden
interpretarse geométricamente como rotaciones, proyecciones, simetrías, etc. En este apartado veremos cómo
construirlas y clasificarlas.
La interpretación de las simetrías y las proyecciones ortogonales en R2 y R3 , como transformación lineal.

La interpretación geométrica de ciertas tranformaciones lineales: rotaciones, simetrías, proyecciones, homotecias,
deslizamientos cortantes.
El efecto de una transformación lineal en R2 sobre el cuadrado unitario de R2 .
La interpretación geométrica del determinante de una matriz cuadrada.

Comencemos por las Rotaciones en R2 . Consideremos un instante las agujas de un reloj. Si miramos el reloj en dos
momentos distintos, el movimiento de cada aguja se puede modelar con una transformación lineal. Basta imaginar
que la aguja es un vector y el reloj, el plano R2 . Supongamos, entonces, que queremos rotar el vector (x, y) ∈ R2
un ángulo θ > 0 en el sentido contrario a las agujas del reloj, y que el vector obtenido luego de la rotación es
el (x0 , y 0 ). Si ||(x, y)|| = r y α es el ángulo entre el vector (x, y) y el vector (r, 0) entonces, por trigonometría,
Figura 6.1: Rotación de un vector en R2 .
x y
cos(α) = r y sin(α) = r (Figura 6.1). Es decir:

x = r cos(α)

y = r sin(α)

Por otra parte, rotar no cambia longitud del vector, por lo que ||(x0 , y 0 )|| = r. Haciendo un razonamiento análogo
0
x0
al anterior, tenemos que cos(α + θ) = r y sin(α + θ) = yr . Es decir:

x0 = r cos(α + θ)

y 0 = r sin(α + θ)

Si ahora usamos algunas identidades trigonométricas obtenemos, por un lado:
x0 = r cos(α + θ)

= r cos(α) cos(θ) − sin(α) sin(θ)
= r cos(α) cos(θ) − r sin(α) sin(θ)
= x cos(θ) − y sin(θ)
y, por otro lado:

y0 = r sin(α + θ)

= r cos(α) sin(θ) + sin(α) cos(θ)
= r cos(α) sin(θ) + r sin(α) cos(θ)
= x sin(θ) + y cos(θ)
Por lo tanto, hemos hallado que: 

x0 = x cos(θ) − y sin(θ)

y 0 = x sin(θ) + y cos(θ)

Esto podemos escribirlo en notación matricial y obtener:

     
x0 cos(θ) − sin(θ) x
 = · 
y0 sin(θ) cos(θ) y
El razonamiento anterior motiva, entonces, la siguiente definición:

Definición 60 Si T : R2 → R2 es la transformación lineal que representa la rotación de ángulo θ > 0 en el
sentido contrario al de las agujas del reloj, entonces la matriz canónica asociada a T es:
 
cos(θ) − sin(θ)
AT =  
sin(θ) cos(θ)
¿Qué sucede ahora si queremos rotar en el sentido de las agujas del reloj? En este caso, decimos que rotamos en un
ángulo −θ. Es decir, el signo del ángulo indicará la orientación de la rotación.
Rotar el vector (x, y) ∈ R2 un ángulo θ > 0 en el sentido de las agujas de reloj, para obtener (x0 , y 0 ) corresponde
entonces a la siguiente operación:
     
x0 cos(−θ) − sin(−θ) x
 = · 
y0 sin(−θ) cos(−θ) y
π
Experimento 36 ¿Cuál es la matriz de la transformación lineal que rota un vector (x, y) en 4 en el
sentido contrario a las agujas del reloj? ¿En qué vector se transforma el vector (1, 1) luego de dicha rotación?
Represéntelo también gráficamente.
¿Qué sucede con rotaciones en R3 ? Imaginemos nuevamente un reloj pero, esta vez, considerémoslo como habitando
el espacio tridimensional; es decir, pensémoslo colgado sobre una pared en una habitación. En este caso, las agujas
también rotan, pero lo hacen respecto del eje perpendicular al reloj. Es decir, si pensamos a las agujas como
contenidas en el plano xy, la dirección que sale perpendicularmente del reloj correspondería al eje z; y la rotación de
las agujas es respecto de este eje. En este libro, sólo estudiaremos rotaciones tridimensionales respecto de uno de los
ejes. Para este caso, la interpretación de este efecto como transformación lineal es muy sencilla, ya que, realmente,
sólo se modifican las coordenadas x e y de los vectores (x, y, z) ∈ R3 (la coordenada z queda inalterada). Además,
la manera cómo se tranforman las coordenadas x e y es, exactamente, como una rotación del plano xy. En definitiva,
arribamos a la siguiente definición:
Definición 61 Si T : R3 → R3 es la transformación lineal que representa la rotación de ángulo θ > 0 en el
sentido contrario al de las agujas del reloj respecto del eje z, entonces la matriz canónica asociada a T es:
 
cos(θ) − sin(θ) 0
 
AT =  sin(θ) cos(θ) 0
 
 
0 0 1
La matriz AT se interpreta de la siguiente manera: en la “submatriz” cuadrada de entradas a11 , a12 , a21 y a22 ,
aparece una rotación en un plano que contiene a las coordenadas x, y y, el coeficiente 1 en el lugar a33 , nos dice que
la coordenada z no es alterada.
Siguiendo el mismo razonamiento, podemos ver que la matriz asociada a una rotación tridimensional de ángulo θ,
en el sentido contrario al de las agujas del reloj, respecto del eje x es:
 
1 0 0
 
AT = 0 cos(θ) − sin(θ)
 
 
0 sin(θ) cos(θ)
Mientras que la matriz asociada a una rotación en R3 de ángulo θ, en el sentido contrario al de las agujas del reloj,
respecto del eje y es:  
cos(θ) 0 sin(θ)
 
AT =  0
 
1 0 
 
− sin(θ) 0 cos(θ)
Ahora, estudiaremos las transformaciones lineales asociadas a las simetrías en R2 y R3 ya vistas en el capítulo 2.
Importante Las simetrías que pueden ser caracterizadas por transformaciones lineales son aquellas que se
definen con respecto de rectas y planos que pasan por el origen. Esto es debido a que las transformaciones lineales
son funciones entre subespacios vectoriales y, como vimos en el capítulo 3, los espacios vectoriales contienen el
“cero”, que en la geometría del plano y el espacio es el origen.
Comencemos estudiando las simetrías en el plano R2 . Sea L = {X ∈ R2 : X = t~v , t ∈ R}, la recta en R2 de

vector director ~v que pasa por el origen, queremos hallar la transformación lineal T : R2 → R2 que transforme cada
vector de R2 en el vector simétrico respecto de la recta L (Figura 6.2).
- - - - -
-
-
-
-
Figura 6.2: Un vector en R2 y simétrico.
Por un lado, que los vectores que pertenecen a la recta L quedan fijos por la simetría. En particular, T (~v ) = ~v . Por
el otro lado, los vectores perpendiculares al vector director de la recta se transforman en sus inversos; es decir, el
simétrico de (x, y) es (−x, −y) en este caso (pueden comprobarlo por su cuenta). Por lo tanto, si w
~ es un vector
~ = −w.
ortogonal a ~v , entonces T (w) ~ ¿Por qué nos interesan estos casos particulares de vectores? Porque {~v , w}
~
es una base de R2 . Por lo tanto, para saber cuál es la transformación lineal que modela una simetría, alcanza con
determinar las imágenes de los vectores ~v y w,
~ ¡Es lo que acabamos de hacer!
Definición 62 Si T : R2 → R2 es la transformación lineal que representa la simetría respecto de la recta L de
ecuación vectorial X = t~v entonces, dado w

~ ortogonal a ~v cualquiera, T queda unívocamente determinada por
los siguientes valores en la base {v, w}: 

T (~v ) = ~v

~ = −w
T (w) ~

Experimento 37 Calculen la expresión de la transformación lineal de la simetría respecto de la recta y = 2x
¿Cuál es el vector simétrico de (1, 1) respecto de esa recta?
Estudiemos ahora las simetrías en R3 . Consideremos un plano Π en R3 , de ecuación vectorial X = t~v + sw

~ (que
pasa por el origen). Queremos encontrar la transformación lineal T : R3 → R3 que transforme cada vector de R3
en el vector simétrico respecto del plano Π. Si bien este problema es más complicado que el anterior, procedemos
de la misma manera. Tengamos en cuenta que los vectores ~v y w ~ es un vector
~ quedan fijos por la simetría, y si N
~ se transforma en su opuesto −N
normal al plano, entonces N ~ . Nuevamente, se puede probar que {v, w, N } es una
base de R3 , por lo que alcanza con definir a T en esta base de la siguiente manera:



 T (v) = v


 T (w) = w



T (N ) = −N
Observación 37 La matriz canónica asociada a la simetría respecto del plano xy es:

 
1 0 0
 
AT = 0
 
1 0
 
0 0 −1
Las transformaciones del plano o del espacio que hemos estudiado hasta ahora no modifican el “tamaño” de los
vectores. Pero es muy usual realizar transformaciones que sí lo hagan. Por ejemplo, si tenemos un dibujo en
tamaño A4 y hacemos una fotocopia que reduce su tamaño a la mitad, entonces la transformación de los puntos
del dibujo original al dibujo reducido, se puede modelar con un tipo especial de transformaciones lineales: las
homotecias. En este ejemplo, la transformación de reducción de la fotocopia se modela con la transformación lineal
T (x, y) = 12 (x, y). Una ampliación al doble de tamaño se traduce en la transformación lineal T (x, y) = 2(x, y).
Definición 63 Una transformación lineal T : R2 → R2 se dice homotecia si T (x, y) = k(x, y), con k > 0 fijo.
La constante k se llama el factor de la homotecia. Si 0 < k < 1, la homotecia se denomina contracción y si
k > 1, se denomina dilatación. Notemos que si k = 1, la transformación es la identidad.
Observación 38 Es fácil convencerse que la matriz canónica asociada a una homotecia T de factor k es:
 
k 0
AT =  .
0 k
Otro tipo de homotecia consiste en modificar el tamaño de los vectores de modo no homogéneo, es decir, mediante
una dilatación o contracción en una dirección determinada (horizontal o vertical).
Definición 64 Una transformación lineal T : R2 → R2 se dice homotecia de factor k en la dirección x si
T (x, y) = (kx, y); y se dice homotecia de factor k en la dirección y si T (x, y) = (x, ky). En ambos casos, si
0 < k < 1, la homotecia se denomina contracción y, si k > 1, se denomina dilatación.
Observación 39
La matriz canónica asociada a una homotecia T de factor k en la dirección x es:

 
k 0
AT =  
0 1
La matriz canónica asociada a una homotecia T de factor k en la dirección y es:

 
1 0
AT =  
0 k
Una contracción o dilatación de vectores en el caso tridimensional tiene exactamente el mismo significado que para
las homotecias en R2 . Las definiciones en este caso, son idénticas:
Definición 65 Una transformación lineal T : R3 → R3 se dice homotecia si T (x, y, z) = k(x, y, z), con k > 0
fijo. La constante k se llama el factor de la homotecia. Si 0 < k < 1, la homotecia se denomina contracción y si
k > 1, se denomina dilatación. Notemos que si k = 1, la transformación es la identidad.
La matriz de una homotecia T : R3 → R3 de factor k es entonces:

 
k 0 0
 
AT =  0 k 0 
 
 
0 0 k
Definición 66 Una transformación lineal T : R3 → R3 se dice homotecia de factor k en la dirección x si
T (x, y, z) = (kx, y, z). De manera análoga se definen homotecias en las direcciones y y z.
Experimento 38 Encuentren la forma que tienen las matrices canónicas de las homotecias en las direcciones
x, y y z.
Los deslizamientos cortantes son maneras de “inclinar” los vectores del plano de forma paralela a uno de los ejes.
La idea básica de este tipo de transformaciones es enviar el vector (x, y) a (x + ky, y). En este caso, se llama un
deslizamiento cortante de factor k en la dirección x. Notemos que la inclinación arriba referida tiene que ver con el
hecho que la coordenada x está siendo alterada en una cantidad proporcional a la coordenada y, por lo que, cuando
mayor sea el valor de y, más grande será la traslación del punto. Esta es la diferencia con una simple traslación en el
sentido x (que tiene la forma (x, y) → (x + k, y)). La matriz asociada a este tipo de transformaciones es:
 
1 k
AT =  
0 1
Observemos que, no tendrán problemas en escribir la matriz asociada a un deslizamiento cortante en la dirección y.
Las ideas básicas de estas transformaciones quedarán mejor evidenciadas cuando veamos como afectan al cuadrado
unitario.
Las proyecciones ortogonales que estudiamos en el capítulo 2 también son transformaciones lineales. Comencemos
estudiando proyecciones en R2 .
Sea L la recta de R2 de ecuación vectorial X = t~v , queremos construir la proyección ortogonal T : R2 → R2 sobre
la recta L. Claramente, los vectores de la recta L quedan fijos. Si L0 es la recta ortogonal a la recta L que pasa por
el origen, entonces los vectores de L0 tendrán como imagen por T al vector (0, 0) (Figura 6.3).
- - - - -
-
-
-
-
Figura 6.3: Proyección ortogonal en R2 .
~ es una base de R2 , y la proyección ortogonal

~ es un vector ortogonal a ~v , entonces {~v , w}
Concretamente, si w
T : R2 → R2 sobre la recta L queda unívocamente determinada por:

T (~v ) = ~v

T (w) = (0, 0)

Ejemplo 65 Veamos cuál es la fórmula de la proyección ortogonal sobre la recta L = {(x, y) ∈ R2 : x = y}. La
ecuación vectorial de la recta sobre la que estamos proyectando es X = λ(1, 1). Un vector ortogonal a ~v = (1, 1) es,
~ = (1, −1). Definimos T : R2 → R2 por:
por ejemplo, w

T (1, 1) = (1, 1)

T (1, −1) = (0, 0)


Hallemos ahora la fórmula de T . Un vector (x, y) ∈ R2 se escribe como combinación lineal de los vectores de la base
{(1, 1), (1, −1)} de la siguiente forma:
x+y x−y
(x, y) = (1, 1) + (1, −1)
2 2
Por lo tanto,
x+y x−y x+y x + y x + y
T (x, y) = T (1, 1) + T (1, −1) = (1, 1) = ,
2 2 2 2 2
Esta es la fórmula de la transformación lineal que representa la proyección ortogonal buscada.
El razonamiento para R3 es completamente análogo. Si Π = {X ∈ R3 : X = t~v + sw,

~ t, s ∈ R} es un plano que
~ es un vector normal al plano, entonces {~v , w,
pasa por el origen y N ~ N~ } constituye una base de R3 , y la proyección
ortogonal T : R3 → R3 sobre el plano Π queda unívocamente determinada por:




 T (~v ) = ~v


 T (w)
~ =w ~


~ ) = (0, 0, 0)

T ( N
Experimento 39 Utilizando esta ultima transformación, calculen la expresión de la proyección ortogonal

en R3 sobre el plano xy.
Transformando el cuadrado unitario. Para tener una idea más precisa de qué hacen realmente todas estas trans-
formaciones geométricas sobre R2 , vamos a estudiar el efecto de cada una de ellas sobre el cuadrado unitario
C de R2 ; es decir, el cuadrado de vértices (0, 0), (0, 1), (1, 0) y (1, 1). Como comentamos al comienzo de la
unidad, una de las consecuencias que se desprende de las propiedades de las tranformaciones lineales, es que
un segmento P Q es enviado al segmento T (P )T (Q). En efecto, todos los puntos del segmento P Q se pueden
escribir de la forma tP + (1 − t)Q, donde 0 ≤ t ≤ 1. Una transformación lineal T envía a estos puntos a
T (tP + (1 − t)Q) = tT (P ) + (1 − t)T (Q), que son precisamente todos los puntos del segmento T (P )T (Q) (ya
que 0 ≤ t ≤ 1). Por lo tanto, para saber cuál es la imagen del cuadrado unitario C por una transformación lineal
T : R2 → R2 , solo debemos calcular a qué puntos envía T a los vértices del C, ya que, necesariamente, el segmento
que une dos de sus vértices, será enviado al segmento que une sus imágenes. Por ejemplo, la imagen por T del
segmento que une el (0, 0) con el (0, 1) es el segmento que une T (0, 0) con T (0, 1). En la Figura 6.4 podemos ver
el efecto sobre el cuadrado unitario de todas las transformaciones estudiadas al comienzo de este apartado.
Figura 6.4: Tranformaciones del cuadrado unitario de R2 (en orden de aparición): rotación, simetría respecto de la recta L,
homotecia de factor k, homotecia de factor k en la dirección x, deslizamiento cortante de factor k en la dirección x y proyección
sobre la recta L.
También podemos estudiar el efecto de una tranformación lineal R3 sobre el cubo unitario: el cubo de vértices
(0, 0, 0), (1, 0, 0), (0, 1, 0), (0, 0, 1), (1, 1, 0), (0, 1, 1), (1, 0, 1) y (1, 1, 1). El procedimiento en este caso es idéntico:
los segmentos entre estos puntos serán enviados a los segmentos entre sus imágenes. En particular, los cuadrados que
forman los lados del cubo son enviados por T a los trapezoides cuyos vértices son las imágenes de los vértices del
cuadrado en cuestión. Por ejemplo, el cuadrado de vértices (0, 0, 0), (1, 0, 0), (0, 1, 0) y (1, 1, 0) tiene por imagen
el trapezoide T (0, 0, 0), T (1, 0, 0), T (0, 1, 0) y T (1, 1, 0).
Experimento 40 Como hicimos en la Figura 6.4, hagan el dibujo del efecto sobre el cubo unitario de R3 de
todas las transformaciones estudiadas al comienzo de esta sección.
6.3.1 La interpretación geométrica del determinante
Como vimos, en el capítulo 5, el determinante de una matriz cuadrada tiene una interpretación algebraica como
un número indicativo de la inversibilidad de una matriz. Sorprendentemente, también posee una interpretación
geométrica: pensando a la matriz como asociada a una transformación lineal, nos dice cómo cambia el área o
volumen de una figura al aplicarle la transformación lineal. Veamos algunos ejemplos para clarificar esta aserción.
Supongamos que tenemos una homotecia T de factor k en R2 . Sabemos que la matriz asociada a esta transformación

lineal es AT = k0 k0 . Tal como vimos en la Figura 6.4, si aplicamos esta homotecia al cuadrado unitario C ⊂ R2 ,
entonces obtenemos un cuadrado cuyos lados tienen medida k. ¿Cuál es el área de este nuevo cuadrado T (C)?
Como el área de un cuadrado se mide multiplicando la longitud de la base por la altura, entonces es k 2 . Es decir,
el cuadrado C de área 1 fue transformado en una figura (que en este caso es un cuadrado también) de área k 2 .
Notemos que k 2 es, precisamente, el determinante de AT mutiplicado por 1. ¿Qué sucede si, ahora, aplicamos la
misma homotecia al cuadrado C2 de vértices (0, 0), (0, 2), (2, 0) y (2, 2)? Obtenemos el cuadrado de vértices (0, 0),
(0, 2k), (2k, 0) y (2k, 2k), cuyos lados miden 2k, por lo que su área es (2k)2 = 4k 2 . ¿Cuál es el área del cuadrado
original? Pues, 22 = 4. Por lo tanto, vemos que:
Área de T (C2 ) = (Área de C2 ) det(AT )
Esto es algo que sucede siempre, para cualquier transformación lineal dentro de R2 (no solo las homotecias). Lo
enunciamos a continuación.
Proposición 40 Sea T : R2 → R2 una transformación lineal y sea F ⊂ R2 una figura cualquiera. Entonces:
Área de T (F ) = (Área de F )| det(AT )|
Esta proposición dice que el módulo del determinante de la matriz asociada a T nos da el factor por el que se
modifica el área de una figura al aplicarle T . Por ejemplo, ¿qué sucede con las rotaciones? Geométricamente,
estamos girando una figura; no le alteramos el área. ¿Cuál es el determinante de una matriz de rotación θ? Pues:
 
cos(θ) − sin(θ)
det   = cos(θ)2 + sin(θ)2 = 1.
sin(θ) cos(θ)
Por lo tanto, ¡hemos redescubierto que el área antes y después de la rotación no se altera!
Ejemplo 66 Estudiemos cómo se modifica el área del círclo D de radio r = 3 centrado en el origen al aplicarle
una homotecia T de factor 12 . Sabemos que el área de D es 2πr = 6π. La Proposición 40 nos dice que, luego de
1 0
aplicar la homotecia T , el área de T (D) es 6π det(AT ). Como det(AT ) = det 02 1 , entonces T (D) tiene área
2
1 2 3

2
6π = 2
π.
Para transformaciones lineales en R3 vale la misma propiedad pero, en este caso, el determinante nos dice cómo se
modifica el volumen de una figura tridimensional.
Proposición 41 Sea T : R3 → R3 una transformación lineal y sea R ⊂ R3 una región. Entonces:
Volumen de T (F ) = (Volumen de F )| det(AT )|

Al igual que para R2 , esta proposición dice que el módulo del determinante de la matriz asociada a T nos da el
factor por el que se modifica el volumen de una región al aplicarle T .
Ejemplo 67 ¿Qué transformación hay que aplicarle al cubo unitario C de R3 para “agrandarlo” a un cubo de volumen
7? Lo primero que se nos viene a la mente es transformarlo por medio de una homotecia T . ¿Qué factor k debe tener la
homotecia para alcanzar el volumen deseado? Sabemos que volumen de T (C) = (Volumen de C) det(AT ). Como el
k 0 0
volumen de C es 1, debemos hallar k tal que det(AT ) sea 7. Como AT = 0 k 0 , entonces det(AT ) = k3 . Por lo
0 0 k
√
tanto, k debe ser 3 7.
Esta propiedad del determinante vale, en realidad, para una transformación lineal dentro de Rn para cualquier
n ∈ N. En este caso, lo que marca dicho determinante es cómo se altera el volumen n-dimensional de la región.
Claro que, para n ≥ 4, ya no podemos imaginarnos qué interpretación geométrica tiene dicho “volumen”.
Estudiamos las simetrías y las proyecciones ortogonales en R2 y R3 desde el punto de vista de las transformaciones
lineales.
Estudiamos la interpretación geométrica de ciertas tranformaciones lineales: rotaciones, simetrías, proyecciones,
homotecias y deslizamientos cortantes. En cada caso, estudiamos la forma que tienen sus matrices asociadas.
Vimos el efecto de una transformación lineal dentro de R2 sobre el cuadrado unitario de R2 y el de una transformación
lineal dentro de R3 sobre el cubo unitario de R3 .
Dimos una interpretación geométrica del determinante de una matriz cuadrada, como el factor de deformación del
área (o volumen) de una región en R2 (o R3 ).

6.4 Composición e inversa de transformaciones lineales
De la misma forma que en la escuela secundaria se define la composición f ◦ g de dos funciones f, g : R → R,

en este apartado vamos a ver cómo se pueden componer dos transformaciones lineales. En este caso, el resultado
vuelve a ser una transformación lineal.
Cómo se componen las transformaciones lineales.

Cómo calcular al transformación inversa de una transformación lineal inversible.

6.4.1 ¿Qué significa componer funciones?
Supongamos que tenemos dos funciones f, g : R → R. Componer f con g es una nueva función f ◦ g : R → R
que se obtiene al aplicar primero g y después f ; es decir, la función compuesta f ◦ g en el punto x toma el valor
f (g(x)) (aplico g a x y obtengo g(x), y a este valor le aplico f ). Componer no es otra cosa que “aplicar una función
a continuación de la otra”. Por ejemplo, si f (x) = x2 y g(x) = x + 1 entonces (f ◦ g)(x) = (x + 1)2 . En efecto,
al aplicar g a x obtenemos x + 1. Y a este último valor le aplicamos f ; es decir, calculamos f (x + 1) = (x + 1)2 .
Notemos que importa el orden en que componemos las funciones. En general f ◦ g no es la misma función que
g ◦ f . En el ejemplo de recién, g ◦ f (x) = x2 + 1, y esta función no es igual a f ◦ g (en x = 1, por ejemplo, toman
distintos valores).
Álgebra A. Composición e inversa de transformaciones lineales. 189
En general, podemos componer funciones cuyo dominio y codominio no coincidan. Lo único que tendremos
presente es que, para que esté definida f ◦ g, “el conjunto donde cae g debe estar contenido en el conjunto donde
sale f ”; es decir, el codominio de g debe estar contenido en el dominio de f . Esta es una condición necesaria ya
que f ◦ g quiere decir que, para un x en el dominio de g, primero aplicamos g y después f ; pero f solo podemos
aplicarlo si g(x) está en el dominio de f . Más concretamente: si f : A → B y g : B → C son dos funciones entre
conjuntos cualesquiera, entonces, podemos definir g ◦ f : A → C. Notemos que f cae en B y g sale de B, por lo
que al valor f (x) podemos aplicarle g. También, tengamos en cuenta que g ◦ f es una función cuyo dominio es el
dominio de f y cuyo codominio es el codominio de g. La regla para recordar qué función se aplica primero en la
notación g ◦ f es leerla de derecha a izquierda: en este caso, primero f y luego g.
6.4.2 Composición de transformaciones lineales
Las transformaciones lineales son, en particular, funciones, por lo que podemos componerlas. Si T : Rn → Rm y
T 0 : Rm → Rk , entonces podemos armar la composición T ◦ T 0 : Rn → Rk , que consiste en aplicar primero T 0 y,
luego, T . Es decir:
(T ◦ T 0 )(~v ) = T (T 0 (~v ))
Por ejemplo, si T : R2 → R3 está dada por T (x, y) = (x + y, 2x, 2y) y T 0 : R3 → R2 está dada por T 0 (x, y, z) =
(x − y − 2z, 2x − z), entonces, tanto T ◦ T 0 : R3 → R3 como T 0 ◦ T : R2 → R2 están definidas. Para calcular T ◦ T 0
debemos aplicar, primero, T 0 a un (x, y, z) genérico y, luego, aplicar al resultado la transformación lineal T . Por un
lado, T 0 (x, y, z) = (x − y − 2z, 2x − z). ¿Qué significa aplicar T a este resultado? Pues que la primera coordenada
es x − y − 2z y la segunda coordenada es 2x − z. Es decir que, en la fórmula T (x, y) = (x + y, 2x, 2y) que define
T , el papel de x lo hace x − y − 2z y, el de y, lo hace 2x − z. Por lo tanto, debemos calcular T (x − y − 2z, 2x − z):
T (x − y − 2z , 2x − z ) = ((x − y − 2z ) + (2x − z ), 2(x − y − 2z ), 2(2x − z ))

| {z } | {z } | {z } | {z } | {z } | {z }
“x” “y” “x” “y” “x” “y”
= (3x − y − 3z, 2x − 2y − 4z, 4x − 2z).
Entonces, hemos hallado que T ◦ T 0 (x, y, z) = (3x − y − 3z, 2x − 2y − 4z, 4x − 2z). Por otro lado:
T 0 ◦ T (x, y) = T 0 (x + y , |{z}
2x , 2y )
| {z } |{z}
“x” “y” “z”
= ((x + y ) − (|{z}
2x ) − 2( 2y ), 2(x + y ) − ( 2y ))
| {z } |{z} | {z } |{z}
“x” “y” “z” “x” “z”
= (−x − 3y, 2x)
¿Qué sucede a nivel matricial? Sabemos que toda transformación lineal puede representarse de manera canónica
por medio de una matriz, donde el resultado de evaluar un vector en la transformación equivale a multiplicar dicho
vector por la matriz. Por este motivo, no nos debería sorprender que componer dos tranformaciones lineales equivale,
a nivel matricial, a multiplicar sus matrices asociadas. En efecto, supongamos que T : Rn → Rm y T 0 : Rm → Rk .
Si queremos calcular T 0 ◦ T en un vector ~v , entonces sabemos que T (~v ) = AT · ~v y T 0 (~v ) = AT 0 · ~v . Por lo tanto,
T 0 ◦ T (~v ) = T 0 (T (~v )) = T 0 (AT · ~v ) = AT 0 · (AT · ~v ) = (AT 0 · AT ) · ~v .
Como esto vale para todo ~v ∈ Rn , concluimos que:
AT 0 ◦T = AT 0 ◦ AT
De esta manera, hemos mostrado la validez de la siguiente proposición:

Proposición 42 Si T : Rn → Rm tiene por matriz canónica asociada a AT y T 0 : Rm → Rk tiene por matriz
canónica asociada a AT 0 , entonces, la matriz canónica asociada a T 0 ◦ T es AT 0 · AT .
Retomemos los ejemplos anteriores. Teníamos que T : R2 → R3 estaba dada por T (x, y) = (x + y, 2x, 2y) y
T 0 : R3 → R2 por T 0 (x, y, z) = (x − y − 2z, 2x − z). Calculamos:
 
1 1  
  1 −1 −2
AT = 2 0 AT 0 = 
  
  2 0 −1
0 2
La Proposición 42 nos dice que T 0 ◦ T tiene por matriz canónica asociada a:

 
  1 1  
1 −1 −2   −1 −3
AT 0 · AT =   · 2 0 = 
  
2 0 −1   2 0
0 2
Si pasamos esto a forma funcional tenemos:
    
−1 −3 x −x − 3y
(T 0 ◦ T )(x, y) =    =  
2 0 y 2x
Es decir, (T 0 ◦T )(x, y) = (−x−3y, 2x), y descubrimos la misma fórmula que conseguimos haciendo la composición
directamente. En el siguiente experimento, los invitamos a hacer el cálculo de la composición para el otro lado.
Experimento 41 Muestren que T ◦ T 0 = (3x − y − 3z, 2x − 2y − 4z, 4x − 2z) haciendo la multiplicación

de las matrices AT y AT 0 .
6.4.3 Construyendo transformaciones lineales compuestas
La composición nos permite ampliar el conjunto de transformaciones lineales que estudiamos en el apartado anterior.
Ahora, podemos construirnos funciones que transformen de manera más general regiones del plano o el espacio.
Por ejemplo, supongamos que queremos armar una transformación lineal en R3 que, dada una región, la dilate
manteniendo sus proporciones, de forma que tenga el doble de su área original y, también, la rote 45o en el sentido
de las agujas del reloj. Sabemos que la transformación que agranda el área de una región en 2 es:
√
H = 02 √02
mientras que la transformación que rota una región 45o en el sentido horario es:
cos(− π ) − sin(− π )

R = sin(− π4 ) cos(− π4)
4 4
Por lo tanto, la transformación buscada es la composición de ambas transformaciones. Pero, ¿en qué orden debemos
aplicarlas? Notemos que la misma naturaleza de las transformaciones nos dice que no importa, ya que las rotaciones
no afectan el área y las homotecias no afectan la “inclinación” de la región. Elegimos H ◦ R:
√    √ √ 
π π π π
2 0 cos(− 4 ) − sin(− 4 ) 2 cos(− 4 ) − 2 sin(− 4 )
A(H◦R) =  √ · π π
 = √ √ 
0 2 sin(− 4 ) cos(− 4 ) 2 sin(− π4 ) 2 cos(− π4 )
Por lo tanto, la transformación lineal buscada es:
√ √ 
2 cos(− π4 ) − 2 sin(− π4 )
(H ◦ R) · ~v =  √ √  · ~v
2 sin(− π4 ) 2 cos(− π4 )
Tomemos la circunferencia unitaria S de R2 y apliquémosle las siguientes transformaciones:

Una simetría respecto del eje y.

Una rotación de ángulo θ en el sentido antihorario, para cierto 0 ≤ θ < 2π.
Una simetría respecto del eje y nuevamente.
Si seguimos gráficamente el recorrido que hace un punto cualquiera de S al aplicarle estas transformaciones,
veremos que el resultado es el mismo que rotar la circunferencia en θ en sentido horario. Confirmemos esta
hipótesis. Sabemos, por un lado, que la simetría respecto del eje y tiene por matriz asociada a T = −1 0

0 1 . Por otro

− sin(θ)
lado, la rotación en θ en sentido antihorario tiene por matriz asociada a T 0 = cos(θ)
sin(θ) cos(θ)
. Por lo tanto, las tres
transformaciones que aplicamos sobre S se resumen en la transformación T ◦ T 0 ◦ T cuya matriz asociada resulta:
     
−1 0 cos(θ) − sin(θ) −1 0
AT ◦T 0 ◦T =  · · 
0 1 sin(θ) cos(θ) 0 1
   
− cos(θ) sin(θ) −1 0
=  · 
sin(θ) cos(θ) 0 1
 
cos(θ) sin(θ)
=  
− sin(θ) cos(θ)
Ahora, debemos recordar que cos(θ) = cos(−θ) y sin(θ) = − sin(−θ) para todo θ. Por lo tanto, esta última matriz
podemos reescribirla:  
cos(−θ) − sin(−θ)
AT ◦T 0 ◦T = 
sin(−θ) cos(−θ)
que es, precisamente, la matriz asociada a la transformación lineal que rota en θ en el sentido horario. Esto confirma
nuestra hipótesis.
Experimento 42 Le aplicamos a la circunferencia unitaria S ⊂ R2 las siguientes dos transformaciones:

primero, una simetría respecto del eje x y, luego, una simetría respecto del eje y. Prueben que el efecto de estas
transformaciones es el mismo que rotar la circunferencia 180o en el sentido antihorario.
6.4.4 Inversa de una transformación lineal
Recordemos que, si tenemos una función entre conjuntos f : A → B que es biyectiva, entonces, podemos definir la
función inversa, f −1 : B → A, que envía al elemento f (x) ∈ B al elemento x ∈ A; es decir, lo devuelve al mismo
punto de donde lo envió f . Formalmente, esto se escribe f −1 ◦ f (x) = x. La función f −1 se llama la inversa de
f y es única (es la única función que verifica esta igualdad). Algunas transformaciones lineales también admiten
inversa. Por ejemplo, la inversa de la transformación que rota los vectores en 90o en el sentido antihorario es la
transformación que rota los vectores 90o en el sentido horario. Por otro lado, la inversa de una simetría es ella
misma, pues el simétrico de un simétrico es el punto original. Finalmente, la inversa de dilatar por un factor k > 1
es contraer por k1 . En todos estos casos, la inversa de una transformación lineal vuelve a ser una transformación
lineal. Veremos que esto es siempre así.
Antes de dar la definición de inversa de una transformación lineal observemos que, para que exista la inversa, la
transformación debe ser biyectiva. Esto es siempre un requerimiento para que tenga sentido buscar una inversa. Las
transformaciones lineales biyectivas son necesariamente isormorfismos, por lo que una tranformación lineal admite
inversa sí, y solo sí, es un isomorfismo. En particular, el dominio y el codominio deben ser el mismo espacio.
Definición 67 Sea T : Rn → Rn un isomorfismo. La inversa de T es una transformación lineal T −1 : Rn → Rn
que verifica (T ◦ T −1 )(~v ) = ~v y (T 0 ◦ T )(~v ) = ~v para todo ~v ∈ Rn .
No es difícil ver que la inversa de T es única; es decir, no hay otra transformación lineal con esas caracteríticas. Por
este motivo, la llamamos T −1 (pues no crea ambigüedad).
¿Cómo se calcula la inversa de un isomorfismo? Veamos un ejemplo. Consideremos el isomorfismo T : R3 → R3
dado por T (x, y, z) = (x − y − z, x − 2y − 4z, 2x − z). Recordemos que, para construir una transformación lineal,
alcanza con definir cúales son los valores que esta toma en una base. Pero, ¿qué base nos conviene considerar?
Tengamos en cuenta que:
T (1, 0, 0) = (1, 1, 2)
T (0, 1, 0) = (−1, −2, 0)
T (0, 0, 1) = (−1, −4, −1)
Como T es isomorfismo y {(1, 0, 0), (0, 1, 0), (0, 0, 1)} es una base de R3 , entonces
3
{(1, 1, 2), (−1, −2, 0), (−1, −4, −1)} también es una base de R (por la Proposición 35). Notemos que, entonces,
definir la inversa es automático a partir de esta observación. La inversa T −1 debe verificar:
T −1 (1, 1, 2) = (1, 0, 0)
T −1 (−1, −2, 0) = (0, 1, 0)
T −1 (−1, −4, −1) = (0, 0, 1)
Si ahora queremos encontrar la expresión funcional de T −1 , podemos proceder como mostramos en el apartado
6.1.3. Sin embargo, este procedimiento para hallar la forma funcional de una transformación lineal definida en una
base involucra, en general, una gran cantidad de cuentas. Por suerte, existe una manera más directa de calcular la
inversa de una transformación lineal: calcular la forma matricial de T −1 . A esta altura, no debería sorprendernos
que ¡la forma matricial de la inversa de T es la matriz inversa de AT ! Esto es evidente ya que, si (T −1 ◦ T )(~v )
para todo ~v ∈ Rn , entonces (AT −1 · AT ) · ~v = ~v para todo ~v ∈ Rn . Esto fuerza a que AT −1 · AT = I. ¿Se
dan cuenta por qué sucede esto? Concluimos, entonces, que AT −1 = A−1
T . Por lo tanto, para hallar la inversa de
T (x, y, z) = (x − y − z, x − 2y − 4z, 2x − z), podemos escribir primero su matriz asociada:

 
1 −1 −1
 
AT = 1 −2 −4
 
 
2 0 −1
y, luego, calcular su matriz inversa:  

2
5 − 51 2
5
 
A−1
 7 1 3
= − 5

T 5 5

 
4
5 − 52 − 15
Esta última matriz es, entonces, la matriz asociada a AT −1 ; y podemos hallar que su forma funcional es:
     
2 1 2
x − 5  x
   5 5
−1    7 1 3 
T (x, y, z) = AT −1 · y  = − 5 · =
 
   5 5  y 
4
z 5 − 52 − 15 z
2
− 15 y + 25 z, − 57 x + 15 y + 53 z, 45 x − 25 y − 15 z

= 5x
Observamos que, del ejemplo anterior, podemos deducir la siguiente propiedad de los isomorfismos:
Proposición 43 Una transformación lineal T es un isomorfismo sí, y solo sí, su matriz canónica asociada AT es
inversible.
Ejemplo 68 Calculemos, si existe, la inversa de la transformación lineal T : R2 → R2 dada por T (x, y) =
(3x − 2y, 2x − y). Para decidir si esta transformación lineal tiene inversa, debemos verificar si es o no un isomorfimo.
Nos armamos la matriz canónica asociada:  
3 −2
AT =  
2 −1
Como det(AT ) = 1 6= 0, entonces AT es inversible y, por lo tanto, T es un isomorfismo. Ahora que sabemos que T
tiene inversa, la calculamos. Buscamos entonces la inversa de AT :
     
3 −2 1 0 F2 →F2 − 2
3
F1 3 −2 1 0 3F2 3 −2 1 0
 − −−−−−−−− →  −−→  
1
2 −1 0 1 0 3
− 23 1 0 1 −2 3
   
F1 →F1 +2F2 3 0 −3 6 1F
3 1
1 0 −1 2
−−−−−−−−→   −−−→  
0 1 −2 3 0 1 −2 3
Esta última matriz es, entonces, AT −1 , por lo que la forma funcional de T −1 es:
     
−1 2 x −x + 2y
T −1 (x, y) =  · = .
−2 3 y −2x + 3y
Es decir, T −1 (x, y) = (−x + 2y, −2x + 3y). Para verificar que este cálculo es correcto, calculemos T ◦ T −1 :
T ◦ T −1 (x, y) = T (−x + 2y, −2x + 3y)

= (3(−x + 2y) − 2(−2x + 3y), 2(−x + 2y) − (−2x + 3y))
= (−3x + 6y + 4x − 6y, −2x + 4y + 2x − 3y)
= (x, y)
Estudiamos la composición de transformaciones lineales y vimos que la matriz canónica asociada a una composición
es el producto de las matrices canónicas asociadas a las transformaciones originales. Usamos estas propiedades para
mostrar cómo construir tranformaciones lineales que sean composiciones de rotaciones, simetrías, homotecias, etc.
Definimos la inversa de un isomorfismo y vimos que la matriz canónica asociada a la transformación inversa es la
matriz inversa de la matriz asociada al isomorfismo original.

7. Números complejos
Los números complejos forman un conjunto numérico más grande que los números reales, que surgen ante la
necesidad de encontrar soluciones a ecuaciones cuadráticas con coeficientes en R. En este sentido, son la “extensión”
necesaria (más pequeña) que garantiza que todas estas ecuaciones tienen solución. Si bien los números complejos,
como objeto matemático, son una abstracción, surgieron en el estudio de ciertos problemas geométricos y en la
resolución de ecuaciones polinomiales.
7.1 ¿Qué son los números complejos?

Probablemente hayan tenido contacto con números complejos durante su formación y asocien a ellos la palabra
“imaginario” y la famosa letra i. Lo cierto es que las presentaciones de los números complejos que se hacen, en
general, oscurecen el fuerte sentido geométrico que conllevan.
El sentido geométrico de los números complejos.

La definición de número complejo y las operaciones básicas entre ellos.

7.1.1 ¿Cómo surgen los números complejos?
Los números naturales son los números que utilizamos para contar, de allí su nombre. Supongamos que queremos
resolver ecuaciones con estos números. Por ejemplo, x + 3 = 5 puede ser resuelta sin problema: la solución es
x = 2. Pero ¿qué sucede si queremos resolver x + 3 = 1? Esta ecuación no tiene solución en números naturales (no
hay ningún número natural tal que, al sumarle 3, nos dé como resultado 1). ¿Qué podemos hacer? Pues podemos
introducir los números naturales negativos para resolver este tipo de ecuaciones. Creamos, entonces, los números
enteros, que constan de los números naturales y sus inversos aditivos (y del 0, ya que vamos a tener que poder
representar 1 − 1, por ejemplo). De esta manera, ya podemos resolver x + 3 = 1; la solución es el número entero −2.
¿Y si quisiéramos ahora resolver 2x + 3 = 4? ¿Podemos? ¡No! Esta ecuación no tiene solución con los números
enteros. Necesitamos nuevamente ampliar el conjunto de números con el que trabajamos. Entonces, construimos
los cocientes entre números enteros: los números racionales. Con estos últimos, es posible resolver este tipo de
ecuaciones. En este caso, la solución de la ecuación es el número racional 12 . ¿Qué sucede ahora si queremos resolver
la ecuación cuadrática x2 = 2? Pues sucede que esta ecuación no tiene solución con los números racionales. Como
√ √
bien sabemos ahora, las posibles soluciones a dicha ecuación son 2 y − 2, y estos números no se pueden escribir
como cociente de números enteros (la demostración de este hecho se puede ver como información complementaria
sobre el Teorema de Gauss del próximo capítulo). Entonces, llegamos a definir los números reales, que son los
números que conocemos y utilizamos todo el tiempo. Lamentablemente, especificar cuáles son los números reales
no es tan sencillo como lo es especificar los números enteros (a partir de los naturales) o los números racionales (a
partir de los enteros). Podemos decir que, informalmente, los números reales constan de los números racionales
más los números que se encuentran entre los racionales en la recta real (es decir, los números necesarios para llenar
la recta y que no queden huecos). ¿Llegamos al final del camino? ¿Son estos los últimos números que vamos a
necesitar? Miremos la ecuación x2 + 1 = 0. ¿Existe algún número real que, elevado al cuadrado y sumado con
1, nos de 0? ¡No! Sabemos que el cuadrado de cualquier número real es un número positivo, por lo que no es
posible que, al sumarle 1 a un número positivo, obtengamos algo más pequeño que 1 (mucho menos, el 0). Es, en
este contexto, que necesitamos agrandar aún más el conjunto de números con el que trabajamos. Y aquí es donde
aparecen los números complejos: nos permiten, en particular, resolver la ecuación x2 = −1. Para ello, vamos a
tener que introducir un número que elevado al cuadrado de como resultado −1: el famoso número i.
7.1.2 ¿Cómo se define el conjunto de números complejos?
Tal como mencionamos en el párrafo anterior, buscamos que el conjunto de números complejos sea una extensión de
los reales que, además, contenga un elemento i que verifique i2 = −1. Esta “ampliación” del conjunto R debemos
realizarla de manera que las operaciones que de suma y multiplicación en este nuevo conjunto sean coherentes
con las que llevamos a cabo en los números reales. Vamos a describir al conjunto C de números complejos de la
siguiente manera:
C = {z = a + bi : a, b ∈ R}
donde establecimos que el nuevo “número” i verifica i2 = −1. Es decir, un número complejo es la suma de un
número real a y de un múltiplo real b de i. Notemos que el conjunto R es efectivamente un subconjunto de C ya que
puede escribirse de la siguiente manera:
R = {z = a + bi ∈ C : b = 0}
Ahora que sabemos qué forma tienen los números complejos, debemos aprender a sumarlos y multiplicarlos.
Como dijimos, estas operaciones tienen que coincidir con las operaciones que ya conocemos de R cuando estemos
trabajando con números reales vistos como subconjuntos de C:
Definición 68 Dados números complejos z = a + bi, w = c + di ∈ C, definimos la suma y el producto entre
ellos de la siguiente manera:

Suma: z + w = (a + c) + (b + d)i
Producto: zw = (ac − bd) + (ad + bc)i
Observemos que la suma de números complejos consiste, simplemente, en sumar entre sí a los números reales
que no están multiplicando a i y, entre sí, a los que están multiplicando a i. Por otro lado, si bien la fórmula del
Álgebra A. El plano complejo. 197
producto de números complejos parece complicada, esta surge de aplicar la propiedad distributiva y recordando que
el número i al cuadrado es −1:
zw = (a + bi)(c + di) = ac + di + bci + bdi2 = ac + di + bci − bd = (ac − bd) + (ad + bc)i
Ejemplo 69
3i − (1 + 2i) = (0 − 1) + (3 − 2)i = −1 + i.
(4 + 5i)(1 + 3i) = 4 − 15 + (12 + 5)i = −11 + 17i.
3,5 = (15 − 0,0) + (0,5 + 3,0)i = 15.

Nos preguntamos ahora, ¿cuáles son los números complejos inversibles? Sabemos que todo número real λ distinto
de 0 tiene inverso: el número λ1 . ¿Qué sucede con un número complejo a + bi distinto de 0? Podríamos proponer
1
como inverso de este número a a+bi ; pero, ¿es esto un número complejo? En realidad, sí lo es, solo que no está
1
escrito de una forma que lo reconozcamos como tal. ¿Cómo podemos hacer para reescribir a+bi de la manera como
a−bi
definimos a los números complejos? Pues multiplicamos esta expresión por a−bi , ¡que es simplemente 1! (por lo
que no la estamos cambiando). ¿Cuál es el resultado de esta cuenta?:
1 a − bi a − bi a − bi a −b
. = = 2 2
= 2 2
+ 2 i
a + bi a − bi (a + bi)(a − bi) a +b a +b a + b2
a
Esta última expresión está escrita en la forma en la que definimos a los números complejos (un números real a2 +b2
b
sumado a un número real − a2 +b 2 multiplicado por i). Verifiquemos que, efectivamente, este número es el inverso
de a + bi:

a −b a −b −b a
(a + bi) + 2 i = a −b 2 + a +b 2 i
a2 + b2 a + b2 a2 + b2 a + b2 a2 + b2 a + b2
a2 + b2 −ab + ab
= 2 2
+ 2
a +b a + b2
= 1 + 0i
= 1
De esta manera podemos concluir que todos los números complejos no nulos son inversibles.
Mostramos la necesidad para definir y trabajar con números complejos (nos brindan soluciones a ecuaciones que no
tienen soluciones reales).
Definimos el conjunto de números complejos junto con su suma y multiplicación, estudiamos sus propiedades y
vimos que eran coherentes con las operaciones de los números reales.
Vimos que todos los números complejos no nulos son inversibles y estudiamos una manera de calcular dicho inverso.

7.2 El plano complejo

El hecho que un número complejo a + bi esté definido a partir de los números reales a y b, no hace pensar si
existe alguna relación entre estos y los puntos del plano R2 . Esta relación existe y, en muchas ocasiones, será
conveniente pensar un número complejo z = a + bi como el vector (a, b) ∈ R2 . Este proceso nos permite obtener
una representación gráfica de los números complejos e interpretar geométricamente las operaciones de suma y
producto.
La representación en el plano de los números complejos.

La forma binómica de un número complejo (partes real e imaginaria) y el conjugado de un número complejo.
El módulo de un número complejo y la distancia entre números complejos.

7.2.1 Representación en el plano y forma binómica
Podemos, entonces, identificar un número complejo a + bi con el vector (a, b) ∈ R2 . Es decir, la primera coordenada
del vector asociado corresponde a la componente real que no multiplica al número i, y la segunda coordenada, a
la componente real que multiplica i. Esta identificación es biyectiva: a cada número complejo le corresponde un
único vector de R2 y, a cada vector de R2 , le corresponde un único número complejo. Cuando pensemos a R2
representando a los números complejos, lo llamaremos el plano complejo.
Observación 44 Notemos que, el vector de R2 que le corresponde a la suma z + w de los números complejos
z, w ∈ C, es el vector que se obtiene al sumar los vectores asociados a z y w. Es decir, si (a, b) es el vector
asociado a z y (c, d) el vector asociado a w, entonces el vector asociado a z +w es (a, b)+(c, d) = (a+c, b+d).
Por otro lado, el vector asociado al producto zw es (ac − bd, ad + bc).
Las componentes o coordenadas que constituyen un número complejo, tienen un nombre:

Definición 69 Si z = a + bi ∈ C, con a, b ∈ R, llamaremos parte real de z al número a y parte imaginaria a b,
y escribiremos a = Re(z), b = Im(z). Siempre que un número complejo esté escrito de esta manera, diremos
que está en forma binómica.
Ejemplo 70
Para z = 4 + 3i, ¿cuánto valen Re(z), Im(z)? Como z ya está en forma binómica, podemos ver directamente
que Re(z) = 4, Im(z) = 3.
Si ahora z es z = i(3 + 2i)2 , para hallar Re(z), Im(z), primero necesitamos ponerlo en forma binómica.
Desarrollemos el cuadrado:
z = i(3 + 2i)2 = i(32 + 2,3,2i + (2i)2 ) = i(9 + 12i − 4) = i(5 + 12i)
Ahora efectuamos la multiplicación de los dos números complejos que nos quedaron y obtenemos
z = −12 + 5i
que resulta la forma binómica de z. Por lo tanto, la respuesta es Re(z) = −12, Im(z) = 5.

Importante Notemos que las partes real e imaginaria de un número complejo siempre son números reales. Por
ejemplo, Im(i) = 1 y no i.
Experimento 43 Calculen Re(z + w) y Im(z + w) en términos de Re(z) y Im(w) para complejos

z = a + bi y w = c + di.
Un punto importante, que quizás escapa a primera vista, es que llevar números complejos a su forma binómica
nos permite decidir si dos números dados son iguales. ¿De qué manera? Es claro que, si z = 2i, w = 2i, entonces
z = w. Pero si fuera z = 2i(4 + i) y w = i(8 − 2i), no es tan inmediato responder si z = w o z 6= w. Sucede que
dos números complejos z y w son iguales sí, y solo sí,
Re(z) = Re(w) e Im(z) = Im(w)
Dado que tenemos que z = 2i(4 + i) = −2 + 8i y w = i(8 − 2i) = 2 + 8i. Como Re(z) = 2 6= −2 = Re(w),
podemos afirmar que z 6= w.
Traducir la igualdad de números complejos en términos de partes real e imaginaria es una herramienta más poderosa
de lo que parece. Veamos un ejemplo de esto.
Ejemplo 71
Supongamos que queremos averiguar cuáles son los números complejos z que satisfacen (3 + i)z = 4 − 2i.
Llamemos z = a + bi, con a, b ∈ R, y operemos:
(3 + i)z = (3 + i)(a + bi) = (3a − b) + (a + 3b)i
Por lo tanto, tenemos que (3 + i)z = 4 + 2i sí, y solo sí, 3a − b = 4 y a + 3b = −2. ¡Este es un sistema de
ecuaciones lineales con coeficientes reales! Es fácil calcular que las soluciones son a = 1 y b = −1.
Busquemos ahora los números complejos z tales que Re(z(1 − 2i)) + 4i = zIm(z). Escribimos z = a + bi,
con a, b ∈ R, y reemplazamos en la ecuación original. El lado izquierdo de la igualdad queda:
Re(z(1 − 2i)) + 4i = Re((a + bi)(1 − 2i)) + 4i = Re(a + 2b + (−2a + b)i) + 4i = a + 2b + 4i.
Del lado derecho:

zIm(z) = (a + bi)b = ab + ib2
Si ahora igualamos las partes real e imaginaria de cada lado, obtenemos:
a + 2b = ab y b2 = 4
4
De aquí, vemos que b = 2 o b = −2. En el primer caso, a = 4 y, en el segundo caso, a = 3
. Concluimos,
4
entonces, que hay dos soluciones a la ecuación original: z1 = 4 + 2i y z2 = 3
− 2i.

Norma de un número complejo. Una propiedad importante que conocíamos de los vectores en R2 es su longitud,
que llamamos en general norma. En el caso de un número complejo z = a + bi, llamaremos módulo a la norma del
vector de R2 asociado.
Definición 70 Dado un número complejo z = a + bi en forma binómica, su módulo es el número real
√
|z| = a2 + b2 . Gráficamente, este número representa la longitud del vector de R2 asociado al número complejo
z.
Ejemplo 72
√
El módulo del número complejo z = 2i es |z| = 02 + 22 = 2. Esto es claro si pensamos que el vector asociado
a z es (0, 2).
¿Cuál es el módulo de zw, donde z = 3 + 2i y w = −1 + 5i? Hallemos la forma binómica de zw:
zw = (3 + 2i)(−1 + 5i) = (−3 − 10) + (−2 + 15)i = −13 + 13i.
Aplicamos ahora la fórmula del módulo para obtener:

p √
|zw| = 132 + 132 = 13 2
Como el módulo de un número complejo se define a partir de su representación en el plano, entonces sus propiedades
con relación a la suma y a la multiplicación por escalar real son las mismas que para la de la norma de vectores
en R2 . Sin embargo, los números complejos pueden multiplicarse entre sí (operación que no está definida para
vectores). Nos preguntamos, ¿existe alguna propiedad que verifique el módulo respecto del producto de números
complejos? La respuesta es sí, y dado que conciste en hacer las mismas cuentas que ya hicimos, se las dejamos para
desarrollar en el siguiente experimento.
Experimento 44 Sean z = a + bi y w = c + di. Muestren que |zw| = |z||w| (o sea, el módulo del producto
de dos números complejos es el producto de los módulos de dichos números).
Comentamos en el párrafo anterior que, para un número complejo a + bi, el número a − bi es de mucha importancia.
Entre otras cosas, este número está relacionado sutilmente con el módulo. Lo definimos a continuación:
Definición 71 Dado un número complejo z = a + bi, escrito en forma binómica, definimos el conjugado de z,
que notaremos por z, como el número complejo z = a − bi.
Notemos que, si (a, b) es el vector asociado a z, entonces (a, −b) es el vector asociado a z. Gráficamente, z es el
simétrico de (a, b) respecto del eje x.
Ejemplo 73
El conjugado de 3 + i es, obviamente 3 − i.

El conjugado de 2 es él mismo pues 2 escrito en forma binómica es 2 + 0i, por lo que su conjugado es 2 − 0i = 2.
Gráficamente, el simétrico del vector asociado (2, 0) respecto del eje x es (2, 0), pues este vector pertenece a
dicho eje.

Veremos que el conjugado de un número complejo z aparece muchas veces relacionado a propiedades de z. El
siguiente experimento muestra algunas de las mismas.
Experimento 45
1. Consideren z = 2 + 3i. Calculen zz. ¿Qué relación tiene este producto con |z|? ¿Y para un número
complejo en general?
2. Verifiquen las siguientes propiedades de la conjugación para números complejos z, w:
z=z
z + w = z + w.
zw = z w.
z + z = 2Re(z), z − z = 2Im(z).
|z| = |z|.

Observemos que, del experimento anterior, podemos deducir que todo número complejo distinto de 0 es inversible.
z
Más aún, podemos calcular directamente el inverso por medio de z −1 = 2 .
|z|
Ejemplo 74 Calculemos z −1 para z = (3 + i). De acuerdo a la fórmula que acabamos de ver necesitamos, en
√ √
primer lugar, hallar |z| y z. Por un lado |z| = 32 + 12 = 10. Por otro lado, z = 3 − i. Por lo tanto, tenemos
−1 3−i 3 1
z = 10
= 10
− 10
i.
¿Qué más nos permite hacer el módulo de números complejos? Podemos medir la distancia entre dos números
complejos z, w de la misma manera que hacíamos con los vectores de R2 .
Definición 72 Dados dos números complejos z y w, definimos la distancia entre z y w como el número real
|z − w|.
Por supuesto, la distancia entre z y w es, simplemente, la distancia en el plano complejo entre sus vectores asociados.
Ejemplo 75
La distancia entre z = −1 + 4i y w = −5 − 2i es:

p √
|z − w| = |(−1 + 4i) − (−5 − 2i)| = |4 + 6i| = 42 + 62 = 52
¿Cuál es el conjunto C = {z ∈ C : |z − (3 + i)| = 2}? Pues son los números que distan en 2 unidades del
número 3 + i. Gráficamente, en el plano complejo, C es la circunferencia de radio 2 y centro (3, 1).
Consideremos ahora el conjunto L = {z ∈ C : |z − 1| = |z − i|}. ¿Qué significa la condición que define al
conjunto? Los elementos de L son los números complejos que distan de 1 lo mismo que de i. Gráficamente, en el
plano complejo, son los puntos que distan de (1, 0) en lo mismo que de (0, 1). Si lo pensamos un rato, podemos
convencernos de que este conjunto es una recta (que pasa por 0). Hagamos el cálculo formal para confirmarlo.
Tomemos z ∈ L y escribamos z = a + bi. Si reemplazamos en la ecuación que define a L, tenemos:
|a + bi − 1| = |a + bi − i|
Por la definición de módulo, podemos escribir:

p p
(a − 1)2 + b2 = a2 + (b − 1)2
Si elevamos ambos lados de la igualdad al cuadrado, obtenemos:
(a − 1)2 + b2 = a2 + (b − 1)2
Si expandimos los cuadrados y operamos, descubrimos que la igualdad de arriba equivale a a = b. Concluimos
que un número complejo z = a + bi pertenece a L sí, y solo sí, a = b, es decir, es de la forma a + ai. Podemos
entonces escribir:
L = {a + ai : a ∈ R} = {a(1 + i) : a ∈ R}.
Esto nos dice que L consiste en todos los números complejos múltiplos de 1 + i. Gráficamente, el vector asociado
a 1 + i es el (1, 1), por lo que, visto en el plano complejo, el conjunto L es el conjunto
L = {a(1, 1) : a ∈ R}.
Concluimos que L se trata de la recta con ecuación vectorial t(1, 1).

7.2.2 Transformaciones en el plano complejo
Dado que hay una identificación natural entre los vectores de R2 y los números complejos, ¿cómo se traducen las
transformaciones geométricas que vimos en el capítulo anterior en el lenguaje de números complejos? En este
apartado las estudiaremos.
Empecemos por las traslaciones. Una de las transformaciones más simples en R2 consiste en “trasladar” un vector
~v por medio de otro vector w
~ = (a, b). Por ejemplo, si a y b son números positivos, esto consiste en desplazar al
vector ~v en a unidades a la derecha y en b unidades hacia arriba. La fórmula de la traslación Tw~ : R2 → R2 por el
vector w
~ está dada por:
Tw~ (x, y) = (x + a, y + b) = (x, y) + (a, b)
Si pensamos en la misma transformación en el plano complejo, esta consiste en sumar, a un número complejo dado,
el número w = a + bi. Es decir, la traslación Tw : C → C por un número complejo w = a + bi está dada por:
Tw (z) = z + w = z + (a + bi)
Analicen por qué las traslaciones T~v : R2 → R2 no son transformaciones lineales.
Como vimos en el capítulo anterior, una homotecia consiste en cambiar la longitud de cada vector multiplicándolo
por un número r > 0 fijo, llamado la razón de la homotecia. Si r < 1, la homotecia de razón r “acorta” vectores y,
si es r > 1, los “alarga”. Una homotecia Hr : R2 → R2 de razón r en R2 tiene fórmula:
Hr (x, y) = r(x, y) = (rx, ry)
Una homotecia en el plano complejo se traduce, entonces, a multiplicar por el número complejo r + 0i. Es decir, es
la función Hr : C → C dada por:
Hr (z) = Hr (x + iy) = r(x + iy) = rx + iry
Las rotaciones en R2 consisten en girar a cada vector un ángulo fijo en determinado sentido. En el capítulo anterior,
vimos que la rotación Rθ : R2 → R2 de ángulo θ > 0, en sentido contrario a las agujas del reloj, está dada por la
fórmula:
Rθ (x, y) = (x cos(θ) − y sin(θ), x sin(θ) + y cos(θ))
Consideremos el número complejo ω = cos(θ) + i sin(θ). ¿Qué características tiene? En primer lugar, su módulo
es 1:
q √
|ω| = cos2 (θ) + sin2 (θ) = 1=1
Por otro lado, al multiplicarlo con otro número complejo z = x + iy se obtiene:
zω = (x + iy)(cos(θ) + i sin(θ)) = (x cos(θ) − y sin(θ)) + i(x sin(θ) + y cos(θ))
¡Notemos que el vector asociado a esta última expresión es exactamente Rθ (x, y)! Por lo tanto, concluimos que, en
el plano complejo, la fórmula de rotación de ángulo θ > 0, en sentido antihorario, es:
Rθ : C → C , Rθ (z) = zω,
donde ω = cos(θ) + i sin(θ).
Importante La deducción que acabamos de realizar muestra una propiedad geométrica muy interesante de los
números complejos: multiplicar por un número complejo de módulo 1 es una rotación por cierto ángulo.
Veamos ahora las simetrías. Recordemos, del capítulo 2, que en R2 teníamos dos tipos de simetrías: respecto de un
punto y respecto de una recta. Para el plano complejo, sólo consideraremos simetrías respecto de puntos. En general,
una simetría S : C → C respecto de un número complejo w es la correspondiente simetría S : R2 → R2 respecto
del vector asociado a w. Por ejemplo, como la simetría S : R2 → R2 respecto del origen de coordenadas tiene por
fórmula a S(x, y) = −(x, y) = (−x, −y), entonces la simetría respecto del número complejo 0 tiene es la función
S(z) = −z. Si bien no desarrollaremos simetrías respecto de rectas, recordemos que ya hemos estado trabajando
con una: el conjungado z de un número complejo z es el simétrico de z respecto de la recta dada por el eje x.
Ejemplo 76
Interpretemos geométricamente el efecto de la operación T : C → C dada por T (z) = (1 + i)z − 3, sabiendo

√
que (1 + i) = 2 cos π4 + i sin π4 . Si analizamos la expresión de T , vemos que dicha operación consta

de varias transformaciones sucesivas de las que hemos estudiado. En efecto, lo primero que hace T a un número
complejo z es rotarlo un ángulo de π4 en sentido antihorario; luego, “agranda” el resultado por medio de una
√
homotecia de razón 2. Finalmente, traslada lo obtenido tres unidades a la izquierda.
¿Cuál es la fórmula de la simetría S respecto del número w = 3 + 2i? Veremos que podemos reducir el cálculo
de S(z), para z ∈ C, al caso conocido de la simetría respecto de 0. Notemos que, si realizamos una translación
por el número −w, entonces dos números simétricos respecto de w van a parar, necesariamente, a dos números
simétricos respecto de 0 (pues esta traslación manda w a 0). Como z y S(z) son simétricos respecto de w, esto
dice que:
Tw (z) = z − w = −(Tw (S(z))) = −(S(z) − w) = −S(z) + w
De aquí, concluimos que S(z) = −z + 2w.

Si bien no desarrollaremos simetrías respecto de rectas, miremos la siguiente propiedad de la simetría S respecto
del eje y en el plano complejo. Se puede ver que, si z = a + bi, entonces S(z) = S(a + bi) = −a + bi. Notemos
que −a + bi = −(a − bi) = −z, por lo que S(z) = −z. Interpretada de esta manera, vemos que la simetría
respecto del eje y consiste en la simetría respecto del eje x (que manda z a z), seguida de la simetría respecto del
0 (que manda z a −z).

Interpretamos a los números complejos como vectores en R2 .

Definimos la forma binómica de un número complejo y sus partes real e imaginaria (que siempre son números reales).
Vimos que dos números complejos son iguales sí, y solo sí, sus partes reales y sus partes imaginarias coinciden.
Definimos el módulo de un número complejo como la norma del vector de R2 asociado a dicho número y observamos
que tiene la propiedad que el módulo de un producto es el producto de los módulos. También definimos distancia
entre números complejos.
Definimos el conjugado de un número complejo a + bi como a − bi que, geométricamente es el punto simétrico a
(a, b) respecto del eje de las x, y estudiamos sus propiedades y relación con el cálculo de la inversa del número.
Estudiamos las posibles transformaciones que se pueden hacer geométricamente con los números complejos (inter-
pretándolos como vectores del plano): traslaciones, homotecias, rotaciones y simetrías.

7.3 Ecuaciones cuadráticas

Seguramente saben calcular las raíces (reales) de una ecuación cuadrática con coeficientes reales. La fórmula
resolvente dice que todas las soluciones reales de la ecuación
ax2 + bx + c = 0 con a, b, c ∈ R, a 6= 0
son de la forma: √
−b ± b2 − 4ac
2a
El principal aprendizaje de este apartado es que la misma expresión vale para ecuaciones cuadráticas con coeficientes
complejos.
Cómo resolver ecuaciones cuadráticas en los números complejos.

7.3.1 Raíces cuadradas complejas
¿Qué es la raíz cuadrada de un número real x > 0? Muchas veces se dice que es “otro número y tal que y 2 = x.”
Pero esta definición no es correcta. Lo que entendemos por “raíz cuadrada de un número real x > 0” es el único
número positivo y tal que y 2 = x. Por ejemplo, si bien tanto 2 como −2 verifican que, al elevarlos al cuadrado,
dan como resultado 4, la raíz cuadrada de 4 es 2. Esta unicidad de la raíz cuadrada y de x es lo que nos permite
√ √
escribirla como y = x: si no convenimos que siempre es positiva, no sabríamos si 4 representa al 2 o al −2.
¿Cómo se traslada la definición de raíz cuadrada a números complejos? Los números complejos no tienen noción de
orden, por lo cual, en particular, no se pueden diferenciar entre positivos (mayores a 0) o negativos (menores a 0).
Por este motivo, en los números complejos, no existe esta unicidad de la raíz cuadrada.
Definición 73 Una raíz cuadrada de z ∈ C es un número complejo w tal que w2 = z.
A diferencia de los reales, donde los números negativos no poseen raíz cuadrada, cualquier número complejo
siempre tiene raíces cuadradas (aunque sea un real negativo). Veremos, de hecho, que siempre tiene exactamente
dos. Analicemos cómo calcularlas “a mano” por medio de algunos ejemplos.
Álgebra A. Ecuaciones cuadráticas. 205
Ejemplos 77
¿Cuáles son las raíces cuadradas de −4? Para que un número complejo w sea una raíz cuadrada de −4 debe
suceder que w2 = −4. Si escribimos w = a + bi, esto se traduce en pedir:
w2 = (a + bi)2 = a2 − b2 + 2abi = −4
Al igualar las partes real e imaginaria, deducimos que a2 − b2 = −4 y 2ab = 0. La segunda condición nos dice
que, o bien a = 0, o bien b = 0. Si a = 0 entonces b2 = 4, de donde b = 2 o b = −2. Concluimos que w = 2i
y 2 = −2i son raíces cuadradas de −4. En el caso que fuera b = 0, entonces debería ser a2 = −4. Pero a ∈ R,
y no hay números reales cuyo cuadrado sea −4. Por lo tanto, todas las raíces cuadradas de −4 son 2i y −2i.
Hallemos todas las raíces cuadradas de z = 4 + 3i. Es decir, busquemos todos los números complejos w tales
que w2 = 4 + 3i. Si, como antes, escribimos w = a + bi, entonces se tiene:
w2 = (a + bi)2 = a2 − b2 + 2abi = 4 + 3i
Esto implica que a2 − b2 = 4 y 2ab = 3. Esta vez, parece más difícil resolver estas ecuaciones simultáneas
3
(notemos que no son lineales). Si despejamos, por ejemplo, a = 2b
de la segunda ecuación y la reemplazamos
2 2
3
en la primera, obtenemos (2b)2
− b = 4. Esto nos dice que debemos buscar un número b que verifique
4 2
9 − 4b = 16b . Si bien esto no es muy difícil (lo aprenderemos a hacer en el capítulo ocho), existe una manera
más fácil de resolver nuestro problema. Observemos que podemos extraer más información de los datos del
problema. En efecto, como el w buscado debe verificar w2 = 4 + 3i, entonces, en particular, |w2 | = |4 + 3i| = 5.
√
Como |w2 | = |w|2 (por Experimento 44), entonces debemos tener |w| = 5. En términos de a y b, esto quiere
decir que a2 + b2 = 5. Esta es una nueva ecuación que nos va a facilitar el despeje los valores de a y b. Tenemos:

a2 − b2 = 4





 2ab = 3


a2 + b2 = 5


Sumando la primera ecuación con la tercera, obtenemos a2 = 29 , de donde a = 3

√
2
o a = − √32 . Reemplazando
1
cada una de estas posibilidades en la segunda ecuación, hallamos b = √
2
y b = − √12 , respectivamente.
Concluimos que todas las raíces cuadradas de z = 4 + 3i son w1 = √3 + √1 i y w2 = − √3 − √1 i. Siempre
2 2 2 2
es una buena idea verificar si la respuesta hallada es efectivamente una solución al problema:
2
3 1 9 1 3 1
w12 = √ + √ i = − + 2 √ √ = 4 + 3i
2 2 2 2 2 2
Por otro lado, notemos que w2 = −w1 , por lo que w22 = (−w1 )2 = w12 = 4 + 3i.

Observación 45 Como muestran los ejemplos anteriores, si z es un número complejo distinto de 0, entonces z
tiene exactamente dos raíces cuadradas y, además, una es la inversa aditiva de la otra.
7.3.2 Resolución de ecuaciones cuadráticas
Ahora, vamos a estudiar cómo resolver ecuaciones cuadráticas con coeficientes en C.

Definición 74 Una ecuación cuadrática con coeficientes complejos es una ecuación de la forma:
az 2 + bz + c = 0,
donde a, b, c son números complejos y a 6= 0.

√
−b± b2 −4ac
Como dijimos al comienzo del apartado, la misma fórmula resolvente x1 , x2 = 2a es válida para este tipo
de ecuaciones complejas. Notemos que esta fórmula puede reescribirse como:
−b + w
z1 , z2 = ,
2a
donde w es una raíz cuadrada (compleja) de b2 − 4ac. El término b2 − 4ac se llama discriminante y se lo nota
∆ = b2 − 4ac. Tengamos en cuenta que, en esta fórmula, no tenemos la necesidad de utilizar el símbolo ±, ya que
sabemos que, si w es raíz cuadrada de b2 − 4ac, también lo es −w.
Ejemplos 78
Hallemos los números complejos z que satisfacen z 2 + 2iz − 3 = 0. Para esto, busquemos las raíces cuadradas
√ √
de ∆ = (2i)2 − 4(−3) = −4 + 12 = 8. Se trata entonces de 8 y − 8. Por lo tanto, las soluciones de la
ecuación son: √ √
−2i + 8 −2i − 8
y
2 2
√ √
Simplificando estas fracciones: 2 − i y − 2 − i.
Encontremos las soluciones de z 2 + (3 + i)z + (1 + 34 i) = 0. Debemos encontrar las raíces cuadradas de:

3
∆ = (3 + i)2 − 4 1 + i = 9 − 1 + 6i − 4 − 3i = 4 + 3i
4
Las raíces cuadradas de 4 + 3i las habíamos calculado en el Ejemplo 77:
3 1 3 1
w1 = √ + √ i y w2 = − √ − √ i
2 2 2 2
Por lo tanto, las soluciones de la ecuación original son:
−(3 + i) + w1 −(3 + i) + w2
y
2 2
Estudiamos el concepto de “raiz cuadrada” de un número complejo. Vimos que todo número complejo tiene dos
raíces (siendo una la inversa aditiva de la otra) y mostramos cómo hallarlas.
Aprendimos a resolver ecuaciones cuadráticas en los números complejos (utilizando al fórmula resolvente conocida).

7.4 Formas polar y exponencial

Existen otras maneras de representar a los números complejos que resultarán muy convenientes a la hora de resolver
ecuaciones.
La forma polar de un número complejo.

La forma exponencial de un número complejo.

7.4.1 El problema de la forma binomial
En el apartado anterior vimos cómo resolver ecuaciones cuadráticas con coeficientes complejos. ¿Pero qué sucede
con las ecuaciones cúbicas, cuartas o de grados mayores? Supongamos, por ejemplo, que buscamos un número
complejo z que cumpla z 4 = 1. Una manera directa de encarar este problema es plantear un número complejo
Álgebra A. Formas polar y exponencial. 207
genérico z = a + bi (con a, b, ∈ R), calcular (a + bi)4 e intentar despejar a y b. Si hacemos estas cuentas tenemos,
primero:
z 2 = (a + bi)(a + bi) = (a2 − b2 ) + 2abi
Luego,
z 3 = z 2 z = ((a2 − b2 ) + 2abi)(a + bi) = a3 − 3ab2 + (3a2 b − b3 )i
Finalmente,
z 4 = z 3 z = (a3 − 3ab2 + (3a2 b − b3 )i)(a + bi) = a4 − 6a2 b2 + b4 + (4a3 b − 4ab3 )i
Por lo tanto, deberíamos lidiar con la ecuación:
a4 − 6a2 b2 + b4 + (4a3 b − 4ab3 )i = 1
En este punto, resulta claro que este camino no es muy ameno, tanto por la complejidad de la ecuación como por la
cantidad de cuentas que hay que llevar a cabo para arribar a la misma. Por suerte, hay otra forma mucho más simple
de encarar este problema. Esta consiste en utilizar otra manera de representar números complejos: la forma polar.
7.4.2 La forma polar de un número complejo
Hasta este punto, el único modo que utilizamos para especificar un vector ~v ∈ R2 es por medio de sus coordenadas.
Pero existen otros. Uno consiste en dar la longitud de ~v (su norma) y la inclinación que tiene respecto del semieje
positivo de las x (Figura 7.1, lado izquierdo). Dadas las coordenadas del vector, ya sabemos como calcular su
norma. ¿Cómo encontramos el ángulo de ~v respecto del semieje positivo de las x? Notemos que, si ~v está en el
semiplano superior {(x, y) ∈ R2 : y ≥ 0} (es decir, el semiplano determinado por todos los puntos del plano cuya
coordenada y es mayor o igual a 0) entonces el ángulo buscado es, simplemente, el ángulo θ entre ~v y el vector
(1, 0) (o cualquier vector con extremo en el semieje positivo de las x, en realidad; Figura 7.1, lado izquierdo). Por
otro lado, si ~v está en el semiplano inferior {(x, y) ∈ R2 : y ≤ 0} de los puntos cuya coordenada y es menor o
igual a 0, entonces el ángulo buscado es 2π − θ, donde θ es, nuevamente, el ángulo entre ~v y el (0, 1) (Figura 7.1,
lado derecho).
=
=
Figura 7.1: Representación polar de vectores.
Por otro lado, dados la norma y ángulo α respecto del semieje positivo de las x del vector ~v , ¿cómo podemos
hallar las coordenadas a, b de ~v ? Supongamos primero que el vector tiene norma 1. En este caso, es fácil ver que
a = cos(α) y b = sin(α), de forma que ~v = (cos(α), sin(α)). Si ahora ||~v || es cualquier valor, entonces podemos
~
v
considerar el vector w
~= v || ,
||~ que es un vector con la misma dirección que ~v pero de norma 1. Por el razonamiento
anterior, sabemos entonces que w

~ = (cos(α), sin(α)), donde α es el ángulo entre w
~ y el (1, 0) (que es el mismo
~
v
ángulo entre ~v y el (1, 0)). Por lo tanto, como w
~= v || ,
||~ concluimos que:
~v = ||~v ||(cos(α), sin(α)) = (||~v || cos(α), ||~v || sin(α))
donde α es el ángulo entre ~v y el semieje positivo de las x.

Estudiemos esta situación en el plano complejo. Si tenemos z = a + bi ∈ C, entonces aplicando el razonamiento
anterior al vector asociado (a, b), podemos concluir que a = |z| cos(α) y b = |z| sin(α), donde α es el ángulo entre
el vector (a, b) y el semieje positivo de las x. Es decir, z = |z|(cos(α) + i sin(α)). Esta forma de representar a z es
lo que se conoce como forma polar de z. Lo definimos formalmente a continuación:
Definición 75 Dado z = a + ib ∈ C, donde a y b son números reales (y no son ambos 0), vamos a llamar el
argumento de z, y lo vamos a notar arg(z), al ángulo que forma (a, b) con el semieje positivo de las x. Observar
que 0 ≤ arg(z) < 2π. De esta manera, vale:
z = |z|(cos(arg(z)) + i sin(arg(z)))
Un número complejo escrito de esta manera se dice que está en forma polar. Si |z| = 1, suele omitirse en la
expresión.
Notemos que hemos definido el argumento de un número complejo basados en la fuerte relación geométrica entre C
y el subespacio R2 . Existe, de todas formas, una manera puramente algebraica de especificarlo: el argumento de un
número complejo z = a + bi 6= 0 es el único ángulo arg(z) que satisface, simultáneamente, que arg(z) ∈ [0, 2π),
a b
|z| = cos(arg(z)) y |z| = sin(arg(z)). Esta manera de definirlo no requiere conocimientos de cálculo de ángulos
entre vectores, pero suele involucrar más cuentas.
Observación 46 Si z = |z|(cos(α) + i sin(α)) está dado en forma polar, es muy fácil encontrar sus partes real
e imaginaria. Como z = |z| cos(α) + i|z| sin(α) y, tanto |z| cos(α) como |z| sin(α) son números reales, se tiene
Re(z) = |z| cos(α) y Im(z) = |z| sin(α).
Ejemplos 79
√ √
Hallemos la forma polar de z = (1 − i). En primer lugar, el módulo de z es |z| = 12 + 12 = 2. Por otro
lado, el vector asociado a z en el plano complejo es (1, −1), el cual se encuentra en el semiplano inferior del
plano, por lo arg(z) = 2π − θ, donde θ es el ángulo entre (1, −1) y (1, 0). Este ángulo es;

(1, −1) · (1, 0) 1 π
θ = arc cos = arc cos √ =
||(1, −1)||||(1, 0)|| 2 4
√
Por lo tanto, arg(z) = 2π − π4 = 74 π, y la forma polar de z es 2(cos( 47 π) + i sin( 74 π)).
¿Cuál es la forma polar de z = 3 cos − π4 + i sin − π4 ? A primera vista, podría parecer que este número

ya está escrito en forma polar, pero hay una condición que falla: − π4 no está en el intervalo [0, 2π). Por lo tanto,
esta no es la escritura polar de z. Notemos, sin embargo, que 3 sí es el módulo de z, pues:
r π π r π π √
2
|z| = 9 cos − 2 + 9 sin − = 9 cos2 − + sin2 − = 9=3
4 4 4 4
Ahora, tenemos que Re(z) = 3 cos − π4 y Im(z) = 3 sin − π4 . Como cos(− π4 ) = √12 y sin(− π4 ) = − √12 ,

entonces el vector asociado a z es ( √32 , − √32 ). Este vector está en el semiplano inferior, por lo que arg(z) =
Álgebra A. Formas polar y exponencial. 209
2π − θ, donde θ es el ángulo entre ( √32 , − √32 ) y el (1, 0). Dicho ángulo es:
( √32 , − √32 ) · (1, 0)

!
1 π
θ = arc cos = arc cos √ =
||( √32 , − √32 )||||(1, 0)|| 2 4
π 7
Por lo tanto, arg(z) = 2π − 4
= 4
π, y la forma polar de z resulta 3(cos( 74 π) + i sin( 74 π)). Observemos
que el argumento que acabamos de hallar es el mismo que el del ejemplo anterior. Esto no es casualidad, ya
que ( √32 , − √32 ) y (1, −1) forman el mismo ángulo con el semieje positivo de las x (porque son múltiplos).
Como para calcular ángulos no nos importan las longitudes de los vectores involucrados, siempre podemos
reemplazar los vectores por múltiplos convenientes de ellos. En este ejemplo concreto, podríamos haber calculado
el argumento de z utilizando el ángulo entre (1, −1) y (1, 0), cosa que nos hubiera simplificado las cuentas.
√
Busquemos ahora la forma polar de z = −1 + 3i. Un cálculo rápido muestra que |z| = 2. El vector asociado a
√
z es (−1, 3), el cual se encuentra en el semiplano superior. Por lo tanto, el argumento de z es el ángulo entre
√
(−1, 3) y el (1, 0). Dicho ángulo es:
√
(−1, 3) · (1, 0) −1 2
θ = arc cos √ = arc cos = π
||(−1, 3)||||(1, 0)|| 2 3
Por lo tanto, la forma polar de z es 2(cos( 32 π) + i sin( 32 π))

Observación 47 En el segundo de los ejemplos anteriores, vimos que el número z = 3 cos − π4 + i sin − π4

7 7

tenía por forma polar a 3 cos 4π + i sin 4π . Estas son dos maneras de escribir al mismo número. De
hecho, si reemplazamos el argumento 74 π por cualquier otro número en el cual el seno y coseno tomen el mismo
valor que toma este argumento (en cualquier número de la forma 74 π + 2kπ, para cualquier k ∈ Z), entonces
vemos que existen infinitas maneras de representar al número z. Pero la forma polar es la única expresión de esta
forma que tiene al ángulo entre 0 y 2π. Además, la norma de z no depende del argumento. Por estos motivos,
podemos concluir que: dos números complejos z, w son iguales sí, y solo sí, sus formas polares son idénticas; es
decir, z = w sí, y solo sí, |z| = |w| y arg(z) = arg(w).
Una de las características más importantes de la forma polar de los complejos es la interpretación del producto.
Supongamos que z y w son números complejos no nulos, y sean z = |z|(cos(α) + i sin(α)) y w = |w|(cos(β) +
i sin(β)) sus escrituras en forma polar, respectivamente. Si hacemos el producto entre z y w, se tiene:
zw = |z|(cos(α) + i sin(α))|w|(cos(β) + i sin(β))

= |z||w|(cos(α) cos(β) − sin(α) sin(β) + i(cos(α) sin(β) + sin(α) cos(β)))
Si recordamos las siguientes identidades trigonométricas:

cos(α + β) = cos(α) cos(β) − sin(α) sin(β) y
sin(α + β) = cos(α) sin(β) + sin(α) cos(β))
entonces podemos concluir el siguiente resultado, que se conoce como Teorema de De Moivre:
Teorema 48 [De Moivre] Si z, w ∈ C son distintos de 0 y se pueden escribir de la forma z = |z|(cos(α) +
i sin(α)) y w = |w|(cos(β) + i sin(β)), para ciertos ángulos α y β (que no necesariamente estén en el intervalo
[0, 2π)), entonces:
zw = |z||w|(cos(α + β) + i sin(α + β))
¡Este resultado es realmente maravilloso! Dice que el módulo de zw es el producto de los módulos de z y w (que ya
sabíamos de antes), pero, también, que el ángulo de zw respecto del eje de las x es la suma de los ángulos de z y
w. Esto muestra que, gráficamente, el efecto de multiplicar un número complejo z por otro w es el de modificar
el módulo de vector determinado por z en la proporción |w| y rotar el vector determinado por z en el sentido
y magnitud especificada por arg(w). En particular, si multiplicamos a z por un número complejo de módulo 1,
entonces el efecto es simplemente de rotación.
Los siguientes resultados son consecuencia directa del Teorema de De Moivre:
Corolario 49 Si z = |z|(cos(α) + i sin(α)) es no nulo, entonces:
1. z −1 = 1
|z| (cos(−α) + i sin(−α)).
2. z = |z|(cos(−α) + i sin(−α)).
3. z n = |z|n (cos(nα) + i sin(nα)).
Por ejemplo, veamos por qué vale la primera propiedad enunciada en el corolario. Tenemos que verificar que
z −1 = 1
|z| (cos(−α) + i sin(−α)). Si llamamos w = 1
|z| (cos(−α) + i sin(−α)) entonces, por el Teorema de De
Moivre:
1
zw = |z| (cos(α − α) + i sin(α − α)) = 1(cos(0) + i sin(0)) = 1
|z|
Esto demuestra que z −1 = w.
Experimento 46 Demuestren las otras dos propiedades enunciadas en el corolario.
7.4.3 La forma exponencial
Aun existe otra forma de representar un número complejo. Esencialmente, es equivalente a la forma polar, pero
tiene la ventaja que es más “cómoda” para su notación.
Definición 76 Para un número real x, definimos eix = cos(x) + i sin(x). Usando esta notación, si z es un
número complejo no nulo con forma polar z = |z|(cos(α) + i sin(α)), tenemos que z = |z|eiα . A esta escritura
la llamaremos forma exponencial de z.
¿Qué ganamos con esta nueva escritura? En primer lugar, da una expresión más concisa que la forma polar para
un número complejo. En segundo lugar, nos permite reescribir el Teorema de De Moivre, y sus consecuencias, de
manera que es consistente con la propiedad de la exponencial en R de transformar sumas en productos (es decir, la
conocida identidad ex+y = ex ey para números reales x, y). Enunciamos a continuación la “versión exponencial” de
los resultados y propiedades que vimos para números complejos dados en forma polar. Si z = |z|eiα y w = |w|eiβ ,
entonces:
1. zw = |z|eiα |w|eiβ = |z||w|eiα+iβ = |z||w|ei(α+β) (este es el Teorema de De Moivre).
2. z −1 = 1 −iα
|z| e .
3. z = |z|e−iα .
4. z n = |z|n einα , para cualquier número natural n.
Definimos la forma polar de un número complejo (módulo y argumento) y estudiamos sus propiedades e interpretación
geométrica.
Enunciamos el teorema de De Moivre que establece cómo se obtiene la forma polar de un producto de números
complejos a partir de los módulos y argumentos de los números involucrados.
Introdujimos la forma exponencial de un número complejo.

Álgebra A. Resolución de ecuaciones generales. 211
7.5 Resolución de ecuaciones generales
Vamos ahora a estudiar cómo resolver ecuaciones con coeficientes complejos.
Las raíces n-ésimas de la unidad y de un número complejo cualquiera.

La resolución de algunas ecuaciones que involucran números complejos.

7.5.1 Raíces n-ésimas de la unidad
En el apartado 7.3 estudiamos las raíces cuadradas de un número complejo z, que son los w ∈ C tales que w2 = z,
y vimos que saber calcular raíces cuadradas nos permite resolver ecuaciones cuadráticas generales. En es apartado
vamos a aprender a resolver ecuaciones que tengan grado n mayor a dos y, para ello, en muchas ocasiones será
útil poder encontrar las raíces n-ésimas de un número z, es decir, los w ∈ C tales que wn = z. Esta es una
generalización de la noción de raíz cuadrada a cualquier número natural n. Lo definimos a continuación:
Definición 77 Si n es un número natural, una raíz n-ésima de z ∈ C es un número complejo tal que wn = z.
Observación 50 Así como todo número complejo no nulo tiene, exactamente, dos raíces cuadradas, veremos
que todo número complejo no nulo tiene, exactamente, n raíces n-ésimas distintas.
¿Cómo hacemos para encontrar las raíces n-ésimas de un número complejo z 6= 0 dado? Para empezar a buscar una
manera, pensemos por un momento, la situación “al revés”. Supongamos que sabemos de antemano que w1 y w2
son raíces n-ésimas de z. ¿Qué podemos decir de la relación entre ellas? Observemos que, como w1n = w2n = z
(por definición de “raíz n-ésima”), entonces:
n
w1
=1
w2
w0
Esto dice que, entonces, w1 es una raíz n-ésima del número 1. Además indica que podría haber alguna relación
entre las raíces en n-ésimas de un número complejo cualquiera y las raíces n-ésimas del número 1. Esto no debería
sorprendernos, ya que lo mismo sucede para las raíces cuadradas: si w es una raíz cuadrada de z entonces −w es la
otra; pero −w se obtiene al multiplicar a w por la “otra” raíz cuadrada de 1: −1.
Comencemos entonces, estudiando cuáles son raíces cuadradas del número 1; las llamaremos raíces n-ésimas de la
unidad.
Ejemplos 80
Las raíces cuadradas de la unidad son 1 y −1, como ya sabíamos.

√ √
Las raíces cúbicas de la unidad son 1, − 21 + 2
3
i y − 12 − 2
3
i.

Busquemos las raíces cuartas de la unidad, es decir, los ω ∈ C tales que ω 4 = 1. Lo primero que notamos es que la
norma de ω debe ser 1. Esto se debe a que |ω 4 | = |ω|4 , y el único número real positivo que elevado a la cuarta da
1 es el mismo 1 (de hecho, esto sucede para cualquier potencia n). Por otro lado, como ω = 0 no es una posible
raíz, podemos escribir ω = |ω|(cos(α) + i sin(α)) = cos(α) + i sin(α) (en forma polar). Aquí, hemos escrito
arg(ω) = α y ya hemos hecho el reemplazo |ω| = 1. Si reemplazamos en la ecuación ω 4 = 1 obtenemos, por De
Moivre:
cos(4α) + i sin(4α) = 1
Si escribimos al 1 en forma polar, esta igualdad queda:
cos(4α) + i sin(4α) = cos(0) + i sin(0)
Recordemos que dos números complejos escritos en forma polar son iguales sí, y solo sí, sus módulos coinciden
y sus argumentos coinciden. ¡Pero cuidado! ¡No sabemos si la expresión de ω 4 en esta última igualdad es su
forma polar! Por ejemplo, si α fuera π entonces 4α = 4π, el cual no es un argumento válido. Debemos, entonces,
averiguar cual es realmente el argumento de ω 4 para poder igualarlo a 0 (que es el argumento de 1). Notemos
que, en caso que 4α fuera mayor a 2π deberíamos ir restándole múltiplos de 2π hasta arribar a un número del
intervalo [0, 2π); o si fuera menor a 0, sumándole múltiplos de 2π. Por lo tanto, el argumento de ω 4 será de la forma
4α + k2π para cierto k ∈ Z, donde k representa el múltiplo mencionado, y será positivo o negativo dependiendo de
si hay que sumar o restar el 2π. Ahora que sabemos que arg(ω 4 ) es de esta forma (para cierto k), podemos igualarlo
al argumento de 1 y escribir 4α + k2π = 0. ¿Qué nos dice esta ecuación? Nos dice que el argumento α de ω que
estamos buscando debe ser tal que, al multiplicarlo por 4 y, luego, sumarle un múltiplo de 2π, el resultado debe ser
0. Pero, ¿qué múltiplo? No importa. Alguno. Mientras 4α + k2π sea igual a 0 para cierto k, el α correspondiente
será un argumento válido para el ω que estamos buscando. De hecho, veremos que existen varios múltiplos que
nos servirán, dando lugar a varios posibles argumentos α para ω. Esto no debería soreprendernos, ya que debemos
hallar cuatro raíces n-enésima de la unidad. recién mencionado, el múltiplo k no es importante, y solo nos interesará
hallar los α. Si despejamos la última ecuación que encontramos, obtenemos:
kπ
α=−
2
Esto dice que “α tiene la forma − kπ

2 para k ∈ Z”. Pero, ¿para cualquier k? ¡No! Debemos recordar que α = arg(ω),
por lo que α ∈ [0, 2π). Entonces, ¿para qué valores de k ∈ Z vale que − kπ
2 esté en dicho intervalo? Si vamos
π
haciendo la prueba, vemos que para k = 0 queda α = 0, para k = −1 queda α = 2, para k = −2 queda α = π
y para k = −3 queda α = 32 π. Para un k ∈ Z distinto de estos valores, los ángulos determinados caen fuera del
intervalo [0, 2π). Como dijimos antes, no nos importan cuáles son estos múltiplos k; solo nos importan cuáles son
los posibles argumentos α. Hay cuatro posibles argumentos para ω, por lo que encontramos las cuatro raíces cuartas
de la unidad:
ω0 = cos(0) + i sin(0) = 1
ω1 = cos π2 + i sin π2 = i

ω2 = cos (π) + i sin (π) = −1

ω3 = cos 32 π + i sin 32 π = −i

Es decir, las raíces cuartas de la unidad son 1, −1, i y −i.

Este razonamiento se puede repetir para calcular las raíces n-ésimas de la unidad para cualquier n ∈ N. Por un
lado, el módulo de toda raíz será 1. Por otro lado, como el argumento de ω n es nα, donde α = arg(ω), entonces
obtendremos la ecuación nα − k2π = 0, de donde concluimos que los posibles alpha son de la forma − k2π
n ,
para los k ∈ Z tales que − k2π

n ∈ [0, 2π). Es fácil chequear que dichos k son 0, −1, −2, −3, . . . , −(n − 1), por
2(n−1)π
lo que los posibles argumentos de ω son 0, 2π 4π 6π
n , n , n ,..., n ; es decir, los números de la forma 2tπ
n para
t = 0, . . . , n − 1. Concluimos que las raíces n-ésimas de la unidad son:
ω0 = cos (0) + i sin (0) = 1
ω1 = cos 2π 2π

n + i sin n
ω2 = cos 4π 4π

n + i sin n
..
.

2(n−1)π 2(n−1)π
ωn−1 = cos n + i sin n .
2tπ 2tπ

Notemos que los subíndices de los ωt los hemos elegido de manera que ωt = cos n + i sin n .
7.5.2 Raíces n-ésimas de números complejos
Sea z ∈ C no nulo. Supongamos que conocemos de antemano una raíz n-ésima de z. Llamémosla η. Por un lado, si
η̃
η̃ es otra raíz n-ésima de z, entonces vimos que η es raíz n-ésima de la unidad. Por otro lado, si ω es una raíz de la
unidad, entonces ωη es una raíz n-ésima de z, pues:
(ωη)n = |{z}
ωn ηn = z
|{z}
=1 =z
Por lo tanto, acabamos de ver que, fijada una raíz n-ésima de z particular, a cada raíz n-ésima de z da lugar a una
raíz n-ésima de la unidad y, a su vez, cada raíz n-ésima de la unidad da lugar a una raíz n-ésima de z. Por lo tanto,
para hallar todas las raíces n-ésimas de z, nos alcanza con encontrar una en particular y, luego, multiplicarla por
cada una de las raíces n-ésimas de la unidad. Ahora, si z = |z|(cos(α) + i sin(α)) es la forma polar de z, entonces
p
una posible raíz n-ésima de z es η0 = n |z|(cos( α α
n ) + i sin( n )) (pueden comprobarlo elevando esta expresión a la
n). Concluimos, entonces, que todas las raíces n-ésimas de z son:

p
η0 = η0 ω0 = n |z|(cos( α α
n ) + i sin( n ))
p
η1 = η0 ω1 = n |z|(cos( α+2π α+2π
n ) + i sin( n ))
p
η2 = η0 ω2 = n |z|(cos( α+4π α+4π
n ) + i sin( n ))
..
.
ηn−1 = η0 ωn−1 = n |z|(cos( α+2(n−1)π ) + i sin( α+2(n−1)π
p
n n )).
p
Notemos que los subíndices de los ηt los hemos elegido de manera que ηt = η0 ωt = n
|z|(cos( α+2tπ
n ) +
i sin( α+2tπ
n )).
Ejemplo 81 Calculemos las raíces sextas de 1 + i. Por lo visto recién, vamos a necesitar calcular las raíces sextas de
p
la unidad y una raíz sexta de 1 + i particular. Sabemos que una tal raíz es η0 = 6 |1 + i|(cos( α6 ) + i sin( α6 )), donde
√ √
α = arg(1 + i). Como |1 + i| = 2 y α = π4 , entonces η0 = 12 2(cos( 24 π π
) + i sin( 24 )). Por otro lado, las raíces
2tπ 2tπ

sextas de la unidad son los números complejos de la forma ωt = cos 6 + i sin 6 para t = 0, 1, 2, 3, 4, 5. Por
lo tanto, las raíces sextas de 1 + i son:
√ π π
η0 = η0 ω0 = 12 2(cos( 24 ) + i sin( 24 ))
√
12 9π 9π
η1 = η0 ω1 = 2(cos( 24 ) + i sin( 24 ))
√
η2 = η0 ω2 = 12
2(cos( 17π
24
) + i sin( 17π
24
))
√
12 25π 25π
η2 = η0 ω2 = 2(cos( 24 ) + i sin( 24 ))
√
η2 = η0 ω2 = 12
2(cos( 33π
24
) + i sin( 33π
24
))
√
12 41π 41π
η2 = η0 ω2 = 2(cos( 24 ) + i sin( 24 ))
Estos números en general tienen partes reales e imaginarias muy complicadas de escribir, por lo que los dejaremos
expresados en forma polar. Por ejemplo, η0 ≈ 1, 059460329406 + 0, 002420479749i
7.5.3 Resolución de ecuaciones generales
Vamos a aprender a resolver ecuaciones con coeficientes complejos que incorporan todo lo que aprendimos en la
unidad: raíces n-ésimas, módulos y conjugados. Mostramos las ideas principales de resolución en dos ejemplos.
Busquemos, primero, todos los números complejos z ∈ C que cumplan z 3 = (1 + i)(3 − 2i)3 . Un posible camino
es llevar a cabo las operaciones indicadas en el lado derecho de la igualdad (es decir, calcular el cubo de 3 − 2i y
multiplicarlo por 1 + i) y, luego, hallar las raíces cúbicas del resultado. Este camino es efectivamente factible, pero
muchas veces se pueden “reordenar” ciertas expresiones para hacer más fáciles los cálculos (o, directamente, nos
lo podemos ahorrar). En este caso, como hay una potencia cúbica a cada lado de la igualdad, pasar el (3 − 2i)3
dividiendo y reescribir:
3
z
=1+i
3 − 2i
z
Esto nos está diciendo que el número 3−2i es una raíz cúbica de 1 + i. Ya sabemos calcular raíces n-ésimas para
cualquier n, así que podemos hallar que las raíces cúbicas de 1 + i son:
√ π
π

η0 = 6 2 cos 12 + i sin 12
√
η1 = 6 2 cos 9π 9π

12 + i sin 12
√
η2 = 6 2 cos 17π 17π

12 + i sin 12
z
Por lo tanto, estas son las tres posibilidades para 3−2i . Si pasamos multiplicando el 3 − 2i hallamos los z buscados:
√ π
π

z0 = (3 − 2i) 6 2 cos 12 + i sin 12
√
z1 = (3 − 2i) 6 2 cos 9π 9π

12 + i sin 12
√
z2 = (3 − 2i) 6 2 cos 17π 17π

12 + i sin 12
Supongamos ahora que queremos hallar todos los z ∈ C que satisfacen z 4 + z 2 (2 − 2i)|z| = 0. Siempre es una
posibilidad plantear z en forma binomial, llevar a cabo las operaciones que indican la ecuación y tratar de despejar
la parte real e imaginaria de z. Pero, como vimos en ejemplos anteriores, en general, la forma binomial no es muy
cómoda a la hora de calcular potencias grandes de números. Elijamos, entonces, la forma polar. Recuerden que la
forma polar de un número complejo está definida sólo para números no nulos, por lo que, siempre que resolvamos
ecuaciones apelando a esta forma, debemos tratar por separado el caso z = 0. En este caso, es claro que z = 0 es
una solución de esta ecuación. Ahora que ya la registramos como posible solución, la dejamos de lado y estudiamos
si alguno de los números no nulos es también solución. Escribimos z = |z|(cos(α) + i sin(α)), con α = arg(z), y
reemplazamos en la ecuación para obtener:
|z|4 (cos(−4α) + i sin(−4α)) + |z|2 (cos(2α) + i sin(2α))(2 − 2i)|z| = 0

| {z } | {z }
z4 z2
¿Cómo seguimos? Vimos que, por el Teorema de De Moivre, es muy sencillo multiplicar las formas polares de
dos números complejos, pero no hay ningún resultado que nos diga cómo es la suma de este tipo de expresiones.
Sí sabemos cómo lidiar con una igualdad de formas polares: sus módulos y argumentos deben coincidir. Por este
motivo, lo mejor que podemos hacer, en este caso, es pasar uno de los términos de la suma al otro lado de la
igualdad, con el fin de “deshacernos” de la suma y llevar la ecuación a una expesión de igualdad entre formas
polares. Entonces, obtenemos:
|z|4 (cos(−4α) + i sin(−4α)) = |z|3 (cos(2α) + i sin(2α))(−2 + 2i)
Aquí hemos juntado |z|2 con el |z| del final de la expresión y hemos incluido el signo “−” que aparece por haber
pasado restando, dentro del paréntesis del número 2 − 2i (por este motivo aparece −2 + 2i en su lugar). Ahora,
6 0, pues descartamos el caso z = 0, entonces podemos cancelar el |z|3 a ambos lados de la igualdad (lo
como |z| =
√
que deja solo un |z| del lado izquierdo). Por otro lado, −2 + 2i tiene por forma polar a 8(cos( 3π 3π
4 ) + i sin( 4 )),
por lo cual, luego de hacer la multiplicación por (cos(2α) + i sin(2α)), la igualdad nos queda:
√

3π 3π
|z|(cos(−4α) + i sin(−4α)) = 8 cos 2α + + i sin 2 + α
4 4
Esta última, se asemeja a una igualdad de formas polares, pero ya sabemos que no lo es. Los ángulos involucrados
no verifican ser posibles argumentos (pues podrían no estar dentro del rango [0, 2π)). Como este problema lo
tenemos en ambos términos de la igualdad, sería muy complicado relacionar todos los posibles argumentos del
término de la derecha con los posibles argumentos de la izquierda. ¡En este caso, lo más conveniente es volver a
acudir al Teorema de De Moivre! ¿Cómo? ¡Pues podemos pasar dividiendo el término de la derecha! Recordemos
que, al dividir números escritos en forma polar, se resta el argumento del divisor al del dividendo. Por lo tanto,
nuestra ecuación equivale a:

|z| 3π 3π
√ cos −6α − + i sin −6α − =1
8 4 4
Ahora procedemos de manera análoga a cuando hallamos las raíces cuartas de la unidad (en la página 211). No
3π
sabemos si −6α − 4 es un argumento válido ya que no podemos garantizar que caiga en el intervalo [0, 2π). Por
lo tanto, debemos sumarle a esta expresión algún múltiplo entero de 2π para llevarlo a dicho intervalo. Como el
argumento de 1 es 0, entonces al igualar argumentos nos queda la igualdad:
3π
−6α − + k2π = 0
4
De aquí, despejamos que:

k2π − 43 π
α=
6
Como α representa el argumento del z, entonces debemos ver para qué valores de k ∈ Z esta última expresión
está en el intervalo [0, 2π). Esto podemos hacerlo a mano, y descubrir que los únicos k ∈ Z que verifican esto son
5
k = 1, 2, 3, 4, 5, 6. Por lo tanto, los posibles argumentos de z son α = 24 π, 13 21 29 37 45
24 π, 24 π, 24 π, 24 π, 24 π. Por otro lado,
|z| √
como el módulo de 1 es 1, entonces √ 8
= 1, de donde |z| = 8. Hemos hallado, entonces, que todas las soluciones
de la ecuación z 4 + z 2 (2 − 2i)|z| = 0 son:
z0 = 0 (que habíamos hallado al comienzo)
√ 5 5
z1 = 8(cos( 24 π) + i sin( 24 π))
√ 13
z1 = 8(cos( 24 π) + i sin( 13
24 π))
√ 21 21
z1 = 8(cos( 24 π) + i sin( 24 π))
√ 29
z1 = 8(cos( 24 π) + i sin( 29
24 π))
√ 37 37
z1 = 8(cos( 24 π) + i sin( 24 π))
√ 45
z1 = 8(cos( 24 π) + i sin( 45
24 π))
Estudiamos las raíces n-ésimas de la unidad y de un número complejo genérico.

Vimos como resolver algunas ecuaciones generales que involucran a los números complejos.

8. Polinomios
En este capítulo vamos a introducir uno de los principales objetos de estudios del Álgebra: los polinomios. Los
polinomios poseen una estructura algebraica muy rica que es similar a la teoría de números enteros (mejor
conocida como Teoría de números) y aparecen prácticamente en todas las ramas de la Matemática. En este curso,
estudiaremos los resultados más relevantes de esta teoría.
8.1 ¿Qué es un polinomio?

Los polinomios son expresiones que se construyen a partir de números y potencias de una variable x. Aquí los
trabajaremos desde una visión algebraica.
La definición de polinomio de una variable como objeto algebraico.

Las operaciones que pueden llevarse a cabo entre polinomios.
La evaluación de polinomios en números.

8.1.1 La visión algebraica de los polinomios
Los polinomios suelen ser considerados como un tipo especial de funciones reales. Si bien esta interpretación es
válida, los polinomios poseen una estructura muy regular, lo que permite realizar operaciones entre ellos y tratarlos
como objetos algebraicos. Los polinomios constan de una única variable x, que es elevada a distintas potencias, cada
una de estas potencias es multiplicada por una constante (número) y, finalmente, todos estos términos son sumados
entre sí. Si lo relacionamos con la noción de combinación lineal que estudiamos en el capítulo 3, se lo puede
pensar como una combinación lineal de potencias de x. Veremos más adelante que esta interpretación es, de hecho,
bastante acertada. La importancia de los polinomios desde el punto de vista algebraico, es que admiten operaciones
conocidas, como la suma, multiplicación y división, y, en cada caso, el resultado vuelve a ser un polinomio. En este
sentido, el conjunto de estas funciones no es simplemente un conjunto, sino que es lo que se conoce como un anillo
(un conjunto con una estructura algebraica muy rica).

Definición 78 Un polinomio P (x) en una indeterminada (o variable) x con coeficientes en C es una expresión
de la forma:
P (x) = an xn + an−1 xn−1 + ... + a2 x2 + a1 x + a0 ,
donde los a0 , . . . , an son números complejos. Si todos los ai son números reales, decimos que P (x) es un
polinomio con coeficientes en R y si todos los ai son racionales, que P (x) es un polinomio con coeficientes en
Q. El índice i más grande tal que ai 6= 0 se llama el grado del polinomio y se nota gr(P ).
Las constantes a0 , a1 , ..., an se llaman coeficientes del polinomio. Al coeficiente a0 se le da el nombre de término
independiente y al coeficiente an , el de coeficiente principal. Cuando el coeficiente principal es 1, al polinomio se le
llama mónico. El conjunto de polinomios con coeficientes complejos se nota C[x], el de polinomios con coeficientes
reales, R[x], y el de polinomios con coeficientes racionales, Q[x]. Por supuesto, Q[x] ⊂ R[x] ⊂ C[x].
Importante En general, vamos a usar K para representar alguno de los conjuntos numéricos Q, R o C, de
forma que K[x] representará el conjunto de polinomios con coeficientes en K. De esta manera, vamos a poder
enunciar resultados de manera más sencilla (utilizando el K), en lugar de tener que escribir un enunciado para
cada conjunto numérico Q, R o C.
Ejemplo 82
P (x) = 1 es un polinomio donde el único coeficiente no nulo es el término independiente (no aparece explícita-
mente la variable x). En general, un polinomio P (x) = λ ∈ C, con λ 6= 0, se llama polinomio constante. El
grado de un polinomio constante es 0.
Observemos que, en el caso de los polinomios constantes, hemos descartado la posibilidad que la constante sea el
0. El polinomio P (x) = 0 es un polinomio especial que se llama polinomio nulo y no tiene grado. Entenderemos
esta diferenciación con los polinomios constantes cuando veamos el producto de polinomios.
Q(x) = 2x − 5 es un polinomio de grado 1. Su coeficiente principal es 2 y su término independiente es −5. A
los polinomios de grado 1 se los llama polinomios lineales.
R(x) = − 25 x2 − 3x + 7 es un polinomio de grado 2. Su coeficiente principal es − 25 y su término independiente
es 7. A los polinomios de grado 2 se los llama polinomios cuadráticos. Tengamos en cuenta que las ecuaciones
cuadráticas que estuvimos resolviendo en el apartado 3 del capítulo anterior, son precisamente polinomios
cuadráticos en C[x].
N (x) = x4 +1 y M (x) = 3x4 −2x3 +5x2 −x son polinomios de grado 4. El primero es mónico (su coeficiente
principal 1); el segundo, no. Consideremos que el término independiente de M (x) es 0.
S(x) = x3 − 3ix2 + (1 − 2i)x + 7i es un polinomio con coeficientes complejos. A diferencia de los ejemplos
anteriores, este polinomio no está en R[x].

Observación 51 Así como consideramos R ⊂ C mediante la identificación R = {a + bi : b = 0}, también
podemos considerar los números complejos como contenidos en los polinomios con coeficientes complejos; es
decir, C ⊂ C[x]. La identificación, por supuesto, es interpretar a C como el conjunto de polinomios constantes;
es decir, C = {an xn + · · · + a1 x + a0 ∈ C[x] : an = an−1 = · · · = a2 = a1 = 0}. De la misma manera,
podemos considerar R ⊂ R[x] y Q ⊂ Q[x].
Álgebra A. ¿Qué es un polinomio?. 219
8.1.2 Operaciones con polinomios
Comentamos en el comienzo del capítulo que los polinomios se pueden sumar, multiplicar e, inclusive, dividir.
Primero veamos suma y resta de polinomios. Para sumar (o restar) dos polinomios, se agrupan los términos
de igual grado y se suman (o restan) sus coeficientes. Por ejemplo, si P (x) = 2x4 − 5x3 + x − 7 y Q(x) =
6x4 + x3 − 2x2 − 6x + 9, el polinomio P (x) + Q(x) se calcula:
P (x) + Q(x) = (2x4 − 5x3 + x − 7) + (6x4 + x3 − 2x2 − 6x + 9)

= (2 + 6)x4 + (−5 + 1)x3 − 2x2 + (1 − 6)x + (−7 + 9)
= 8x4 − 4x3 − 2x2 − 5x + 2
Por otro lado, el polinomio P (x) − Q(x) se calcula:
P (x) − Q(x) = (2x4 − 5x3 + x − 7) − (6x4 + x3 − 2x2 − 6x + 9)

P (x) + Q(x) = (2 − 6)x4 + (−5 − 1)x3 + (0 − (−2))x2 + (1 − (−6))x + (−7 − 9)
= −4x4 − 6x3 + 2x2 + 7x − 16
Si P y Q tienen sus coeficientes en K, entonces P + Q y P − Q también.
Experimento 47 Si gr(P ) = n y gr(Q) = m, observen cuál es el grado de P + Q.
Prosigamos con Multiplicación de polinomios. Para multiplicar dos polinomios, basta aplicar la propiedad distributiva
y las leyes de la multiplicación y de las potencias. Es decir, se multiplica cada término de uno de los polinomios por
cada término del otro y se suman todas estas multiplicaciones. Por ejemplo, para P (x) = 2x4 − 5x3 + x − 7 y
Q(x) = 2x2 − x + 1, el producto P (x)Q(x) se calcula:
P (x)Q(x) = (2x4 − 5x3 + x − 7)(2x2 − x + 1)

= (2x4 − 5x3 + x − 7)2x2 + (2x4 − 5x3 + x − 7)(−x) + (2x4 − 5x3 + x − 7)
= 4x6 − 10x5 + 2x3 − 14x2 − 2x5 + 5x4 − x2 + 7x + 2x4 − 5x3 + x − 7
= 4x6 + (−10x5 − 2x5 ) + (5x4 + 2x4 ) + (2x3 − 5x3 ) + (−14x2 − x2 ) + (7x + x) + (−7)
= 4x6 − 12x5 + 7x4 − 3x3 − 15x2 + 8x − 7
Si P y Q tienen sus coeficientes en K, entonces P Q también.
Experimento 48 Si gr(P ) = n y gr(Q) = m, observen cuál es el grado de P Q (noten que, como P y Q
tienen grado, entonces ninguno es el polinomio nulo). Este experimento explica, en parte, la diferenciación que
hacemos entre los polinomios constantes (de grado 0) y el polinomio nulo (que no tiene grado).
Igualdad de polinomios. ¿Cuándo dos polinomios son iguales? Cuando tienen el mismo grado y sus coeficientes
coinciden término a término. Es decir, decimos que el polinomio P (x) = an xn + · · · + a1 x + a0 es igual al
polinomio Q(x) = bn xn +· · ·+b1 x+b0 si ai = bi para todo i entre 0 y n. Por ejemplo, los polinomios x2 +3x−2 y
x3 +x−1 no son iguales porque tienen distinto grado. También, los polinomios x3 −4x2 −x+9 y x3 −4x2 +3x+9
son distintos, pues el coeficiente que acompaña a x en el primero es −1, mientras que en el segundo es 3.
Una característica a tener en cuenta es lo que se denomina evaluación de polinomios. Un hecho importante sobre los
polinomios es que se los puede evaluar en números (racionales, reales, complejos). Esto da lugar a una función (que
es, seguramente, la manera más común de considerarlos). Por supuesto, la evaluación de un polinomio P (x) ∈ K[x]
en un número b ∈ C consiste simplemente en reemplazar la indeterminada x por el número b en la expresión del
polinomio y llevar a cabo la cuenta indicada por el polinomio. Por lo tanto, evaluar un polinomio da como resultado
un número. El polinomio P (x) evaluado en un número b se nota P (b). Es decir, si P (x) = an xn + · · · + a1 x + a0

entonces:
P (b) = an bn + · · · + a1 b + a0 ∈ C.
Por ejemplo, si P (x) = x3 − 4x2 + 3x + 9, entonces P (−2) = (−2)3 − 4(−2)2 + 3(−2) + 9 = −21.
Un monomio es un tipo especial de polinomio que solo tiene un coeficiente que no es cero. Dicho de otra manera,
un monomio es un polinomio de la forma P (x) = axn con a 6= 0. La importancia de los monomios es que todo
polinomio es una suma de monomios.
P (x) = an xn + an−1 xn−1 +... + a2 x2 + a1 x + a0

| {z } | {z } |{z} |{z} |{z}
monomio monomio monomio monomio monomio
De hecho, la expresión polinomio expresa que es un objeto que consta de varios monomios. Cabe aclarar que
los polinomios constantes se consideran monomios de grado 0 (pues a = ax0 ). Veremos, más adelante, que los
monomios son muy útiles a la hora de llevar a cabo muchas operaciones. Esto no debería sorprendernos, ya que
sumando monomios podemos “generar” todos los polinomios.
La palabra “generar” utilizada en la última oración no es casualidad. Sucede que C[x] también es un espacio
vectorial (donde la suma es la suma de polinomios y el producto por escalar es el producto de un polinomio
por otro polinomio constante). Un sistema de generadores natural para el espacio de todos los polinomios
consta de los monomios de todas los grados: {1, x, x2 , x3 , . . . , xn , . . .}. Noten que, pensado de esta manera,
los polinomios son precisamente las combinaciones lineales de los monomios.
Definimos a los polinomios como objetos algebraicos y las operaciones entre polinomios (suma y multiplicación).
Vimos que estas operaciones cumplen propiedades idénticas a las operaciones con números reales o complejos.
Determinamos cuándo dos polinomios son iguales y desarrollamos la idea de evaluar un polinomio en un número.
Definimos los monomios como los polinomios de la forma axn .

8.2 División de polinomios

Vamos ahora a aprender cómo llevar a cabo la división entre dos polinomios y a estudiar algunos resultados
fundamentales de la Teoría de divisibilidad.
El algoritmo de división.
Teorema del resto.

8.2.1 ¿A qué se le llama dividir dos polinomios?
La división de polinomios se define de manera análoga a la división entre números enteros. ¿Qué hacíamos para
dividir dos números enteros? Pues dividir a ∈ Z por b ∈ Z consistía en encontrar enteros q, r ∈ Z tales que
a = qb + r para 0 ≤ r < b. El número q se llamaba el cociente de la división y el número r el resto. También, el
número a era el dividendo y el número b el divisor. El propósito de dividir el número a por b es ver cuántas veces
“entra” en a el número b (dado por el cociente q) y, si no entra “justo”, cuánto “sobra” antes de poder completar
a (el resto r). El hecho que pidamos que el resto sea mayor a cero y menor que el divisor hace que haya únicos
Álgebra A. División de polinomios. 221
enteros q, r ∈ Z que verifiquen a = qb + r. Por ejemplo, la división de 572 por 12 tiene por cociente q = 47 y
por resto r = 8. En efecto, 572 = 12,47 + 8 y el resto 8 es mayor a cero y menor que 12. Conocemos ya desde la
escuela primaria una manera de llevar a cabo a mano la división de dos números enteros, ¡y la manera de hacerlo
con polinomios es prácticamente igual! De hecho, veremos que en cierta forma es mucho más sencillo.
Primero, veamos a qué nos referimos específicamente con “división de dos polinomios”. Consideremos el siguiente
teorema:
Teorema 52 Dados polinomios P, Q ∈ K[x], con Q 6= 0, existen únicos polinomios C y R en K[x] tales que:
P = QC + R y
o bien, R = 0 (el polinomio nulo) o bien, gr(R) < gr(Q).
Notemos que el Teorema 52 es un resultado análogo a lo que vale en el caso de los números enteros: el cociente de
la división de P por Q nos dice cuantas veces “entra” el polinomio Q dentro de P y, si no entra “justo”, el resto nos
indica “cuánto le sobra” para entrar justo. Observemos que, también, en lugar de pedir que el resto sea un número
mayor o igual a cero y menor estricto que el divisor, pedimos que el resto sea un polinomio de grado mayor o igual
que cero o menor o igual que el grado del divisor. Esto es porque no hay un orden natural entre los polinomios, pero
sí hay un orden natural entre los grados de los polinomios. A lo largo del texto hablaremos de polinomios “más
pequeños” o “más grandes”, estas frases deben entenderse como una definición a partir del hecho de que dados dos
polinomios, no iguales, el grado de uno es mayor que el del otro. Entonces al mayor se lo denomina “más grande”
mientras que al de menor grado “más pequeño”. El estudiante debe tener en cuenta, mientras lee, que debe llegar a
familiarizarse con estas formas de expresión típicas. También, al igual que el caso de los enteros, el polinomio P (x)
es llamado el dividendo, el polinomio Q(x), el divisor, el polinomio C(x), el cociente y el polinomio R(x), el resto.
Por lo tanto, cuando nos referimos a “hacer la división entre dos polinomios” lo que vamos a querer hallar es el
cociente y el resto de dicha división.
Observación 53 Observemos que si P, Q tienen coeficientes en K entonces su cociente y resto también.
8.2.2 El algoritmo de división
La forma para llevar a cabo el cálculo de la división entre dos polinomios se conoce como Algoritmo de división.
Veamos con un ejemplo cómo se procede. Supongamos que queremos dividir el polinomio P (x) = 3x5 − 2x3 +
7x2 − 2x por el polinomio Q(x) = x3 + 3x2 − 1. Al igual que para números enteros, los ubicamos gráficamente
así:
3x5 − 2x3 + 7x2 − 2x |x3 + 3x2 − 1
Vamos a empezar a armar el cociente calculando los monomios que lo constituyen uno a la vez (de hecho, del más
grande al más chico). Lo que debemos hacer es considerar el monomio de potencia más grande del divisor Q (en
este caso es x3 ), el monomio más grande del polinomio que estamos dividiendo (3x5 ) y preguntarnos: ¿por qué otro
monomio debo multiplicar a x3 para “llegar” a 3x5 ? La respuesta es, por supuesto, 3x2 . Este es, entonces, el primer
monomio de cociente.
3x5 − 2x3 + 7x2 − 2x |x3 + 3x2 − 1

3x2
Y ahora hacemos lo mismo que en la división de enteros: multiplicamos el divisor por el monomio que acabamos de
agregar al cociente y ponemos el resultado debajo del dividendo:
3x5 − 2x3 + 7x2 − 2x |x3 + 3x2 − 1

3x5 + 9x4 − 3x2 3x2
Luego, restamos el dividendo por este nuevo polinomio que ubicamos bajo él:
3x5 − 2x3 + 7x2 − 2x |x3 + 3x2 − 1

3x5 + 9x4 − 3x2 3x2
−9x4 − 2x3 + 10x2 − 2x
Es importante tener en cuenta que la idea central en este último punto es la de realizar la resta de dos polinomios,
con lo cual al principio de su aprendizaje tal vez sea útil que, como cálculo auxiliar, escriba explícitamente dicha
operación,
(3x5 − 2x3 + 7x2 − 2x) − (3x5 + 9x4 − 3x2 ) = −9x4 − 2x3 + 10x2 − 2x
¿Qué hemos logrado con este procedimiento? ¡Pues ahora nos quedó un polinomio de menor grado en el sector
donde estaba el dividendo (en este caso, de grado 4)! Esto nos indica que este procedimiento va a ir disminuyendo
los grados de los polinomios bajo el dividendo y, por lo tanto, eventualmente arribaremos a un polinomio de grado
menor al divisor (y habremos terminado el cálculo, pues esta es la característica que buscamos en el resto).
Veamos cómo seguimos. En el lugar del dividendo, nos quedó el polinomio −9x4 −2x3 +10x2 −2x, cuyo monomio
principal es −9x4 . Nos preguntamos nuevamente, ¿por qué monomio tenemos que multiplicar a x3 para llegar a
−9x4 ? La respuesta es −9x. Entonces, sumamos este monomio al cociente:
3x5 − 2x3 + 7x2 − 2x |x3 + 3x2 − 1

3x5 + 9x4 − 3x2 3x2 − 9x
−9x4 − 2x3 + 10x2 − 2x
Hacemos a continuación la multiplicación de este monomio (y solo este monomio) por Q y lo ubicamos debajo del
último polinomio que calculamos:
3x5 − 2x3 + 7x2 − 2x |x3 + 3x2 − 1

3x5 + 9x4 − 3x2 3x2 − 9x
−9x4 − 2x3 + 10x2 − 2x
−9x4 − 27x3 + 9x
y restamos estos últimos dos polinomios:
3x5 − 2x3 + 7x2 − 2x |x3 + 3x2 − 1

3x5 + 9x4 − 3x2 3x2 − 9x
−9x4 − 2x3 + 10x2 − 2x
−9x4 − 27x3 + 9x
25x3 + 10x2 − 11x
Como este último polinomio obtenido aún no tiene grado menor al grado del divisor, continuamos. ¿Por qué
monomio tenemos que multiplicar x3 para “deshacernos” del 25x3 ? Por 25 (recuerden que las constantes también
Álgebra A. División de polinomios. 223
son monomios). Siguiendo el mismo procedimiento que antes, tenemos:
3x5 − 2x3 + 7x2 − 2x |x3 + 3x2 − 1

3x5 + 9x4 − 3x2 3x2 − 9x + 25
−9x4 − 2x3 + 10x2 − 2x
−9x4 − 27x3 + 9x
25x3 + 10x2 − 11x
25x3 + 75x2 + 25
−65x2 − 11x + 25
Y ahora sí, como en el lugar del dividendo arribamos a un polinomio de grado menor a 3, terminamos con la
división. El resultado obtenido es que el cociente de la división entre P y Q es C(x) = 3x2 − 9x + 25 y el resto
R(x) = −65x2 − 11x + 25. Pueden corroborar que:
3x5 − 2x3 + 7x2 − 2x = (3x2 − 9x + 25)(x3 + 3x2 − 1) + (−65x2 − 11x + 25)
¿Qué sucede si el grado del dividendo P es menor que el grado del divisor Q? ¡En este caso la división es obvia!
El cociente es 0 y el resto es P (de forma que P = 0.Q + P ). Notemos que el cociente y el resto, así definidos,
cumplen las condiciones del Teorema 52. Además, la interpretación de este hecho es natural: si gr(Q) > gr(P ),
entonces Q no puede “entrar” siquiera una vez dentro de P , por lo que el cociente es 0. Les dejamos para pensar en
el siguiente experimento otra situación especial del algoritmo de división.
Experimento 49 ¿Cómo es el cociente y el resto de la división entre P y Q si ambos polinomios tienen el
mismo grado?
Veamos otro ejemplo del algoritmo de división. Supongamos que queremos hacer la división entre P (x) =
−x3 + 12x2 − 47x + 60 por Q(x) = x − 4. Escribimos todo junto el procedimiento.
−x3 + 12x2 − 47x + 60 |x − 4

3 2
−x + 4x −x2 + 8x − 15
8x2 − 47x + 60
8x2 − 32x
−15x + 60
15x − 60
0
En este caso, el resto es el polinomio 0, lo que nos dice que P (x) = Q(x)(−x2 + 8x − 15). Esto es análogo al caso
cuando obteníamos resto 0 en la división de número enteros. Por ejemplo, el resto de dividir 455 por 13 es 0, lo
que quiere decir que 455 es múltiplo de 13 (o que 13 divide a 455). De la misma manera, se dice que un polinomio
Q(x) divide a P (x), o que el polinomio P (x) es divisible por el polinomio Q(x), si el resto de la división entre
P (x) y Q(x) es el polinomio nulo R(x) = 0. Veremos al final de la unidad cómo descomponer a los polinomios
como producto de sus divisores más pequeños (llamados factores).
8.2.3 El Teorema del resto
En algunas situaciones, existe una manera de conocer el polinomio resto con antelación a efectuar la división entre
dos polinomios. Y esto resulta útil dado que se puede conocer si la división será exacta (es decir, con resto 0) sin la
necesidad de efectuarla. El Teorema del resto permite averiguar el valor del resto de la división entre un polinomio
P (x) por otro polinomio de la forma Q(x) = x − a, con a ∈ C, sin necesidad de hacer la división.
Teorema 54 — Teorema del resto. El resto de dividir el polinomio P (x) ∈ K[x] por el polinomio x − a, con
a ∈ C, es igual a P (a).
Observemos que, como estamos dividiendo por un polinomio de grado 1, entonces el resto de la división entre
P (x) y x − a será el polinomio nulo o un polinomio constante. Lo que dice el teorema es que esta constante será
precisamente el número P (a). La demostración de este hecho no es complicada: si C(x) y R(x) son el cociente y el
resto, respectivamente, de la división entre P (x) y x−a, entonces P (x) = (x−a)C(x)+R(x). Si ahora evaluamos
al polinomio P (x) en x = a, resulta: P (a) = (a − a)C(a) + R(a) = R(a). Como R(x) es un polinomio nulo o
un polinomio constante, entonces toma el mismo valor cualquier número en lo que lo evaluemos. En particular,
R(x) = R(a), que es lo que queríamos demostrar.
Ejemplo 83 Calculemos el resto de la división de P (x) = x3 − 5x2 + 6x por el polinomio Q(x) = x − 3.
Como el divisor es de la forma x − a, entonces podemos usar el Teorema del resto y hallar que el resto es P (3) =
33 − 5(32 ) + 6,3 = 27 − 45 + 18 = −18 + 18 = 0.
Estudiamos cómo dividir polinomios (de manera análoga a la división de números enteros).
Introducimos el concepto de que un polinomio P sea divisible por otro Q (que el resto de la división de P por Q sea
el polinomio nulo).
Enunciamos y demostramos el Teorema del resto, que nos dice cuál es el resto de la división de un polinomio P por
un polinomio de la forma x − a.

8.3 Raíces
Estudiemos, ahora, cómo hallar los ceros de los polinomios; esto es, los números que, al evaluarlos en el polinomio,
lo anulan.
La definición de raíz de un polinomio.

La relación entre las raíces del polinomio P y los polinomios que dividen a P .
Cómo buscar raíces de polinomios.
El Teorema de Gauss.
La multiplicidad de una raíz.
El Teorema fundamental del Álgebra.

8.3.1 ¿Qué son las raíces de un polinomio?
Ya sabemos que las ecuaciones cuadráticas que resolvimos en el capítulo anterior son, en realidad, ecuaciones
polinomiales (determinadas por un polinomio de grado 2). Probablemente ya estén al tanto de que los ceros de una
ecuación cuadrática se llaman también raíces de la ecuación. Este concepto de raíz es común a todos los polinomios
y, ahora, vamos a definirlo de manera general.
Álgebra A. Raíces. 225
Definición 79 Sea P (x) ∈ K[x]. Un número a ∈ C se dice una raíz de P si P (a) = 0.
Es decir, las raíces son los números donde el polinomio se anula. Notemos que, según el Teorema del resto, el resto
de la división entre P (x) y x − a se obtiene como P (a). En particular, si el resto de esta división es 0 ∈ C[x],
entonces P (a) = 0. Esto quiere decir que x = a es raíz del polinomio P (x). Por otro lado, si x = a es raíz de
P (x), entonces P (a) = 0 (por definición de raíz). El Teorema del resto nos dice que el resto de dividir P (x) por
x − a es, entonces, P (a) = 0, por lo que concluimos que x − a divide a P (x). Hemos hallado, así, que vale la
siguiente propiedad:
Importante Un número a ∈ C es raíz del polinomio P (x) si, y solo si, x − a divide a P (x).
Experimento 50 Supongan que el polinomio Q(x) divide al polinomio P (x). ¿Qué relación hay entre las
raíces de Q(x) y las de P (x)?
Supongamos ahora que a y b son raíces distintas del polinomio P . Esto, en particular, nos dice que tanto x − a
como x − b dividen a P . ¿Es cierto que el polinomio cuadrático (x − a)(x − b) = x2 − (a + b)x + ab también
divide a P ? ¡Sí! Como x − a divide a P (x) entonces P (x) = (x − a)Q(x) para cierto polinomio Q(x). Ahora,
como b es raíz de P , entonces P (b) = 0. Pero P (b) = (b − a)Q(b). Como estamos suponiendo que b 6= a, entonces
b − a 6= 0, por lo que, para que (b − a)Q(b) = 0, debe ser Q(b) = 0. Esto nos dice que b es raíz de Q(b) y, por
lo tanto, (x − b) divide a Q. Entonces, podemos escribir Q(x) = (x − b)R(x) para cierto polinomio R. De esta
manera, hallamos que
P (x) = (x − a)Q(x) = (x − a)(x − b)R(x) = (x2 − (a + b)x + ab)R(x).
Observemos que, si seguimos repitiendo el razonamiento para R(x), podemos probar que, si tenemos varias raíces
distintas λ1 , . . . , λt de P (x), entonces el producto (x−λ1 )(x−λ2 ) . . . (x−λt ) divide a P (x). Lo dejamos asentado
en el siguiente lema.
Lema 55 Si varios polinomios de la forma x − λ1 , . . . , x − λt dividen a P y todos los λi son distintos entre sí,
entonces el producto (x − λ1 ) . . . (x − λt ) también divide a P .
8.3.2 ¿Cómo encontrar raíces de un polinomio?
Encontrar raíces de polinomios es un problema central del Álgebra y el Análisis Matemático. Ahora bien, ¿cómo
encontramos las raíces? La primera observación que podemos hacer es que ya sabemos cómo encontrar las raíces
de polinomios lineales y cuadráticos. En efecto, para un polinomio lineal a1 x + a0 (con a1 6= 0) solo debemos
despejar x de la ecuación a1 x + a0 = 0. O sea, la única raíz es x = − aa01 . Por otro lado, a un polinomio cuadrático
a2 x2 + a1 x + a0 (con a2 6= 0), también sabemos calcularle las raíces: utilizamos la fórmula resolvente:
p
−a1 + a21 − 4a2 a0
x1 , x2 =
2a2
para la cual ya vimos, en el capítulo anterior, que siempre tiene dos soluciones en los números complejos. Para
polinomios de grados mayores, ya no tenemos procedimientos o fórmulas directas para hallar las raíces. La estrategia
general es ir hallando progresivamente las raíces de un polinomio P (x) de la siguiente manera:
Conseguir (de alguna manera) una raíz a ∈ C de P (x).
Como sabemos que x − a divide a P (x), hallar el cociente C(x) de dicha división, de manera que P (x) =
(x − a)C(x). Recuerden que C(x) tiene grado menor a P (x).
Si C(x) tiene grado 1 o 2, calcular, usando las fórmulas conocidas, las raíces de C(x) (que también son raíces
de P (x)). Si el grado de C(x) es mayor a 2, repetir el procedimiento para C(x).
Notemos que esta estrategia pide conseguir una raíz de alguna manera para comenzar. Algunas veces, las raíces se
pueden identificar rápidamente (por ejemplo, si el polinomio no tiene término independiente entonces x = 0 es raíz)
y otras veces son datos del problema. El siguiente teorema, debido a Gauss, nos permite anticipar las posibles raíces
racionales de un polinomio con coeficientes enteros.
Teorema 56 — Teorema de Gauss. Sea P (x) = an xn + · · · + a1 x + a0 con an , . . . , a1 , a0 ∈ Z. Si el número
p p
racional q es raíz del polinomio (q 6= 0), siendo q una fracción irreducible, entonces p divide a a0 y q divide a an .
En particular, si P (x) es un polinomio mónico (el coeficiente principal an = 1), las posibles raíces racionales
del polinomio son los divisores del término independiente a0 .
Es importante remarcar que este teorema no nos dice que un polinomio con coeficientes enteros tiene raíces
racionales. Lo que dice es que, de existir raíces racionales, estas deben forzosamente ser de una manera determinada.
Es decir, “si tiene, son de esta forma”. Es por esta razón para determinar si tiene raíces racionales, debemos probar
con los números racionales que tienen la forma anticipada por el teorema. Pero podría ser que ninguno sea raíz, y
por lo tanto, el polinomio en cuestión no tendría raíces racionales (solo reales y complejas).
Ejemplos 84
Consideremos el polinomio P (x) = x3 − 3x2 − 2x + 6. Como tiene coeficientes enteros, el Teorema de Gauss
nos indica que, de tener una raíz racional pq , debe suceder que p debe dividir al término independiente 6 y q debe
dividir al coeficiente principal 1. En este caso, las únicas posibilidades para q son 1 y −1. Por otro lado, las
posibilidades para p son los posibles divisores de 6: 1, −1, 2, −2, 3, −3, 6, −6. Probando con todos encontramos
que P (3) = 0. Hemos hallado, entonces, una raíz racional (de hecho, entera) de P (x).
Consideremos ahora el polinomio Q(x) = 2x4 − 10x2 + 12. Nuevamente, como tiene coeficientes enteros,
podemos utilizar el Teorema de Gauss para ver si tiene alguna raíz racional pq . En este caso, p debe dividir a 12 y
q a 2. Las opciones para q son 1, −1, 2, −2 y las opciones para p son 1, −1, 2, −2, 3, −3, 4, −4, 6, −6, 12, −12.
p
Por lo tanto, todas las posibles opciones para q
se obtienen eligiendo un numerador p entre las doce opciones
disponibles y un denominador q entre las cuatro opciones disponibles. Esto da un total de 12,4 = 48 posibles
opciones a considerar. Sin embargo, hay muchas combinaciones que dan como resultado el mismo número
1 −1 4
racional. Por ejemplo, −1
y 1
; o 2
y 21 . Al mirar con detenimiento se puede advertir que las opciones que hay
que chequear son las siguientes:
p 1 1 3 3
= 1, −1, 2, −2, 3, −3, 4, −4, 6, −6, 12, −12, , − , , − .
q 2 2 2 2
Al verificar todas estas posibilidades, no se encuentra ningún número que anule al polinomio. Por lo tanto, P (x)
no tiene raíces racionales.

√
Un dato interesante sobre el Teorema de Gauss es que proporciona una demostración del hecho que 2 no es
√
un número racional. En efecto, consideremos el polinomio P (x) = x2 − 2. Claramente, 2 es raíz de P (x).
√
Pero 2 no puede ser racional pues el Teorema de Gauss nos dice que, si un racional pq es raíz de P , entonces
p divide a 2 y q divide a 1. Como las únicas posibilidades para q son 1 o −1 entonces una raíz racional pq es en
√
realidad un número entero. Por lo tanto, si 2 fuera racional debería ser un número entero (que sabemos que
no es).
Álgebra A. Raíces. 227
Vamos a ver ahora qué es la multiplicidad de una raíz. Consideremos el polinomio P (x) = x2 − 2x + 1. El Teorema
de Gauss nos dice que las únicas posibles raíces racionales de P (x) son 1 o −1. Es fácil ver que x = 1 es una raíz
P (x). Por lo visto en el apartado 8.3.1, sabemos que x − 1 divide a P (x). Si ahora hacemos la división entre P (x)
y x − 1, hallamos que el cociente de la división es también x − 1. Es decir, se tiene que:
P (x) = (x − 1)(x − 1) = (x − 1)2 .
El hecho de que P (x) “sea divisible” dos veces de x − 1 se interpreta diciendo que x = 1 es raíz doble de P (x) o
que es una raíz de multiplicidad 2. Definimos esta noción de manera general a continuación:
Definición 80 Sea P (x) ∈ K[x]. Un número a ∈ C se dice una raíz de multiplicidad k de P (x) si el polinomio
(x − a)k divide a P (x), pero el polinomio (x − a)k+1 , no. Dicho de otra manera, existe un polinomio C(x) tal
que C(a) 6= 0 y P (x) = (x − a)k C(x). Si k = 1, entonces a recibe el nombre de raíz simple y si k > 1, raíz
múltiple.
Ejemplo 85 El polinomio P (x) = x5 + 7x4 + 18x3 + 20x2 + 8x tiene 5 raíces: la raíz x = −2 con multiplicidad
3, la raíz x = −1 con multiplicidad 1 y la raíz x = 0, también con multiplicidad 1. Pueden verificar que P (x) =
(x + 2)3 (x + 1)x.
Si conocen la noción de derivada de una función, podrán advertir que la derivada de un polinomio (visto
como función) es nuevamente un polinomio (de un grado menos). Una definición alternativa del concepto
de multiplicidad es la siguiente: una raíz de P (x) tiene multiplicidad k si también es raíz de los primeros k
polinomios derivados P 0 (x), P 00 (x), . . . , P (k) (x) de P (x), pero no de la derivada (k + 1)-ésima de P (x).
En este punto queremos poder responder la pregunta ¿Cuántas raíces tiene un polinomio? El Teorema de Gauss nos
ayuda a encontrar raíces racionales. En algunos casos las hallamos y en otros, no. Si queremos buscar todas las
raíces de un polinomio, ¿cómo sabemos cuándo parar? ¿Cuántas raíces puede tener un polinomio? ¿Puede no tener
ninguna? No es difícil ver que un polinomio de grado n no puede anularse en más de n números. Se los dejamos
para pensar en el siguiente experimento:
Experimento 51 Sea P (x) ∈ K[x] de grado n. Vamos a ver que P (x) no puede tener más de n raíces.
Si P (x) no tiene raíces, entonces lo que estamos tratando de ver es cierto (si no tiene ninguna raíz, no tiene
más de n). Supongamos que posee al menos una raíz a. Sabemos que x − a divide a P (x) y que, por lo tanto,
P (x) = (x − a)C(x), donde C(x) es el cociente de la división. ¿Qué grado tiene C(x)? Observemos que si,
ahora, C(x) no tiene raíces, entonces, nuevamente, hemos visto que P (x) no tiene más de n raíces. ¿Qué harían
si C(x) tiene al menos una raíz? ¿Cómo seguirían el razonamiento? ¿Cómo concluyen el resultado? Recuerden
el Experimento 50.
Sabemos, entonces, que un polinomio de grado n tiene, a lo sumo, n raíces. Pero, ¿puede haber polinomios sin
raíces? El siguiente teorema, que fue probado por Gauss, contesta esta pregunta. Es llamado (ni más ni menos) el
Teorema fundamental del Álgebra.
Teorema 57 Todo polinomio P (x) ∈ C[x] [Teorema fundamental del Álgebra (TFA)] de grado mayor a cero
tiene, al menos, una raíz compleja.
En este teorema hemos remarcado que la raíz es compleja (lo que abarca, por supuesto, enteros, racionales y reales)
pues, de lo contrario, el resultado no vale. Por ejemplo, ya vimos que el polinomio x2 + 1 no tiene ninguna raíz real.
Pese a que el TFA habla de la existencia de, al menos, una raíz, podemos, en realidad, dar un enunciado más preciso
de este resultado (que se deduce de este teorema que hemos escrito) y decir cuántas raíces tiene exactamente un
polinomio de grado n.
Teorema 58 [Enunciado equivalente del TFA] Todo polinomio P (x) ∈ C[x] de grado n > 0 tiene exactamente
n raíces complejas (no necesariamente distintas; es decir, contadas con multiplicidad).
Aunque este último enunciado parezca más “fuerte” que el del TFA, ambos teoremas se deducen uno del otro. En
efecto, si vale el enunciado equivalente al TFA, entonces todo polinomio de grado n tiene exactamente n raíces.
Pero esto quiere decir que, en particular, tiene al menos una. Por lo tanto, se tiene que vale el TFA. Les dejamos en
un experimento para que vean que se deduce dicha equivalencia.
Experimento 52 Sea P (x) un polinomio de grado n > 0. Veamos, usando el TFA, que P (x) tiene
exactamente n raíces. Precisamente por el TFA sabemos que P (x) tiene al menos una raíz a ∈ C. Por lo tanto,
x − a divide a P (x) y se tiene P (x) = (x − a)C(x). ¿Qué harían ahora? ¿Cómo seguirían el razonamiento?
Observación 59 Notemos que el Teorema fundamental del Álgebra es un resultado de existencia de raíces: solo
nos dice qué cantidad debemos buscar, pero no nos dice cómo buscarlas.
Ejemplos 86
Hallemos todas las raíces del polinomio P (x) = x4 + 2x3 − 7x2 − 8x + 12. Por el TFA debemos buscar
cuatro raíces. El polinomio P tiene como coeficiente principal 1 y como término independiente 12. Según el
Teorema de Gauss, las posibles raíces son los divisores de 12: 1, −1, 2, −2, 3, −3, 4, −4, 6, −6, 12, −12.
Si evaluamos en x = −1 obtenemos P (−1) = (−1)4 + 2(−1)3 − 7(−1)2 − 8(−1) + 12 = 1 − 2 −
7 + 8 − 12 = −12. Concluimos que x = −1 no es raíz de P (x). Si ahora evaluamos en x = 1 se tiene
P (1) = (1)4 + 2(1)3 − 7(1)2 − 8(1) + 12 = 1 + 2 − 7 − 8 + 12 = 0. Entonces, x = 1 es raíz de P (x).
Haciendo la división de P por (x − 1), obtenemos P (x) = (x − 1)(x3 + 3x2 − 4x − 12). El Teorema de Gauss
puede ser aplicado nuevamente el polinomio de grado 3. Si evaluamos el polinomio Q(x) en x = −2 resulta
Q(−2) = (−2)3 + 3(−2)2 − 4(−2) − 12 = −8 + 12 + 8 − 12 = 0. Haciendo la división de Q(x) y x + 2 se
tiene Q(x) = (x + 2)(x2 + x − 6). Aquí podemos utilizar la fórmula de la resolvente para hallar que las raíces
de x2 + x − 6 son 2 y −3. Concluímos que las raíces de P son 1, −2, 2 y 3.
Busquemos ahora la raíces del polinomio Q(x) = −2x3 −10x2 −2x−10. El TFA nos dice que tiene que tener tres
raíces complejas. Por el Teorema de Gauss, las posibles raíces son 10, −10, 5, −5, 52 , − 52 , 2, −2, 1, −1, 12 , − 12 .
Si evaluamos Q(−5) = −2(−5)3 − 10(−5)2 − 2(−5) − 10 = 250 − 250 + 10 − 10 = 0. Dividiendo Q(x)
por x + 5 obtenemos Q(x) = (x + 5)(−2x2 − 2). Observemos que −2x2 − 2 es un polinomio que no tiene
raíces reales (siempre toma valores negativos, por lo que no se anula en ningún valor de x). Para hallar sus raíces
complejas podemos utilizar la fórmula de la resolvente o, también, simplemente igualar a 0 (que es más directo
en este caso ya que el polinomio no tiene término lineal):
−2x2 − 2 = 0
⇒ −2x2 = 2
⇒ x2 = 2
−2
⇒ x2 = −1
Concluimos que las raíces de Q con −5, i, −i.

Álgebra A. Factorización de polinomios. 229
Proposición 60 Si P (x) con coeficientes reales y z ∈ C es raíz de P (x), entonces z también es raíz de P (x).
Ejemplo 87 Supongamos que queremos hallar todas las raíces de P (x) = x4 − 7x3 + 18x2 − 22x + 12 y sabemos
que 1 + i es raíz de P . Como P tiene coeficientes reales, entonces 1 + i = 1 − i también será raíz de P . Luego,
x − (1 + i) y x − (1 − i) dividen a P y, como 1 + i 6= 1 − i, entonces (x − (1 + i))(x − (1 − i)) = x2 − 2x + 2 divide
a P (por Lema 55). Si llevamos a cabo la división, hallamos que P (x) = (x2 − 2x + 2)(x2 − 5x + 6). Finalmente,
podemos calcular las raíces de x2 − 5x + 6 utilizando la fórmula de la resolvente y hallar que todas las raíces de P son
1 + i, 1 − i, 2, 3.
Existen polinomios de grado 2 que no tienen raíces. Analicen si es posible que esto suceda con los polinomios
de grado 3 cuyos coeficientes son números reales.
Definimos qué son las raíces de los polinomios y las clasificamos según su multiplicidad.
Vimos que si a es raíz de P entonces x − a divide a P .
Dimos un procedimiento para encontrar todas las raíces de un polinomio.
Enunciamos el Teorema de Gauss para buscar raíces racionales en polinomios con coeficientes enteros.
Enunciamos el Teorema Fundamental del Álgebra que dice que un polinomio de grado n > 0 tiene necesariamente n
raíces en los números complejos.

8.4 Factorización de polinomios

Una de las informaciones más útiles que podemos tener de un polinomio es conocer cuáles polinomios más pequeños
lo componen.
Qué son los polinomios irreducibles.

Cómo hallar la descomposición en factores irreducibles de un polinomio en los distintos conjuntos de polinomios
Q[x], R[x] y C[x].

8.4.1 Polinomios irreducibles
La descomposición en factores primos es una herramienta fundamental de la teoría de números enteros. ¿En qué
consiste? Recordemos que un número primo es un número entero cuyos únicos divisores positivos son el 1 y él
mismo. Los primeros números primos positivos son 2, 3, 5, 7, 11, 13, 17, . . . El 6, por ejemplo, no es primo, pues 2
divide a 6 (por lo que 6 tiene un divisor distinto de 1 y 6). Es un hecho soprendente que los números que no son
primos se pueden escribir como producto de potencias de números primos. Tomemos, por ejemplo, el número 60,
que se puede escribir como 22 ,3,5; es decir, es producto potencias de 2, 3 y 5, que son números primos. La expresión
22 ,3,5 se llama la descomposición en números primos del número 60, y es única: no existe otra descomposición
del 60 que use otros números primos (u otras potencias de estos mismos primos). Con los polinomios sucede algo
prácticamente idéntico: todo polinomio puede descomponerse en factores irreducibles (los análogos a los primos en
este contexto); y la característica que tiene estos factores irreducibles es que no pueden escribirse como producto de
polinomios más pequeños (de allí el nombre “irreducibles”).
Definición 81 Un polinomio P (x) ∈ K[x], de grado mayor a 0, se dice irreducible en K (o irreducible en K[x])
si no se puede escribir como producto de dos polinomios de grados mayores a 0 que pertenecen a K[x]. Un
polinomio que no es irreducible se dice reducible.
Por ejemplo, el polinomio Q(x) = x2 − 5x + 6 no es irreducible en Q[x], ya que Q(x) = (x − 2)(x − 3), y tanto
x − 2 como x − 3 tienen grado mayor a 0 y pertenecen a Q[x]. Por otro lado, el polinomio P (x) = x2 + 1 es
irreducible en R[x], pues no se puede escribir como producto de polinomios de grado mayor a 0. En efecto, sabemos
que sus raíces son i y −i, por lo cual, tanto x − i como x + i, dividen a P (x). Es fácil verificar que P (x) es,
exactamente, (x − i)(x + i). Pero los polinomios x − i y x + i no pertenecen a R[x] (pues su término independiente
es un número no real). Por lo tanto, P (x) no se puede escribir como producto de polinomios más pequeños que
pertenecen a R[x]. Lo que notamos es que P (x) se puede escribir como producto de polinomios más pequeños que
pertenecen a C[x]. Por lo tanto, el polinomio P (x) sí es reducible en C[x]. Observemos que, de este último ejemplo,
podemos concluir lo siguiente: que un polinomio sea o no irreducible depende de dónde lo estemos considerando.
Por supuesto, si un polinomio es irreducible en C[x], entonces también lo es en R[x] y en Q[x] (y si es irreducible
en R[x], también lo es en Q[x]). ¿Se dan cuenta por qué?
Ejemplos 88
El polinomio P (x) = x2 − 2 es irreducible en Q[x], pues lo únicos polinomios de grado mayor a 1 que lo
√ √
dividen son x − 2 y x + 2, que no tienen coeficientes racionales. En particular, sí es reducible en R[x], dado
√
que 2 ∈ R. Como es reducible en R[x], también lo es en C[x].
El polinomio Q(x) = x3 − x2 + 4x − 4 es reducible en Q[x], ya que puede escribirse como (x2 + 4)(x − 1),
y ambos polinomios en este producto grado mayor a cero y coeficientes racionales. También resulta, entonces,
reducible en R[x] y C[x].
El polinomio R(x) = x2 +4 es irreducible en Q[x] y R[x]. Es reducible en C[x] ya que R(x) = (x−2i)(x+2i).

Consideremos que, en la definición de polinomio irreducible, hemos dejado afuera a los polinomios constantes.
Estos no son considerados polinomios irreducibles ni reducibles. También, de la misma definición, es fácil deducir
que todos los polinomios de grado 1 son irreducibles en cualquier K[x].
Veamos como escribir cualquier polinomio como descomposición en factores irreducibles. Así como todos los
números enteros pueden descomponerse en producto de potencias de primos, los polinomios pueden descomponerse
en producto de potencias de polinomios irreducibles. En este sentido, los polinomios irreducibles son los “números
primos” de los polinomios. Como mecionamos en el párrafo anterior, la reducibilidad o irreducibilidad de un
polinomio varía dependiendo en qué conjunto numérico K estemos considerando la factorización. Por lo tanto,
cuando busquemos la descomposición en factores irreducibles de un polinomio, deberemos especificar respecto de
qué conjunto numérico K la estamos buscando. Por ejemplo, consideremos el polinomio T (x) = −x4 − 3x3 +
9x2 − 3x + 10. Su descomposición en Q[x] es −(x − 2)(x + 5)(x2 + 1). Está también es su descomposición en
R[x]. Sin embargo, su descomposición en factores irreducibles en C[x] es (x − 2)(x + 5)(x − i)(x + i). Por lo
tanto, tiene tres factores irreducibles en Q y R pero cuatro en C.
Definición 82 Una descomposición en factores irreducibles en K[x] de un polinomio P (x) ∈ K[x] es una
escritura de P (x) como producto de potencias polinomios irreducibles en K.
Por ejemplo, una descomposición de P (x) = 4x3 − 8x2 + 4x en Q[x] es (4x)(x − 1)2 . En este caso, los factores
irreducibles son 4x y x − 1 (este último aparece elevado al cuadrado). Notemos que esta descomposición no es
única, pues también podríamos escribir P (x) = x(2x − 2)2 , y aquí los factores irreducibles resultarían x y (2x − 2).
Lo que sucede en este caso es que hemos “reordenado” el coeficiente principal para que aparezca en un factor o en
otro (en el primer caso, en el factor 4x y, en el segundo caso, en 2x − 2, donde el 4 aparece al elevar al cuadrado este
factor). Este “intercambio” del coeficiente principal no influye en la naturaleza de la factorización y es, de hecho,
irrelevante en qué lugar aparezca situado. Para simplificar las cosas, hacemos, entonces, la siguiente convención.
Importante Vamos a convenir que la descomposición en factores irreducibles K de un polinomio P (x) ∈ K es
una descomposición en producto de potencias de polinomios irreducibles mónicos, todo multiplicado por una
constante de K. En el ejemplo anterior, escribimos P (x) = 2x(x − 1)2 y consideramos que los componentes
irreducibles son x y x − 1, y la constante que multiplica todo es 2.
Tengamos en cuenta que, con esta convención, la descomposición en factores irreducibles de un polinomio es
única. ¿Se dan cuenta por qué? En general, trabajaremos con polinomios mónicos, por lo que no aparecerá la
constante correspondiente al coeficiente principal. El objetivo de este apartado es, entonces, aprender a calcular la
descomposición en factores irreducibles de un polinomio. A esta tarea se la conoce como factorizar el polinomio.
Observación 61 Notemos que los polinomios lineales (de grado 1) son siempre irreducibles en cualquier
conjunto K[x]. Esto es inmediato de la definición de polinomio irreducible y las propiedades del grado de un
producto de polinomios.
Observemos ¿Cómo se halla la descomposición en factores irreducibles de un polinomio? Estamos ya al tanto

de que la descomposición en factores irreducibles está íntimamente ligada a la existencia de raíces del polinomio:
si λ ∈ K es raíz de P entonces x − λ divide a P , y viceversa. Por lo tanto, para calcular la factorización de
un polinomio podemos intentar buscar todas las raíces del polinomio, de manera de ir obteniendo los factores
irreducibles progresivamente. Si alguno de los factores que hallamos no tiene raíces en el K que estamos trabajando,
entonces dicho factor será irreducible en K[x]. Dado que la demostración rigurosa de esto sería demasiado exigente,
veamos el procedimiento a partir de algunos casos particulares.
Factoricemos el polinomio P (x) = x3 − 5x2 + 6x en cada uno de los tres conjuntos de polinomios con los que
trabajamos: Q[x], R[x] y C[x]. Como P (x) no tiene término independiente, entonces x = 0 es una raíz de él.
Aquí no necesitamos hacer la división de P por x − 0, ya que podemos, simplemente, sacar x de factor común:
P (x) = x(x2 − 5x + 6). Ahora, buscamos las raíces de x2 − 5x + 6, que podemos hallar mediante la fórmula de la
resolvente: x = 2 y x = 3. Por lo tanto, utilizando el Lema 55, se deduce que P (x) = x(x − 2)(x − 3). Como todos
los polinomios en este producto tienen grado 1 entonces son irreducibles en C[x] (y, por lo tanto, también en R[x] y
Q[x]). Como, además, estos polinomios tienen coeficientes en Q, entonces x(x − 2)(x − 3) es la factorización de
P (x) en Q. Esta también es la factorización en R[x] y C[x].
Consideremos ahora el polinomio T (x) = −x4 − 3x3 + 9x2 − 3x + 10. El Teorema de Gauss nos dice que las
posibles raíces racionales, de existir, son 1, −1, 2, −2, 5, −5, 10, −10. Evaluando el polinomio en estos números,
obtenemos que 2 y −5 son raíces de T (x). Dividiendo T (x) por (x − 2)(x + 5) = x2 + 3x − 10 hallamos que
T (x) = (x2 +3x−10)(x2 +1). Sabemos que x2 +1 no tiene raíces racionales, por lo que es un polinomio irreducible
en Q. Por lo tanto, la descomposición de T (x) en Q[x] es precisamente (x − 2)(x + 5)(x2 + 1). Como x2 + 1
tampoco tiene raíces reales, entonces la descomposición en R[x] es la misma. Por otro lado, x2 + 1 se descompone
como (x − i)(x + i) en C[x], por lo que la descomposición de T (x) en C[x] es (x − 2)(x + 5)(x − i)(x + i).
Estudiemos, finalmente, cómo factorizar el polinomio Q(x) = x6 + x5 − 3x4 + 2x3 + x2 − 3x + 1 sabiendo que
√ √
1 3 1 3
2 + 2 es una de sus raíces. Notemos que, como Q(x) tiene coeficientes en Q, el hecho que 2 + 2 sea raíz
√
1 3
de Q(x) implica que su conjugada 2 − 2 también debe ser raíz de Q(x) (por la Proposición 60). Por lo tanto,
concluímos que el polinomio
√ !! √ !!
1 3 1 3
x− + x+ + = x2 − x + 1
2 2 2 2
debe dividir a Q(x). Llevemos a cabo la división.
x6 + x5 − 3x4 + 2x3 + x2 − 3x + 1 |x2 − x + 1

x6 − x5 + x4 x4 + 2x3 − 2x2 − 2x + 1
2x5 − 4x4 + 2x3 + x2 − 3x + 1
2x5 − 2x4 + 2x3
−2x4 + 0x3 + x2 − 3x + 1
−2x4 + 2x3 − 2x2
−2x3 + 3x2 − 3x + 1
−2x3 + 2x2 − 2x
x2 − x + 1
x2 − x + 1
0
Luego:
Q(x) = (x2 − x + 1)(x4 + 2x3 − 2x2 − 2x + 1)
Para factorizar x4 + 2x3 − 2x2 − 2x + 1 en Q[x] recurrimos al Teorema de Gauss, donde vemos que las únicas
posibilidades son 1 y −1. Como ambos números anulan a x4 + 2x3 − 2x2 − 2x + 1 podemos concluir que (x2 − 1)
divide a x4 + 2x3 − 2x2 − 2x + 1. Hacemos esta división.
x4 + 2x3 − 2x2 − 2x + 1 |x2 − 1

x4 − x2 x2 + 2x − 1
2x3 − x2 − 2x + 1
2x3 − 2x
−x2 + 1
−x2 + 1
0
Hasta aquí hemos hallado que
Q(x) = (x2 − x + 1)(x − 1)(x + 1)(x2 + 2x − 1)
Observemos que x2 + 2x − 1 es irreducible en Q[x] pues, nuevamente por Teorema de Gauss, las únicas posibles
raíces racionales son 1 y −1, y ninguna anula a x2 + 2x − 1. Por lo tanto, la factorización de Q(x) en Q[x] es
precisamente (x2 − x + 1)(x − 1)(x + 1)(x2 + 2x − 1).
Ahora, como x2 − x + 1 es irreducible en R[x] (pues sus raíces son complejas no reales), entonces, para hallar la
factorización de Q(x) en R[x], debemos chequear la reducibilidad de x2 + 2x − 1. Las raíces de este polinomio
vienen dadas por: √
−2 + 4+4 √
= −1 + 2∈R
2
√
−2 − 4+4 √
= −1 − 2∈R
2
Luego, la factorización de Q(x) en R[x] es:
√ √
(x2 − x + 1)(x − 1)(x + 1)(x + 1 − 2)(x + 1 + 2)
Finalmente, la factorización de Q(x) en C[x] es:

√ !! √ !!
1 3 1 3 √ √
x− + x+ + (x − 1)(x + 1)(x + 1 − 2)(x + 1 + 2)
2 2 2 2
Esto concluye la solución del problema.

Quizá ya se han percatado que todos los polinomios se descomponen en factores lineales en C. Esto solo es cierto
para C (ya vimos, por ejemplo, que x2 + 1 es irreducible en R y no es lineal).
Definimos los polinomios irreducibles en K[x] como los polinomios que no se pueden escribir como producto de dos
(o más) polinomios de grados mayores a 0.
Estudiamos cómo hallar la descomposición en factores irreducibles en Q[x], R[x] y C[x] de polinomios en K[x].

9. Experimentos resueltos
Experimento Resuelto 1 (pág. 29)
El gráfico del punto a, es:
~ = (2, 6), ~v − w
Los calculos para el punto b dan ~v + w ~ = (−2, 8), 12 ~v = ( 23 , 1) y
~ = (4, −2), −~v = (−3, −2), 2w
~ − 12 ~v = (− 72 , 7)
2w
Y sus gráficos son:

Los gráficos del punto c son:
En la siguiente imagen vemos todos los vectores pedidos, junto con las sumas:
los vectores y las restas:
los vectores multiplicados por 2:

237
y multiplicados por 12 :

p
El módulo de (x1 , x2 ) es x21 + x22 que es exactamente la longitud de la hipotenusa del triángulo que obtenemos si
hacemos Pitágoras, pues la longitud de los catetos en este caso es x1 y x2 , como podemos constatar en la imagen.
Gráficamente es imposible de observar pues ~v (en negro) se superpone con ~u = ~v − w

~ +w
~ (en color):
Análiticamente tenemos (x1 , x2 ) − (y1 , y2 ) + (y1 , y2 ) = (x1 − y1 + y1 , x2 − y1 + y2 ) = (x1 , x2 ).

p √ √ √
1. Si ~v = (3, −4) y w
~ = (1, 2), entonces, ||~v || = 32 + (−4)2 = 25 = 5, ||w||
~ = 12 + 22 = 5,
√ √ √ √ p
~ = ||(4, 2)|| = 42 + 22 = 20 = 2 5, ||~v || + ||w||
||~v + w|| ~ = 5 + 5, ||2~v || = 62 + (−8)2 =
√ q q
100 = 10, || 12 ~v || = ( 32 )2 + (−2)2 = 25 5
4 = 2.
2. Vemos que al duplicar el vector se duplica el módulo y al dividirlo por dos el módulo tambien se divide por
dos.
√ √
~ = 2 5 ≤ 5 + 5 = ||~v || + ||w||
3. ||~v + w|| ~

1. Tres vectores ortogonales a (2, 3): (−3, 2), (6, −4) y (−5, 10
3 ). El producto escalar entre los vectores y (2, 3)
siempre es cero.
2. Los vectores ortogonales a (2, −2) serán de la forma (k, k) con k ∈ R, entonces como nos piden norma 1
√ √ √ √
tenemos que k 2 + k 2 = 2k 2 = |k| 2, con lo cual para que la norma sea 1 necesitamos que |k| = 22 ,
√ √ √ √
2 2 2 2
por lo tanto los vectores ortogonales a (2, −2) con norma 1 son ( 2 , 2 ) y (− 2 , − 2 ).
3. Dos vectores ortogonales a (1, 2, 1) no paralelos entes si pueden ser (2, −1, 0) y (0, 1, −2).
4. Los vectores simultaneamente ortogonales a (1, 2, 1) y (1, −3, 0) serán multiplos del vector (3, 1, −5).

Tomemos como ejemplo ~v = (1, −1, 2), w

~ = (1, 3, 1) y ~u = (−1, 3, 7), entonces ~v xw
~ = (−7, 1, 4), esta será la
normal al plano Π.
La ecuación normal es (−7, 1, 4)[(x, y, z)−(−1, 3, 7)] = 0, de aquí obtenemos −7(x+1)+(y −3) = 4(z −7) = 0,
de lo cual deducimos −7x + y + 4z = 38.

~ = (a, b, c).
Cuando nos dan un plano a través de una ecuación ax + by + cz = d la normal del plano Π0 es N
Para encontrar un punto del plano basta buscar una terna de números que “cumpla” la ecuación, uno puede
ser P = (0, 0, dc ), pues si reemplazamos obtenemos a0 + b0 + c dc = d ⇒ d = d.
~
Un posible  a N es ~v = (−b, a, 0), pues (a, b, c) · (−b, a, 0) = −ab + ab = 0.
 vector ortogonal
i j k
 
~ x~v =  a
N

b c  = (−ac, −bc, a2 + b2 )

 
−b a 0
239
X = t(−b, a, 0) + s(−ac, −bc, a2 + b2 ) + (0, 0, dc ), donde s, t ∈ R

1. Los puntos del plano Π0 son de la forma (s − 3, t + 1, t − 2s), al reemplazarlos en la ecuación de Π obtenemos
2(s − 3) − (t + 1) + (t − 2s) = 13 lo cual es −7 = 13, absurdo. Por lo tanto tenemos que Π ∩ Π0 = ∅.
2. Los puntos del plano Π00 son de la forma (2k − l + 5, 2k + l, −2k − 3l + 3), al reemplazarlos en la ecuación
de Π obtenemos 2(2k − l + 5) − (2k + l) + (−2k − 3l + 3) = 13 con lo cual tenemos −6l + 13 = 13, o
sea l = 0, con lo cual Π ∩ Π00 = {X ∈ R3 : X = k(2, 2, −2) + (5, 0, 3), k ∈ R}

1. Los puntos del plano Π0 son de la forma (−3k + l + 1, − 12 k + l + 3, 2k − 3l − 1), al igualarlos con los que
surjen de la ecuación de Π obtenemos:



 −3k + l + 1 = 2t − s + 2


 − 12 k + l + 3 = t



2k − 3l − 1 = −4t + s − 3
resolviendo ese sistema obtenemos k = 2l + 29 , entonces tenemos que Π ∩ Π0 = {X ∈ R3 : X =

l(−5, 0, 1) + ( 23 5
2 , 4 , −8), l ∈ R}.
2. De la misma forma al igualar los puntos de cada recta obtenemos:




 −3j + 1 = 2t − s + 2


 r−j =t



−2r + 5j − 2 = −4t + s − 3
resolviendo ese sistema obtenemos 0 = −2, absurdo. Por lo tanto tenemos que Π ∩ Π00 = ∅.

1. La recta L escrita en forma de ecuaciones cartesianas es:


x + y = 1

z = 1

Entonces para encontrar Π ∩ L debemos resolver el sistema:




x+y+z =1


x+y =1



z = 1
A partir de las dos primeras ecuaciones tenemos que 1 + z = 1, pero esto es z = 0. Con lo cual el sistema es
contradictorio. No tiene solución, luego Π ∩ L = ∅.
2. Mientras que la recta L0 es:

x − 2y = 2

y + z = 1

Entonces para encontrar Π ∩ L0 debemos resolver el sistema:




 x+y+z =1


 x − 2y = 2



 y+z =1
De la primera y tercera ecuaciones tenemos x + 1 = 1, es decir x = 0, entonces reemplazando esto en la

segunda ecuacion nos queda −2y = 2, o sea y = −1, y volviendo con esto a la tercera ecuación −1 + z = 1,
es decir z = 2, con lo cual tenemos que Π ∩ L0 = {(0, −1, 2)}.

1. Los puntos de L tienen la forma (t + 2, 3t + 2, −t).

2. (t + 2) + (3t + 2) + (−t) = 1, la interpretación de este paso es que de todos los puntos del plano, nos estamos
quedando con los que tienen la forma de los puntos que estan en la recta, es decir los puntos que estan al
mismo tiempo en el plano y en la recta.
3. El t que se deduce del punto anterior es t = −1, entonces Π ∩ L = {(1, −1, 1)}.

En este experimento nos piden averiguar la distancia de P = (1; −3) a la recta:

L = X ∈ R2 : X = t(2; −3) + (0; 5), t ∈ R
En primer lugar, buscamos la ecuación de una recta L perpendicular a L que pase por el punto P . Para ello, buscamos
un vector perpendicular a L, por ejemplo: ~v = (3; 2). Luego: L = X ∈ R2 : X = k(3; 2) + (1; −3), k ∈ R
Para hallar a intersección entre L y L, igualamos coordenada a coordenada sus ecuaciones paramétricas, es decir:
2t = 3k + 1 y −3t + 5 = 2k − 3. Al reoslver este sistema obtienen que t = 2 y k = 1. por lo tanto, las rectas
se intersecan en el punto Q = (4; −1).
Ahora nos resta calcular la distancia entre P = (1; −3) y Q = (4; −1):
p √ √
d(P ; Q) = (4 − 1)2 + (−1 + 3)2 = 9 + 4 = 13
Esta es la distancia de la recta L al punto P .
Para hallar el plano Π perpendicular a L, tomamos como vector normal al plano al vector director de la recta L:
Π : 1 · x + 2 · y − 3 · z + d = 0. Nos falta hallar d. Para eso reemplazamos en esta ecuación por el punto P :
1 · 1 + 2 · 0 − 3 · 1 + d = 0 → 1 − 3 + d = 0 → d = 2. Luego: Π : x + 2y − 3z + 2 = 0
Para hallar el punto Q de intersección entre L y Π, reemplazamos las ecuaciones paramétricas de L en Π:
(t) + 2(2t + 1) − 3(−3t + 5) + 2 = 0 → 14t = 11 → t = 11 11 18 37

14 . Luego: Q = 14 ; 7 ; 14
q 2 2 2 √
Solo nos resta hallar la distancia d(P ; Q) = 11
14 − 1 + 18
7 −0 + 37
14 − 1 = 183414
Primero vamos a escribir la ecuación del plano Π en su forma implícita. Para ello, averiguamos el vector normal al
~ = (−6; 1; −10).
plano como el producto vectorial entre los vectores (2, 2, −1) y (5, 0, −3) y nos da: N
Luego: Π : −6x + y − 10z + d = 0. Si reemplazamos por el punto del plano (2; 0; 0) obtenemos que d = 12.
Entonces Π : −6x + y − 10z + 12 = 0
Para escribir L perpendicular a Π y que pase por P = (−1; −2; 4), usamos como vector director de L la normal la
plano:
241
L : X = k(−6; 1; −10) + (−1; −2; 4). Expresamos esta recta en sus ecuaciones paramétricas y las reemplaza-
mos en la ecuación del plano para encontrar el punto Q intersecciónn:
24
→ Q = − 281 250 308

−6(−6k − 1) + (k − 2) − 10(−10k + 4) + 12 = 0 → k = 137 137 ; − 137 ; 137
Luego resta calcular: d(P ; Q) = d(Π; L) = 2, 05
Para probar que los planos son paralelos, podemos buscar el vector normal al plano Π calculando en producto
vectorial entre los vectores contenidos en él: (−2; 1; 1) y (0; −3; 4).
~ = (7; 8; 6). Para comprobar que el plano Π es paralelo Π verificamos que las coordenadas
Este vector normal es:N
de los vectores normales son proporcionales (porque son paralelos): en este caso basta con ver que tienen el mismo
vector normal.
Para construir la recta L perpendicular a ambos planos, podemos definirla con el vector normal a los planos como
vector director (se verifica la condición de perpendicularidad pedida) y que pase, por ejemplo, por un punto del
plano Π:
L : X = k(7; 8; 6) + (5; −1; 0). De esta forma nos ahorramos el paso de calcular P dado que ese punto es
P = (5; −1; 0) Ahora buscamos la intersección entre L y Π y a ese punto lo llamamos Q. ¿Cómo? Reemplazando
las ecuaciones paramétricas de L en Π:
29 542 381 174

7(7k + 5) + 8(8k − 1) + 6(6k) = −2 → k = − 149 . Luego Q = 149 ; − 149 ; − 149
√
29 149
Solo nos resta calcular d(P ; Q) = 149 . Este número representa la distancia entre los planos.
Primero vamos a expresar a la reecta L1 en su ecuación vectorial. Como viene dada por la intersección de dos
planos, elegimos despejar la variable y de ambas ecuaciones e igualarlas.
De ello resulta que: 2x − z − 4 = 4x − 2z − 9 y si se despeja z se obtiene: z = 2x − 5. Al volver con esta igualdad
a una de las ecuaciones de los planos -puede ser cualquiera- se obtiene que y = 1.
Luego, todo punto de la forma (x; 1; 2x − 5) es un punto de la recta L1 . Separando lo que tiene x de lo que no,
resulta que una posible ecuación vectorial de L1 es:
L1 : X = k(1; 0; 2) + (0; 1; −5). Ustedes pueden observar que el vector director de L1 es el mismo vector
director de L2 . Esto nos garantiza que las rectas son paralelas.
Para encontrar una ecuación de Π perpendicular a L2 , tomamos el vector director de esta recta como la normal al
plano:
1 · x + 0 · y + 2 · z + d = 0. Luego reemplazamos por el punto P = (1; 2; −3) y obtenemos d:
1 + 2(−3) + d = 0 → d = 5. Entonces: Π : x + 2z + 5 = 0.
Para encontrar Q, reemplazamos las ecuaciones paramétricas de L1 en Π: (k) + 2(2k − 5) + 5 = 0 → k = 1 →
Q = (1; 1; −3)
Solo nos resta hallar d(P ; Q), que es la distancia entre las rectas paralelas. Pero como P = Q ¡son el mismo punto!,
dicha distancia vale 0 (cero).
Para probar que L es perpendicular a Π basta con mostrar que el vector director de la recta es ortogonal al vector
normal al plano, es decir: el producto escalar entre ambos es nulo:
~ = 0 → (−1; 0; 1)(1; 1; 1) = −1 + 0 + 1 = 0. ¡Comprobado!
v~L · N
Para encontrar L0 ortogonal a Π, se toma como vector director de esta recta la normal al plano Π y si, además, debe
pasar por P = (1; 1; 2) reuslta:
L0 : X = k(1; 1; 1) + (1; 1; 2). Si esta recta la expresamos en sus coordenadas cartesianas y la reemplazamos
en Π resulta:
(k + 1) + (k + 1) + (k + 2) = 1 → k = −1. Luego Q = (0; 0; 1).
√
La distancia d(P ; Q) = d(L; Π) = 3.
1. Para probar que las rectas L1 y L2 son alabeadas debemos comprobar que su intersección es vacía y que no
son paralelas.
Si reemplazamos las ecuaciones paramétricas de L2 en L1 resulta que:
x − y − z = 1 → 2λ + 3λ + 1 = 1 → 5λ = 0 → λ = 0
x − 2y + z = −2 → 2λ + 6λ − 1 = −2 → −1 = −2 es absurdo (pues λ = 0). Entonces la intersección
entre las rectas es vacía.
Ahora bien, si escribimos la ecuación vectorial de L1 resulta: (x; y; z) = k(3; 2; 1) + (4; 3; 0). Como el vector
director de L2 es (2; −3; 0) es sencillo comprobar que las coordenadas de los vectores de ambas rectas no
son proporcionales.
Por lo tanto, comprobamos que las rectas no son paralelas. Luego: las rectas son alabeadas.
2. La ecuación vectorial de la recta L1 es k(3, 2, 1) + (4, 3, 0). Entonces los planos buscados serán de la forma:
Π1 = {λ(3, 2, 1) + β(2, −3, 0) + (4, 3, 0), λ, β ∈ R}
Π2 = {λ0 (3, 2, 1) + β 0 (2, −3, 0) + (0, 0, −1)λ0 , β 0 ∈ R}
3. Para encontrar la distancia entre los planos, primero buscamos la recta perpendicular a Π2 que pasa por
(0, 0, 1).
Para
esto encontramos
la normal al plano:

i j k

2 1 = (3, 2, −13)

3

2 −3 0

Entonces la ecuación de la recta buscada es α(3, 2, −13) + (0, 0, −1).

La intersección de esta recta con el plano Π1 es el punto (42, 28, −183).
√
Entonces d(Π1 , Π2 ) = d((0, 0, 1), (42, 28, −183)) = 14 182.

Para encontrar una recta L que pase por P = (1; 2; 3) y sea perpendicular al plano Π : x + 2y + 2z = 0 utilizamos
~ = (1; 2; 3) como vector director de la recta. Es decir:
el punto P como punto de la recta y la normal al plano N
L : (x; y; z) = k(1; 2; 3)+(1; 2; 3). Luego, reemplazamos las ecuaciones paramétricas de la recta en la ecuación
del plano para enocntrar las coordenadas del punto R:
(k + 1) + 2(2k + 2) + 3(3k + 3) = 0 → 14k + 14 = 0 → k = −1 entonces R = (0; 0; 0)
Como R es el punto medio entre P y Q podemos plantear que:

x +x y +y z +z
(xR ; yR ; zR ) = P 2 Q ; P 2 Q ; P 2 Q

1+xQ 2+yQ 3+zQ
(0; 0; 0) = 2 ; 2 ; 2
Q = (−1; −2; −3)

243
1. Si P ∈ L → P = t1 · ~v y si Q ∈ L → Q = t2 · ~v
Sumamos miembro a miembro ambas igualdades y resulta: P + Q = t1 · ~v + t2 · ~v
Luego: P + Q = (t1 + t2 ) · ~v → P + Q ∈ L
Si P ∈ L → P = t1 · ~v y multiplicamos miembro a miembro por λ ∈ R resulta:
λP = λt1 · ~v → λP = (λt1 ) · ~v → λP ∈ L
2. Si P ∈ Π → P = s1 · w
~ + r1 · ~u
Si Q ∈ Π → Q = s2 · w
~ + r2 · ~u
Si sumamos miembro a miembro resulta:
P + Q = s1 · w
~ + r1 · ~u + s2 · w
~ + r2 · ~u
Si se extraer como factor común los vectores w
~ y ~u resulta:
P + Q = (s1 + r1 ) · ~u + (s2 + r2 ) · ~u → P + Q ∈ Π
Si P ∈ Π → P = s1 · w
~ + r1 · ~u y multiplicamos miembro a miembro por λ ∈ R resulta:
λP = λ(s1 · w
~ + r1 · ~u)
Si se distribuye λ resulta: λP = (λ · s1 ) · w
~ + (λ · r1 )~u)
Entonces: λP ∈ Π.

1. Todo vector del subespacio S = (x1 ; x2 ; x3 ; x4 ; x5 ) ∈ R5 : x5 = 0 puede ser escrito como (a; b; c; d; 0) con
a, b, c, d ∈ R.
Para probar que el conjunto < (1; 0; 0; 0; 0); (0; 1; 0; 0; 0); (0; 0; 1; 0; 0); (0; 0; 0; 1; 0) > genera S debo
mostrar que (a; b; c; d; 0) puede ser escrito como combinación lineal de los vectores del conjunto dado:
(a; b; c; d; 0) = a(1; 0; 0; 0; 0) + b(0; 1; 0; 0; 0) + c(0; 0; 1; 0; 0) + d(0; 0; 0; 1; 0) siendo a, b, c, d ∈ R.
¡Así queda probado que el conjunto dado genera S!
2. En este caso, debemos probar que: < (1; 0; 0; 0; 0); (1; 1; 0; 0; 0); (1; 1; 1; 0; 0); (1; 1; 1; 1; 0) > genera S.
Luego:
(a; b; c; d; 0) = (a − b)(1; 0; 0; 0; 0) + (b − c)(1; 1; 0; 0; 0) + (c − d)(1; 1; 1; 0; 0) + d(1; 1; 1; 1; 0) siendo
a, b, c, d ∈ R.
3. En este caso, debemos probar que
< (1; 0; 0; 0; 0); (0; 1; 0; 0; 0); (0; 0; 1; 0; 0); (0; 0; 0; 1; 0); (1; 2; 3; 4; 0) >
genera S. Luego:
(a; b; c; d; 0) = a(1; 0; 0; 0; 0) + b(0; 1; 0; 0; 0) + c(0; 0; 1; 0; 0) + d(0; 0; 0; 1; 0) + 0(1; 2; 3; 4; 0) siendo
a, b, c, d ∈ R.

Experimento Resuelto 25 (pág. 103) 9x2 − 16y 2 − 36x + 32y − 124 = 0
(9x2 − 36x) − (16y 2 − 32y) = 124
9(x2 − 4x) − 16(y 2 + 2y) = 124
9(x2 − 4x + 4 − 4) − 16(y 2 + 2y + 1 − 1) = 124
9[(x − 2)2 − 4] − 16[(y + 1)2 − 1] = 124
9(x − 2)2 − 36 − 16(y + 1)2 + 16 = 124
9(x − 2)2 − 16(y + 1)2 = 124 + 36 − 16
9(x − 2)2 − 16(y + 1)2 = 144

9(x−2)2 16(y+1)2 144
144 − 144 = 144
(x−2)2 (y+1)2
16 − 9 =1

245
Experimento Resuelto 27 (pág. 147) Primero resolvamos el producto de la izquierda. Obtenemos:
Como se ve bastante feo, pero los sistema que salen de esa igualdad son:
Cómo se observa, son muchas cuentas. Lo cual nos deja en claro que el método para encontrar la inversa nos
facilita el trabajo. La idea detrás de esto es que al irse alternando la fila que tiene al 1 en cada sistema al hacer
la triángulación por el método de Gauss estaremos reproduciendo de forma ordenada los despejes que, de todas
formas, deberiamos hacer para resolver los tres sistemas.
v1 , ~v2 . . . , ~vk } ⊂ Rn es un conjunto de vectores linealmente indepen-

Experimento Resuelto 28 (pág. 150) Si {~
diente entonces:
α1~v1 + α2~v2 + . . . + αk~vk = 0
implica que αi = 0 para todo i, por la definición de independencia lineal. Pero entoces como cualquier reordena-
miento de una suma finita da el mismo resultado, tenemos que:
α2~v2 + α1~v1 + . . . + αk~vk = 0
implica lo mismo, luego {~v2 , ~v1 . . . , ~vk } ⊂ Rn , es linealmente independiente.

Pero entonces si αi = 0 tenemos que α2 = 0 y λα2 = 0, sin importar el valor de λ, con lo cual {~v1 , λ~v2 . . . , ~vk } ⊂
Rn es L.I.
Por último como:
α1~v1 + α2~v2 + . . . + αk~vk = 0
implica αi = 0 para todo i, entonces, a partir de:
α1~v1 + α2 (~v2 + λ~v1 ) + . . . + αk~vk = 0

tenemos:
(α1 + λα2 )~v1 + α2~v2 + . . . + αk~vk = 0
pero (α1 + λα2 ) = 0, pues ambos αi lo son, con lo cual {~v1 , ~v2 + λ~v1 , . . . , ~vk } ⊂ Rn es L.I.
Conviene desarrollar por la última fila o la primer columna. Dado que son las que contienen la mayor cantidad de
ceros. Si desarrollamos el determinante obtenemos a1 1 · a2 2 · a3 3. Con lo cual la conclusión es que el determinante
de una matriz triangular se obtiene multiplicando los elementos de la diagonal de dicha matriz.
1. Calculemos el determinante de una matriz que tiene una fila de ceros, en el caso de columna es lo mismo. Para
fijar ideas pensemos en la primer fila, en caso de ser otra es lo mismo. En ese caso al momento del calculo
obtenemos 0 · |A11 | − 0 · |A12 | + 0 · |A13 | − · · · + (−1)n · · · 0 · |A1n |, como vemos todos los terminos de
la suma son |A1 i| donde este es el determinante del menos de la matriz, por cero. Sea cual sea el resultado
del determinate del menor lo estoy multiplicando por cero, con lo cual obtengo una suma de ceros, lo que
obviamente es cero.
2. Para el caso de una matriz con dos filas o columnas iguales, en este caso para fijar ideas las primera y
segunda, debemos tener en cuenta la propiedad que dice que el determinante de una matriz es el mismo que el
determinante que surje de reemplazar una fila por el resultado de la resta de dos filas de la matriz, que nos da:

a11 a12 ... a1n a11 a12 ... a1n

a1n a11 − a11 a12 − a12 a1n − a1n

a11 a12 ... ...
=

... ...

an1 an2 ... ann an1 an2 ... ann
Pero al hacer esa resta tenemos que nos queda una fila de ceros, lo cual hace que el determinante de cero:

a11 a12 ... a1n a11 a12 ... a1n

a11 a12 ... a1n 0 0 ... 0
= =0

... ...

an1 an2 ... ann an1 an2 ... ann
3. Para que una matriz de nxn tenga rango menor que n debe tener una, o más, filas o columnas todas
conformadas por ceros. Pero en este caso, por el ítem 1 tenemos que el determinante da cero.

1. El determinante será det(Ak ) = det(A · A · A . . . A) = det(A) · det(A) · det(A) . . . det(A) = (det(A))k .

2. 1 = det(I) = det(A · A−1 ) = det(A) · det(A−1 ) ⇒ (det(A))−1 = det(A−1 ).
3. Son matrices diferentes.
4. Si A · B es inversible entonces det(A · B) 6= 0 pero entonces det(A) · det(B) 6= 0, y como los determinantes
son números reales entonces det(A) 6= 0 y det(B) 6= 0, con lo cual A y B son inversibles.

Como en general ~0 = 0 · ~v , en particular ~0 = 0 · T (~v ) = T (~0 · ~v ) = T (~0)

~0 = T (~v − ~v ) = T (~v + (−~v )) = T (~v ) + T (−~v ) ⇒ −T (~v ) = T (−~v )
247
T (~v − w)
~ = T (~v + (−w)) ~ = T (~v ) − T (w)
~ = T (~v ) + T (−w) ~
Para dos vectores tenemos T (α1~v1 + α2~v2 ) = T (~v1 + ~v1 + · · · + ~v1 + ~v2 + ~v2 + · · · + ~v2 ) = T (~v1 ) +
T (~v1 ) + · · · + T (~v1 ) + T (~v2 ) + T (~v2 ) + · · · + T (~v2 ) = α1 T (~v1 ) + α2 T (~v2 ). Este razonamiento puede
extenderse en general para la suma de r vectores.

Como S es subespacio entonces si v, w ∈ S ⇒ T (v), T (w) ∈ T (S), pero entonces T (v) + T (w) = T (v + w) ∈
T (S). Del mismo modo λT (v) = T (λv) ∈ T (S), pues λv ∈ S. Finalmente, ~0 = T (~0) ∈ T (S). Por lo tanto T(S)
cumple las tres condiciones con las que definimos un subespacio. Luego T (S) ⊂ (R)m es un subespacio de (R)m .
Experimento Resuelto 34 (pág. 176)  

1 0
 
Por exploración podemos encontrar que la matriz A que cumple que T (~v ) = A~v es de la forma A =  0 1 .
 
 
1 1
 
1 0  
  x1 
 
Esto lo podemos comprobar haciendo  0 1  ·

  x2
1 1
A partir de lo que obtenemos (x1 , x2 , x1 + x2 ) que es T (x1 , x2 ).
Pero tenemos tambien que T ((1, 0)) = (1, 0, 1) y T ((0, 1)) = (0, 1, 1), que podemos observar son las columnas de
la matriz anterior.
Si W es un subespacio de Rm entonces si w ~ 2 ∈ W tomemos ~v1 , ~v2 ∈ T −1 (W ) tales que T (~v1 ) = w

~ 1, w ~1 y
T (~v2 ) = w
~ 2 . Pero entonces w ~ 2 = T (~v1 ) + T (~v2 ) = T (~v1 +~v2 ) ∈ T (W ), del mismo modo λw
~1 + w ~ 1 = λT (~v1 ) =
T (λ~v1 ) ∈ T (W ). Por lo tanto T −1 (W ) es subespacio de Rm .
Experimento Resuelto 36 (pág. 181)  √ √ 

2 2
π 2 − 2
La matriz de la transformación rotación de 2 en el sentido contrario a las agujas del reloj es  √ √ 
2 2
2 2
 √ √   
2 2
2 − 2 1 √
 √ √ ·  = (0, 2)
2 2
2 2 1

La expresión de la T.L. simetría respecto de y = 2x es T (x, y) = ( −3x+4y

5 , 4x+3y
5 ). T (1, 1) = ( 15 , 75 ).
Experimento Resuelto 38 (pág. 184)  

k 0 0
 
Matriz canónica de la homotecia de factor k en la dirección x:  0
 
1 0 
 
0 0 1
 
1 0 0
 
Matriz canónica de la homotecia de factor k en la dirección y:  0
 
k 0 
 
0 0 1
 
1 0 0
 
Matriz canónica de la homotecia de factor k en la dirección z:  0
 
1 0 
 
0 0 k
Como el plano xy esta generado por ~v = (1, 0, 0) y por w

~ = (0, 1, 0) y como normal podemos tomar N = (0, 0, 1),
entonces la transformación buscada cumple T (1, 0, 0) = (1, 0, 0), T (0, 1, 0) = (0, 1, 0) y T (0, 0, 1) = (0, 0, 0).
Entonces tenemos:
T (x, y, z) = T (x, 0, 0) + T (0, y, 0) + T (0, 0, z) = xT (1, 0, 0) + yT (0, 1, 0) + zT (0, 0, 1) =
x(1, 0, 0) + y(0, 1, 0) = (x, y, 0)
Experimento Resuelto 41 (pág. 190) Primero calculamos el producto de las matrices AT y A0T :
   
1 1   3 −1 −3
  1 −1 −2  
AT · A0T =  2 0 · = −2 −4 
  
 2
  2 0 −1  
0 2 2 0 −2
Una vez que tenemos esto veamos que el producto de la matriz resultante por el vector de variables nos da lo mismo
que la forma funcional de la composición T oT 0 , es decir:
  
3 −1 −3 x
  
−2 −4   y  = (3x − y − 3z, 2x − 2y − 4z, 2x − 2z)
  
 2
  
2 0 −2 z
Vemos que se recupera la expresión funcional de la composición.
Si z = a + bi y w = c + di entonces:
z + w = (a + bi) + (c + di) = (a + c) + i(b + d). Luego:
249
Re(z + w) = a + c = Re(z) + Re(w)

Im(z + w) = b + d = Im(z) + Im(w)

Experimento Resuelto 44 (pág. 201) Si z = a + bi y w = c + di sucede que:
|z · w|2 = (z · w)((z · w))

|z · w|2 = z · w · z · w
|z · w|2 = z · z · w · w
|z · w|2 = |z|2 |w|2
Tomando raíces cuadradas en la igualdad obtenida, resulta: |z · w| = |z| · |w|.
1. Si z = 2 + 3i entonces z = 2 − 3i
Luego: z · |z| = (2 + 3i)(2 − 3i) = 22 − (3i)2 por ser una diferencia de cuadrados.
z · z = 4 − 9i2 = 4 + 9 = 13. Este valor coincide con |z|2 .
En general, sucede que si z = a + bi entonces z = a − bi. Entonces:
z · z = |z|2 .
2. Si z = a + bi y w = c + di son dos números complejos, se verifica que:
z = a + bi = a − bi = a + bi = z
z + w = a + bi + c + di = (a + c) − i(b + d) = (a − ib) + (c − id) = z + w
zw = (a + bi)(c + di) = (ac − bd) + i(ad + bc) = (ac − bd) − i(ad + bc) = ac − bd − iad − ibc =
(a − bi)(c − di) = zw
z + z = (a + bi) + (a − bi) = 2a = 2Re(z) ; z − z = (a + bi) − (a − bi) = 2bi = 2Im(z)
√ p
|z| = a2 + b2 = a2 + (−b)2 = |z|

Propiedad 2 del corolario 49:

z = |z|(cos(α) + i sin(α))
z = |z| cos(α) + i|z| sin(α)
z = |z| cos(α) + i|z| sin(α)
z = |z| cos(α) − i|z| sin(α)
Pero cos(α) = cos(−α) y sin(α) = − sin(−α)
Entonces: z = |z| cos(−α) − i|z|(− sin(−α))
z = |z| cos(−α) + i|z| sin(−α)
z = |z|(cos(−α) + i sin(−α))
Si gr(P ) = n y gr(Q) = m, el grado de P + Q será:

gr(P + Q) = n si n > m
gr(P + Q) = m si m > n
gr(P + Q) = n si n = m

Experimento Resuelto 48 (pág. 219) Si gr(P ) = n y gr(Q) = m, el grado de P · Q será:
gr(P · Q) = n + m

Si se realiza la división entre dos polinomios del mismo grado, el cociente y el resto son polinomios de grado 0, es
decir, funciones constantes.
Si el polinomio Q(x) divide al polinomio P (x) entonces las raíces de Q(x) son raíces también de P (x).

Sea P (x) ∈ K[x] de grado n. Observemos que P (x) no puede tener más de n raíces. Si P (x) no tiene raíces,
entonces lo que estamos tratando de ver es cierto (si no tiene ninguna raíz, no tiene más de n). Ahora bien:
supongamos que P (x) posee al menos una raíz a. Sabemos que x − a divide a P (x) y que, por lo tanto, P (x) =
(x − a)C(x), donde C(x) es el cociente de la división y su grado es n − 1. Observemos que si, ahora, C(x) no
tiene raíces, entonces, nuevamente, hemos visto que P (x) no tiene más de n raíces.
Si C(x) tiene al menos una raíz, se procede de la misma forma y, entonces, P (x) tiene dos raíces: a y la raíz de
C(x). Nuevamente, P (x) tiene n raíces.
Sea P (x) un polinomio de grado n > 0. Por el TFA, sabemos que P (x) tiene al menos una raíz a ∈ C. Por lo
tanto, x − a divide a P (x) y se tiene P (x) = (x − a)C(x). Calculando las raíces de C(x) puede repetirse el
procedimiento y, con el experimento 50, sabemos que las raíces de C son raíces de P . Luego, P tiene como máximo
n raíces: la raíz x = a y las n − 1 raíces de C.

10. Bibliografía
Grossman, S. (1996). Álgebra lineal. México D. F.: Mcgraw Hill.

Jeronimo, G., Sabia, J. y Tesauri, S. (2008). Álgebra lineal. Buenos Aires: UBA. (Disponible en: http:
//mate.dm.uba.ar/~jeronimo/algebra_lineal/AlgebraLineal.pdf)
Krick, T. (2017). Álgebra I. Buenos Aires: UBA. (Disponible en: http://cms.dm.uba.ar/depto/
public/grado/fascgrado9.pdf)
Lang, S. (1990). Introducción al álgebra lineal. Wilmington: Addison-Wesley Iberoamericana.
Lipschutz, S. (1992). Álgebra lineal. México D. F.: Mcgraw Hill.
Oteyza, E. et al. (2011). Geometría analítica. México D. F.: Pearson Educación.
Índice Alfabético
Ángulo inclusión de, 20

entre planos, 67 intersección, 24
entre recta y plano, 67 unión, 23
entre rectas, 66 universal, 21
entre vectores, 35 Conjunto de generadores, 83
Cono, 90
Base, 85
dimensión del subespacio, 86 De Moivre, Teorema, 209
extender, 85 Dependencia lineal, 82
extraer, 85 Desigualdad de Cauchy-Schwarz, 36
Dimensión del subespacio, 86
Circunferencia
Distancia
Como lugar geométrico, 93
entre plano y recta, 70
Ecuación canónica, 93
entre planos, 70
Ecuación general, 94
entre punto y plano, 70
Combinación lineal, 80
entre punto y recta, 68, 69
Conjunto de , 81
entre rectas, 70
Determinar, 81
entre puntos, 34
Subespacio, 81
Conjunto, 19 Ecuación implícita
complemento, 25 de la recta, 43
descr. por comprensión, 20 de rectas, 60
descr. por extensión, 20 del plano, 49
diferencia, 24 Ecuación lineal, 114
igualdad de, 20 Ecuación normal del plano, 52
254 ÍNDICE ALFABÉTICO
Ecuación vectorial Producto entre matrices, 142

de la recta, 40 Propiedades del determinante, 160
del plano, 47 Propiedades operaciones, 141
Elipse, 95 Rango, 150
Ecuación canónica, 96 Rango de una matriz cuadrada, 151
Ecuación general, 99 Suma y multiplicación por escalares, 140
Excentricidad, 98 Traspuesta, 148
Espacio n-dimensional, 23 Triangulación, 126
Espacio bidimensional, 21 Triangular, 128
Espacio tridimensional, 22
Números complejos, 196
Gauss, Teorema, 226 Conjugado, 200
De Moivre, 209
Hipérbola, 101
Distancia entre, 201
Ecuación canónica, 102
Forma exponencial, 210
Ecuación general, 103
Forma polar, 208
Excentricidad, 103
Inverso multiplicativo, 197
Asíntotas, 104
Módulo, 199
Intersección Parte real y parte imaginaria, 198
de plano y recta, 62 Raíces n-ésimas de la unidad, 211
de planos, 58, 60, 61 Raíz n-ésima, 211
de rectas, 64 Raiz cuadrada, 204
Representación en el plano, 198
Matriz, 121
Resolución de ecuaciones cuadráticas, 205
ampliada, 123
Resolución de ecuaciones generales, 213
Asociada a un transformación lineal, 170
Rotación, 203
Clasificación de sistemas, 134
Simetrías respecto de puntos, 203
Cuadrada, 144
Suma y producto, 196
de coeficientes del sistema, 123
Traslaciones, 202
Determinante de 2 × 2, 155
Vector asociado, 198
Determinante de 3 × 3, 156
Forma binómica, 198
Determinante de n × n, 160
Norma de un vector, 33
Determinante e inversibilidad, 163
Normal de un plano, 53
Determinante y clasificación de sistemas, 164
Diagonal principal, 128
Ortogonalidad, 37
Identidad, 144
Interpretación geométrica del determinante, 188 Parábola, 105
inversible, 145 Ecuación canónica, 107
Matriz asociada a la simetría respecto del plano, Ecuación general, 106
183 Excentricidad, 109
Matriz de una homotecia de factor k, 184 Paralelismo
Operaciones por filas y columnas, 125, 126 de rectas, 43
ÍNDICE ALFABÉTICO 255
Perpendicularidad sobre rectas, 77

de rectas, 43 Punto
Plano en recta, 42
ángulo con recta, 67
Recta
angulo entre, 67
ángulo con plano, 67
distancia a punto, 70
ángulo entre, 66
distancia a un plano, 70
clasificación en R3 , 65
distancia a una recta, 70
distancia a punto, 68, 69
ecuación implícita, 49
distancia a una recta, 70
ecuación normal, 52
ecuación implícita, 43, 60
ecuación vectorial, 47
ecuación vectorial, 40
intersección con recta, 62
intersección con plano, 62, 64
intersección de, 58, 60, 61
paralelismo, 43
normal, 53
perpendicularidad, 43
paralelismo, 54
Regla del paralelogramo, 27
perpendicularidad, 54
Polinomios
Simetría
Definición, 218
respecto de planos, 72
Evaluación, 219
respecto de rectas, 74
Grado, 218
Sistemas de ecuaciones lineales, 114
Igualdad, 219
Clasificación, 119, 133
Irreducibles, 230
Determinante y clasificación de sistemas, 164
Mónico, 218
Equivalencia, 117
Monomio, 220
Forma matricial, 152
Suma, 219
Homogéneo, 118, 131
Teorema del resto, 224
Matriz, 122
Algoritmo de división, 221
Parámetros, 135
Descomposición en factores irreducibles, 230
Resolución, 130
Descomposición en factores lineales, 233
Subconjunto, 20
Multiplicación, 219
Subespacio, 80
Multiplicidad de una raíz, 227
Descripción por ecuaciones, 83
Raíz, 225
Descripción por generadores, 83
Teorema de Gauss, 226
Pasaje entre descripciones, 84
Teorema fundamental del Álgebra, 227
Suma
Producto escalar, 32
de vectores, 27, 30–32
Producto por escalar, 30, 31
distancia, 34 Transformación lineal, 167, 168
propiedades, 35 Clasificación, 177
Producto vectorial, 55 Composiciones, 189
Proyección ortogonal, 76 Deslizamientos cortantes, 184
sobre planos, 77 Forma funcional, 169
256 ÍNDICE ALFABÉTICO
Forma matricial, 170 Sistema de generadores de la imagen, 175

Homotecia, 183 Teorema de la dimensión, 177
Contracción y dilatación, 184 Transformaciones del cuadrado unitario, 186
Homotecia de factor k, 183
Vector
Homotecia de factor k en R3 , 184
dirección, 25
Imagen, 174
en el espacio, 30
Inversa, 192
en el plano, 27
Matriz asociada a la simetría respecto del plano,
equivalencia, 26
183
módulo, 25
Núcleo, 176 noción, 25
Núcleo y sistema homogéneo, 177 norma, 33
Proyección ortogonal, 185 nulo, 26
Relación con las bases del espacio, 172 ortogonalidad, 37
2
Rotaciones en R , 180 producto por escalar, 28, 30, 31
Simetrías en R3 , 183 producto vectorial, 55
2
Simetrías en el plano R , 182 sentido, 25
Simetrías respecto de una recta, 182 suma, 27, 30, 31

Álgebra A Nodrm

Cargado por

Copyright:

Formatos disponibles

Álgebra A Nodrm

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Álgebra A Nodrm

Cargado por

Copyright:

Formatos disponibles

Tapa Álgebra final.

pdf 1 17/02/2020 9:25:07

Rector Alberto Edgardo Barbieri

PROGRAMA UBA XXI

Coordinación Desarrollo Pedagógico María Alejandra Codazzi

Coordinación Producción Transmedia Liliana Castillo

Archivo Digital: descarga

1. Álgebra. 2. Universidades Públicas. I. Lombardo, Claudia, coord.

Primera edición: marzo de 2020

Legales.indd 1 26/03/2020 12:01:22 p.m.

UBA XXI es un Programa de Educación a Distancia de la Universidad de Buenos

Álgebra es un texto diferente en el que van a encontrar explicaciones de distintos

el margen izquierdo. Esto es indicativo de información esencial de la teoría.

Esta categoría contiene información y notas importantes que complementan la teoría.

1.1.1 ¿Qué es un conjunto? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

1.1.2 ¿Cómo describir un conjunto? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.1.3 Subconjuntos del plano y el espacio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

1.1.4 Cómo construir conjuntos a partir de otros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

1.2.1 La noción de vector . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

1.2.2 Vectores en el espacio n-dimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

1.3 Producto escalar de vectores 32

1.3.1 Producto escalar, norma y distancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

1.3.2 Ángulo entre vectores y ortogonalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

2.1.1 ¿Cómo describir una recta? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

2.1.2 La ecuación vectorial de la recta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

2.1.3 Ecuación implícita de una recta en R2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

2.1.4 ¿Cómo hallar la ecuación vectorial a partir de la implícita? ¿y viceversa? . . . . . . . . . . . . . . . . . . . 44

2.2.2 Ecuación implícita de un plano en R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

2.2.3 ¿Cómo hallar la ecuación vectorial a partir de la implícita, y viceversa? . . . . . . . . . . . . . . . . . . . . 50

2.3 La ecuación normal de un plano 52

2.3.2 El producto vectorial de vectores de R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

2.3.3 Nuevo cálculo de la ecuación implícita a partir de la vectorial, y viceversa . . . . . . . . . . . . . . . . . . 56

2.4 Intersección de subespacios de R3 57

2.4.2 Intersección de un plano y una recta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

2.4.3 Intersección de rectas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

2.5 Distancias y ángulos entre rectas y planos 65

2.5.2 Distancia de un punto a una recta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

2.5.3 Distancia de un punto a un plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

2.5.4 Distancia entre rectas y planos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

2.6 Proyecciones y simetrías 72

2.6.2 Proyección ortogonal de puntos sobre rectas y planos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

3.2 Combinación lineal 80

3.3 Dependencia lineal 81

3.4 Generadores, base y dimensión 83

4.1.2 Corte del cono con distintos planos planos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

4.3.2 La ecuación de la elipse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

4.3.3 Excentricidad de una elipse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

4.5 La parábola 105

5 Ecuaciones lineales, matrices y determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

5.2 Matrices 121

5.3 Resolución y clasificación de sistemas de ecuaciones lineales 129

5.4 La teoría de matrices 139

5.5 Determinantes 154

6 Transformaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

6.1 La transformación lineal 167

6.1.1 ¿Que caracteriza a una transformación lineal? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

6.1.2 Forma funcional y matricial de una transformación lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

6.1.3 Cómo construir transformaciones lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171

6.2 Imagen y núcleo 174