Álgebra A Nodrm
Álgebra A Nodrm
Álgebra A Nodrm
Subsecretaría de Innovación y
Calidad Académica Marilina Lipsman
Eudeba
Universidad de Buenos Aires
© 2020
Editorial Universitaria de Buenos Aires
Sociedad de Economía Mixta
Av. Rivadavia 1571/73 (1033) Ciudad de Buenos Aires
Tel: 4383-8025 / Fax: 4383-2202
www.eudeba.com.ar
UBA XXI a través de diferentes recursos instala debates para estimular el avance de
las comunidades de conocimiento en el marco de nuevos escenarios de enseñanza y
aprendizaje, sin perder de vista su complejidad.
Los invitamos a leer Álgebra con el deseo de promover nuevas lecturas que les
permitan resignificar y contextualizar los temas aquí presentados.
Claudia Lombardo
Coordinadora General
UBA XXI
A mi mujer Melina y mis hijos Agustín y Santiago, con la promesa que nunca estaré en el lado equivocado otra vez.
Nicolás.
A Ale y Tiara, por animarme a volar y cumplir mis sueños. A Analía por alentarme a asumir este proyecto.
Rosa María.
A todas las personas que me crucé y me sigo cruzando en este camino de aprender y enseñar matemáticas.
Ximena.
A Pasio por su ayuda con el lenguaje. A mis viejos y hermanos por todo lo demás.
Gerardo.
9
Introducción
Este libro es, probablemente, muy diferente a otros libros o apuntes de matemática que hayan leído: aquí encontrarán
un importante caudal de explicaciones de conceptos y ejemplos básicos incluidos para ayudarlos a entender las
ideas detrás de las definiciones y los objetos que estudiaremos. Muchos textos de matemática presentan las teorías
desde un punto de vista formal y abstracto (“la teoría es esta y así funciona”) en lugar de explicar el origen y las
implicaciones y aplicaciones de la misma, lo que clarifica completamente los conceptos que la conforman, de
manera que resulta casi natural su existencia. Asimismo, mucha de la teoría contenida en este libro tiene orígenes
(y aplicaciones) geométricas, y se ha hecho énfasis en resaltar estos hechos, dejando en un segundo plano la
“abstractización” de la teoría para dar lugar a un enfoque más visual e intuitivo.
El cuerpo del texto está separado en dos partes. En la primera donde se desarrollan aspectos más geométricos,
aunque no exentos de álgebra, mientras que en la segunda los aspectos son netamente algebraicos, lo cual no obsta a
que se los relacione con los de la primera parte. Al final de esa segunda parte encontrarán las resoluciones de los
experimentos.
Para los alumnos que no estén familiarizados con el formato de los libros de matemática, es sugerido que tomen el
curso virtual LECMat, disponible gratuitamente en el campus virtual de UBA XXI.
La siguiente lista muestra los distintos tipos de categorías que contiene el apunte:
1. Definiciones, Teoremas y Proposiciones.
2. Ejemplos.
3. Observaciones.
4. Experimentos.
5. Para pensar (representado por una lamparita).
6. Información complementaria (representada por una letra “i”).
Teniendo en cuenta estas disposiciones, el estudiante debe tener presente el siguiente orden de prioridades.
1. P RIORIDAD 1.
Definiciones, Teoremas, Proposiciones.
Ejemplos.
2. P RIORIDAD 2.
Observaciones.
Experimentos.
Texto en cursiva.
3. P RIORIDAD 3.
Para pensar.
Información complementaria.
Sugerimos que, en una primera lectura, el apunte sea leído en su totalidad. Para el alumno que desee, en lecturas
posteriores, utilizar el apunte, puede optar por leer solo las categorías de P RIORIDAD 1 ó de P RORIDAD 1 y 2,
según el grado de produndidad que desee encarar.
En próxima página encontrarán ejemplos de los distintos formatos y categorías del apunte.
10
Página ejemplo
El texto sin formato (estándar) es texto de lectura obligatoria. En él se introducirán objetos, se explicarán conceptos
y se resolverán problemas concretos necesarios para el desarrollo de la teoría.
Definición 1 Las definiciones, Proposiciones y Teoremas aparecen con una barra vertical naranja gruesa sobre
Teorema 1 Los Teoremas, Proposiciones y Lemas aparecen con la barra vertical gruesa también.
Ejemplo 1 Los ejemplos aparecen en letra más pequeña y centrados en la página. Esto ayudará al estudiante a
indentificarlos rápidamente dentro del texto. En general, muestran como llevar a cabo cálculos introducidos en la teoría
y de qué manera escribir la solución de los ejercicios.
Observación 2 Las observaciones aparecen con una barra vertical naranja finita sobre el margen izquierdo.
Experimento 1 Los experimentos son “ejercicios guiados” que se dejan al estudiante para resolver. Esta es
la mejor manera de aprender los conceptos introducidos. Muchas veces, cuando se considera que el estudiante
tiene las herramientas para entender una definición o una cuenta por su lado, se lo deja planteado para que lo
descubra por su cuenta dentro de un experimento. Las resoluciones de los experimentos se encuentran al final
del libro.
Esta sección “Para pensar...” tiene por objetivo dejarle al estudiante una pregunta relacionada con la teoría
que acaba de aprender. Le será áltamente beneficioso tomarse un tiempo para pensar estas preguntas ya que le
ayudará a comprender en más profundida muchos de los conceptos desarrollados.
Esta sección “Información complementaria” tiene por objetivo complementar algunos de los conceptos
introducidos para una formación más integral del estudiante.
Contenidos
I Parte 1
1 Vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.1 Conjuntos 19
1.2 Vectores de Rn 25
2 Rectas y planos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.1 Rectas 39
3 Espacios vectoriales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.1 Subespacios de Rn 79
4 Cónicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.1 Curvas cónicas 89
4.1.1 ¿Qué es un cono? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.2 La circunferencia 92
4.2.1 La circunferencia como lugar geométrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.3 La elipse 94
4.3.1 La elipse como lugar geométrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
II Parte 2
10 Bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
I
Parte 1
1 Vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.1 Conjuntos
1.2 Vectores de Rn
1.3 Producto escalar de vectores
2 Rectas y planos . . . . . . . . . . . . . . . . . . . . . . . 39
2.1 Rectas
2.2 Planos
2.3 La ecuación normal de un plano
2.4 Intersección de subespacios de R3
2.5 Distancias y ángulos entre rectas y planos
2.6 Proyecciones y simetrías
3 Espacios vectoriales . . . . . . . . . . . . . . . . . . . . 79
3.1 Subespacios de Rn
3.2 Combinación lineal
3.3 Dependencia lineal
3.4 Generadores, base y dimensión
4 Cónicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.1 Curvas cónicas
4.2 La circunferencia
4.3 La elipse
4.4 La hipérbola
4.5 La parábola
1. Vectores
Los vectores constituyen el principal objeto de estudio de la mayor parte del contenido de este libro. Son objetos
sencillos que tienen interpretaciones muy concretas, tanto geométricas como algebraicas. En este capítulo vamos a
definirlos y estudiar sus propiedades principales.
1.1 Conjuntos
Comenzaremos viendo algunas nociones básicas de la teoría de conjuntos que atraviesan el desarrollo de este libro.
Es importante tenerlas presentes e interiorizarlas.
Gran parte de la Matemática que conocemos se cimenta alrededor de la noción de conjunto. Un conjunto es una
colección de objetos o elementos. Estos objetos o elementos pueden ser de cualquier tipo: concretos (como los útiles
en nuestra cartuchera o las hojas de un árbol) o abstractos (como los números que usamos para contar o los puntos
en un plano). Un conjunto puede tener cualquier tipo de elementos, concretos o abstractos, y cualquier cantidad de
ellos, ya sea finita o infinita.
Habitualmente se utilizan letras mayúsculas (A, B, C) para representar conjuntos y letras minúsculas para representar
los objetos o elementos pertenecientes a estos conjuntos. Cuando un elemento x pertenece a un conjunto A
escribimos:
x∈A
Por ejemplo, si X es el conjunto cuyos elementos son el número 1, el símbolo @, una manzana y una naranja
20 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Importante Un conjunto queda determinado de manera única por sus elementos, de forma que dos conjuntos
que tengan los mismos elementos son idénticos. Si A y B son conjuntos con los mismos elementos escribiremos
A = B.
Muchas veces nos interesará trabajar con algunos de los elementos de un conjunto dado. Por ejemplo, podríamos
querer considerar el “conjunto de las frutas que están en X”. Es decir, al conjunto formado por la manzana y la
naranja. Este es un conjunto Y que está contenido o incluido en X, ya que los elementos de Y son, en particular,
elementos de X. En este caso decimos que “Y es un subconjunto de X” y lo escribimos:
Y ⊆X
Lo que implica la notación Y ⊆ X es que todo elemento de Y es un elemento de X. De igual manera que antes,
utilizamos el símbolo tachado * para indicar que un conjunto no está contenido en el otro. Por ejemplo, si Z es el
conjunto de elementos 1, @ y ], entonces Z * X ya que ] ∈
/ X. Observemos que, para que B * A, alcanza con
que al menos un elemento de B no pertenezca a A.
Observación 1 La noción de inclusión brinda una manera de determinar cuando dos conjuntos son idénticos:
A = B si simultáneamente vale que A ⊆ B y B ⊆ A. En efecto, si A = B entonces es cierto que los elementos
de A están en B y viceversa, por lo que es cierto que A ⊆ B y B ⊆ A. Por otro lado, si A ⊆ B entonces todos
los elementos de A también están en B; y si B ⊆ A entonces todos los elementos de B también están en A.
Concluimos que tienen los mismos elementos y, por ende, son iguales.
Existen dos maneras clásicas en las que es posible especificar el contenido de un conjunto; se las denomina
descripción por extensión y descripción por comprensión.
Si el conjunto tiene pocos elementos, se puede escribir la lista entre llaves “{ }”. Por ejemplo,
Esta manera de describir un conjunto se llama por extensión. Cuando describimos un conjunto de esta mane-
ra, no importa el orden en el que se presentan los objetos. Es decir, los conjuntos {1, @, manzana, naranja} y
{naranja, 1, manzana, @} representan el mismo conjunto (en este caso, X).
Muchas veces es imposible listar todos los elementos del conjunto o es muy tedioso hacerlo. En este caso, se
apela a una propiedad que compartan los elementos del conjunto para describirlo. Por ejemplo, cuando definimos
anteriormente el conjunto Y dijimos que Y era “el conjunto de las frutas en X”. De esta manera, el conjunto Y
quedó determinado por la premisa que entendemos qué es una fruta (o, por lo menos, sabemos distinguir una fruta
de algo que no lo es). Esta manera de describir los conjuntos se llama por comprensión y su expresión simbólica es:
Y = {x ∈ X : x es una fruta}
Aquí las llaves significan “el conjunto de” y los dos puntos “:” sustituyen las palabras “tales que”. La definición
anterior se lee “Y es el conjunto de los x pertenecientes a X tales que x es una fruta”. Notemos que al principio
Álgebra A. Conjuntos. 21
de la descripción se especifica de dónde se están tomando los elementos (en este caso en X) y, luego, cuál es su
propiedad definitoria (en este caso “ser una fruta”). Es habitual que cuando describimos un conjunto por comprensión
utilicemos un conjunto referencial de donde elegimos los elementos. Por ejemplo, el conjunto de los números reales
positivos menores que 10 lo escribimos de la siguiente manera:
W = {x ∈ R : 0 < x ≤ 10}
Aquí el conjunto referencial es R. En general, se especifica (o deja en claro) el “universo” en donde se “va a trabajar”
y se llama conjunto universal.
Observación 2 En Matemática generalmente se trabaja con conjuntos de números que ya tienen nombres
asignados:
N, los números naturales;
Z, los números enteros;
Q, los números racionales;
R, los números reales;
C, los números complejos.
1. A = {x ∈ N : x es múltiplo de 2 y x ≤ 10};
2. B = {x ∈ R : x2 = 1}
3. C = {x ∈ R : x2 = −1}
Podemos escribir por extensión estos conjuntos. El conjunto A es exactamente el conjunto {2, 4, 6, 8, 10}; el conjunto
B es {1, −1}. Por otro lado, el conjunto C no tiene elementos ya que ningún número real elevado al cuadrado puede
dar como resultado un número negativo. Es decir, C = ∅.
En este libro vamos a trabajar principalmente con subconjuntos del plano y del espacio. Lo que se conoce como
plano es el conjunto de los pares ordenados de números reales (x, y) y se nota R2 . Formalmente, se escribe:
R2 = {(x, y) : x, y ∈ R}
El adjetivo “ordenados” quiere decir que en la expresión “(x, y)” importa el orden de los números x e y (y, por lo
tanto, (x, y) e (y, x) son objetos diferentes). El nombre “plano” que se le da a R2 surge del hecho que uno puede
representar un elemento de R2 como un punto en el esquema de ejes cartesianos (Figura 1.1). Aquí, el número x
representa cuánto hay que desplazarse en el sentido del eje horizontal y el número y cuánto en el sentido vertical.
De esta manera, a cada punto (x, y) ∈ R2 le corresponde un punto del plano cartesiano y viceversa. Los números x
e y se llaman las coordenadas del punto (x, y). El punto (0, 0) ∈ R2 se llama el origen de coordenadas.
22 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
y
2
1. P1 = {(x, y) ∈ R2 : 0 ≤ x ≤ 10 y 2 ≤ y ≤ 8}.
2. P2 = {(x, y) ∈ R2 : x = y}.
3. P3 = {(x, y) ∈ R2 : y = x2 + 3}.
El conjunto P1 coincide con los puntos dentro de un rectángulo de base 10 y altura 6. El conjunto P2 son los puntos
cuyas coordenadas son iguales. Esto forma una recta en el plano: la recta de ecuación y = x. El conjunto P3 son los
puntos cuya segunda coordenada es el cuadrado de la primera más 3. Esto forma una parábola en el plano: la parábola
y = x2 + 3. En la Figura 1.2 están representados gráficamente estos conjuntos.
2
x
De manera análoga al plano, se puede considerar R3 = {(x, y, z) : x, y, z ∈ R}; es decir, el conjunto de ternas
ordenadas de números reales. Este conjunto se lo llama espacio ya que se identifica con un ambiente tridimensional.
El objeto (x, y, z) ∈ R3 se corresponde con el punto del espacio de tres ejes cartesianos perpendiculares, de manera
que el número x dice cuánto hay que desplazarse en la dirección de ese eje, y lo mismo con los números y, z y sus
respectivos ejes (Figura 1.3). En este caso, (0, 0, 0) ∈ R3 es el origen de coordenadas.
1. E1 = {(x, y, z) ∈ R3 : 0 ≤ x ≤ 5, 2 ≤ y ≤ 4 y 1 ≤ z ≤ 3}.
2. E2 = {(x, y, z) ∈ R3 : z = 0}
3. E3 = {(x, y, z) ∈ R3 : x = y = z}
El conjunto E1 coincide con los puntos dentro de un paralelepípedo de lados de tamaño 5, 2 y 2. El conjunto E2 son los
puntos que se encuentran en el plano xy (aquí consideramos el valor de la coordenada z como la “altura” a la que se
Álgebra A. Conjuntos. 23
encuentran los puntos respecto del “piso” xy). El hecho de que z = 0 nos dice precisamente que se trata de los puntos
que se encuentran en el “piso”. El conjunto E3 esta conformado por los puntos tales que sus coordenadas son todas
iguales. Esto forma una recta en el espacio. En la Figura 1.4 están representados estos conjuntos.
Generalizando estas ideas, podemos también considerar el conjunto de “tiras ordenadas” de números reales
Rn = {(x1 , . . . , xn ) : x1 , . . . , xn ∈ R}. Una tira como la que acabamos de describir se la llama n-upla ordenada
de números reales. Para n > 3 ya no podemos representar las n-uplas como puntos en un esquema de ejes cartesianos
(el ser humano sólo visualiza hasta tres dimensiones). El espacio Rn se lo conoce como el espacio n-dimensional.
El origen de coordenadas de Rn es la n-upla (0, 0, . . . , 0) de n ceros.
Importante Cuando mencionemos un objeto de Rn pero no tengamos la necesidad de especificar sus coordena-
das, escribiremos solamente X ∈ Rn (utilizando letras mayúsculas). Aquí se entiende que X = (x1 , . . . , xn )
para ciertos x1 , . . . , xn ∈ R.
Hay un número de operaciones básicas que es necesario hacer con los conjuntos: unión, intersección, diferencia y
complemento.
Unión de conjuntos. Esta operación consiste en “juntar” el contenido de dos conjuntos.
Definición 1 Si A y B son conjuntos que viven dentro del mismo universo U, entonces, el nuevo conjunto
A ∪ B, llamado unión entre A y B, es el que tiene por elementos aquellos que pertenecen a A o a B; es decir, a
24 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
A ∪ B = {x ∈ U : x ∈ A o x ∈ B}
Por ejemplo, con los conjuntos X = {1, @, manzana, naranja}, Y = {manzana, naranja} y Z = {@, ]} que
consideramos anteriormente, tenemos:
X ∪ Y = {manzana, naranja, 1, @}
Y ∪ Z = {manzana, naranja, @, ]}
X ∪ Z = {manzana, naranja, 1, @, ]}
Observemos que X ∪ Y = X. Esto se debe a que Y ⊆ X, por lo cual los elementos de Y ya son elementos de
X y no se agrega nada nuevo al unirlos.
15} entonces W ∪ V = {x ∈ R : 0 < x ≤ 15}. Notemos que los números reales que están entre 5 y 10 pertenecen
tanto a W como a V .
Intersección de conjuntos. Esta operación nos permite construir un conjunto que contenga los elementos que tengan
en común los dos conjuntos originales.
Definición 2 El conjunto cuyos elementos pertenecen a A y a B al mismo tiempo, se llama la intersección entre
A ∩ B = {x : x ∈ A y x ∈ B}
Con los conjuntos X = {1, @, manzana, naranja}, Y = {manzana, naranja} y Z = {@, ]} tenemos:
X ∩ Y = {manzana, naranja}
Y ∩Z =∅
X ∩ Z = {@}
Diferencia de conjuntos. Esta operación consiste en “removerle” a un conjunto A los elementos que sean, a su vez,
elementos de un conjunto B.
Definición 3 El conjunto que se obtiene al quedarse con los elementos de A que no están en B se llama la
diferencia entre A y B y se nota A \ B. Simbólicamente, se escribe de la siguiente manera:
A \ B = {x : x ∈ A pero x ∈
/ B}
Por último, definimos un conjunto formado por los elementos que se encuentran fuera de un conjunto dado A.
Esto da lugar a un nuevo conjunto llamado complemento de A, el cual se nota Ac . Pero, ¿qué significa “afuera”?
Por ejemplo, ¿qué hay afuera de Y = {manzana, naranja}? Esto depende de cuál es el universo en el que estamos
trabajando. Si trabajamos con el universo de todas las frutas, entonces Y c es el conjunto de todas las frutas que no
son la manzana y la naranja. Si tomamos el universo dado por el conjunto X = {manzana, naranja, 1, @} entonces
Y c = {1, @}. Por lo tanto, el complemento de un conjunto siempre es en relación al conjunto universal que estamos
considerando.
Definición 4 El complemento de un conjunto A respecto del universo U es el conjunto de elementos de U que
Ac = U \ A
Repasamos las nociones de pertenencia de un elemento en relación con un conjunto (∈) y de inclusión de un conjunto
en otro (⊆).
Introdujimos el conjunto R2 de pares ordenados de números reales (y lo identificamos con un plano), el conjunto
R3 de ternas ordenadas de números reales (y lo identificamos con el espacio 3-dimensional) y generalizamos estos
conjuntos a las n-uplas ordenadas de números reales, llamado Rn .
Definimos las operaciones usuales que hacemos con conjuntos: unión de conjuntos (∪), intersección de conjuntos
(∩), diferencia de conjuntos (\) y complemento de un conjunto respecto del conjunto universal (Ac ).
1.2 Vectores de Rn
En este apartado estudiaremos los vectores. Es probable que tengan la idea intuitiva de que un vector es una flecha,
al menos gráficamente. Será de gran utilidad tener presente esta noción para comprender la definición matemática
de este concepto.
Seguramente ustedes ya han utilizado flechas (segmentos orientados) para representar cantidades físicas, como
fuerzas aplicadas sobre un cuerpo o dirección de trayectorias. Una flecha queda determinada por su origen (donde
comienza) y su extremo (donde termina). Con estos datos, la flecha obtiene una dirección (la recta sobre la cual está
contenida), sentido (dónde empieza y dónde termina) y módulo (la longitud de la flecha). Análogamente, si se elige
26 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
el origen de la flecha, y especifica su dirección, sentido y módulo, entonces se obtiene el extremo de la misma.
~ y sus elementos son la
Definición 5 El segmento orientado de origen A y extremo B se llama vector AB
dirección (recta que contiene a los puntos A y B), el sentido (desde A hacia B) y el módulo (la distancia entre
los puntos A y B).
Cuando se dibujan flechas sobre la hoja de papel se están dibujando vectores en R2 , en el sentido que su origen y su
extremo son puntos de un plano. Al señalar un avión que está pasando por el cielo, podemos pensar que estamos
representando un vector con origen en nuestro hombro y extremo en nuestro dedo índice. Este vector “pertenece” a
R3 , ya que son necesarias tres coordenadas para dar la ubicación del hombro y el dedo índice en el espacio. Los
vectores que consideraremos en esta materia serán “vectores en Rn ”, en el sentido que su origen y extremo estarán
dados por puntos de Rn .
Tengamos en cuenta que la dirección, el sentido y el módulo de un vector son propiedades intrínsecas del mismo; es
decir, son independientes del punto origen del vector. El origen y el extremo de un vector dependen de su posición
relativa con respecto a un sistema de coordenadas cartesianas, mientras que la dirección, el sentido y el módulo,
no. En este libro nos importa estudiar las características propias de los vectores, independientemente de dónde
estén ubicados en el sistema de referencia. Por este motivo, consideramos que todos los vectores de igual dirección,
sentido y módulo son equivalentes; es decir, para nuestros propósitos es equivalente estudiar cualquiera de ellos. Sin
embargo, tenemos en cuenta que de todos los vectores de Rn equivalentes a uno dado, el más sencillo de describir
es el que tiene su origen en el origen de coordenadas (0, 0, . . . , 0) ∈ Rn , pues de esta manera, para especificar un
vector alcanza con dar su extremo.
Importante En este libro, trabajamos exclusivamente con vectores ~
v cuyo origen es el origen de coordenadas
(0, . . . , 0) ∈ Rn . Es decir que, al indicar el vector ~v = (x1 , x2 , . . . , xn ) en Rn nos estamos refiriendo al vector
con origen en el punto (0, 0, 0, ..., 0) ∈ Rn y extremo en el punto (x1 , x2 , . . . , xn ).
En particular, el origen de coordenadas también da lugar a un vector: el vector nulo (no tiene longitud, ni dirección,
ni sentido). Este vector es el único para el cual su origen y extremo coinciden y se nota ~0. Observemos que en R2 el
vector nulo es ~0 = (0, 0) y en R3 es ~0 = (0, 0, 0). Cuando escribamos ~0, nos referiremos siempre al vector nulo del
Rn en el que estemos trabajando en ese momento.
Hay dos operaciones fundamentales a tener en cuenta durante el trabajo con vectores: “sumar dos vectores” y
“escalar un vector por un número real”. Estas operaciones tienen un significado en función del contexto en el cual se
Álgebra A. Vectores de Rn . 27
las utiliza (a veces geométrico y a veces algebraico). Por ejemplo, si hay dos fuerzas aplicadas sobre un cuerpo y
los vectores ~v y w
~ especifican la dirección y magnitud de cada una de las fuerzas, necesitamos determinar cuál es
la fuerza resultante. En este caso, será la suma de los vectores anteriores (Figura 1.6). También, si necesitáramos
mover más rápido el cuerpo tendríamos que hacer el doble de fuerza en la misma dirección de ~v ; en este caso, el
vector que representa esta “duplicación de fuerza” será el obtenido al escalar en 2 el vector ~v . De igual manera, si
necesitamos contrarrestar una fuerza para que el cuerpo permanezca inmóvil, deberemos hallar una fuerza de la
misma intensidad pero de sentido opuesto. Esto corresponderá al vector opuesto a ~v , que se obtiene de escalar a este
vector por −1 (Figura 1.6). Estas operaciones de suma de vectores y producto de un vector por un escalar son la
base de la teoría que estudiaremos a lo largo del libro.
F 2F
F1 F1 + F2
-F
F2 F
En este apartado, formalizaremos las nociones de “sumar vectores” y “escalarlos por un número real” sugeridas
anteriormente. En primer lugar trabajamos con vectores en R2 y R3 para desarrollar la intuición de su definición y
sus propiedades.
A un vector en R2 lo llamamos un vector en el plano, y escribimos ~v ∈ R2 . Por lo tanto, ~v queda determinado por
un punto (x, y) del plano. Usaremos la notación ~v = (x, y) para referirnos al vector de origen (0, 0) y extremo
(x, y).
Definición 6 Dados dos vectores ~ ~ ∈ R2 , se define otro vector ~v + w
v, w ~ ∈ R2 . Este nuevo vector es llamado la
suma de ~v y w
~ (o vector suma). Si ~v = (x1 , x2 ) y w
~ = (y1 , y2 ) entonces:
~v + w
~ = (x1 + y1 , x2 + y2 )
v = (2, −5) y w
Ejemplo 7 Si ~ ~ = (−3, −2) entonces:
Existe otro medio de obtener nuevos vectores: escalarlo a partir de uno dado. Esto remite a las ideas de; “alargarlo”,
“acortarlo” o “invertirlo”. Suponemos que multiplicar un vector por el número 2 duplicará su tamaño; multiplicarlo
por 12 , lo reducirá a la mitad; y multiplicarlo por −1, lo invertirá, es decir, le cambiará el sentido (Figura 1.8). Esta
operación de multiplicación se llama producto de un vector por un escalar y está definida analíticamente de la
siguiente manera.
v = (x1 , x2 ) y λ ∈ R entonces el producto del vector ~v por el escalar λ es el vector
Definición 7 Si ~
Observación 3 En la teoría de vectores, a los números reales se los conoce como escalares pues se utilizan para
Observación 4 Notemos que las operaciones de suma de vectores y producto por escalar están definidas
coordenada a coordenada. Esto quiere decir que, para hallar la suma del vector ~v con el vector w,
~ debemos hacer
las sumas entre las respectivas coordenadas de estos vectores: la primera coordenada de ~v con la primera de w
~
y la segunda de ~v con la segunda de w.
~ De igual manera sucede con el producto de un vector por un escalar.
Notemos que el efecto de multiplicar un vector por −1 invierte el sentido del vector. Se nota −~v en lugar de (−1)~v .
Esta notación tiene sentido ya que ~v + (−1)~v = ~0. ¿Cómo se calcula en general ~v − w?
~ Gráficamente, primero se
calcula −w
~ (invirtiendo el sentido del vector) y, luego, se suma ~v con −w
~ usando la regla del paralelogramo. La
resta de dos vectores tiene una interpretación muy importante que veremos en la próxima sección (Experimento 4).
30 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Experimento 2 Consideren en R2 el vector ~t = (4, 2) y el triángulo cuyos vértices son los extremos de
~v = (−4, 1), w
~ = (−3, 6) y ~u = (−1, 7).
1. Grafiquen todos los vectores en el plano.
2. Grafiquen, con la misma escala, el triángulo cuyos vértices son los extremos de ~v + ~t, w
~ + ~t y ~u + ~t y el
triángulo cuyos vértices son los extremos de ~v − ~t, w
~ − ~t y ~u − ~t. ¿Qué efecto geométrico produce sumar
el vector ~t a los puntos de R2 ? ¿Y que sucede al restar el vector ~t?
3. Grafiquen, con la misma escala, el triángulo cuyos vértices son los extremos de 2~v , 2w
~ y 2~u y el triángulo
cuyos vértices son los extremos de 12 ~v , 12 w
~ y 12 ~u. ¿Qué efecto geométrico produce multiplicar por 2? ¿Y
por 12 ?
Para trabajar en el espacio R3 se procede de manera idéntica al caso de R2 . En este caso, cada vector ~v ∈ R3 queda
determinado por las coordenadas de su extremo (considerando su origen en el (0, 0, 0)) y se hará referencia al
“vector ~v = (x, y, z)” (Figura 1.9). Las operaciones de suma de vectores y producto de un vector por un escalar se
definen de forma análoga a las operaciones con vectores en el plano, pero extendiéndolas a una coordenada más.
v = (x1 , x2 , x3 ) ∈ R3 , w
Definición 8 Si ~ ~ = (y1 , y2 , y3 ) ∈ R3 y λ ∈ R, se define la suma de los vectores ~v y w
~
y el producto de ~v por el escalar λ de la siguiente manera:
~v + w
~ = (x1 + y1 , x2 + y2 , x3 + y3 )
λ~v = (λx1 , λx2 , λx3 )
v = (1, 2, −5), w
Ejemplo 9 Si ~ ~ = (3, −2, 0) y λ = −4 entonces:
~ = (1, 2, −5) + (3, −2, 0) = (1 + 3, 2 − 2, −5 + 0) = (4, 0, −5) y
~v + w
λ~v = (−4).(1, 2, −5) = ((−4),1, (−4),2, (−4).(−5)) = (−4, −8, 20).
Gráficamente, el efecto de la multiplicación de un vector por un escalar es el mismo que en el caso del plano (alarga,
acorta y/o invierte). Por otro lado, la suma de los vectores ~v y w
~ conserva la misma interpretación: es el vector a
cuyo extremo se arriba partiendo de (0, 0, 0) al recorrer, primero, el vector ~v y, luego, desde el punto extremo de ~v ,
el vector w.
~ De esta manera, la regla del paralelogramo también puede ser utilizada para interpretar la suma de dos
Álgebra A. Vectores de Rn . 31
vectores en el espacio, pensando a los vectores como incluidos en el plano que los contiene; es decir, identificando
dicho plano con R2 (Figura 1.10).
Como es de esperar, todos los conceptos introducidos para R2 y R3 se pueden extender a cualquier Rn de idéntica
manera. Las operaciones para vectores en Rn , se definen de forma completamente análoga a los casos n = 2 y
n = 3.
v = (x1 , x2 , . . . , xn ) ∈ Rn , w
Definición 9 Si ~ ~ = (y1 , y2 , . . . , yn ) ∈ Rn y λ ∈ R entonces:
~ = (x1 + y1 , x2 + y2 , . . . , xn + yn ) ∈ Rn
~v + w
λ~v = (λx1 , λx2 , . . . , λxn ) ∈ Rn
Ejemplos 10
La noción gráfica que debe interiorizarse sigue siendo la misma: la multiplicación por escalar estira, acorta y/o
invierte el vector, y la suma de vectores responde a recorrer un vector y, a continuación, el otro (aunque ya no
puedan visualizar este hecho). Todas las propiedades y conclusiones de los experimentos que hicimos en el caso
n = 2 valen para todos los n ∈ N.
Introdujimos la noción de vector de Rn y nos concentramos en trabajar con vectores con origen en ~0.
~ en Rn y vimos que el resultado es un nuevo vector ~v + w,
Definimos la suma de dos vectores ~v y w ~ cuyo extremo
es la suma lugar a lugar de las coordenadas de los extremos de los vectores ~v y w.
~ Gráficamente, es el vector que
coincide con la diagonal del paralelogramo de lados ~v y w.
~
Definimos el producto de un vector ~v por un escalar (número real) λ y vimos que el resultado es un nuevo vector λ~v
cuyo extremo es la multiplicación lugar a lugar de las coordenadas del extremo de ~v con λ. Gráficamente, el resultado
es un vector “escalado” por λ.
Observamos que el vector ~v − w,
~ es un vector cuya dirección, sentido y módulo es el mismo el vector de origen el
extremo de w
~ y extremo el extremo de ~v .
32 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
~v · w
~ = x1 y1 + · · · + xn yn
Ejemplos 11
A diferencia de las operaciones vistas en la Sección 1.2, el producto escalar es una operación entre vectores cuyo
resultado no es un vector, sino un número (de allí su nombre).
El producto escalar de vectores nos permitirá hacer cálculos de longitudes, distancias y ángulos. En efecto,
consideremos el producto escalar de un vector de R2 consigo mismo. Si ~v = (x1 , x2 ) entonces:
~v · ~v = x1 x1 + x2 x2 = x21 + x22
Experimento 3 Consideren el triángulo de vértices (0, 0), (x1 , 0) y (x1 , x2 ), para algunos x1 , x2 > 0
genéricos (Figura 1.11). Luego:
1. Noten que dicho triángulo es rectángulo y que el módulo de ~v = (x1 , x2 ) es exactamente la longitud de
la hipotenusa.
2. Calculen el módulo de ~v utilizando el Teorema de Pitágoras.
√
El resultado del experimento anterior da cuenta de que el módulo de ~v es exactamente ~v · ~v . ¿Qué sucede con
~ ∈ R3 ? Se puede mostrar con argumentos similares que el módulo de un vector en R3 es exactamente
un vector w
√
~ En el caso general de vectores de Rn , el módulo de un vector se lo conoce como norma del vector, y se
~ · w.
w
define:
√
v ∈ Rn , se define la norma del vector ~v como el número real ||~v || =
Definición 11 Si ~ ~v · ~v . Es decir, si
p
~v = (x1 , . . . , xn ) entonces ||~v || = x21 + · · · + x2n .
Por lo tanto, teniendo a disposición el producto escalar tenemos una manera de medir el módulo o norma de los
vectores.
||~v − w||,
~ donde ~v es el vector cuyo extremo es P y w
~ es el vector cuyo extremo es Q. Esto es, si P = (x1 , . . . , xn )
p
y Q = (y1 , . . . , yn ) entonces d(P, Q) = (x1 − y1 )2 + · · · + (xn − yn )2 .
Ejemplos 13
Álgebra A. Producto escalar de vectores. 35
Figura 1.13: Utilización de la teoría de vectores para calcular la distancia entre puntos.
1. ~v · w ~ · ~v (es conmutativo)
~ =w
2. ~u · (~v + w)
~ = ~u · ~v + ~u · w
~ (distribuye respecto de la suma de vectores)
3. (λ~v ) · w
~ = λ(~v · w)
~ = ~v · (λw)
~ (si algún vector está multiplicado por un escalar, este puede “sacarse fuera”
del producto interno).
~ = (1, 2) en R2 :
v = (3, −4) y w
Experimento 5 Dados ~
1. Calculen
||~v ||, ||w||,
~ ||~v + w||,
~ ||~v || + ||w||,
~ ||2~v || y || 12 ~v ||.
2. ¿Qué relación hallaron entre ||~v || y ||2~v ||? ¿Y entre ||~v || y || 21 ~v ||?
3. ¿Qué relación hallaron entre ||~v + w||
~ y ||~v || + ||w||?
~ ¿Cuál es más grande que el otro? Esto sucede
siempre y es conocido como desigualdad triangular.
Con lo desarrollado hasta aquí, ya tenemos una traducción matemática de la noción de “regla”, es decir, como
podemos medir longitudes y distancias. Como se mencionó al inicio de esta sección, el producto escalar también
nos provee la noción de “transportador”, que nos permitirá calcular ángulos entre vectores (no nulos).
¿A qué nos referimos cuando hablamos del ángulo entre dos vectores de R2 ? A que, de los dos ángulos que quedan
determinados por los vectores, consideramos el más pequeño de los dos; es decir, el que está entre 0 y π (Figura
1.14 lado izquierdo). Si se tienen dos vectores en R3 entonces también se tiene determinado un ángulo entre ellos:
el ángulo de menor amplitud al cual hay que girar uno de los vectores alrededor de su origen hasta que quede
superpuesto con el otro vector. Notemos que este recorrido de un vector hacia el otro en realidad sucede en el plano
que contiene a ambos (Figura 1.14 lado derecho). En general, dos vectores en cualquier espacio Rn están contenidos
en un plano, por lo cual medir ángulos de vectores de cualquier dimensión es lo mismo que medirlos en R2 .
Definición 13 Sean ~ ~ ∈ Rn no nulos. Se define el ángulo entre ~v y w
v, w ~ como el único ángulo θ entre 0 y π tal
que:
~v · w~
cos(θ) =
||~v ||||w||
~
36 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Ejemplos 14
(1,0)·(0,1)
El ángulo entre los vectores (1, 0) y (0, 1) en R2 es aquel ángulo θ entre 0 y π tal que cos(θ) = ||(1,0)||.||(0,1)||
.
π
Pero (1, 0) · (0, 1) = 0, por lo que θ = 2
. O sea, los vectores (1, 0) y (0, 1) son perpendiculares.
El ángulo entre los vectores (1, 2, 3) y (1, 0, −1) en R3 es aquel ángulo θ entre 0 y π tal que
Observación 5 Observemos cómo la expresión para hallar el ángulo entre los vectores depende únicamente
del producto escalar (pues la norma también está definida a partir del mismo). El hecho que esta fórmula,
efectivamente, calcula el ángulo entre los dos vectores es una consecuencia del Teorema del Coseno.
Como el coseno siempre es un número entre −1 y 1, uno puede deducir de la fórmula del ángulo entre dos
vectores que |~v · w|
~ ≤ ||~v ||.||w|| ~ ∈ Rn . Esta desigualdad se conoce como desigualdad
~ para cualesquiera ~v , w
de Cauchy-Schwarz.
Por otro lado, de la fórmula del ángulo entre dos vectores se deduce otra expresión para el producto escalar entre
~ ∈ Rn y θ es el ángulo entre ambos entonces:
vectores. Si ~v , w
~v · w
~ = ||~v ||||w||
~ cos(θ)
Por lo tanto, si uno tiene por datos la norma de los vectores y el ángulo entre ellos, puede calcular de manera
directa su producto escalar. Esta fórmula nos ofrece un criterio para decidir si dos vectores son perpendiculares.
π
~ ∈ R2 son perpendiculares u ortogonales si el ángulo entre ellos es
Recordemos que dos vectores ~v , w 2. Pero
como cos( π2 ) = 0, entonces deducimos de esta fórmula que ~v · w
~ = 0. Por otro lado, como el único ángulo en el
π
intervalo (0, π) que anula al coseno es 2 entonces, si ~v · w
~ = 0, quiere decir, nuevamente por la fórmula de arriba,
π
que θ = 2; o sea, ~v y w
~ son ortogonales. Por lo tanto, tenemos la siguiente definición que caracteriza a los vectores
perpendiculares.
Álgebra A. Producto escalar de vectores. 37
Ejemplos 15
Los vectores (2, −5) y (−3, −3) no son ortogonales pues (2, −5) · (−3, −3) = 9.
Los vectores (1, −2) y (4, 2) son ortogonales pues (1, −2) · (4, 2) = 0.
El vector (−1, 1, 1) es ortogonal al vector (−1, −2, 1) y también al vector (1, 1, 0).
Definimos el producto escalar entre dos vectores. Su resultado es un número real que contiene información de la
relación entre los vectores involucrados.
Interpretamos la raíz cuadrada del producto escalar de un vector con él mismo como el módulo de dicho vector.
√ p
Definimos la norma del vector ~v = (x1 , . . . , xn ) de Rn como ||~v || = ~v · ~v = x21 + · · · + x2n .
Definimos la distancia entre dos puntos P = (x1 , . . . , xn ) y Q = (y1 , . . . , yn ) en Rn como la norma del vector
p
cuyo extremo es P − Q. O sea, d(P, Q) = (x1 − y1 )2 + · · · + (xn − yn )2 .
v ·w
~ de Rn como el único ángulo θ entre 0 y π tal que cos(θ) =
Definimos el ángulo entro dos vectores ~v y w ||~
~ ~
v ||||w||
~
.
~ en Rn son ortogonales sí, y solo sí, ~v · w
Determinamos que dos vectores ~v y w ~ = 0.
2. Rectas y planos
En este capítulo utilizaremos el contenido que desarrollamos en el capítulo 1 para estudiar rectas y planos en el
espacio. La importancia de estudiar dichos objetos se debe a que, desde el punto de vista algebraico, las rectas
y los planos son casos particulares de conjuntos de vectores que tienen propiedades relevantes en relación a la
suma de vectores y al producto de un vector por un escalar. Por este motivo, a estos objetos no se los considera
simplemente un “conjuntos de puntos” sino un espacio de vectores o espacios lineales. Las propiedades de estos
espacios de vectores, que estudiaremos en más generalidad en el capítulo próximo, son la base del Álgebra Lineal.
2.1 Rectas
Las rectas son los espacios lineales más sencillos, dado que poseen una sola dirección. Si bien nos concentraremos
en rectas en el espacio, todas las definiciones son válidas para espacios n-dimensionales.
Es usual que se enseñe a describir una recta en el plano por medio de una ecuación de la forma y = mx + b, donde
m (la pendiente) y b (la ordenada) son números reales dados. Formalmente, esta ecuación está diciendo que la recta
es precisamente el conjunto {(x, y) ∈ R2 : y = mx + b}. Esta manera de describir una recta se basa, entonces, en
establecer una “relación entre las coordenadas de sus puntos”. Por ejemplo, si la ecuación de la recta es y = 3x + 2
entonces el punto (1, 5) pertenece ella, ya que 5 = 3,1 + 2.
Lo curioso es que, si no nos hubieran enseñado a describir a las rectas de esta manera, probablemente no hubiésemos
40 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
ideado este tipo de descripción. Imaginemos que estamos en una habitación en penumbras y hay un rayo láser
que la atraviesa de punta a punta en alguna dirección. ¿Cómo podemos describir la recta que determina el haz?
Supongamos que tenemos una vara de madera de 1 metro de largo y que queremos representar el haz por medio de
la vara, en el sentido que queremos ubicar la vara sobre la recta del haz. Para esto, podemos acercar la vara hasta
que corte el rayo y después “enderezarla” para que coincida con este. O mejor aún, podemos enderezar primero la
vara para que quede paralela al rayo y después, sin cambiar la dirección que tiene, desplazarla hasta superponerla
con el rayo. Esta última manera se puede se puede traducir al lenguaje de vectores: utilizamos un vector para
determinar la dirección de la recta (“enderezar la vara” para hacerla paralela al haz) y, después, utilizar otro vector
para determinar por dónde pasa la recta (“trasladar la vara” hasta que quede superpuesta con el haz). La descripción
de una recta identificando su dirección y un punto por el que pasa, se conoce como ecuación vectorial de la recta.
Para describir una recta vectorialmente, necesitamos un vector ~v que nos brinde la dirección de la recta y un vector
w
~ que traslade la recta hasta un punto por el cual queremos que pase. Recordemos que todos los múltiplos t~v de
~v (con t ∈ R) forman una recta que tiene la dirección de ~v . Esta recta pasa por el origen de coordenadas, pues el
vector ~v tiene su origen allí. Por lo tanto, esta recta es paralela a la que describiremos y solo nos resta desplazarla en
el sentido del vector w.
~
Definición 15 Una ecuación vectorial para la recta L contenida en Rn con dirección ~
v ∈ Rn y que pasa por el
punto P ∈ Rn es:
t~v + w,
~
Importante La igualdad X = t~
v+w
~ utilizada en la definición anterior debe interpretarse como “el punto X es
el extremo del vector t~v + w”.
~ Este abuso de notación aparecerá muy seguido en el texto y esta justificado desde
la identificación natural que hay entre vectores de Rn con origen en ~0 ∈ Rn y puntos de Rn .
Como planteamos, t~v es la ecuación de una recta con dirección ~v que pasa por el origen de coordenadas. Si
recordamos la interpretación de la suma de vectores, observemos que al sumar el vector w
~ a cada punto de la recta,
lo estamos trasladando en esa dirección (Figura 2.1). En particular, el ~0 va a parar al w.
~ Gráficamente, alcanza con
imaginarnos que tomamos con el pulgar y el índice la recta por el origen, la levantamos y la apoyamos en el extremo
de w,
~ sin cambiarle la dirección.
Álgebra A. Rectas. 41
Ejemplos 16
La recta L = {X ∈ R2 : X = t(1, 2) + (3, 3), t ∈ R} es una recta del plano con dirección (1, 2) que pasa por
el punto (3, 3).
La recta L0 = {X ∈ R3 : X = t(−1, 0, 3) + (−2, 2, 7), t ∈ R} es una recta con dirección (−1, 0, 3) y que
pasa por el punto (−2, 2, 7).
Recordemos que en la definición de ecuación vectorial dijimos “Una ecuación vectorial para la recta...” y no “La
ecuación vectorial para la recta...”. Esto se debe a que hay infinitas ecuaciones vectoriales que pueden describir la
misma recta. Por un lado, del vector director solo nos importa la dirección que nos provee; ademas ni su sentido, ni
su módulo alteran esta dirección. De este modo, las ecuaciones t~v + w
~ y t(5~v ) + w representan la misma recta
(aquí 5 puede ser reemplazado por cualquier número real distinto de 0). Por otro lado, el vector w
~ es trasladar la
recta de manera que el punto de la recta que, originalmente, tocaba el origen de coordenadas es “reubicado” en el
extremo de w.
~ Pero dado que una recta se extiende infinitamente en ambas direcciones, es lo mismo trasladar este
punto que toca el origen a cualquier otro punto de la recta (Figura 2.2). Por lo tanto, la elección de w
~ para desplazar
a la recta tampoco es única.
s(4, 2, −2) + (1, 3, 2), s ∈ R} y L00 = {X ∈ R3 : X = k(−6, −3, 3) + (3, 4, 1), k ∈ R} son iguales. Observen
que, si bien los vectores directores de L y L0 son distintos, uno es múltiplo del otro, por lo cual determinan la misma
dirección. Por otro lado, el vector director de L00 también es múltiplo de los vectores directores de L y L0 , por lo cual
determina la misma dirección que estas, y además pasa por el punto (3, 4, 1) que pertenece a L y L0 .
¿Cuándo un punto pertenece a una recta? Si queremos saber si el punto (3, −2) pertenece a la recta L = {X ∈
R2 : X = t(2, 1) + (5, −1), t ∈ R}, ya vimos que la interpretación geométrica de esta ecuación significa que
la recta tiene dirección (2, 1) y pasa por el punto (5, −1). ¿Cuál es su interpretación algebraica? La ecuación
X = t(2, 1) + (5, −1) establece que los puntos de la recta “son de la forma” t(2, 1) + (5, −1), para t un número
real; o, aquello que es lo mismo, son de la forma (2t + 5, t − 1) –teniendo presente las definiciones de producto de
un vector por un escalar y de suma de vectores–. Esto quiere decir que: un punto (x, y) ∈ R2 pertenece a la recta L
si y solo si existe un número real t tal que simultáneamente x = 2t + 5 e y = t − 1. Cuando queremos que dos
ecuaciones se verifiquen simultáneamente, las escribimos abarcadas por una llave “{” de la siguiente manera:
x = 2t + 5
y =t−1
3−5
Al despejar t de la primera ecuación nos queda: t = 2 = −1. Esto determina que, si existe dicho t entonces
tiene que ser el −1 (de lo contrario no se verificaría la primera ecuación). Lo que nos resta verificar es si con
t = −1 se verifica la segunda ecuación (pues buscamos un t que verifique ambas ecuaciones simultáneamente).
Pero −2 = −1 − 1, por lo cual, con t = −1 se verifican ambas ecuaciones y podemos concluir que (3, −2) ∈ L.
¿Qué sucede ahora con el punto (−1, 0)? ¿Pertenece a L? En este caso buscamos un t ∈ R tal que:
−1 = 2t + 5
0=t−1
Para que sea válida la segunda ecuación debemos tener t = 1. Pero si reemplazamos con t = 1, en la primera
ecuación obtenemos −1 = 2,1 + 5 = 7, lo cual es una contradicción (pues −1 6= 7). En este caso, no existe ningún
t ∈ R verificando ambas condiciones simultánemanete, por lo que (−1, 0) ∈
/ L.
Dados dos puntos P, Q ∈ Rn analicen cuál debe ser la dirección de la recta que pasa por ellos, por qué punto
debe pasar y si es única la escritura de suecuación vectorial.
¿Cómo se puede expresar la ecuación de una recta en R3 o Rn en general? Lo que debemos hacer es análogo a lo
que hicimos en R2 . Observen el siguiente ejemplo.
t(1, 3, −1) + (2, 5, 4), t ∈ R}. Los puntos de L son de la forma (t + 2, 3t + 5, −t + 4), por lo que (1, 2, 1) ∈ L si y
Álgebra A. Rectas. 43
Ejemplos 19
Más allá de la naturalidad de describir una recta por medio de su ecuación vectorial, en muchas ocasiones, es
conveniente tener descriptos sus puntos por medio de la relación entre sus coordenadas. En este apartado veremos
cómo describir rectas de R2 de esta forma. Para rectas en R3 debemos esperar hasta el tema intersecciones de plano.
Sabemos que en R2 una recta queda determinada por una relación de la forma y = 3x + 2. A esta ecuación podemos
escribirla de manera equivalente como −3x + y = 2 (simplemente despejamos todas las coordenadas de un lado
y dejamos los números del otro). La manera de describir una recta por medio de este tipo de ecuaciones se llama
ecuación implícita de la recta.
Definición 17 Una ecuación implícita para la recta L en R2 es una relación de la forma ax + by = c, con
a, b, c ∈ R, de manera que un punto (x, y) ∈ L si y solo si sus coordenadas verifican dicha ecuación. La relaciones
de esta forma se llaman lineales. La recta L queda definida entonces por L = {(x, y) ∈ R2 : ax + by = c}.
Ejemplos 20
Observación 6 Si bien la ecuación implícita de una recta en R2 consta de una ecuación, en dimensiones mayores
se necesita más de una ecuación para describir una recta. Por ejemplo, en R3 se necesitan dos ecuaciones para
describir una recta (veremos en el próximo apartado que una sola ecuación en R3 describe un plano, no una
recta).
¿Por qué se necesitan más ecuaciones para describir implícitamente un recta en Rn con n ≥ 3? Que un
conjunto de puntos verifiquen una ecuación es poner una restricción a esos puntos. Cuanto más restricciones
pongamos, menos será la cantidad de puntos que las verifiquen. En los espacios de vectores, una restricción
disminuye la dimensión en 1; esto quiere decir que, si ponemos una restricción (ecuación) a los puntos de
R2 (un espacio de 2 dimensiones), obtenemos un espacio que tiene una sola dimensión: una recta. Si en
cambio ponemos una restricción a los puntos de R3 (espacio de 3 dimensiones), obtenemos un espacio con 2
dimensiones: un plano. Si agregamos ahora una restricción más (2 ecuaciones en total) entonces obtenemos un
espacio de otra dimensión menos: una recta.
Una de las ventajas de tener una recta descripta en forma implícita es que verificar la pertenencia de un punto a la
recta es mucho más sencillo. Efectivamente, como la ecuación implícita es simplemente una relación que cumplen
las coordenadas de los puntos de la recta, un punto que cumpla dicha relación estará en la recta, y un punto que no la
cumpla, no. Por ejemplo, para verificar si (3, −2) pertenece a la recta L0 de ecuación x + 2y = −1, solo debemos
reemplazar x = 3 e y = −2 en dicha ecuación y ver si se verifica la igualdad. En este caso, 3 + 2.(−2) = −1,
por lo que concluimos cual (3, −2) ∈ L0 . También, (−1, 0) pertenece a L0 , ya que −1 + 2,0 = −1. Por otro lado,
/ L0 pues 1 + 2,1 = 3 6= −1.
(1, 1) ∈
Como se pudo haber notado (o sospechado), para hacer ciertas cosas es conveniente trabajar con la ecuación vectorial,
y para hacer otras, con la implícita. Por ejemplo, la ecuación vectorial es más fácil para describir geométricamente la
recta, mientras que, para chequear la pertenencia de un punto a la recta, es mejor trabajar con la ecuación implícita.
Por este motivo, es importante que sepamos cómo pasar de una a otra. Lo hacemos con un ejemplo.
Consideremos nuevamente la recta L = {X ∈ R2 : X = t(2, 1) + (5, −1), t ∈ R}. Vimos que un punto
(x, y) ∈ L si y solo si:
x = 2t + 5
y =t−1
Para escribir una ecuación implícita para L debemos hallar una relación lineal entre sus coordenadas. Aunque no
sea del todo evidente, estas ecuaciones muestran una relación lineal entre x e y; sólo que lo están haciendo por
medio de t. Es decir, nos dicen cómo depende linealmente tanto x de t como y de t. A partir de estas dependencias
de t nuestro trabajo es hallar cómo depende linealmente x de y (algo asi como “eliminar al intermediario”). Esto se
obtiene al despejar t de una ecuación y reemplazarlo en la otra. En este caso, al despejar t de la ecuación segunda,
nos queda t = y + 1; y, al reemplazar t por y + 1 en la ecuación primera, obtenemos x = 2(y + 1) + 5 = 2y + 7.
Álgebra A. Rectas. 45
Por lo tanto, despejando convenientemente, nos queda la relación lineal x − 2y = 7. Esta es la ecuación implícita
de la recta L. Es decir, L = {(x, y) ∈ R2 : x − 2y = 7}.
Ejemplo 21 Hallemos la ecuación implícita de L = {X ∈ R2 : X = t(−1, 1) + (2, 3), t ∈ R}. Los puntos de L
¿Cómo hallamos ahora la ecuación vectorial de una recta dada en forma implícita? Lo hacemos nuevamente con un
ejemplo. Supongamos que tenemos la recta L0 de ecuación x + 2y = −1. De aquí despejamos x, y obtenemos que
x = −2y − 1; es decir, si la segunda coordenada es y entonces la primera debe ser −2y − 1, para cualquier y ∈ R.
Por lo tanto, vemos que los puntos de la recta L0 son de la forma (−2y − 1, y), con y ∈ R. Tal vez hayan notado
que estamos cerca, en caso de que tengan dificultades en este punto puede cambiar la variable “y” por la variable “t”
para que sea más evidente por donde estamos yendo. Reescribiéndolo de esta forma, observamos que los puntos
de la recta L0 son de la forma (−2t − 1, t) con t ∈ R. Este vector tiene la misma forma a la que llegamos luego
de agrupar todos los términos de la ecuación vectorial dentro de un mismo vector. Por lo tanto, lo que debemos
hacer ahora es “desandar” esta expresión para escribirla como un múltiplo de un vector (el vector director) más
otro vector (que traslada la recta al punto por el que pasa). Y la manera de hacerlo es muy sencilla. En primer lugar
escribimos (−2t − 1, t) como suma de dos vectores: uno cuyas coordenadas están multiplicadas por t y otro cuyas
coordenadas son solo números. En este caso:
En segundo lugar, “sacamos” el t por fuera del primero de estos vectores de manera que (−2t, t) = t(−2, 1). Por lo
tanto, obtenemos:
(−2t − 1, t) = t(−2, 1) + (−1, 0),
y esta es una ecuación vectorial de L0 (con vector director (−2, 1) y punto de paso (−1, 0). En la expresión anterior
¿qué hubiese sucedido si despejábamos y en función de x en lugar de x en función de y? Pues en este caso,
−1−x
como y = 2 , vemos que los puntos de L son de la forma (x, −1−x
2 ) con x ∈ R. Al descomponer este vector,
observamos que:
−1 − x 1 x 1 1
x, = x, − − = x 1, − + 0, − ,
2 2 2 2 2
y obtenemos la ecuación vectorial s(1, − 21 ) + (0, − 12 ), s ∈ R. Por supuesto, esta ecuación define la misma recta
L. Notemos que los vectores directores, en ambos casos, son múltiplos uno del otro, y se puede verificar que
el punto (−1, 0) puede escribirse como s(1, − 12 ) + (0, − 12 ) (así como el punto (0, − 12 ) puede escribirse como
t(−2, 1) + (−1, 0)).
1
Ejemplo 22 Encontremos la ecuación vectorial de la recta L definida por la ecuación 3x + 2
y = −1. Al despejar y
en función de x, vemos que y = 2(−1 − 3x) = −2 − 6x. Por lo tanto, los puntos de L son de la forma (x, −2 − 6x)
con x ∈ R. Reescribiendo este vector convenientemente tenemos (x, −2 − 6x) = x(1, −6) + (0, −2). Por lo tanto,
46 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Definimos la ecuación vectorial de una recta en Rn a partir de una dirección (vector director) y de un punto de paso
(un vector que traslada la recta al dicho punto).
Aprendimos cómo determinar que dos rectas sean paralelas o perpendiculares en función de los vectores directores de
sus ecuaciones vectoriales.
Definimos la ecuación implícita de una recta en R2 como una relación lineal entre las coordenadas de los puntos de la
recta. Esta relación determina completamente cuáles puntos forman parte de la recta y cuáles no.
Estudiamos cómo determinar cuándo un punto pertenecía a una recta y cómo pasar de la ecuación vectorial a la
implícita, y viceversa.
Álgebra A. Planos. 47
2.2 Planos
En este apartado se estudiarán planos en el espacio. ¿Cuál es la diferencia fundamental entre un plano y una recta?
Seguramente, ningún estudiante tendrá problema en distinguir entre ambos conceptos, pero contestar esta pregunta
podría requerir tiempo para pensar su respuesta. La diferencia fundamental entre un plano y una recta es que una
recta solo “contiene” una dirección, mientras que el plano contiene infinitas. Gráficamente, si estamos parados
en un punto de una recta y nos queremos desplazar sobre ella, solo tenemos dos opciones: ir a la derecha o ir a
la izquierda (de donde estamos). En cambio, si estamos en un plano, podemos movernos en cualquier dirección:
derecha, izquierda, adelante, atrás o una combinación de las anteriores (por ejemplo, dos pasos a la derecha y 3
pasos hacia atrás). Pero, ¿es posible sobre un plano movernos en cualquier dirección? En realidad, no. Porque, por
ejemplo, no podemos movernos hacia arriba (nos iríamos del plano). Mientras que en el espacio, sí tenemos esta
posibilidad (derecha, izquierda, adelante, atrás, arriba y abajo).
¿Qué es entonces lo que diferencia la recta, el plano y el espacio? Los grados de libertad; es decir, la cantidad
de direcciones independientes en las que nos podemos mover. La recta tiene un solo grado de libertad, pues solo
tenemos una dirección en la cual movernos (depende el sentido que escojamos será a la derecha o a la izquierda). El
plano tiene dos grados de libertad, ya que además de derecha-izquierda podemos movernos adelante-atrás. ¿Qué
sucede con los movimientos en diagonal? Como mencionamos anteriormente, son combinación de movimientos en
la dirección derecha-izquierda y adelante-atrás, por lo cual no son nuevos grados de libertad: no son independientes
de derecha-izquierda y adelante-atrás. Por supuesto, el espacio tiene tres grados de libertad.
El concepto que hay detras del procedimiento para formar una ecuación vectorial para un plano es la misma que
para la recta. Para describir un plano, primero determinamos su “inclinación” y después lo trasladamos hasta el
punto por donde esperamos que pase. En el caso de las rectas, usamos un vector que nos dé la dirección de la recta.
En el caso de los planos, necesitamos dos vectores (que no sean múltiplos) para dar la inclinación del plano. Desde
el punto de vista geométrico, al elegir dos vectores que no son múltiplos queda determinado un único plano que
contiene a ambos (Figura 2.3). Desde el punto de vista algebraico, elegir dos vectores representa determinar en qué
dirección serán los grados de libertad que tiene ese plano. Por ejemplo, el plano xy tiene sus grados de libertad en el
eje x y el eje y (y, por lo tanto, podemos movernos en las infinitas combinaciones de movimientos sobre el eje x y
el eje y). Como el eje x consta de todos los múltiplos de (1, 0, 0) y el eje y del (0, 1, 0) entonces podemos pensar
a estos vectores como directores del plano xy. Si bien estos vectores son perpendiculares, esto no es, en general,
necesario. Por ejemplo, los vectores (1, 2, 0) y (−1, 1, 0) también determinan el plano xy.
48 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Definición 18 Una ecuación vectorial del plano Π contenido en Rn con vectores directores ~ ~ ∈ Rn y que
v, w
pasa por el punto P ∈ Rn es:
L : t~v + sw
~ + ~u,
donde ~u ∈ Rn es el vector de extremo P y t, s ∈ R. Una ecuación vectorial para el plano Π permite describir los
puntos del plano, y lo hacemos de la siguiente manera:
Π = {X ∈ R3 : X = t~v + sw
~ + ~u, t, s ∈ R}.
Ejemplos 23
La ecuación t(1, 1, 2) + s(−1, 3, 7) + (2, 0, 0) con t, s ∈ R determina un plano de vectores directores (1, 1, 2)
y (−1, 3 − 7) y que pasa por el punto (2, 0, 0).
La ecuación t(−1, 5, 2) + s(2, −10, −4) + (1, 1, 3) con t, s ∈ R no es la ecuación vectorial de un plano ya que
(2, −10, −4) = −2(−1, 5, 2); es decir, los vectores directores son múltiplos y, por lo tanto, no determinan dos
grados de libertad. En este caso, esta ecuación describe los puntos de una recta de vector director (−1, 5, 2) que
pasa por el punto (1, 1, 3). Además describe a dicha recta de manera redundante, ya que sabemos que podemos
utilizar un único vector director para hacerlo.
Al igual que con las rectas, un plano posee infinitas ecuaciones vectoriales; pero en este caso, la variedad de
ecuaciones que uno puede construir es mucho mayor. Realicen el siguiente experimento.
Observación 7 Vemos como resultado del Experimento 7 que, a diferencia del caso de las rectas, en el que los
vectores directores de distintas ecuaciones vectoriales resultan múltiplos entre sí, ahora los vectores directores
de dos ecuaciones vectoriales del plano pueden no estar relacionados de una manera tan directa.
De la primera ecuación despejamos t = −1. Al reemplazar en la segunda ecuación y al despejar s, nos queda s = 0.
Finalmente, al reemplazar por t = −1 y s = 0 en la última ecuación se tiene, −2 = −2, lo cual es correcto. Por lo
tanto, (1, 3, −2) ∈ Π, ya que hallamos t, s ∈ R que verifican las ecuaciones de arriba, simultáneamente.
Cómo comentamos en la observación de la página 44, un plano se puede describir a través de una única ecuación
que relacione linealmente sus coordenadas.
Definición 19 Una ecuación implícita para el plano Π en R3 es una relación lineal ax + by + cz = d con
a, b, c, d ∈ R de manera que un punto (x, y, z) ∈ Π si y solo si sus coordenadas verifican dicha ecuación. Lo
notamos Π = {(x, y, z) ∈ R3 : ax + by + cz = d}.
50 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Ejemplos 24
El plano xy tiene por ecuación implícita la ecuación z = 0. Observemos que la característica que tienen en
común los puntos de dicho plano es, precisamente, que la cooordenada z es nula.
El plano cuyos vectores directores son (1, 0, 1) y (1, 1, 0), tiene ecuación implícita x − y − z = 0.
Comprobar la pertenencia de puntos a un plano descripto por una ecuación implícita es también más sencillo que si
viene dado por una ecuación vectorial, ya que solo debemos corroborar que se verifique la ecuación. Por ejemplo, si
Π = {(x, y, z) ∈ R3 : 2x − 3z = −7}, entonces (1, 2, 3) ∈ Π, pues 2,1 − 3,3 = −7. Por otro lado, (1, 0, 0) ∈
/Π
pues 2,1 − 3,0 = 2 6= −7.
El procedimiento es el mismo que para las rectas, solo que se suma una variable más con la cual debemos
trabajar. Tomemos un ejemplo, considerando de nuevo el plano Π = {X ∈ R3 : X = t(1, 2, 1) + s(0, 1, −1) +
(2, 5, −1), t, s ∈ R}. En el mismo, vimos que un punto (x, y, z) estaba en Π si y solo si:
x=t+2
y = 2t + s + 5
z =t−s−1
Al igual que en el caso de las rectas, estas ecuaciones brindan una relación lineal entre las variables x, y, z, solo
que lo están haciendo por medio de s y t. Nuestro objetivo, entonces, es desenmascarar esta relación quitando s y
t, Al despejar t y s en función de nuestras coordenadas. Por ejemplo, de la primera ecuación despejamos t y nos
queda t = x − 2. En la segunda ecuación, al reemplazar este nuevo dato, nos queda y = 2(x − 2) + s + 5, de
donde despejamos s, y obtenemos s = y − 2x − 1. Una vez despejadas s y t en función de las coordenadas, solo
nos resta reemplazar estos datos en la última ecuación para obtener z = (x − 2) − (y − 2x − 1) − 1, a partir de
la cual conseguimos la ecuación z = 3x − y − 2. Al agrupar para que quede en forma implícita, hallamos que
Π = {(x, y, z) ∈ R3 : −3x + y + z = −2}.
Ejemplos 25
Consideremos el plano Π = {X ∈ R3 : X = t(1, 0, 1) + s(−2, 2, 3) + (1, −3, −1), t, s ∈ R}. Entonces, los
puntos (x, y, z) ∈ Π verifican las siguientes relaciones:
x = t − 2s + 1
y = 2s − 3
z = t + 3s − 1
En la primera ecuación obtenemos t = x + 2s. Luego, al reemplazaar esta última igualdad en la segunda y
tercera ecuación, resulta y = 2(x + 2s) − 4s = 2x y z = −(x + 2s) + 2s + 1 = −x + 1, respectivamente. En
este caso, tenemos las siguientes dos ecuaciones:
y = 2x
z = −x + 1
Observemos que estas dos ecuaciones no pueden reducirse a una sola pues tanto y como z dependen de x de
manera independiente. Si quisiéramos despejar x de la primera ecuación y reemplazarla en la segunda, de manera
y
de quedarnos solo con la ecuación z = 2
+ 1, entonces estaríamos perdiendo información, ya que sabríamos
cómo depende z de y pero ignoraríamos cómo depende y de x. Por lo tanto, las dos ecuaciones son independientes
y no pueden reducirse a una sola.
¿Cómo hallamos ahora la ecuación vectorial de un plano dado en forma implícita? Lo hacemos con un ejemplo.
Supongamos que tenemos el plano Π0 = {(x, y, z) ∈ R3 : x + 2y − z = −1}. De aquí obtenemos que
x = −2y + z − 1. Es decir, la ecuación nos indica que, dados y, z ∈ R, el punto (x, y, z) ∈ Π0 si y solo si
x = −2y + z − 1. Por lo tanto, los puntos del plano Π0 son de la forma (−2y + z − 1, y, z) con y, z ∈ R.
Nuevamente, debemos “descomponer” este vector para escribirlo como un múltiplo de un vector director, más un
múltiplo de otro vector director, más otro vector que indica el punto por el que pasa. En primer lugar escribimos
(−2y + z − 1, y, z) como suma de tres vectores: uno cuyas coordenadas están multiplicadas por y, otro cuyas
coordenadas estén multiplicadas por z y otro cuyas coordenadas son solo números. En este caso:
Luego, “sacamos” y por fuera del primero de estos vectores y z por fuera del segundo y, de esta manera, obtenemos:
la cual es una ecuación vectorial para Π0 . Así mismo, podemos reemplazar las variables y y z en esta expresión para
escribir Π0 = {X ∈ R3 : X = t(−2, 1, 0) + s(1, 0, 1) + (−1, 0, 0), t, s ∈ R}.
Estudien cómo se modifica la ecuación del plano si en vez de comenzar despejando la variable x se hubiese
despejado la variable y o la z.
variable z de esta última ecuación y obtenemos z = 3x − 7y. Así, un punto (x, y, z) pertenece a Π si y solo si verifica
que (x, y, z) = (x, y, 3x − 7y) = (x, 0, 3x) + (0, y, −7y) = x(1, 0, 3) + y(0, 1, −7). De esta forma, obtenemos la
ecuación implícita t(1, 0, 3) + s(0, 1, −7) para Π.
Los planos admiten otra forma de descripción, además, de la ecuación vectorial y la implícita, esta es: la ecuación
normal que desarrollaremos en el próximo apartado.
52 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Definimos la ecuación vectorial del plano en R3 a partir de dos direcciones distintas (vectores directores) y un punto
de paso (un vector que traslada el plano a dicho punto).
Definimos la ecuación implícita de un plano en R3 como una relación lineal entre las coordenadas de los puntos del
plano. Esta relación determina completamente cuáles puntos forman parte del plano y cuáles no.
Estudiamos cómo determinar cuando un punto pertenece a un plano y cómo pasar de la ecuación vectorial a la
implícita, y viceversa.
Veamos otra forma vectorial de describir un plano: la ecuación normal. En este caso, necesitaremos utilizar nuestra
herramienta de medición introducida en el capítulo anterior: el producto escalar.
Primero veamos una analogía, imaginemos que tenemos una placa plana de vidrio con una sopapa (un palo con
ventosa) pegada a (Figura 2.5 lado izquierdo). Supongamos que la placa es “infinita”, de manera que podemos
pensarla como un plano de R3 . Todos los puntos de la placa tienen una propiedad en común respecto de la sopapa:
si pensamos que el lugar donde la sopapa está pegada a la placa es el origen de coordenadas, entonces cada punto de
la placa (visto como el extremo de un vector), es perpendicular al vector determinado por la sopapa (Figura 2.5 lado
derecho). De hecho, esta propiedad es definitoria del plano, en el sentido que un punto está en la placa si y solo si es
perpendicular a la ventosa. Es decir, podemos describir (el plano dado por) la placa como “el conjunto formado
por todos los puntos perpendiculares (al vector dado por) la sopapa”. ¿Cómo escribir esta propiedad formalmente?
Sabemos que dos vectores son perpendiculares si su producto escalar es 0. Si llamamos Π al plano determinado por
~ al vector determinado por la sopapa, entonces escribimos:
la placa y N
~ ·X
Π = {X ∈ R3 : N ~ = 0}.
~ que es perpendicular al plano se llama una normal del plano. La forma de describir un plano como el
Un vector N
conjunto de vectores ortogonales a una dirección normal dada, se llama la ecuación normal del plano y se sintetiza
~ ·X
escribiendo N ~ = 0, donde X ∈ R3 . Esta ecuación está diciendo “considero los X ∈ R3 que son perpendiculares
~ ”.
aN
En nuestra deducción de la ecuación normal del plano motivada por la analogía anterior, hemos asumido en un
momento que la intersección entre la placa y la sopapa justamente sucedía en el origen de coordenadas. ¿Qué
sucede si tenemos un plano que no pasa por el origen de coordenadas? En este caso, no es verdad que el plano sea
el conjunto de puntos perpendiculares a un vector normal a él. Esto sucede ya que la perpendicularidad se mide
por medio del producto escalar de vectores, y las propiedades de dicho producto valen para vectores con origen en
(0, 0, 0) ∈ R3 . Una manera de resolver esto consiste en trasladar el plano hasta que pase por el origen (esto no altera
la inclinación del plano ni la de la normal) y así, entonces, plantear la ecuación normal para planos que introdujimos.
Si Π0 es ahora un plano que no pasa por el origen, digamos que pasa por un punto P 6= ~0, entonces se puede
trasladar el plano Π0 al origen desplazándolo por medio del vector −P~ (Figura 2.6). Los puntos de este nuevo plano
~ es una normal de Π0 , la frase “el plano Π0
trasladado son de la forma X − P , donde X ∈ Π0 . Por lo tanto, si N
~ ”, se puede
es el conjunto de puntos de R3 tales que, luego de trasladar Π0 al origen, resultan perpendiculares a N
expresar de la siguiente manera:
~ · (X
Π0 = {X ∈ R3 : N ~ − P~ ) = 0}.
~ · (X
En este caso, lo que se conoce como ecuación normal del plano es la fórmula N ~ − P~ ) = 0. Cuando P = ~0,
obtenemos la ecuación normal del plano por el origen que vimos antes. Estonos lleva a la siguiente definición:
Definición 20 Una ecuación normal de un plano Π es:
~ · (X
N ~ − P~ ) = 0,
~ es una normal del plano (un vector perpendicular a él) y P es un punto de Π (cualquiera).
donde N
Ejemplos 27
El plano xy consta de todos los puntos que son perpendiculares al eje z. Por lo tanto, podemos pensar que son los
puntos (x, y, z) que verifican que (x, y, z) · (0, 0, 1) = 0.
| {z }
~
N
El plano Π = {X ∈ R3 : X = t(1, 0, 1) + s(1, 1, 0) + (1, 2, 0), t, s ∈ R} al trasladarlo al origen (por ejemplo,
54 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
por medio del vector −(1, 2, 0)) es el plano = {X ∈ R3 : X = t(1, 0, 1) + s(1, 1, 0), t, s ∈ R}. Es fácil
ver que el vector (−1, 1, 1) es perpendicular a los vectores (1, 0, 1) y (1, 1, 0) simultáneamente y, por lo tanto,
a todos los puntos del plano trasladado al origen Π − (1, 2, 0). Así, el vector (−1, 1, 1) resulta ser un vector
normal de dicho plano. Por lo tanto, una ecuación normal para Π es (−1, 1, 1) · ((x, y, z) − (1, 2, 0)) = 0.
¿Cuándo son dos planos paralelos?¿Cuándo es un plano perpendicular a una recta? La noción de “normal de un
plano” nos ofrece una manera muy sencilla de contestar estas preguntas. El estudiante podrá interpretar gráficamente
estas definiciones.
Definición 21 Dos planos Π y Π0 son paralelos si sus vectores normales son múltiplos uno del otro. Un plano Π
¡La ecuación normal y la ecuación implícita son lo mismo! Anteriormente cuando hablamos de la ecuación implícita
del plano, la presentamos como una manera de describir los puntos del espacio que verifican ciertas restricciones
(ecuaciones). Pero ahora podemos ver que, en realidad, la ecuación implícita de un plano se desprende precisamente
~ · (X
de la ecuación normal. En efecto, solo basta reescribir la ecuación N ~ − P~ ) = 0 en toda su extensión. Es decir,
~ = (a, b, c), un punto genérico X = (x, y, z) y un punto fijo del
si para un plano Π escribimos su vector normal N
plano P = (α, β, γ) entonces, teniendo en cuenta la definición de producto escalar, la ecuación normal del plano se
convierte en:
(a, b, c) · ((x, y, z) − (α, β, γ)) = 0,
En esta última ecuación, aα + bβ + cγ es simplemente un número real, por lo que ¡obtenemos una ecuación implícita
para el plano!
Observación 8 Veamos que los coeficientes que acompañanan a las coordenadas x, y, z en una ecuación
implícita del plano son siempre las coordenadas de una normal de dicho plano.
Ejemplos 28
Consideremos el primer ítem de los Ejemplos 27. Vimos que la ecuación normal del plano xy es (x, y, z) ·
(0, 0, 1) = 0. al desarrollar el producto escalar obtenemos que x · 0 + y · 0 + z · 1 = 0. Es decir, hallamos la
ecuación implícita z = 0 para el plano xy.
En el segundo ítem de los Ejemplos 27, una ecuación normal para Π era (−1, 1, 1) · ((x, y, z) − (1, 2, 0)) = 0.
Nuevamente, si hacemos el producto escalar, obtenemos que (−1, 1, 1) · ((x, y, z) − (1, 2, 0)) = (−1, 1, 1) ·
(x − 1, y − 2, z) = −x + 1 + y − 2 + z = 0. Luego obtenemos la ecuación implícita −x + y + z = 1 para Π.
Entonces la ecuación normal del plano nos provee una manera de interpretar geométricamente la ecuación implícita
de un plano. Recuperar la normal de un plano y su ecuación normal, a partir de una ecuación implícita, es sencillo. En
efecto, supongamos por ejemplo que tenemos el plano Π = {(x, y, z) ∈ R3 : 3x + 2y − z = 4}. Inmediatamente
~ = (3, 2, −1), por la Observación 8. Además, como 4 debe coincidir con −N
hallamos que N ~ · P entonces:
de donde 3α + 2β − γ = 4. Es decir, P debe ser un punto que verifica esta ecuación; por ejemplo: P = (0, 1, −2).
Álgebra A. La ecuación normal de un plano. 55
Observación 9 Observen que tuvimos mucha libertad al elegir el punto P (podíamos elegir cualquiera cuyas
coordenadas verificaran la ecuación dada). Esto se debe a que en la ecuación normal de un plano, el punto P
puede ser tomado como cualquier punto del plano, ya que el objetivo es trasladar el plano al origen y no nos
importa de qué manera (Figura 2.7).
Figura 2.7: Diferentes maneras de trasladar un plano desde el origen para obtener el mismo plano.
La ecuación implícita de un plano se puede deducir a partir de su ecuación normal. La misma permite describir
al plano como un conjunto de puntos perpendiculares a una dirección. Deduzcan, a partir de esta premisa, la
ecuación de una recta en R2 y comprueben que toda recta en el plano que pasa por el origen de coordenadas
puede describirse como el conjunto de los puntos perpendiculares a una dirección perpendicular a ella.
A esta altura, ya hemos notado que es conveniente calcular la normal de un plano (pues a partir de ella encontramos
una descripción muy sencilla del mismo). Si el plano está dado en forma vectorial, entonces la normal es un vector
que es perpendicular al plano que los vectores directores generan (y que pasa por el origen). En particular, es
ortogonal a los dos vectores directores simultáneamente. En esta apartado, introduciremos una herramienta para
hallar un vector de R3 que sea perpendicular a otros dos vectores dados. Esto es, si ~v , w
~ ∈ R3 no son paralelos,
entonces definiremos otro vector ~u ∈ R3 , llamado el producto vectorial entre ~v y w,
~ cuya propiedad principal es
que es perpendicular tanto a ~v como a w.
~ Esto nos permitirá calcular automáticamente la normal de un plano dado
en forma vectorial. A diferencia de las demás operaciones entre vectores, el producto vectorial sólo está definido
para vectores de R3 .
Definición 22 Sean ~ ~ ∈ R3 . El producto vectorial entre los vectores ~v = (x1 , x2 , x3 ) y w
v, w ~ = (y1 , y2 , y3 ), es
el vector ~u ∈ R3 definido por:
~u = (x2 y3 − x3 y2 , x3 y1 − x1 y3 , x1 y2 − x2 y1 ).
Se nota ~u = ~v × w.
~
Por ejemplo, (1, 2, 0) × (−1, 3, −2) = (2.(−2) − 0,3, 0.(−1) − 1.(−2), 1,3 − 2.(−1)) = (−4, 2, 5). Si ahora
chequeamos la ortogonalidad de este vector con los originales encontramos que:
56 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
(1, 2, 0) · (−4, 2, 5) = −4 + 4 + 0 = 0 y
(−1, 3, −2) · (−4, 2, 5) = 4 + 6 − 10 = 0,
Se verifica que, efectivamente, el nuevo vector hallado es perpendicular a los dos originales: la propiedad fundamental
del producto vectorial.
Es claro que la fórmula que define el producto vectorial es algo complicada, y tratar de memorizar qué término va
en cada lugar parece una pérdida de tiempo. Por esta razon, proporcionamos la siguiente “regla” para recordar cómo
formar el producto vectorial. Esta regla se basa en un “movimiento” que aparecerá muchas veces en la teoría (por lo
cual es una buena idea ir introduciéndolo). El movimiento puede verse en la Figura 2.8:
- - -
Figura 2.9: Cálculo del producto vectorial entre (1, 2, 0) y (6, 3, 5).
Ahora que pudimos interpretar la ecuación implícita de un plano a partir de su ecuación normal, y teniendo a mano
la noción de producto vectorial de vectores, tenemos una forma mucho más sencilla y directa de pasar de la ecuación
Álgebra A. Intersección de subespacios de R3 . 57
Luego:
~ del plano Π0 y algún punto P por el que pase dicho plano (hay muchos).
Hallen la normal N
~ (hay muchos).
Encuentren (“a ojo” o haciendo una cuenta) algún vector ~v ortogonal a N
Usen el producto vectorial para hallar un vector w ~ y a ~v simultáneamente.
~ ortogonal a N
~ × ~v y el vector de extremo P .
Formen la ecuación vectorial de Π0 con vectores directores ~v y N
Observación 10 Tengamos en cuenta que, en este último experimento, los vectores directores hallados son
ortogonales. Por supuesto, esto no es un requerimiento para una ecuación vectorial del plano, aunque es muchas
veces preferible que las direcciones tengan esta propiedad. De todas maneras, al calcular la ecuación vectorial
de esta forma (utilizando el producto vectorial), lo que intentamos hacer es mecanizar el procedimiento.
El nombre espacio lineal proviene de que estos espacios tienen la propiedad que, cada vez que dos puntos
pertenecen al espacio, entonces la (única) recta que pasa por ellos también pertenece a dicho espacio. El
lector interesado puede comprobar este hecho de manera directa utilizando ecuaciones vectoriales de las rectas
(repasen lo escrito en la sección “Para pensar.” de la página 42).
Definimos la ecuación normal del plano que permite describirlo como todos los puntos perpendiculares a una dirección
dada. A partir de esta ecuación, obtenemos inmediatamente la ecuación implícita del plano.
Definimos el producto vectorial entre vectores de R3 , cuyo resultado es un vector de R3 perpendicular a los vectores
originales, simultáneamente.
Interpreten que la intersección de subespacios lineales es nuevamente un espacio lineal, a partir de la propiedad
que poseen los espacios lineales: si dos puntos pertenecen al espacio entonces toda recta que los atraviesa
también.
58 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Sabemos que existen tres posibles resultados al buscar la intersección de dos planos:
1. se “atraviesan” a lo largo de una recta,
2. no se intersecan (pues son paralelos) o
3. son el mismo plano (y su intersección es el mismo único plano).
Estas posibilidades pueden verse en la Figura 2.10. Vamos a estudiar cómo hallar la intersección en cada uno de
estos planos según como aparezcan descriptos.
Intersección de planos dados en forma implícita La manera más sencilla de calcular la intersección de dos planos es
si ambos vienen descriptos por su ecuación implícita.1 Supongamos que tenemos los planos Π = {(x, y, z) ∈ R3 :
2x − 3y + 2z = 2} y Π0 = {(x, y, z) ∈ R3 : x − 2y − z = 0}. La interpretación de los puntos de la intersección
entre ambos es directa: si los puntos de Π son los (x, y, z) ∈ R3 que verifican 2x − 3y + 2z = 2 y los de Π0 los
que verifican x − 2y − z = 0, entonces, para estar en ambos planos, deben corroborarse ambas ecuaciones a la vez.
Es decir, buscamos los (x, y, z) ∈ R3 tales que:
2x − 3y + 2z = 2
x − 2y − z = 0
Entonces, ¿cuáles son los puntos en Π ∩ Π0 ? Como mencionamos anteriormente, sabemos que dicha intersección
tiene tres posibles formas de concretarse, o bien formarán una recta, o bien serán el mismo plano, o bien no habrá
ninguno punto en común entre los dos planos. La manera de resolver estas ecuaciones simultáneas es la misma que
ya utilizamos anteriormente para resolver otras situaciones análogas. El objetivo es despejar una variable en una
ecuación y, luego, reemplazarla en la otra (cuál y de qué ecuación, es indistinto). En este caso, podemos despejar
x de la segunda ecuación y obtener x = 2y + z. Al reemplazar x por 2y + z en la primera ecuación, obtenemos
2(2y + z) − 3y + 2z = 2; o lo que es lo mismo: y + 4z = 2. De esta última ecuación, despejamos de nuevo una
variable en función de la otra (esta ecuación solo tiene las variables y y z). Por ejemplo, y = 2 − 4z. Con esto,
1 Esto será evidente cuando estudiemos la resolución de sistemas de ecuaciones lineales en la segunda parte del libro.
Álgebra A. Intersección de subespacios de R3 . 59
observamos que y depende de z (y solo de z). ¿Qué sucede con x? Ya habíamos visto que x = 2y + z; pero ahora
tenemos más información que cuando despejamos x: sabemos que y = 2 − 4z. Por lo tanto, reemplazamos y por
este valor en la ecuación x = 2y + z para hallar: x = 2(2 − 4z) + z = 4 − 7z. De esta manera, vemos que x
también depende solo de z. Lo que hemos hallado, entonces, es que se verifica:
x = 4 − 7z
y = 2 − 4z
Es decir que los puntos en Π ∩ Π0 son de la forma (4 − 7z, 2 − 4z, z) para z ∈ R cualquiera. Ahora, desarmamos
el vector como ya hicimos anteriormente: escribiéndolo como suma de un vector con todas sus coordenadas
multiplicadas por z y otro con solo números:
¡Esta es precisamente la ecuación vectorial de una recta en R3 ! Su vector director es (−7, −4, 1) y su punto de
paso el (4, 2, 0). Esto nos indica que los planos Π y Π0 se intersecan efectivamente y que la recta encontrada está
compuesta por los puntos que están en ambos planos. Este es el resultado que debemos esperar siempre que los
planos no sean paralelos.
En el ejemplo anterior, al resolver el sistema de dos ecuaciones lineales simultáneas, se obtuvieron dos
ecuaciones en las que tanto x como y dependen del valor de z. Analicen cómo se modifica esta solución si se le
agrega una tercera ecuación al sistema.
Estamos en condiciones de explicar cómo es una ecuación implícita de una recta en R3 . Ya mencionamos que
necesitamos dos ecuaciones; ¡y estas son precisamente las ecuaciones de dos planos dados en forma implícita
cuya intersección es dicha recta! En efecto, si retomamos el primer ejemplo de la carilla 54, vemos que si
Π = {(x, y, z) ∈ R3 : 2x − 3y + 2z = 2} y Π0 = {(x, y, z) ∈ R3 : x − 2y − z = 0}, entonces su intersección
era la recta L = {X ∈ R3 : X = t(−7, −4, 1) + (4, 2, 0), t ∈ R}. Y los puntos de L eran precisamente los que
satisfacían las ecuaciones de los dos planos simultáneamente. Este sistema de dos ecuaciones simultáneas es lo que
llamaremos una ecuación implícita para la recta L. Se expresa de la siguiente manera:
2x − 3y + 2z = 2
L:
x − 2y − z = 0
Como sabemos, las ecuaciones implícitas no son únicas y uno tiene, en general, libertad para elegir qué planos
“intersecar” para determinar la ecuación implícita. Por ejemplo, la recta recién descripta también se podría obtener
como intersección de los planos 5x − 7y + 7z = 6 y 21x − 44y − 29z = −4, con lo cual otra ecuación implícita
para dicha recta es:
5x − 7y + 7z = 6
L:
21x + 44y + 29z = 172
Ejemplo 29 Veamos cómo podemos hacer para encontrar esta segunda ecuación implícita para la recta L = {X ∈
3
R : X = t(−7, −4, 1) + (4, 2, 0), t ∈ R}. Tenemos que encontrar dos planos (distintos) que contengan a dicha
recta simultáneamente. En primer lugar, para asegurarnos de que un plano contenga a L, tomamos como uno de los
vectores directores del mismo a un vector director de L (por ejemplo, al (−7, −4, 1)) y pedimos que dicho plano
contenga a un punto cualquiera de la recta (por ejemplo, el (4, 2, 0)). Un posible plano es Π1 = {X ∈ R3 : X =
t(−7, −4, 1) + s(0, 1, 1) + (4, 2, 0), t, s ∈ R}. Notemos que el vector (0, 1, 1) fue elegido arbitrariamente con la
única condición de que no sea múltiplo de (−7, −4, 1). La ecuación implícita Π es 5x − 7y + 7z = 6. En segundo
lugar, el otro plano que necesitamos lo construimos de la misma manera, pero teniendo en cuenta que no es posible
definir el mismo primer plano que ya contruimos. Es decir, debemos asegurarnos que el segundo vector director que
elegimos no determine el mismo plano Π. Una manera de hacerlo de forma segura, es tomando un vector perpendicular
al (−7, −4, 1) y al (0, 1, 1), al mismo tiempo; por ejemplo, el producto vectorial (−7, −4, 1) × (0, 1, 1) = (−5, 7, −7).
En este caso, obtenemos el plano de ecuación vectorial t(−7, −4, 1) + s(−5, 7, −7) + (4, 2, 0). Al calcular su ecuación
implícita, se obtiene 21x − 44y − 29z = −4. Por lo tanto, como queríamos mostrar:
5x − 7y + 7z = 6
L:
21x − 44y − 29z = −4
Ahora, si bien aquí hemos hallado una ecuación implícita para L por medio de dos planos perpendiculares que se
cortan en L, en general, esto no es necesario. De igual manera, podíamos haber construido un segundo plano que no
sea perpendicular al primero, eligiendo de manera arbitraria el segundo vector director. Si la casualidad es tal que
esta elección en realidad nos devuelve el mismo plano Π, entonces solo debemos volver a sugerir otro vector director
(esperando que la nueva elección no determine el mismo plano otra vez).
¿Cómo calcular la intersección si uno de los planos está dado en forma vectorial? Supongamos ahora que tenemos
los planos Π = {(x, y, z) ∈ R3 : 2x − 3y + 2z = 2} y Π0 = {X ∈ R3 : X = t(2, 1, 0) + s(2, 2, −2) +
(0, −1, 2), t, s ∈ R} y queremos encontrar Π ∩ Π0 . Ya conocemos una manera de resolver esto: hallamos la
ecuación implícita del plano Π0 y, luego, calculamos la intersección como explicamos al comienzo del capítulo.
Pero, ¿si no queremos calcular la ecuación implícita de Π0 ? Como lo venimos haciendo, lo único que debemos tener
Álgebra A. Intersección de subespacios de R3 . 61
presente es qué nos están diciendo estas formas de representar los planos: la ecuación implícita nos impone una
relación que deben verificar las coordenadas de los puntos del plano, mientras que la ecuación vectorial nos dice
“qué forma tienen los puntos del plano”. Recordando lo que hicimos en el apartado anterior (2.3), los puntos de Π0
son de la forma (2t + 2s, t + 2s − 1, −2s + 2) con t, s ∈ R. Por lo tanto, los puntos en Π ∩ Π0 deben ser de esta
forma y, además, sus coordenadas x, y, z deben verificar 2x − 3y + 2z = 2. Pero la forma que tienen los puntos de
Π0 indican precisamente que la coordenada x es de la forma 2t + 2s, la y de la forma t + 2s − 1 y la z de la forma
−2s + 2. Por lo tanto, pedir que estas coordenadas verifiquen la ecuación implícita de Π es pedir que:
Si desarrollamos esta ecuación, obtenemos t−6s+7 = 2, a partir de lo cual tenemos t = 6s−5. Lo que sucedió aquí
es que, originalmente, en la ecuación dada por la forma vectorial de Π0 , las variables s y t eran independientes, en el
sentido que no dependía una de otra. Pero al pedir a los puntos de Π0 que además verifiquen la ecuación implícita de
Π, hemos descubierto que ahora las variables s y t ya no pueden ser independientes: deben estar relacionadas por
una ecuación. En conclusión, de todos los puntos de Π0 (que son de la forma (2t + 2s, t + 2s − 1, −2s + 2)), los que
además están en Π son los que verifican t = 6s − 5. Por lo tanto, los puntos de Π ∩ Π0 son los puntos de la forma:
Ahora ya sabemos qué hacer en este caso: reescribimos este vector convenientemente como:
¿Cómo calcular la intersección si ambos planos están dados en forma vectorial? En esta instancia, ya sabemos cómo
encarar este problema. Lo resolvemos con un ejemplo sin ahondar mucho en detalles. Si Π = {X ∈ R3 : X =
t(1, 0, −1) + s(0, 1, 1) + (0, 0, 3), t, s ∈ R} y Π0 = {X ∈ R3 : X = k(1, 0, 0) + l(0, 1, −2) + (1, 0, 1), k, l ∈ R},
entonces los puntos de Π son de la forma (t, s, −t+s+3) para algún s, t ∈ R y los de Π0 de la forma (k+1, l, −2l+1)
para algunos k, l ∈ R. Por lo tanto, los puntos que estén en ambos planos a la vez deben ser de ambas formas a la
vez. Esto es, deben existir s, t, k, l ∈ R tales que (t, s, −t + s + 3) = (k + 1, l, −2l + 1). De aquí, obtenemos el
siguiente sistema de ecuaciones:
t=k+1
L: s=l
−t + s + 3 = −2l + 1
62 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
¿Cómo calcular la intersección de un plano y una recta en R3 ? Sabemos que las posibilidades son:
1. la recta interseca al plano en un punto (y la intersección es ese único punto),
2. la recta es paralela al plano (y la intersección es vacía) o
3. la recta está contenida dentro del plano (y la intersección es exactamente toda la recta).
Estas opciones pueden verse en la Figura 2.11. Nuevamente, analizamos en cada caso dependiendo de como estén
descriptos el plano y la recta. Como los desarrollos son análogos a los que hicimos en el apartado anterior, (2.4.1),
solo mostraremos con ejemplos la resolución, sin hacer mucho hincapié en los detalles.
Otra vez, la manera más simple de calcular intersecciones de subespacios es cuando estos vienen dados por
ecuaciones implícitas: solo debemos juntar sus ecuaciones. Supogamos, entonces, que tenemos el plano Π =
{(x, y, z) ∈ R3 : 2x − 3y + 2z = 2} y la recta cuyas ecuaciones implícitas son:
x + y − 2z = 0
2x − 4y = 1
Ahora, resolveremos este sistema de ecuaciones simultáneas. De la segunda ecuación podemos despejar x para
hallar que x = 2z − y. Al reemplazar en la primera ecuación obtenemos 2(2z − y) − 3y + 2z = 2; es decir,
−5y + 6z = 2. De aquí, encontramos que y = − 2−6z
5 . Con esta información, podemos “actualizar” la primera
X = t(1, −1, 0) + (1, 0, 1), t ∈ R} y L0 = {X ∈ R3 : X = s(2, 1, −1) + (2, 0, 1), s ∈ R}. Luego, calculen:
1. Π ∩ L
2. Π ∩ L0
utilizando el procedimiento anterior. ¿Qué obtuvieron? ¿Cómo interpretan dicho resultado?
¿Qué sucede si ahora la recta viene dada en forma vectorial? Aquellos que ya hayan dominado la técnica para la
intersección de planos, no tendrán dificultad en seguir el mismo razonamiento para este caso. Los orientamos en el
siguiente experimento.
A esta altura, no tendrán problemas en reconocer o interpretar los resultados de los procedimientos para los casos en
los que la recta sea paralela al plano o esté incluída en el mismo.
Si el plano viene dado en su forma vectorial, pueden comprobar que no importa si es la forma de los puntos de
L que introducimos en las ecuaciones Π o, como en este caso, la forma de os punto de Π que introducimos en
64 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
las ecuaciones de L. En ambos casos lo que se pide es verificar que las dos ecuaciones se verifiquen en forma
simultánea. De esta forma se garantiza que se buscan los puntos en los dos subespacios: la recta y el plano.
Finalmente, el caso en el que tanto la recta como el plano vienen dados en forma vectorial, solo debemos “igualar”
la forma de sus puntos. Por ejemplo, si Π = {X ∈ R3 : X = t(1, 1, 0) + s(1, 0, 1) + (0, 1, 2), t, s ∈ R} y
L = {X ∈ R3 : X = k(1, 3, −1)+(2, 2, 0), k ∈ R}, entonces, buscamos t, s, k ∈ R tales que (t+s, t+1, s+2) =
(k + 2, 3k + 2, −k). A partir de aquí, obtenemos el siguiente sistema de ecuaciones de donde despejamos s, t, k
t+s=k+2
t + 1 = 3k + 2
s + 2 = −k
Analicen qué se espera obtener si la recta es paralela al plano o si está contenida en él.
Analicemos los posibles resultados de la intersección entre dos rectas en el espacio. Dichas rectas podrían:
1. cortarse en un punto,
2. no cortarse (lo que en este caso no implica que sean necesariamente paralelas) o
3. ser la misma recta.
La Figura 2.12 muestra estas posibles situaciones.
Veamos todas las posibles formas de describir a estas rectas. Supongamos que L es la recta dada por las ecuaciones
implícitas x + 2z = 1 y y − z = 1; L0 es la recta dada por las ecuaciones x + y + 3z = 6 y 2x − 3y + z = −13;
L00 la recta de ecuación vectorial t(1, −4, 2) + (3, 1, 0) y L000 la recta de ecuación vectorial s(2, −1, 1) + (−3, 3, 0).
Entonces, L ∩ L0 es el conjunto de soluciones (x, y, z) ∈ R3 del siguiente sistema de cuatro ecuaciones:
x + 2z = 1
y−z =1
x + y + 3z = 6
2x − 3y + z = −13.
Álgebra A. Distancias y ángulos entre rectas y planos. 65
Es la primera vez que nos encontramos con tantas ecuaciones. Si las pensamos como restricciones, nos están
indicando que, para que haya al menos un punto en la intersección de ambas rectas, deben verificarse muchas
condiciones, lo cual, en principio, parecería díficil que suceda. En realidad, dada la espacialidad de R3 , esto tiene
sentido. Si bien en R2 dos rectas casi siempre se cortan (con la única excepción que sean paralelas), en R3 es mucho
más fácil encontrarse con rectas que no se toquen. ¿Cómo se resuelve entonces un sistema de cuatro ecuaciones?
Pues como lo venimos haciendo. Ya vimos en el apartado anterior que, cuando tenemos tres ecuaciones, en general,
quedan despejadas todas las variables y conseguimos un punto como la solución del sistema. En general, aquí
pasará lo mismo con las primeras tres ecuaciones que utilicemos, pero no debemos perder de vista que, el punto que
encontremos con estas tres ecuaciones, también debe satisfacer la cuarta ecuación (que aún no hemos utilizado).
Resolvemos entonces el sistema. De la primera ecuación obtenemos que x = 1 − 2z, y de la segunda ecuación,
y = z + 1. Luego reemplazamos estos resultados en la tercera ecuación, consiguiendo 2 + 2z = 6; con lo cual
z = 2. Así, también, despejamos x = −3 e y = 3. Finalmente, debemos chequear que estos valores que alcanzamos
verifican la última ecuación: 2 · (−3) − 3 · 3 + 2 = −13. Por lo tanto, concluimos que la intersección de ambas
rectas es el punto (−3, 3, 2).
Para los otros casos se procede de manera análoga a cómo lo venimos haciendo.
A diferencia de lo que pasa para las rectas en el plano, dos rectas en el espacio que no se tocan no son necesariamente
paralelas (como sí era el caso entre planos o entre un plano y una recta). Por esta razón, existe la siguiente
clasificación de rectas en R3 .
Definición 23 Sean L y L0 dos rectas en R3 . Entonces, L y L0 se dicen:
Cómo calcular:
1. el ángulo entre dos rectas, entre una recta y un plano y entre dos planos.
2. la distancia entre un punto y una recta y entre un punto y un plano.
3. la distancia entre dos planos, entre dos rectas y entre una recta y un plano.
¿Cómo medir el ángulo entre dos rectas? Tengamos en cuenta tres puntos. Observemos la situación como se muestra
en la Figura 2.13, lado izquierdo. En primer lugar, dos rectas determinan dos ángulos entre ellas, uno más pequeño
y otro más grande. Vamos a considerar que el ángulo entre dos rectas es el más pequeño entre ambos; es decir,
aquel que está entre 0 y π2 . Por otro lado, medimos el ángulo entre dos rectas cualesquiera, aunque no se corten.
Por ejemplo, para nosotros, dos rectas paralelas distintas forman un ángulo de 0. Cabe destacar, entonces, que no
es necesario que las rectas se corten para poder medirles el ángulo. Es posible pensar que, si fuera necesario,
trasladamos una de las rectas (sin cambiarle la dirección) hasta que interseque a la otra.
Entonces, dado que el ángulo depende de la dirección de la recta, ¿alcanza con definir el ángulo entre dos rectas
como el ángulo entre los vectores directores de las rectas? No, pero casi. Observemos la Figura 2.13, lado derecho.
Observemos que el ángulo entre las rectas no coincide con el ángulo entre los vectores directores. Esto sucede
ya que es posible elegir infinitos vectores directores, pero, mientras que en la recta no importa el sentido, en los
vectores directores sí. Entonces veamos que, en este caso, el ángulo se obtiene midiendo el ángulo entre uno de los
vectores directores y el inverso del otro.
Definición 24 Sean L, L0 ∈ R3 y supongamos que ~ ~ un vector director para L0 .
v es un vector director para L y w
~ entonces el ángulo entre L y L0 , el cual se denota ∠(L, L0 ), es ángulo más
Si llamamos θ al ángulo entre ~v y w,
π
pequeño entre θ y π − θ; es decir, el ángulo que está entre 0 y 2 de estos dos.
Independientemente de esta definición, es importante recordar como hacemos para medir ángulos entre rectas: en
primer lugar, buscamos el ángulo más pequeño entre ambas rectas (y para calcularlo, debemos elegir convenien-
temente los vectores directores de ambas; o, en su defecto, elegir vectores directores al azar) y, en segundo lugar,
estimar si se forma un ángulo menor al considerar el opuesto de uno de los vectores directores. Veamos esto con un
par de ejemplos:
Álgebra A. Distancias y ángulos entre rectas y planos. 67
Ejemplos 30
1. Para calcular el ángulo que forman las rectas L = {X ∈ R2 : X = t(1, 2) + (3, −3), t ∈ R} y L0 = {X ∈
R2 : X = s(3, 0) + (2, 5), s ∈ R} de R2 debemos, primero, calcular el ángulo entre los vectores (1, 2) y (3, 0).
3
Este es arc cos 3√ 5
≈ 63,43o . Como este ángulo es menor a π2 entonces este es precisamente ∠(L, L0 ).
2. Para calcular el ángulo que forman las rectas L = {X ∈ R3 : X = t(−1, 2, 0) + (1, 2, −3), t ∈ R} y
L0 = {X ∈ R3 : X = s(−5, −4, 2) + (2, 2, 9), s ∈ R} de R3 debemos, primero, calcular el ángulo entre los
3
≈ 101, 5o . Como este ángulo es mayor a π2 entonces
vectores (−1, 2, 0) y (−5, −4, 2). Este es arc cos − 15
∠(L, L0 ) es aproximado por 180o − 101, 5o = 78, 5o .
También podemos medir ángulos entre dos planos y entre una recta y un plano. Veremos que el cálculo se reduce al
mismo que para medir ángulos entre rectas. Por un lado, la Figura 2.14, lado derecho, muestra que el ángulo formado
entre dos planos es el mismo que el ángulo determinado por las rectas con direcciones normales de dichos planos.
Por otro lado, la Figura 2.14, lado izquierdo, muestra que el ángulo entre una recta L y un plano Π puede calcularse
π
restando a 2 el ángulo entre L y la recta con dirección normal a Π. Tenemos entonces la siguiente definición.
~,N
Definición 25 Sean L una recta y Π, Π0 planos en R3 . Sean N ~ 0 vectores normales a Π, Π0 respectivamente.
R}.
~ , t ∈ R} y
2. El ángulo ∠(Π, Π0 ) entre los planos Π y Π0 es ∠(L0 , L00 ), donde L0 = {X ∈ R3 : X = tN
~ 0 , s ∈ R}.
L00 = {X ∈ R3 : X = sN
Ejemplos 31
1. Calculemos el ángulo que forman la recta L de ecuación vectorial t(1, 2, −1) + (0, 0, 2) y el plano Π =
{(x, y, z) ∈ R3 : 2x − y − 3z = 2}. Por la definición, el ángulo ∠(L, Π) es el ángulo π
2
− ∠(L, L0 ), donde
~ yN
L0 es la recta de ecuación vectorial sN ~ es un vector normal al plano. Si miramos la ecuación implícita de Π,
sabemos que una normal para Π es (2, −1, −3). Por lo tanto, para hallar ∠(L, L0 ), debemos calcular el ángulo
entre los vectores directores (1, 2, −1) y (2, −1, −3). Dicho ángulo es arc cos 2√321 ≈ 70, 89o . Como este
ángulo es menor a π
2
, entonces ∠(L, L0 ) ≈ 70, 89o . Por lo tanto, ∠(L, Π) ≈ 90o − 70, 89o = 19, 11o .
2. Calculemos ahora el ángulo entre los planos Π = {(x, y, z) ∈ R3 : x + y + 3z = 0} y Π0 = {X ∈ R3 : X =
t(0, 2, −1) + s(−3, 1, 1) + (2, −2, 5), t, s ∈ R}. Por definición, ∠(Π, Π0 ) = ∠(L, L0 ), donde L, L0 son las
rectas, que pasan por el origen, cuyos vectores directores son las normales de Π, Π0 respectivamente. Por un lado,
un vector normal para Π es (1, 1, 3). Por otro lado, un vector normal para Π0 es (0, 2, −1)×(−3, 1, 1) = (3, 3, 6).
El ángulo entre (1, 1, 3) y (3, 3, 6) es arc cos 3√ 24
66
≈ 10, 02o . Como este ángulo es menor a π2 , entonces
68 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Hemos vimos que el producto escalar nos brinda una manera de medir la distancia entre dos puntos. Ahora bien,
veamos cómo proceder para medir distancias en otras situaciones. Comencemos calculando la distancia entre un
punto y una recta. ¿Qué significa la distancia entre un punto y una recta? Si imaginamos un deportista de velocidad
llegando a la meta en una carrera, ¿a qué nos referimos cuando decimos “el corredor está a 10 m. de la línea de
llegada? A la menor distancia entre el corredor y la línea de llegada, y, dicha distancia se recorre cuando medimos
la posición del corredor en forma perpendicular respecto de la línea de llegada. Por lo tanto, al pensar en la posición
del corredor como un punto sobre la pista de carrera y la línea de llegada como una recta, la distancia de este punto
a esta recta es la menor distancia entre el punto y todos los puntos de la recta, entonces deducimos que, además,
esta distancia se recorre cuando medimos la distancia en forma perpendicular a la recta. Estudiemos los siguientes
casos, teniendo presente estas nociones.
Comencemos por el caso de R2 . Supongamos que tenemos la recta L = {X ∈ R2 : X = t(2, −3) + (0, 5), t ∈ R}
y el punto P = (1, −3). Es necesario medir la distancia del punto P al punto de la recta que se encuentra
“perpendicular” a la recta a lo largo de P . Entonces calculamos auxiliarmente la recta L0 que es perpendicular a L
y que pasa por el punto P . De esta manera, el punto de la recta que se encuentra más cerca de P es Q = L0 ∩ L
(Figura 2.15). Por lo tanto, la distancia de P a la recta L es la distancia de P a Q (Q es el punto de L más cercano a
P ). Resuelvan este problema a través del siguiente experimento.
Experimento 14 Con L y P recién definidos, sigan los siguientes pasos para hallar la distancia de L a P :
¿Cómo hacemos para calcular ahora la distancia de un punto P ∈ R3 a una recta L en el espacio? Aquí la situación
es un poco más complicada, aunque el procedimiento es exactamente el mismo al utilizado para el cálculo de la
distancia de un punto a una recta en R2 . ¿Cómo calcular el punto de L que se encuentra más cercano al punto P ?
No es difícil ver que la distancia se establece sobre el segmento que une P con una dirección perpendicular a L,
exactamente igual que el caso de R2 . Es posible entonces intentar armar una recta perpendicular a L que pase por P .
Álgebra A. Distancias y ángulos entre rectas y planos. 69
El problema con este acercamiento es que hay infinitas rectas que son perpendiculares a L y pasan por P . Esto se
debe a que hay muchas direcciones perpendiculares a una dada en R3 (a diferencia de R2 , que solo hay una). En
realidad, uno debería armarse la “recta perpendicular a L que pase por P y que corte L”. De todas formas, este
procedimiento que acabamos de describir es más complicado que el caso de R2 , y en el espacio hay una forma más
directa de calcular el punto de L más cercano a P .
Al observar la Figura 2.16, consideramos el plano perpendicular a L que pasa por P . Esto es fácil, ya que dicho
plano podemos representarlo por medio de la ecuación normal, ¡y la normal del plano puede ser escogida como el
vector director de L! Resuelvan este problema en el Experimento 15.
De la misma forma que para el caso de las rectas, si quisiéramos medir la distancia de un punto a un plano, como
por ejemplo la distancia de una mosca que se encuentra volando en una habitación a una de las paredes de la misma,
estaremos pensando en la menor distancia entre la mosca y la pared, y se recorre cuando consideramos la dirección
perpendicular al plano determinado por la pared (Figura 2.17).
Trabajemos con un ejemplo. Sean Π = {X ∈ R3 : X = t(2, 2, −1) + s(5, 0, −3) + (2, 0, 0), t, s ∈ R} y
P = (−1, −2, 4), busquemos la distancia más corta entre un punto del plano y P . Si vemos la Figura 2.17, notamos
que nos alcanza con considerar la recta L perpendicular a Π que pasa por P . Resuelvan el problema en el siguiente
experimento.
Observemos que este caso es inverso al caso de la distancia de un punto a una recta en R3 , ya que aquí
construimos una recta para hallar el punto del plano más cercano a P y, en el caso anterior, construimos un
plano para encontrar el punto de la recta más cercano a P . Esto se debe a que, en R3 , una recta complementa a
un plano y un plano complementa a una recta, porque un plano contiene 2 direcciones y la recta (perpendicular)
contiene la dirección que le falta para “ser” todo el espacio (y lo mismo al revés). Por este motivo hay un único
plano perpendicular a una recta que pasa por P y una única recta perpendicular a un plano que pasa por
P . Precisamente por esta razón, no era conveniente calcular la distancia de un punto P a una recta L en el
espacio buscando la recta perpendicular a L que pase por P (porque hay infinitas opciones y solo una nos
sirve).
Finalmente, abordaremos el problema de medir distancias entre dos rectas, dos planos o una recta y una plano. Así
como vimos que medir distancias entre una recta y un punto, o un plano y un punto se reduce a medir la distancia
entre puntos (el punto dado y el punto más cercano de la recta o el plano), el cálculo de la distancia entre dos rectas,
dos planos o una recta y un plano, puede reducirse al cálculo de la distancia entre un punto y una recta o un punto y
un plano. En lugar de explicar cada uno de estos casos, dejaremos que ustedes los deduzcan por su cuenta en los
experimentos que siguen. Antes de avanzar, cabe destacar algunas consideraciones. Por un lado, cuando estimamos
la distancia entre dos subespacios (recta y recta, recta y plano o plano y plano), si dichos subespacios se intersecan,
entonces la distancia es obviamente 0 (si se tocan, están “pegados” y no hay distancia entre ellos). Por lo tanto, al
calcular distancia entre dos planos, es bueno verificar primero si los planos son paralelos; si no lo son, sabemos que
indefectiblemente se cortarán en una recta y, en particular, se tocarán y estarán a distancia 0 (y no es necesario hacer
ningún cálculo más). Lo mismo al buscar la distancia entre un plano y una recta (debemos chequear si son paralelos;
de lo contrario se tocan y la distancia es 0). En el caso de la distancia entre dos rectas del espacio, vayamos con un
poco más de cuidado. Es indispensable verificar si se intersecan o no, pero sabemos que, aún cuando no se toquen,
podrían no ser paralelas (y ser alabeadas). Observen en los experimentos que ambos casos se abordan de modo
diferente, por lo que habrá que clasificar ambas rectas antes de resolver su distancia.
Álgebra A. Distancias y ángulos entre rectas y planos. 71
Experimento 17 Consideren los planos Π = {X ∈ R3 : X = λ(−2, 1, 1)+µ(0, −3, 4)+(5, −1, 0), λ, µ ∈
R} y Π0 = {(x, y, z) ∈ R3 : 7x + 8y + 6z = −2}.
1. Verifiquen que Π y Π0 son paralelos.
2. Construyan una recta L perpendicular a ambos planos y calculen P = L ∩ Π y Q = L ∩ Π0 .
3. Calculen d(P, Q). ¿Qué representa en este problema el número d(P, Q)?
4. ¿Es importante saber qué recta perpendicular a Π y Π0 construyeron? Expliquen este hecho geométrica-
mente.
Cómo calcular el simétrico de un punto respecto de otro punto, una recta o un plano.
Cómo calcular la proyección ortogonal de un punto sobre una recta o un plano.
2.6.1 Simetrías
Simetría es una palabra que se encuentra presente en todas las ramas de la matemática y puede tener un significado
distinto en cada caso. Sin embargo, en la teoría de espacios lineales, esta noción refiere a la situación más natural de
la palabra: es como la imagen que refleja un espejo. Por ejemplo, si hubiese una mosca frente al espejo (no apoyada
en él), entonces, la imagen de la mosca “del otro lado del espejo” sería su simétrico respecto del espejo. Ahora bien,
formalmente, si tenemos un punto en R3 y un plano (que podemos pensarlo como si fuera un espejado) entonces el
simétrico del punto respecto del plano (el espejo) es aquél punto (del otro lado del plano) que marcaría el reflejo
de dicho punto. Vamos a ver que es posible calcular el simétrico de un punto respecto de otro punto, y de rectas
también. Debemos proceder siempre de la misma manera: el punto, recta o plano actuarán como espejos y nos
interesará saber qué punto es el que está “del otro lado”, en el sentido simétrico de la definición. Veamos cómo
formalizar estas nociones.
Comencemos analizando la situación que más se parece a nuestra realidad tridimensional: el simétrico de un punto
en el espacio respecto de un plano. En este caso, deseamos encontrar cuál es el punto “del otro lado del plano”
que sería la imagen simétrica del punto original, pensando al plano como espejado. Por ejemplo, consideremos el
plano xy (de ecuación z = 0) y el punto (1, 2, 3). ¿Cuál es la imagen reflejada de (1, 2, 3) respecto del plano xy?
Seguramente, no tendrán problemas en hallar la respuesta correcta: (1, 2, −3); este es el punto que naturalmente se
encuentra “del otro lado” del plano xy (Figura 2.18, lado izquierdo). Si ahora cambiamos la inclinación del espejo
para que esté en la dirección del plano Π : x + 2y + 3z = 0 ¿Cuál es el simétrico del (1, 2, 3) respecto de Π? Al
analizar la situación geométricamente, observamos que se trata del punto (−1, −2, −3) (Figura 2.18, lado derecho).
¿Qué hicimos en ambos casos? Pues nos dimos cuenta que, si formamos la recta entre un punto y su simétrico
respecto de un plano, entonces esta recta es perpendicular al plano. Pero además, la distancia del simétrico al plano
debe ser la misma que la del punto original al plano. Esto es lo que debe tenerse presente al momento de análizar la
definición, que se presenta luego de la Figura.
Definición 26 Sean P ∈ R3 y Π un plano. El simétrico de P con respecto a Π es el único punto Q ∈ R3
distinto de P que verifica que el segmento que une a ambos puntos es perpendicular al plano y, además, la
distancia de cada uno de dichos puntos al plano es la misma.
Ya contamos con todas las herramientas necesarias para calcular un simétrico. Observemos el método para encontrar
un simétrico de forma detallada en el siguiente ejemplo.
el simétrico de dicho punto con respecto a Π. Luego, calculamos la recta L que es perpendicular al plano y que pasa por
Álgebra A. Proyecciones y simetrías. 73
el punto (1, 1, 0). A partir de la ecuación de Π, deducimos que la normal del plano es el vector (1, 1, 1). Por lo tanto,
una ecuación vectorial para L es t(1, 1, 1) + (1, 1, 0), t ∈ R. Para calcular d(P, Π) debemos obtener R = L ∩ Π; y,
entonces, resolvemos la ecuación t + 1 + t + 1 + t = 1, de la que conseguimos t = −1/3. Así, el punto de intersección
entre la recta y el plano es R = ( 23 , 32 , − 13 ). Ahora, d(P, Π) = d(P, R) = √1 .
3
Finalmente, Q = (x, y, z) es el (único)
punto de L distinto de P que verifica d(Q, Π) = √1 . Como Q ∈ L, entonces, Q es de la forma (t + 1, t + 1, t) para
3
cierto t ∈ R. Observemos que d(Q, Π) = d(Q, R), por lo que buscamos la solución a:
r
2 2 1 1
(t + 1 − )2 + (t + 1 − )2 + (t + )2 = √ ,
3 3 3 3
o lo que es lo mismo:
1 2 1
3(t + ) = .
3 3
Las dos soluciones de esta ecuación cuadrática son t = 0 y t = − 23 . El caso t = 0 nos devuelve el punto P . El caso
t = − 23 nos devuelve el simétrico de P respecto de Π: Q = 13 , 13 , − 23 .
Existe otra manera (más sencilla) de calcular el simétrico. Solo debemos darnos cuenta de que el punto medio entre
un punto P y su simétrico respecto del plano Π es, necesarimente, un punto del plano Π (justamente, esto es lo
que indica el hecho que la distancia de cada uno de estos puntos al plano sea la misma). Por lo tanto, otra posible
manera de calcular el simétrico en esta situación es la siguiente.
Luego:
1. Hallen la recta L perpendicular a Π que pasa por P .
2. Hallen el punto R = L ∩ Π.
3. Sabiendo que R es el punto medio entre P y su simétrico Q, hallen Q.
Ejemplo 33 Con los datos del ejemplo anterior, vimos que la recta L de ecuación vectorial t(1, 1, 1) + (1, 1, 0)
es perpendicular al plano Π y pasa por (1, 1, 0) y que L ∩ Π es R = ( 32 , 23 , − 13 ). Como sabemos que R debe ser
74 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
P +R
precisamente el punto medio entre (1, 1, 0) y su simétrico Q = (x, y, z) podemos plantear Q = 2
; es decir:
1+x
= 23
2
1+y
2
= 23
z = −1,
2 3
de donde x = 13 , y = 1
3
y z = − 23 . Luego, el simétrico de P respecto de Π es el punto Q = ( 13 , 13 , − 23 ).
En R2 , el caso análogo al del encontrar el simétrico de un punto respecto de un plano, es el de encontrar el simétrico
de un punto respecto de una recta. Esto se debe a que, si viviéramos en dos dimensiones, los espejos serían segmentos
(en lugar de planos como en el espacio tridimensional). Veamos un ejemplo. Consideremos en R2 el punto (3, 4).
¿Cuál es el simétrico de (3, 4) respecto del eje x? Nuevamente, no tendremos problemas en convencernos que la
respuesta correcta es el punto (3, −4): este es el punto que naturalmente se encuentra “del otro lado” del eje x
(Figura 2.19, lado izquierdo). ¿Y el simétrico del (3, 4) respecto de la recta de ecuación vectorial t(1, 1)? Al mirar la
Figura 2.19, lado derecho, vemos que se trata del (4, 3). Lo que sucede en este caso es idéntico al caso del simétrico
de un punto respecto de un plano. La definición es también idéntica.
Q ∈ R2 distinto de P , tal que el segmento que une P con Q es perpendicular a L y la distancia de cada uno de
ellos a L es la misma.
Como sucedía con los simétricos respecto de un plano, si P ∈ L, entonces, su simétrico con respecto a L es el
mismo punto P . También podemos calcular el simétrico de P respecto de L como apuntamos en el Experimento 16;
esto es, teniendo presente que el punto medio entre P y su simétrico es, necesariamente, un punto de la recta L. Si
han comprendido los procedimientos hasta aquí desarrollados, no tendrán problema en reproducirlos en este caso
más sencillo.
Ejemplo 34 Consideremos la recta L = {X ∈ R3 : X = t(1, −1) + (0, 2), t ∈ R} y el punto P = (1, 3), y
calculemos el simétrico Q de dicho punto con respecto a L. En primer lugar, recordemos que un punto y su simétrico
pertenecen a una misma recta que resulta perpendicular a L. Comenzamos, entonces, buscando una ecuación de la recta
L0 que es perpendicular a L y pasa por (1, 3). Luego, elegimos un vector director que sea perpendicular al vector director
de L; por ejemplo, una posibilidad es tomar el vector (1, 1). Una ecuación vectorial para L0 es, entonces, s(1, 1) + (1, 3).
Al calcular la intersección entre ambas rectas, vemos que L ∩ L0 = {(0, 2)}. Por lo tanto, si Q = (x, y), entonces, debe
x+1 y+3
verificarse 2
=0y 2
= 2, a partir de lo cual concluimos que (x, y) = (−1, 1).
Álgebra A. Proyecciones y simetrías. 75
A partir de los conceptos estudiados, analicen con respecto a qué objeto se puede calcular el simétrico de un
punto en R, cómo se lo define y qué calculos son necesarios.
También, es posible definir el simétrico de un punto P respecto de otro punto Q, para R2 o R3 (en realidad, la
definción vale para cualquier Rn ). Como los conceptos y procedimientos son prácticamente los mismos, no surgirán
problemas para hallar esta definición natural.
Definición 28 Sean P, Q ∈ Rn . El simétrico de P respecto de Q es el (único) punto R ∈ Rn distinto de P tal
Al igual que en los casos anteriores, el punto R queda determinado por la propiedad tal que el punto medio entre R
y P es precisamente Q.
Ejemplos 35
1. Hallemos el simétrico del punto P = (1, 2) respecto del punto Q = (−3, 1) en R2 . Si R = (x, y) representa a
dicho simétrico, entonces, debe verificar que P +R = Q; es decir, 1+x , 2+y
2 2 2
= (−3, 1). De aquí, despejamos
fácilmente: x = −7 e y = 0. Luego, R = (−7, 0).
2. Hallemos ahora el simétrico del punto P = (0, −1, 4) respecto del punto Q = (2, −3, −2) en R3 . Si R =
(x, y, z) representa a dicho simétrico, entonces debe verificar 0+x , −1+y , 4+z
2 2 2
= (2, −3, −2). De aquí,
despejamos: x = 4, y = −5 y z = −8. Luego, R = (4, −5, −8).
L es el (único) punto Q ∈ R3 distinto de P tal que el segmento que une P con Q es perpendicular a L y la
distancia de cada uno de ellos a L es la misma. Si P ∈ L entonces P es su mismo simétrico.
Observemos que la definición anterior es prácticamente la misma que la del simétrico respecto de una recta en R2 .
Esto no es casualidad: dados el punto P y la recta L, si P ∈
/ L, entonces existe un único plano que contiene a P y a
L. El simétrico de P va a estar, necesariamente, contenido en este plano, por lo cual, estaremos trabajando en un
plano (que podemos identificar con R2 ). Una posible manera de calcular el simétrico R del punto P , respecto de la
recta L, es la siguiente:
1. Construir el plano Π perpendicular a L que pase por P .
2. Calcular el punto Q = Π ∩ L.
3. Construir la recta L0 que une P con Q.
4. Hallar el punto de L0 , distinto de P , que se encuentre a la misma distancia de Q que P .
También, como en los casos anteriores, el punto R queda determinado por la siguiente propiedad: el punto medio
entre R y P es Q = Π ∩ L. Esta suele ser una manera más directa (y más inmediata) de arribar al resultado.
Ejemplo 36 Hallemos el simétrico del punto P = (−3, −1, 1) respecto de la recta de ecuación vectorial t(1, 1, −1) +
(2, 0, −1). Primero, construimos el plano Π perpendicular a L que pase por P : una ecuación implícita para este plano
es x + y − z = −5. A continuación, calculamos Q = Π ∩ L: es un punto de la forma (t + 2, t, −t − 1) tal que
(t + 2) + t − (−t − 1) = −5. De aquí, despejamos t = − 83 . Por lo tanto, Q = − 32 , − 38 , 53 . Finalmente, si llamamos
¿Qué significa “proyectar” un punto sobre una recta o un plano? La idea es sencilla: retomemos el ejemplo de una
mosca en una habitación (oscura, ahora) en la cual encendemos una linterna y apuntamos hacia la mosca. La sombra
de la mosca caerá sobre la pared que la mosca tiene detrás. Dicha sombra es una proyección de la mosca sobre
la pared. Supongamos que la mosca es un punto y la pared es un plano: la sombra representa la proyección del
punto sobre el plano. Pero, ¿está bien definida esta proyección? No, pues depende de dónde estemos sosteniendo
nosotros la linterna. Es decir, la proyección de un punto sobre una recta o un plano depende desde donde lo estemos
proyectando. En este libro solo estudiaremos el caso de proyecciones que se hagan de manera perpendicular a la
recta o al plano. Este tipo de proyecciones se llaman, naturalmente, proyecciones ortogonales.
¿Cómo calcular la proyección ortogonal? Supongamos que tenemos un punto P ∈ R3 y un plano Π ⊂ R3 .
Queremos proyectar P sobre Π de manera ortogonal. Esto significa que pretendemos que la recta L determinada por
el punto P y el punto desde donde estamos proyectando (donde estaríamos sosteniendo la linterna) sea perpendicular
al plano (Figura 2.20). Entonces, la proyección ortogonal de P sobre Π sería la intersección L ∩ Π (tengamos en
cuenta que la recta L estaría representando el haz de luz de la linterna). Sin embargo, observemos que la recta
L construida es, exactamente, la recta perpendicular a Π que pasa por el punto P . Por lo tanto, para calcular la
proyección ortogonal de P sobre Π, no necesitamos saber dónde está ubicada la linterna, pues alcanza con saber
que está ubicada en una posición cuyo haz es perpendicular a Π.
Al igual que en el ejemplo de cómo calcular el simétrico de un punto, la situación de proyectar un punto P ∈ R2
sobre una recta L ⊂ R2 es completamente análoga a la de proyectar un punto sobre un plano. No presentará
problemas comprender que se trata del punto Q que se encuentra en la intersección de L y la recta L0 , perpendicular
a L, que pasa por P . ¿Se pueden proyectar puntos sobre rectas en R3 ? Claro que sí: es posible proyectar puntos
sobre cualquier espacio lineal. ¿Cómo sería la proyección ortogonal de un punto P ∈ R3 sobre una recta L ⊂ R3 ?
Debemos pedir que la incidencia del haz de luz de la linterna sea perpendicular a la recta. Notemos que esta
última premisa dice dos cosas: por un lado, el haz debe incidir sobre la recta; y por otro lado, la incidencia debe
ser perpendicular. Como sabemos, en R3 hay infinitas direcciones perpendiculares a una recta. En los apartados
anteriores, vimos que, la manera más fácil de hallar una dirección perpendicular a una recta L que corte tanto
a L como a P , es considerar el plano Π perpendicular a la L que pase por el punto P . De esta forma, el punto
Álgebra A. Proyecciones y simetrías. 77
Observación 12 ¡Tengamos presente que ya estuvimos calculando proyecciones ortogonales antes! De hecho,
todas estas construcciones que acabamos de hacer, precisamente, dan cuenta que la proyección ortogonal entre
un punto y una recta o un plano es, en definitiva, el punto de la recta o el plano, respectivamente, que más cerca
se encuentra del punto. Esta es la manera más “económica” de definir este concepto.
Hemos visto, en el apartado 2.5, que la distancia entre un punto P y una recta L (o un plano Π), era la distancia entre
el punto P y el punto Q ∈ L (o Q ∈ Π) más cercano a P . Por lo tanto, el punto Q que calculábamos era exactamente
la proyección ortogonal de P sobre L (o sobre Π). Esto lo desarrollamos en los siguientes experimentos:
Experimento 14: la distancia de un punto P a una recta L en R2 se calculaba como d(P, Q) donde Q = L∩L0 ,
donde L0 era la recta perpendicular a L que pasa por el punto P . Por lo tanto, Q es la proyección ortogonal
de P sobre L.
Experimento 15: la distancia de un punto P a una recta L en R3 se calculaba como d(P, Q) donde Q = L ∩ Π,
donde Π era el plano perpendicular a L que pasa por el punto P . Por lo tanto, Q es la proyección ortogonal
de P sobre L.
Experimento 16: la distancia de un punto P a un plano Π en R3 se calculaba como d(P, Q) donde Q = L0 ∩Π,
donde L0 era la recta perpendicular a Π que pasa por el punto P . Por lo tanto, Q es la proyección ortogonal
de P sobre Π.
Ejemplos 37
1. Calculemos la proyección ortogonal del punto P = (1, −3) sobre la recta L = {X ∈ R2 : X = t(2, −3) +
(0, 5), t ∈ R}. Buscamos primero la recta L0 que es perpendicular a L y que pasa por el punto P : una ecuación
vectorial para L0 es s(3, −2) + (1, −3). La proyección ortogonal de P sobre L será, entonces, Q = L ∩ L0 .
Buscamos esta intersección. En segundo lugar, planteamos (2t, −3t + 5) = (3s + 1, −2s − 3); es decir:
2t = 3s + 1
−3t + 5 = −2s − 3
t +2(2t + 1) − 3(−3t + 5) = −2
|{z} | {z } | {z }
x y z
⇒ 14t − 13 = −2
11
⇒ t= 14
11 18 37
Reemplazando por este valor de t en t(1, 2, −3) + (0, 1, 5), obtenemos Q = , ,
14 7 14
.
78 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
3. Finalmente, calculemos la proyección ortogonal del punto P = (−1, −2, 4) sobre el plano Π = {X ∈ R3 :
X = t(2, 2, −1) + s(5, 0, −3) + (2, 0, 0), t, s ∈ R}. En primer lugar, buscamos la recta L que es perpendicular
a Π y que pasa por el punto P : una ecuación vectorial para L es r(−6, 1, −10) + (−1, −2, 4). La proyección
ortogonal de P sobre Π será, entonces, Q = L ∩ Π. En segundo lugar, buscamos la intersección. Para facilitar
las cuentas, hallemos una ecuación implícita para Π: una normal es (2, 2, −1) × (5, 0, −3) = (−6, 1, −10)
(esta cuenta ya la habíamos hecho para calcular el vector director de L), por lo que la ecuación normal para Π
(utilizando como punto de P el (2, 0, 0)) nos queda:
Luego, los puntos de L ∩ Π son los de la forma (−6r − 1, r − 2, −10r + 4) que verifican
⇒ 137r − 36 = −12
24
⇒ r= 137
Estudiamos el concepto de punto simétrico a otro punto de Rn respecto de puntos, rectas y planos.
Aprendimos cómo calcular la proyección ortogonal de puntos sobre rectas y planos.
3. Espacios vectoriales
En este capítulo analizamos cómo se generalizan las nociones de espacios lineales para vectores de Rn . Los
espacios vectoriales son el objeto principal de estudio del Álgebra Lineal. Los ejemplos abundan en todas las ramas
de la matemática.
En este libro, solo daremos una breve introducción centrados exclusivamente en espacios vectoriales que viven
dentro de Rn ; conocidos como subespacios de Rn .
1. Subespacios de Rn .
2. Combinaciones lineales de vectores.
3. Dependencia lineal de un conjunto de vectores.
4. Generadores, bases y dimensión de subespacios.
3.1 Subespacios de Rn
En el capítulo 1, estudiamos que las propiedades de los espacios de vectores no dependen de su ubicación, sino de
sus características propias (la pendiente de la recta, la inclinación del plano). Por esta razón, la teoría de espacios
vectoriales se desarrolla exclusivamente para espacios de vectores que pasen por el origen. Algebraicamente, esto
tiene, además, la ventaja de contar con el elemento nulo de la suma: el vector ~0.
Importante En esta unidad, todos los espacios lineales que aparecen pasan por el origen.
Desde el punto de vista algebraico, la propiedad característica que tienen las rectas y los planos que pasan por el
origen es que son cerrados por suma de vectores y producto de un vector por un escalar. Esto quiere decir que, si ~v
yw
~ son vectores cuyos extremos pertenecen a una recta L o a un plano Π, entonces el vector ~v + w
~ y todos los
vectores λ~v , para cualquier λ ∈ R, también pertenecen a L o a Π. La manera de generalizar la noción de espacio
lineal a Rn es la siguiente: se trata de un conjunto de vectores de Rn tal que, al sumar dos vectores del conjunto, el
resultado es nuevamente un vector del conjunto y, al multiplicar un vector del conjunto por un escalar cualquiera, el
80 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
resultado es nuevamente un vector del conjunto. Observemos que, dado que la suma y producto por escalar están
definidos considerando que el origen de los vectores es el origen de coordenadas, entonces el vector nulo ~0 deberá
pertenecer necesariamente a dicho conjunto.
Definición 31 Un subespacio de Rn es un conjunto de vectores S ⊂ Rn que tiene las siguientes características:
1. ~0 ∈ S,
~ ∈ S entonces ~v + w
2. si ~v , w ~ ∈Sy
3. si ~v ∈ S y λ ∈ R cualquiera entonces λ~v ∈ S.
Retomamos lo dicho anteriormente: la suma de vectores del subespacio vuelve a ser un vector del subespacio y el
producto de un vector del subespacio por un escalar cualquiera, también es un vector del subespacio. Consideremos
el conjunto S ⊂ R5 de vectores cuya última coordenada es 0. Afirmamos que S es un subespacio. En efecto, el
vector (0, 0, 0, 0, 0) ∈ S, pues su última coordenada es 0. Además, si (a, b, c, d, 0), (p, q, r, s, 0) ∈ S, entonces
(a, b, c, d, 0) + (p, q, r, s, 0) = (a + p, b + q, c + r, d, s, 0 + 0) ∈ S, pues su última coordenada sigue siendo 0. Por
último, si (a, b, c, d, 0) ∈ S y λ ∈ R, entonces λ(a, b, c, d, 0) = (λa, λb, λc, λd, λ0) = λa, λb, λc, λd, 0) ∈ S. Por
lo tanto, S es efectivamente un subespacio.
Proponemos realizar el siguiente experimento para comprobar que las rectas y los planos que pasan por el origen
tienen estas propiedades:
forma:
~ = λ1~v1 + · · · + λr ~vr
w
para algunos λ1 , . . . , λr ∈ R.
¿Cómo hacemos para determinar si un vector es combinación lineal de otros? Pensemos la respuesta a partir de un
ejemplo. Supongamos que queremos saber si el vector (1, 2, 3) ∈ R3 es combinación lineal de los vectores (1, 0, 2)
y (−1, 1, −5). Esto sucederá sí, y solo sí, existen escalares λ, µ ∈ R tales que:
De las dos primera ecuaciones despejamos µ = 2 y λ = 3. Nos resta, entonces, chequear si con estas igualdades se
verifica la última ecuación:
2λ − 5µ = 2,3 − 5,2 = −4 6= 3
Por lo tanto, concluimos que (1, 2, 3) no es combinación lineal de los vectores (1, 0, 2) y (−1, 1, −5).
Veamos, entonces, cómo reescribimos la ecuación vectorial de un plano utilizando la noción de combinación lineal.
Al repasar lo que hicimos anteriormente, observamos que si el plano está generado por los vectores ~v y w
~ (es decir,
son vectores directores del plano), entonces P ∈ Π si y solo si P es combinación lineal de ~v y w.
~ Esto quiere decir
que Π es exactamente el conjunto de los puntos que se obtienen de hacer todas las posibles combinaciones lineales
entre ~v y w.
~ Esto nos lleva a la siguiente definición:
v1 , . . . , v~r ∈ Rn . El conjunto de todas las combinaciones lineales de los vectores ~v1 , . . . , v~r
Definición 33 Sean ~
se nota:
h~v1 , . . . , v~r i
Es decir, los vectores que pertenecen al conjunto h~v1 , . . . , v~r i son aquellos que se pueden escribir como combi-
nación lineal de los vectores ~v1 , . . . , ~vr .
El conjunto h~v1 , . . . , v~r i es un subespacio. El estudiante interesado puede comprobar esto verificando que, tanto la
suma como el producto por escalar de vectores de h~v1 , . . . , v~r i, también pertenece a h~v1 , . . . , v~r i (es decir, también
es combinación lineal de los vectores ~v1 , . . . , v~r ).
ya que estamos empleando dos vectores directores (y dos parámetros), mientras que para describir la recta solo
necesitamos uno. Pero justamente, lo que sucede en este caso es que los vectores (−1, 5, 2) y (2, −10, −4) son
linealmente dependientes (uno es múltiplo del otro). En general, cuando describimos subespacios, buscamos la
manera más económica de hacerlo; y esta es, precisamente, que los vectores que usemos “como directores” sean
linealmente independientes: si no lo fueran, entonces, uno de ellos sería combinación lineal de los otros y sería
necesario para describir al subespacio. La definición formal de independencia lineal es la siguiente:
Definición 34 Un conjunto de vectores {v1 , . . . , vr } se dice linealmente dependiente si existen λ1 , . . . , λr ∈ R
no todos nulos tales que λ1 v1 + · · · + λr vr = 0. Es decir, son linealmente dependientes si existe una combinación
lineal no trivial (no todos los λi = 0) que da el vector ~0. Por lo tanto, el conjunto es linealmente independiente si
la única combinación lineal de los {v1 , . . . , vr } que da 0 es la que tiene a todos los coeficientes de la combinación
lineal nulos.
Analicen la definición de dependencia lineal y vean que es equivalente a expresar que un vector puede ser
escrito como combinación lineal de otros.
Este conjunto será linealmente independiente si, y solo si, la única combinación lineal entre todos sus vectores
–que da como resultado el vector nulo– es aquella que tiene todos los coeficientes de la combinación nulos.
Analicemos, entonces, cómo son las combinaciones lineales de estos vectores que dan como resultado el vector
nulo. Consideremos una combinación lineal genérica igualada al vector nulo:
Es decir:
λ+µ−ν =0
2λ − 6ν = 0
3λ + 2µ − 5ν = 0
Este desarrollo nos indica que el conjunto {(1, 2, 3), (1, 0, 2), (−1, −6, −5)} es linealmente dependiente: hallamos
una combinación lineal del vector nulo donde no todos los coeficientes son nulos (de hecho, ninguno lo es). Entonces,
¿cuándo es un conjunto linealmente independiente? Cuando la solución del sistema de ecuaciones simultáneas da
como resultado λ = 0, µ = 0 y ν = 0 como única solución.
Este subespacio queda, entonces, determinado por todos los vectores de R4 cuyas coordenadas verifican estas
ecuaciones simultáneamente. ¿Cómo se puede describir por ecuaciones el subespacio S introducido en la página
80? Simplemente, de la siguiente manera:
S = {(x1 , x2 , x3 , x4 , x5 ) ∈ R5 : x5 = 0}
Descripción por generadores La otra manera es describir al subespacio exhibiendo generadores del mismo. Recor-
demos que un subespacio T es, simplemente, un conjunto de vectores que tiene las propiedades 1-3 introducidas en
el apartado 3.1. Un conjunto de generadores de T es un conjunto finito de vectores {v1 , . . . , vr } tal que, cualquier
vector de T , puede escribirse como combinación lineal de v1 , . . . , vr (de la misma forma como cualquier punto de
un plano se podía escribir como combinación lineal de sus vectores directores).
Definición 35 Sea T ⊂ Rn un subespacio. Un conjunto de generadores para T es un conjunto finito
Al considerar, nuevamente, al subespacio S ⊂ R5 conformado por todos los vectores de R5 cuya última coordenada
es 0. Afirmamos que el conjunto (de cuatro vectores):
es un sistema de generadores de S. Esto significa que debemos verificar que todos los vectores de S se pueden
escribir como combinación lineal de los vectores (1, 0, 0, 0, 0), (0, 1, 0, 0, 0), (0, 0, 1, 0, 0), (0, 0, 0, 1, 0) y, además,
que todos los vectores de h(1, 0, 0, 0, 0), (0, 1, 0, 0, 0), (0, 0, 1, 0, 0), (0, 0, 0, 1, 0)i están en S (recuerden que dos
conjuntos A y B son iguales si y solo si A ⊂ B y B ⊂ A simultáneamente). Por un lado, los vectores de S tienen
la forma (a, b, c, d, 0) con a, b, c, d ∈ R. Pero,
es una combinación lineal de los vectores del conjunto en consideración. Esto muestra que:
S ⊂ h(1, 0, 0, 0, 0), (0, 1, 0, 0, 0), (0, 0, 1, 0, 0), (0, 0, 0, 1, 0)i.
Por otro lado, cualquier combinación lineal de los vectores (1, 0, 0, 0, 0), (0, 1, 0, 0, 0), (0, 0, 1, 0, 0), (0, 0, 0, 1, 0)
tiene su última coordenada 0, pues:
Esto muestra que h(1, 0, 0, 0, 0), (0, 1, 0, 0, 0), (0, 0, 1, 0, 0), (0, 0, 0, 1, 0)i ⊂ S. Concluimos, entonces, que S =
h(1, 0, 0, 0, 0), (0, 1, 0, 0, 0), (0, 0, 1, 0, 0), (0, 0, 0, 1, 0)i, como queríamos ver.
¿Cómo pasamos de la descripción por generadores a la descripción por ecuaciones y viceversa? De la misma manera
que hicimos para pasar de la ecuación implícita a la vectorial de una recta o un plano. Consideremos el subespacio:
x2 (−2, 1, 0, 1) + x3 (0, 0, 1, 3)
Como x2 y x3 no tienen restricciones, entonces son libres, y los vectores de T son las combinaciones lineales de los
vectores (−2, 1, 0, 1) y (0, 0, 1, 3). Es decir, T = h(−2, 1, 0, 1), (0, 0, 1, 3)i.
Si ahora queremos describir por ecuaciones el subespacio h(−2, 1, 0, 1), (0, 0, 1, 3)i, simplemente debemos plantear
que los puntos del subespacio son las combinaciones lineales de ambos vectores. Es decir, los puntos de este
subespacio son de la forma:
λ(−2, 1, 0, 1) + µ(0, 0, 1, 3)
3.4.1 Bases
Experimento 23 Muestren que cada uno de los siguientes conjuntos es un sistema de generadores para S.
1. {(1, 0, 0, 0, 0), (0, 2, 0, 0, 0), (0, 0, 3, 0, 0), (0, 0, 0, 4, 0)}.
2. {(1, 0, 0, 0, 0), (1, 1, 0, 0, 0), (1, 1, 1, 0, 0), (1, 1, 1, 1, 0)}.
3. {(1, 0, 0, 0, 0), (0, 1, 0, 0, 0), (0, 0, 1, 0, 0), (0, 0, 0, 1, 0), (1, 2, 3, 4, 0)}.
¿Qué sucede en el punto 3. del experimento 24? Tanto en el desarrollo de la explicación como en los puntos 1. y 2.,
vemos que S se puede generar usando cuatro vectores; pero el ítem 3. indica que también podemos hacerlo con
cinco. En este caso, sucede que es que el último vector es combinación lineal de los otros, con lo cual no aporta
ninguna información nueva. Sin embargo, también es un sistema de generadores de S, pues todo elemento de S es
combinación lineal de esos cinco vectores y todo vector que sea combinación lineal de esos cinco vectores está en
S. Si trabajamos con un subespacio, lo más conveniente es tenerlo descripto de la manera más sencilla posible. Es
decir, ¿por qué usar cinco vectores si podemos describirlo con cuatro? Esta es precisamente la noción de base de un
subespacio: un sistema de generadores del subespacio lo más pequeño posible. ¿Qué significa “lo más pequeño
posible”? Que no haya ningún vector “de más” en el sistema: que con el resto de los vectores del sistema “nos
alcanza”. Y un vector “está de más” en un sistema de generadores si lo podemos generar con los otros vectores del
sistema; vale decir, si es combinación lineal de los otros. La definición forma del base es, entonces, la siguiente:
Definición 36 Sea S un subespacio de Rn . Un conjunto de vectores {v1 , . . . , vr } es una base de S si es un
Observemos que si un conjunto de vectores tiene menos vectores que una base, entonces, no puede ser un
sistema de generadores, y si tiene más vectores que una base entonces no puede ser linealmente independiente.
Se puede ver que los conjuntos de generadores de los ítems 1. y 2. del Experimento 23 son bases del subespacio S
(es decir, son conjuntos linealmente independientes). Por el contrario, como observamos, el conjunto de generadores
del ítem 3. no es una base. Sin embargo, notemos que, si removemos el último vector del sistema, obtenemos una
base de S. Esto siempre se le puede hacer a un sistema de generadores: remover sus vectores hasta quedarnos con
un conjunto linealmente independiente. Esto se llama extraer una base del sistema de generadores. Lo que sucede es
que, si X es un sistema de generadores de un subspacio T 6= {~0} que no es base, entonces alguno de sus vectores es
combinación lineal de los otros. Por lo tanto, podemos remover este vector al conjunto X y este nuevo conjunto más
pequeño, seguirá generando al subespacio T (porque, al haber removido un vector que es combinación lineal de los
otros, no perdimos información). Este procedimiento podemos continuarlo hasta obtener un conjunto linealmente
independiente que genere T (y, por ende, sea una base de T ).
Observen por qué el procedimiento anterior siempre termina en un conjunto linealmente independiente. Analicen
cómo son los conjuntos generados por un solo vector.
El procedimiento anterior siempre termina en un conjunto de generadores del suvbespacio. Analicen las posibles
formas en las que no es posible continuar con el proceso.
Tal como establecimos, hallar bases de subespacios es muy importante, ya que las bases proveen las maneras más
fáciles de describir a los subespacios. Miren una de las ventajas de trabajar con bases en el siguiente ejemplo:
Ejemplo 38 Consideren un subespacio S ⊂ Rn y sea B = {v1 , . . . , vr } una base de S. Sabemos que, como B es
un sistema de generadores, entonces todo vector de S es combinación lineal de elementos de B. Pero como B es una
base, demostramos que esta combinación lineal es única. Es decir, existe una sola manera de combinar linealmente los
vectores de B para lograr un vector w
~ ∈ S dado. En efecto, supongamos que hubiese dos maneras de expresar a w
~ como
combinación lineal de los elementos de B:
~ = λ1 v~1 + · · · + λr v~r y w
w ~ = µ1 v~1 + · · · + µr v~r .
Esto es una combinación lineal de los elementos de B que da ~0 y, como B es un conjunto linealmente independiente,
entonces la única posibilidad es que todos los coeficientes λ1 − µ1 , . . . , λr − µr sean 0 (recuerden la definición 34
dada en la página 82). Por lo tanto, λ1 = µ1 , λ2 = µ2 ... λr = µr y concluimos que las dos combinaciones lineales que
en principio parecían distintas, en realidad, son la misma.
Por supuesto, hay infinitas bases que podemos construirnos para un subespacio (como hay infinitas posibilidades de
crear un sistema de generadores o de elegir vectores directores de un plano). Tengamos en cuenta que las bases que
construimos para el subespacio S de vectores de R5 con la última coordenada nula siempre tienen cuatro vectores.
Podríamos preguntarnos si esto es casualidad o no. Es decir, si tenemos dos bases B y B 0 para un subespacio S,
¿tienen la misma cantidad de vectores siempre? La respuesta es sí. Dos bases del mismo subespacio de Rn tienen
siempre la misma cantidad de vectores. Este número se llama dimensión del subespacio S. En nuestro ejemplo,
podemos decir que S tiene dimensión 4.
La noción de dimensión es muy útil también para trabajar con espacios vectoriales. Por ejemplo, si sabemos que S
tiene dimensión 4, entonces, ya podemos concluir que un conjunto que no tenga exactamente cuatro vectores no
puede ser base de S. También, si se tienen dos subespacios T, L ⊂ Rn de la misma dimensión, tales que uno está
contenido en el otro (por ejemplo, L ⊂ T ), entonces concluimos que son iguales.
La palabra “dimensión” en el contexto de la teoría de subespacios está fuertemente ligada a nuestra noción de
esta palabra en la vida cotidiana. Por ejemplo, sabemos que nuestro espacio (de tres grados de libertad) es
tridimensional; y tenemos, seguramente, la idea de que un plano tiene dos dimensiones y una recta, una sola. Y
esto es precisamente lo que sucede con esta definición de dimensión. Puede probarse que toda base de un plano
tiene dos vectores y, por lo tanto, todos los planos tienen dimensión 2. Por ejemplo, el plano xy en R3 tiene por
posible base al {(1, 0, 0), (0, 1, 0)}. De la misma manera, el espacio R3 tiene dimensión 3, con posible base
{(1, 0, 0), (0, 1, 0), (0, 0, 1)}. Estas bases que parecen tan naturales de considerar se las conoce como bases
canónicas.
Álgebra A. Generadores, base y dimensión. 87
Definimos algebraicamente la noción de subespacio vectorial de Rn a partir de sus propiedades relacionadas con la
suma de vectores y el producto por un escalar.
Estudiamos las nociones de combinación lineal de vectores y de dependencia lineal de vectores.
Definimos las nociones de sistema de generadores, de base y de dimensión de un subespacio vectorial.
4. Cónicas
En este capítulo estudiaremos una familia de curvas de R2 , llamadas cónicas. Su nombre proviene de que dichas
curvas se obtienen al cortar un cono en el espacio con distintos tipos de planos. Los conjuntos de puntos que
determinan estas curvas no forman espacios lineales (como rectas y planos que desarrollamos en el capítulo 2),
sino que son curvados. En este sentido, no guardan relación con propiedades de la suma y producto por escalar de
vectores. Además, las ecuaciones que las definen no son lineales (veremos que tienen las coordenadas elevadas al
cuadrado). En la segunda parte del libro, retomaremos el estudio de espacio lineales.
Una sección cónica o curva cónica es una curva que se obtiene al intersecar un cono con un plano que no pasa por
el vértice del cono. Según la inclinación del plano, se obtienen distintas curvas: elipse, circunferencia, parábola e
hipérbola.
Es el conjunto de puntos que se muestra en la Figura 4.1, lado izquierdo. Notemos que, a diferencia de lo que
comúnmente se considera un cono (como un cono de helado), en nuestra definición, se contemplan dos “conos
de helados” que se tocan por los vértices. Llamemos informalmente a las mitades del cono, semicono superior
y semicono inferior. La manera algebraica de definir un cono es por medio de una ecuación. Los puntos de la
curva cumplen que las coordenadas de sus puntos, al reemplazarse en la ecuación dan un resultado verdadero. Tal
como adelantamos arriba, esta ecuación no es lineal, como las que vimos en los capítulos anteriores, sino que es
cuadrática: aparecen las coordenadas elevadas al cuadrado.
90 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
x2 + y 2 − z 2 = 0.
Cabe destacar que el punto (0, 0, 0) pertenece al cono, y se lo llama vértice del cono. Observemos también que el
cono contiene infinitas rectas (Figura 4.1, lado derecho). Justamente, es posible darse cuenta que el cono es, en
realidad, la unión de estas infinitas rectas y que todas ellas se tocan solo en el vértice. Estas rectas reciben el nombre
de generatrices.
En el capítulo 2, cortamos dos planos no paralelos de R3 (es decir, los intersecamos), al hacer esto obtenemos una
recta. Ahora veremos qué sucede al cortar el cono con distintos tipos de planos, obtendremos distintos tipos de
curvas. ¿Qué tipos de planos utilizaremos para cortar? Consideremos todos los posibles planos pero que no pasen
por el vértice del cono. Imaginemos que empezamos con un plano horizontal y vamos inclinándolo hasta hacerlo
vertical; y vayamos viendo las curvas que vamos obteniendo al intersecar.
Por un lado, cortemos al cono con un plano horizontal (es decir, paralelo al plano xy). Si lo hacemos a la altura del
vértice (vale decir, el plano z = 0), solo obtenemos el vértice del cono (esto no nos brinda mucha información).
Entonces, cortemos con el plano Π que está a “altura” 1, es decir, el plano de ecuación z = 1. La manera de calcular
la intersección entre C y Π es la misma que vimos antes. Los puntos en ambos objetos son los que verifican las
ecuaciones de C y las ecuaciones de Π simultáneamente. Por lo tanto, buscamos (x, y, z) ∈ R3 tales que:
x2 + y 2 − z 2 = 0
z=1
p
Al reemplazar la segunda ecuación en la primera, obtenemos x2 +y 2 −12 = 0 o, lo que es lo mismo, x2 + y 2 = 1.
Esta es la ecuación de una circunferencia de radio 1 contenida dentro del plano Π. Si ahora cortamos con el plano
p
Π0 de ecuación z = 2, obtenemos que los puntos de la intersección entre C y Π0 verifican x2 + y 2 = 2, que es la
ecuación de una circunferencia de radio 2 pensada dentro del plano Π0 . En general, al cortar con el plano Πk de
ecuación z = k (con k ∈ R cualquiera), obtenemos una circunferencia de radio |k| dentro de dicho plano (Figura
4.2). Si en cualquiera de estos ejemplos, identificamos el plano Πk con R2 , entonces, todos estos círculos son
Álgebra A. Curvas cónicas. 91
circunferencias centradas en el (0, 0) de radio |k|. Como solo nos importa la forma de estas curvas cónicas, vamos a
estudiar,en general, circunferencias no necesariamente centradas en el origen. Las circunferencias, entonces, son un
tipo de curvas cónicas.
Consideremos ahora un plano horizontal con altura positiva en el eje z, e inclinémoslo levemente de manera que
siga atravesando todas las generatrices de C y que lo haga solo del lado positivo de las z; es decir, que corte solo
el semicono superior de C. El conjunto de puntos que se halla en la intersección entre el cono y este plano forman
una elipse (Figura 4.3). Las elipses admiten una ecuación que las hacen fácilmente identificables pero, en este caso
(y en los que siguen), no haremos la deducción de la ecuación a partir del sistema de ecuaciones que determina la
intersección, porque involucran una serie de pasos técnicos que no nos interesan considerar a esta altura. Las elipses,
entonces, son un tipo de curvas cónicas.
Consideremos un plano que no pase por el vértice del cono y que sea paralelo a alguna directriz. La curva determinada
por la intersección de un plano como este y el cono, es una parábola (Figura 4.4). Seguramente, la parábola es la
cónica más familiar para el estudiante. En este libro la estudiaremos desde un punto de vista más amplio. Entonces,
decimos que las parábolas son un tipo de curvas cónicas.
92 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Finalmente, cortemos el cono con un plano que no pase por su vértice y que interesecte a ambos semiconos del
cono pero que no sea paralelo a ninguna generatriz. La curva que queda determinada por esta intersección, se llama
hipérbola (Figura 4.5), y a diferencia de las otras cónicas que veremos, posee dos ramas. Esto implica que es una
curva desconectada: para recorrerla completamente en algún momento debemos “saltar” hacia la otra rama. Las
hipérbolas son el último tipo de curvas cónicas.
4.2 La circunferencia
Vimos que una circunferencia se obtiene al cortar un cono con un plano horizontal. En este apartado vamos estudiar
cómo definirla como lugar geométrico (es decir, como los puntos que verifican cierta propiedad de distancia respecto
de otro/s punto/s o recta/s), y analizaremos en detalle las propiedades de estas curvas.
Definición 38 Una circunferencia es un conjunto que consta todos los puntos de R2 que están a una distancia
fija, r, de un punto dado P . El punto P recibe el nombre de centro de la circunferencia y la distancia r, el radio.
Esta manera de definir circunferencia se conoce como “dar la circunferencia como lugar geométrico”. Notemos que
el radio r de una circunferencia siempre es un número positivo, ya que está representando una distancia, y no puede
haber distancias negativas.
Veamos esta definición aplicada a un centro y un radio particulares:
Ejemplo 39 Supongamos que queremos encontrar a todos los puntos del plano que están a una distancia de 4 unidades
del punto Q = (3, −1). Si llamamos P = (x, y) a un punto cualquiera que se encuentra a una distancia de 4 unidades
del punto Q, podemos plantear la siguiente igualdad:
p
d(Q, P ) = (x − 3)2 + (y + 1)2 = 4.
(x − 3)2 + (y + 1)2 = 42
Es decir,
(x − 3)2 + (y + 1)2 = 16
La expresión que obtuvimos es la que define el lugar geométrico de los puntos del plano que se encuentran a 4 unidades
de distancia del punto Q = (3, −1); es decir: la ecuación de la circunferencia de centro Q = (3, −1) y radio r = 4.
A partir del ejemplo anterior, podemos pensar en escribir una fórmula que defina el lugar geométrico de todos los
puntos del plano que se encuentran a una distancia r de un punto fijo llamado centro Q = (x0 , y0 ). El razonamiento
es análogo al del ejemplo. Tomemos un punto genérico de la circunferencia P = (x, y). Podemos plantear que la
distancia entre el punto P y Q debe ser siempre igual a r. Es decir:
p
d(Q, P ) = (x − x0 )2 + (y − y0 )2 = r
(x − x0 )2 + (y − y0 )2 = r2
D2 E2 D2 E2
x2 + Dx + + y 2 + Ey + = + −F
4 4 4 4
y, por tanto,
D 2 E 2 D2 + E 2 − 4F
x+ + y+ =
2 2 4
D 2 +E 2 −4F
Definiendo G = 4 , la última ecuación queda escrita como:
D 2 E 2
x+ + y+ =G
2 2
√
Como esta última ecuación 0 ≤ G (pues G es suma de cuadrados), entonces, podemos considerar r = G, y obtener:
D 2 E 2
x+ + y+ =r
2 2
Entonces hemos transformado la ecuación (1) en la ecuación canónica de un círculo de centro (− D E
2 , − 2 ) y radio r.
Cuando ningún punto satisface la fórmula (1), por ejemplo como en el caso x2 + y 2 + 4 = 0, para evitar tener que
considerar diferentes casos, decimos que el vacío (que es el conjunto solución de la ecuación anterior) es un círculo
degenerado.
Denominamos a las fórmulas de la forma:
x2 + y 2 + Dx + Ey + F = 0
cuadrados obtenemos x2 + 2x + 1 + y 2 − 6y + 9 = 1, pues lo único que tuvimos que hacer fue sumar en ambos
miembros 1 y reordenar el primer miembro. Esta última expresión puede reescribirse (x + 1)2 + (y − 3)2 = 1, con lo
cual tenemos que esta ecuación describe una circunferencia de centro (−1, 3) y radio r = 1.
Estudiamos a la circunferencia como lugar geométrico de puntos, es decir, como el conjunto de puntos que distan de
otro punto (el centro) en cierta magnitud (radio).
Introdujimos las ecuaciones canónicas y generales de una circunferencia.
4.3 La elipse
Ya hemos mencionado que la elipse es la cónica que se obtiene cortando al cono con un plano que no pasa por su
vértice y que corta a todas las generatrices. Al igual que la circunferencia, la elipse puede definirse como lugar
geométrico.
Álgebra A. La elipse. 95
Importante En este libro, solo trabajaremos con elipses cuyos focos se encuentran sobre una recta paralela al
eje x o al eje y.
Recuerden que la circunferencia tiene la propiedad definitoria de constar de los puntos del plano que distaban del
centro en una magnitud determinada. Como lugar geométrico, la elipse tiene una propiedad similar pero en lugar de
estar referida a su centro, está referida a dos puntos llamados focos. La propiedad definitoria es la siguiente:
Definición 39 Sean F1 , F2 ∈ R2 dos puntos fijos. Una elipse E asociada a F1 y F2 es el conjunto de puntos
de R2 tales que la suma de sus distancias a F1 y F2 es una magnitud constante. Es decir, hay un número real
positivo k ∈ R fijo tal que E = {P ∈ R2 : d(P, F1 ) + d(P, F2 ) = k}.
Para comprender qué implica esta definición, busquemos el lugar geométrico de los puntos para los cuales la suma
de sus distancias a F1 = (5, 0) y a F2 = (−5, 0) es igual a 26.
Decimos que P = (x, y), es un punto de dicho lugar geométrico. Entonces, tenemos que sumar las distancias de F1
a P y de F2 a P, es decir:
d(P, F1 ) + d(P, F2 ) = 26
p
Dado que la fórmula de la distancia entre dos puntos es d(P, Q) = (xp − xq )2 + (yp − yq )2 , entonces para los
puntos en cuestión tenemos:
p p
(x − 5)2 + (y − 0)2 + (x + 5)2 + (y − 0)2 = 26
p p
x2 − 10x + 25 + y 2 + x2 + 10x + 25 + y 2 = 26
p p
x2 − 10x + 25 + y 2 = 26 − x2 + 10x + 25 + y 2
96 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
p p
( x2 − 10x + 25 + y 2 )2 = (26 − x2 + 10x + 25 + y 2 )2
p
x2 − 10x + 25 + y 2 = 676 − 52 x2 + 10x + 25 + y 2 + x2 + 10x + 25 + y 2
p
x2 − 10x + 25 + y 2 − 701 − (x2 + 10x + y 2 ) = −52 x2 + 10x + 25 + y 2
p
−2(10x + 338) = −52 x2 + 10x + 25 + y 2
p
10x + 338 = 26 x2 + 10x + 25 + y 2
p
(10x + 338)2 = (26 x2 + 10x + 25 + y 2 )2
p
100x2 + 6760x + 114244 = (26 x2 + 10x + 25 + y 2 )2
x y2
+ =1
169 144
es decir,
x2 y2
+ =1
132 122
En el apartado anterior, vimos cómo podemos describir una elipse a través de una ecuación. Para esta deducción
partimos de la definición de la elipse como lugar geométrico (tal como hicimos para la circunferencia) y llegamos a
una fórmula.
Nuevamente, consideremos una elipse genérica alrededor del origen como hicimos en el apartado anterior (Figura
4.7), aunque no necesariamente con el semieje mayor sobre el eje x (podría estar sobre el eje y). Es decir, los focos
equidistan del origen pero pueden estar sobre el eje x o el eje y. Además, sigamos representando a a y b como
la longitud del semieje sobre el eje x y sobre el eje y, respectivamente (alguno de ellos será el mayor y el otro el
menor). Entonces, la ecuación canónica de la elipse de centro (0, 0) es:
x2 y2
+ = 1.
a2 b2
Álgebra A. La elipse. 97
Tengamos en cuenta cómo en la ecuación aparecen explícitamente las longitudes de los semiejes mayor y menor
(sean cuales sean). Más aún, el valor a, que corresponde a la longitud del semieje sobre el eje x, aparece dividiendo
la variable x y el valor b, que corresponde a la longitud del semieje sobre el eje y, a la variable y.
Entonces, en en el caso que vimos más arriba, a = 13 y b = 12. Es decir que, el lugar geométrico de los puntos
para los cuales la suma de sus distancias al punto F1 = (5, 0) y al punto F2 = (−5, 0) es igual a 26 es la elipse de
x2 y2
centro (0, 0) con ecuación 132 + 122 = 1.
A partir de este caso, es muy sencillo obtener la ecuación canónica de una elipse que no esté necesariamente centrada
en el origen. En efecto, si “trasladamos” su centro a cualquier punto (x0 , y0 ), siendo los ejes de la elipse paralelos a
los ejes x e y respectivamente, la ecuación resulta:
(x − x0 )2 (y − y0 )2
+ = 1,
a2 b2
Ejemplos 41
1. La elipse E1 de focos F1 = (−3, 0) y F2 = (3, 0) y longitud de semieje mayor igual a 5 tiene su centro en el
origen de coordenadas y puede verse en la Figura 4.8, lado izquierdo.
2. La elipse E2 de focos F1 = (−1, 1) y F2 = (5, 1) y longitud de semieje mayor igual a 7 puede verse en la
Figura 4.8, centro. El centro de esta elipse es el punto (2, 1).
3. La elipse E3 de focos F1 = (−6, −2) y F2 = (−6, 8) y longitud de semieje mayor igual a 10 puede verse en la
Figura 4.8, lado derecho. El centro es el punto (−6, 3) y el semieje mayor es perpendicular al eje y (a diferencia
de los dos ejemplos anteriores).
Observación 13 Cabe destacar que para definir una elipse, no alcanza con dar los focos. Además, debemos
brindar algún otro parámetro (como, por ejemplo, la longitud del semieje mayor). Una manera sencilla de
observar esto es considerar el caso F1 = F2 (en el que la elipse es realmente una circunferencia). En ese caso,
saber los focos no determina la circunferencia: debemos especificar su radio.
¿Cómo podemos hallar los elementos de la elipse a partir de sus focos y semieje mayor? Veamos cómo encontrar
B1 , B2 , y por ende b, a partir de F1 , F2 y a. Observermos la Figura 4.7. Como B1 es un punto de la elipse entonces
d(B1 , F1 ) + d(B1 , F2 ) = 2a. Pero, como d(B1 , F1 ) = d(B1 , F2 ), se cumple que 2d(B1 , F1 ) = 2a; es decir,
d(B1 , F1 ) = a. Además, como el triángulo de vértices O,B1 y F1 es rectángulo, el Teorema de Pitágoras asegura
que:
d(B1 , F1 )2 = d(B1 , O)2 + d(O, F1 )2
98 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Experimento 24
1. Vuelvan a ver los Ejemplos 41 e interpreten cómo fueron dibujadas las elipses E1 , E2 y E3 , a partir de
los focos y longitud del semieje mayor.
2. Supongan que les brindan como dato el centro de la elipse y la longitud de los semiejes mayor y menor.
Hallen la ubicación de los focos.
Observemos que la excentricidad de la elipse siempre es un número menor a 1. ¿Qué nos dice la excentricidad
de la elipse? Recordemos que c es la distancia de los focos al origen y a la longitud del semieje mayor (es decir,
la distancia del punto donde la elipse corta al eje x al origen). Cuanto más cerca estén los focos de este punto de
intersección más parecidos serán c y a y, por lo tanto, la excentricidad será más cercana a 1. Como resultado la
elipse será más “chata” o “aplastada”. Mientras que más lejos estén estas magnitudes, la excentricidad será más
pequeña (acercándose a 0) y la elipse será más “redondeada”. La situación extrema es, por supuesto, cuando c = 0,
en cuyo caso los focos están en el origen, por lo cual la elipse es en realidad una circunferencia. La excentricidad
mide entonces qué tan lejos está la elipse de ser una circunferencia, donde los valores más cercanos a 0 indican que
es muy parecida, y los valores cercanos a 1 que no (Figura 4.9).
c
Por lo tanto, la excentricidad de la elipse es e = a
= 37 .
Álgebra A. La elipse. 99
p
3. En E3 , la elipse tiene como centro al punto (−6, 3), a = 10 y c = d((−6, 3), (−6, −2)) = (−6 − (−6))2 + (3 − (−2))2 =
5
5. La excentricidad en este caso es e = 10
= 12 .
¿Cuál de estas elipses es más achatada? ¿Cuál más redondeada?
Observación 14 Recordando la observación de la página 103, vemos que el Experimento 24 establece que una
elipse también queda determinada por las longitudes de los semiejes, siempre y cuando especifiquemos el punto
medio entre ambos focos.
Ejemplos 43 Vamos a hallar las ecuaciones canónicas de las elipses del Ejemplo 41.
1. Según la fórmula hallada en el párrafo anterior, podemos construirnos la ecuación de una elipse si conocemos las
longitudes de sus semiejes mayor y menor. En el caso de la elipse E1 , ya sabemos que a = 5, por lo que solo nos
resta hallar b. Pero vimos que siempre vale a2 = b2 + c2 , donde c es la distancia de los focos al centro de la
elipse. En este caso, c = 3; por lo tanto, b2 = a2 − c2 = 52 − 32 = 25 − 9 = 16. Luego, concluimos que la
x2 y2
ecuación canónica de la elipse E1 es 1 = 25
+ 16
. De todas formas, mostraremos cómo pueden obtenerse.
2. En el caso de E2 , tenemos que a = 7 y c = 3, por lo que b2 = a2 − c2 = 40. Aquí tenemos otro centro: el
(2, 1). Por lo tanto, la ecuación canónica de E2 es:
(x−2)2 (y−1)2
1= 49
+ 40
.
(x+6)2 2
3. Finalmente, para E3 se tiene a = 10 y c = 4, por lo que b2 = a2 −c2 = 84. La ecuación es: 1 = 10
+ (y−3)
84
.
Otra manera de representar una elipse por medio de ecuaciones es lo que se conoce como ecuación general de la
elipse. Esta tiene la forma αx2 + βy 2 + γx + δy + = 0, donde α, β, γ, δ, ∈ R. Aquí, los coeficientes no guardan
relación directa con los elementos de la elipse (como sí sucede en el caso de la ecuación canónica). Para hallar la
ecuación general a partir de la ecuación canónica solo debemos desarrollar los términos que aparecen elevados al
cuadrado y “pasar” todos los términos de un lado de la igualdad. Por ejemplo, consideremos la elipse de ecuación
(x−2)2 (y−1)2
canónica 49 + 40 = 1. Al desarrollar, tenemos:
(x − 2)2 (y − 1)2
1 = + =
49 40
x2 − 4x + 4 y 2 − 2y + 1
= + =
49 40
El pasaje de la ecuación general a la canónica es un tanto más laborioso. Antes de hacer un ejemplo, comentemos
el procedimiento que utilizaremos: se llama “completar cuadrados” y es el procedimiento inverso a desarrollar el
cuadrado de la suma de dos términos. Si tenemos una expresión de la forma x2 + 4x + 4, es equivalente a (x + 2)2 .
Pero si tenemos la expresión x2 + 4x, no podemos hacer lo mismo (ya que nos falta el término 4 sumado para
poder escribir la igualdad con el cuadrado de una suma). En estos casos, haremos lo siguiente sumamos el 4 que
necesitamos para poder armar el cuadrado de una suma y luego le restamos el mismo 4 para no cambiar la expresión
(pues equivaldría a sumar 0). Con el 4 que agregamos, podemos ahora armar el cuadrado de x + 2 y nos queda un
100 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
x2 + 4x = x2 + 4x + (4 − 4) = (x2 + 4x + 4) − 4 = (x + 2)2 − 4
Este procedimiento es lo que se conoce como “completar cuadrados”. Veamos ahora con un ejemplo cómo calcular
la ecuación canónica a partir de la ecuación general. Consideremos la elipse de ecuación general 64x2 + 100y 2 −
256x − 200y − 1244 = 0. Como para la ecuación canónica vamos a buscar expresiones de la forma (x − α)2 e
(y − β)2 , entonces completaremos cuadrados entre las x, por un lado, y las y, por el otro. Además, queremos que
estas variables aparezcan con coeficiente 1. Por lo tanto, reescribimos la ecuación general de la elipse de la siguiente
manera:
Aquí agrupamos las x, por un lado, y las y, por otro lado. También sacamos factor común en cada grupo para dejar
que los coeficientes de las variables x e y sean 1, y pasamos el término independiente 1244 hacia el otro lado de la
igualdad (para que la fórmula se asemeje a la ecuación canónica de la elipse). Ahora, podemos completar cuadrados
dentro de cada paréntesis:
x2 − 4x = x2 − 4x + 4 − 4 = (x − 2)2 − 4
y 2 − 2y = y 2 − 2y + 1 − 1 = (y − 1)2 − 1
De aquí, despejamos:
(x − 2)2 (y − 1)2
⇒ + =1
25 16
Estudiamos a la elipse como lugar geométrico de puntos. Es decir, como el conjunto de puntos para los que la suma
de las distancias a los focos de la elipse es constante.
Definimos los semiejes mayor y menor de la elipse, y vimos que la constante antes citada es dos veces la longitud del
semieje mayor.
Definimos la excentricidad de la elipse.
Introducimos la ecuación canónica y la ecuación general de una elipse.
Álgebra A. La hipérbola. 101
4.4 La hipérbola
La hipérbola es la única cónica que no es conexa; ya que consta de dos ramas desconectadas. En este apartado la
analizaremos en detalle.
En este apartado estudiaremos...
Los elementos asociados a una hipérbola son los mismos que los asociados a una elipse (semiejes mayor y menor,
focos, excentricidad). En particular, la hipérbola también se define a partir de dos focos.
Pero antes de entrar en esos detalles analicemos la siguiente situación: busquemos la ecuación que describa los
puntos tales que la diferencia de sus distancias a dos puntos F1 = (5, 0) y F2 = (−5, 0), es igual a 6. La idea es
muy similar a la que desarrollamos para la elipse. Llamemos P = (x, y), entonces:
d(P, F1 ) − d(P, F2 ) = 6
p p
(x − 5)2 + (y − 0)2 − (x − (−5))2 + (y − 0)2 = 6
p p
x2 − 10x + 25 + y 2 − x2 + 10x + 25 + y 2 = 6
p p
( x2 − 10x + 25 + y 2 )2 = (6 + x2 + 10x + 25 + y 2 )2
p
x2 − 10x + 25 + y 2 = 36 + 12 x2 + 10x + 25 + y 2 + x2 + 10x + 25 + y 2
Es decir,
p
−20x − 36 = 12 x2 + 10x + 25 + y 2
p
(−10x − 18)2 = (6 x2 + 10x + 25 + y 2 )2
al despejar:
x2 y2
− =1
32 42
102 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Aquí, los focos F1 y F2 están ubicados sobre el eje de las x, equidistantes del origen de coordenadas O = (0, 0), y
las magnitudes a y b tienen un sentido menos claro que la elipse. Sin embargo, nos permiten relacionar la fórmula
con la ubicación de los focos sobre el eje a partir de la fórmula c2 = a2 + b2 , donde c es la distancia del centro de la
hipérbola a los focos. Entonces, la ecuación canónica de la hipérbola de centro (0, 0) es:
x2 y2
2
− 2 = 1.
a b
Observemos como, al igual que en el caso de la elipse, las longitudes de los semiejes aparecen dividiendo precisa-
mente a la variable correspondiente al eje sobre el que descansan. Si ahora la hipérbola tiene centro en un punto
C0 = (x0 , y0 ) y sus focos están sobre una recta paralela al eje x, entonces su ecuación es:
(x − x0 )2 (y − y0 )2
2
− = 1.
a b2
Por otro lado, si la hipérbola tiene centro en un punto C0 = (x0 , y0 ) y sus focos están sobre una recta paralela al eje
y, entonces su ecuación es:
(y − y0 )2 (x − x0 )2
− = 1.
b2 a2
Importante En este libro, solo trabajaremos con hipérbolas cuyos focos se encuentran sobre una recta paralela
al eje x o al eje y.
Ejemplos 44
1. La hipérbola H1 de focos F1 = (−5, 0) y F2 = (5, 0) y longitud de semieje mayor igual a 4 tiene su centro en
el origen de coordenadas y puede verse en la Figura 4.11, lado izquierdo. Para esta hipérbola, los focos están
sobre una recta paralela al eje x y con centro en el origen, tenemos a = 4, b2 = c2 − a2 = 52 − 42 = 9. Por lo
x2 y2
tanto, la ecuación canónica de la misma es 1 = 16
− 9
.
2. La hipérbola H2 de focos F1 = (−3, 1) y F2 = (7, 1) y longitud de semieje mayor igual a 2 puede verse en
Álgebra A. La hipérbola. 103
la Figura 4.11, centro. El centro de esta hipérbola es el punto (2, 1), y también tiene sus focos sobre una recta
paralela al eje x. Como además a = 2 y b2 = c2 − a2 = 52 − 22 = 21, entonces la ecuación canónica es
(x−2)2 (y−1)2
1= 4
− 21
.
3. La hipérbola H3 de focos F1 = (2, −6) y F2 = (2, 4) y longitud de semieje mayor igual a 3 puede verse en la
Figura 4.11, lado derecho. El centro es el punto (2, −1) y el semieje mayor es perpendicular al eje y (a diferencia
de los dos ejemplos anteriores). Como a = 3 y b2 = c2 − a2 = 52 − 9 = 16 entonces la ecuación canónica de
(y−2)2 (x+1)2
H3 es 1 = 9
− 16
.
Al igual que en el caso de la elipse, podemos desarrollar los cuadrados de la ecuación canónica para obtener una
expresión de la forma αx2 + βy 2 + γx + δy + = 0, con α, β, γ, δ, ∈ R. Pero a diferencia de la ecuación
general de la elipse, los signos de los coeficientes α y β serán necesariamente opuestos. Esto se debe a que en la
ecuación canónica de una elipse, uno de los paréntesis tiene signo positivo y el otro negativo. Esta característca es,
en particular, lo que nos indica si una ecuación general de la forma αx2 + βy 2 + γx + δy + = 0, corresponde a una
elipse o una hipérbola (sólo debemos comparar los signos de los coeficientes que multiplican a x y a y). Por ejemplo,
(x−2)2 2
ecuación general de la hipérbola de ecuación canónica 16 − (y+1)
9 = 1 es 9x2 − 16y 2 − 36x + 32y − 124 = 0.
Les presentamos un experimento para que, a través del mismo, muestren cómo obtener una ecuación de la otra.
Observación 15 Al igual que en la elipse, para definir una hipérbola no nos alcanza con brindar los focos:
debemos dar algún otro parámetro (como longitud de algún semieje).
Ejemplos 45 Vamos a hallar las excentricidades de las hipérbolas de los Ejemplos 44.
√
1. Para la hipérbola H1 , teníamos a = 4 y c = d(F1 , O) = 52 + 02 = 5. La excentricidad de esta hipérbola es,
entonces, e = 45 .
2. Para H2 , teníamos que el centro era (2, 1), a = 2 y
p
c = d((−3, 1), (2, 1)) = (−3 − 2)2 + (1 − 1)2 = 5
c
Por lo tanto, la excentricidad de la hipérbola es e = a
= 52 .
3. En H3 , la hipérbola tiene como centro al punto (2, −1), a = 3 y
p
c = d((2, −6), (2, −1)) = (2 − 2)2 + (−6 − (−1))2 = 5
La hipérbolas son las únicas cónicas que tienen asíntotas. Recuerden que una asíntota de una curva es una recta
a la que la curva se acerca indefinidamente. Ya que no presuponemos que el estudiante tenga conocimiento de la
noción de límite, solo mencionaremos que las ramas de una hipérbola de centro (x0 , y0 ) y longitud de semiejes a y
b se acercan indefinidamente a las rectas L1 y L2 de ecuaciones y = ab x + (y0 − ab x0 ) y y = − ab x + (y0 − ab x0 ),
respectivamente (Figura 4.13). Aquí, ± ab es la pendiente de la recta y y0 − ab x0 es la ordenada al origen de la recta.
También podemos representar estas rectas de manera implícita como hicimos en el capítulo 2:
b
L1 = {(x, y) ∈ R2 : ax − y = ab x0 − y0 }
L2 = {(x, y) ∈ R2 : − ab x − y = ab x0 − y0 }
Estas rectas son las asíntotas de la hipérbola.
Álgebra A. La parábola. 105
1. Para H1 , de centro en el origen, teníamos a = 4 y b = 3. Por lo tanto, las asíntotas de H1 son las rectas y = 34 x
e y = − 43 x.
√
2. H2 tiene su centro en (2, 1) y a = 2 y b = 21. Por lo tanto, las asíntotas de H2 son las rectas y =
√ √ √ √ √ √
21
2
x + (1 − 21) e y = − 221 x + (1 − 21). De manera implícita: {(x, y) ∈ R2 : 221 x − y = 1 − 21}
√ √
y {(x, y) ∈ R2 : − 221 x − y = 1 − 21}.
3. Finalmente, H3 tiene su centro en (2, −1) y a = 3 y b = 4. Sus asíntotas son {(x, y) ∈ R2 : 4
3
x − y = 35 } y
{(x, y) ∈ R2 : − 43 x − y = 53 }.
Estudiamos la hipérbola como lugar geométrico de puntos: es decir, como el conjunto de puntos para los que el
módulo de la diferencia de las distancias a los focos de la hipérbola es constante.
Definimos los semiejes mayor y menor de la hipérbola y vimos que la constante, antes citada, es dos veces la longitud
del semieje mayor.
Definimos la excentricidad de la hipérbola y las asíntotas, y aprendimos a calcularlas.
Introducimos la ecuación canónica y la ecuación general de una hipérbola.
4.5 La parábola
La parábola es seguramente la curva cónica más conocida ya que este tipo de curvas, se estudian extensamente
en la escuela secundaria. Por este motivo, solo introduciremos los elementos propios de esta curva que no suelen
estudiarse allí.
En este apartado estudiaremos...
A diferencia de las cónicas ya estudiadas, donde la definición como lugar geométrico dependía parcialmente de la
ubicación de dos focos, en la parábola depende de una recta L y un punto F no perteneciente a L. Veamos esto en
una situación particular. Encontremos el lugar geométrico de los puntos que equidistan del punto F = (0, 2) y la
106 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
p p
(x − 0)2 + (y − 2)2 = (x − x)2 + (y − (−2))2
En esta ecuación, del lado izquierdo tenemos la distancia del foco (0, 2) al punto genérico (x, y) y, del lado derecho,
la distancia de ese mismo punto genérico al punto más cercano de la recta y = −2, que tiene coordenadas (x, −2).
Al elevar y desarrollar al cuadrado ambos miembros obtenemos:
x2 + y 2 − 4y + 4 = y 2 + 4y + 4
x2 = 8y
Es decir, el lugar geométrico de los puntos del plano que equidistan de (0, 2) y de la recta y = −2 satisfacen la
ecuación x2 = 8y.
Definición 42 Sea F ∈ R2 y sea L ⊂ R2 una recta que no pase por F . La parábola T asociada a F y L es el
Recordemos que d(P, L), representa la distancia del punto P a la recta L (concepto que estudiamos en el capítulo
2). El punto F se llama foco de la parábola y la recta L, directriz de la parábola. El vértice de la parábola es el punto
medio del segmento perpendicular a la directriz que pasa por el foco. Se encuentra a igual distancia del foco que de
la directriz.
Importante Al igual que para las otras cónicas, en este libro solo trabajaremos con parábolas cuya directriz sea
Observación 16 Como en el caso de la hipérbola, las parábolas tienen un eje de simetría, que consiste en la
La ecuación que conocemos de la parábola (con directriz horizontal) y = ax2 + bx + c, se puede despejar para
obtener:
ax2 + bx − y + c = 0
y que se la conoce como la ecuación general de la parábola. Ya que esta ecuación es familiar, nos concentraremos
en la ecuación canónica. Representemos, entonces, una parábola genérica asociada a F y L, de manera que L sea
paralelo al eje y, que el foco esté sobre el semieje positivo de las x y que el vértice de la parábola sea el origen de
coordenadas (Figura 4.14). Sea p la distancia del punto F a la recta L, de modo que F resulta ser el punto ( p2 , 0). Si
P = (x, y) es un punto de la parábola, entonces, debemos tener que d(P, F ) = d(P, L). Pero,
r
p 2 p
d(P, F ) = x− + y 2 y d(P, d) = x + ,
2 2
de donde: r
p 2 p
x− + y2 = x + .
2 2
Si elevamos ambos miembros al cuadrado obtenemos:
p 2 p
x− + y 2 = (x + )2 ,
2 2
de donde:
p2 p2
x2 − px + + y 2 = x2 + px +
4 4
es decir;
p2 p2
x2 + y 2 − x2 = px + + px − .
4 4
Entonces, encontramos la ecuación y 2 = 2px que se la conoce como la ecuación canónica de la parábola con
vértice en el origen. Tengamos en cuenta que el parámetro p, que es la distancia entre el foco y la directriz, es el
que lleva la propiedad definitoria de las características de la parábola. También, es posible observar, que podemos
1 2
reescribir esta ecuación canónica como x = 2p y , cuya forma es la misma de la ecuación que conocemos de la
escuela secundaria, salvo el hecho que tiene intercambiadas las variables x e y (pues estamos considerando una
parábola “acostada”).
Esta ecuación canónica con vértice en el origen corresponde entonces a una parábola con la directriz paralela al eje
y y foco perteneciente al semieje positivo de las x. Las ecuaciones canónicas con vértice en el origen para casos
más generales de directriz y foco son las siguientes:
Si el foco esta a la “derecha” de la directriz (paralela al eje y) entonces la ecuación es y 2 = 2px.
Si el foco esta a la “izquierda” de la directriz (paralela al eje y) entonces la ecuación es y 2 = −2px.
Si el foco esta “arriba” de la directriz (paralela al eje x) entonces la ecuación es x2 = 2py.
Si el foco esta “abajo” de la directriz (paralela al eje x) entonces la ecuación es x2 = −2py.
Observación 17 La variable que aparece elevada al cuadrado es la que nos dice a qué eje es paralela la
directriz.
108 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
También, al igual que el caso de la circunferencia, la elipse o la hipérbola, si el vértice de la parábola no está en
el origen de coordenadas, sino que está en el vértice (x0 , y0 ), entonces la ecuación canónica es la misma que la
ecuación para parábolas con vértice en el origen pero reemplazando x por x − x0 e y por y − y0 , respectivamente.
Por ejemplo, la ecuación canónica de una parábola con vértice (x0 , y0 ), directriz paralela al eje x y foco en el
semieje positivo de las y es:
(x − x0 )2 = 2p(y − y0 )
Cabe destacar que, de esta ecuación, deducimos la ecuación general que conocemos de la parábola. En efecto, si
desarrollamos esta ecuación obtenemos:
x2 − 2xx0 + x20 = 2py − 2py0 . Al reordenar los términos:,
x20
1 2 x0
y= x − x+ − y0 .
2p p 2p
x20
Esta ecuación es de la forma y = ax2 + bx + c mediante las identificaciones a = 1
2p , b = − xp0 y c = 2p − y0 .
Observemos que, al igual que las ecuaciones canónicas de la elipse y la hipérbola, la ecuación canónica de una
parábola contiene la información de todos sus elementos. En efecto, aparecen las coordenadas del vértice (x0 , y0 ) y el
valor p nos permite deducir la ubicación del foco y la directriz. Por ejemplo, si la ecuación es (x−x0 )2 = 2p(y −y0 ),
entonces sabemos que la directriz es paralela al eje x, por lo que el foco debe ser el punto (x0 + p2 , y0 ) y la directriz
p
debe ser la recta de ecuación x = x0 − 2 (miren la Figura 4.14).
Experimento 26 De manera análoga a como fue hecho en el apartado busquen los focos y la directriz a
¿Cómo hacemos para obtener la ecuación canónica de una parábola? Lo mostramos en varios ejemplos. En primer
lugar, supongamos que tenemos la parábola y = 14 x2 − 2x + 6 y hallamos la ecuación canónica. Nuevamente, la
idea es “completar cuadrados”.
y = 14 x2 − 2x + 6
⇒ y − 6 = 14 x2 − 2x
⇒ y − 6 = 14 (x2 − 8x)
Completamos cuadrados dentro del paréntesis:
Hemos arribado, entonces, a la expresión canónica de la parábola. De aquí, inmediatamente vemos que el vértice es
el punto (4, 2). Sabemos que, como el valor 4 es el que multiplica a la expresión (y − 2) (que no está elevada al
p
cuadrado), entonces 2p = 4. Luego, p = 2 y, por ende, 2 = 1 es la distancia entre el foco y el vértice y entre el vértice
Álgebra A. La parábola. 109
y la directriz. Como la variable que está elevada al cuadrado es la x entonces, sabemos que la directriz será paralela al
eje x. Por lo tanto, para hallar las coordenadas del foco simplemente hacemos F = (4, 2 + p2 ) = (4, 2 + 1) = (4, 3)
p
y la ecuación de la directriz nos queda, y = 2 − 2 = 2 − 1 = 1.
Ahora bien, supongamos que queremos hallar la ecuación de la parábola cuyo foco es F = (−6, −4) y cuya
directriz es la recta de ecuación x = −2. Sabemos que el vértice se encuentra en la recta perpendicular a la directriz
que contiene al foco, a igual distancia del foco que de la directriz. Las rectas perpendiculares a x = −2 son las
de la forma y = λ, para cualquier λ ∈ R. Como queremos que pase por F entonces debe ser y = −4. Esta recta
interseca a la directriz en (−2, −4), por lo que el vértice es el punto medio entre (−2, 4) y F ; es decir, el vértice de
la parábola es (−4, −4). Para hallar p, utilizamos que la distancia del foco (o la directriz) al vértice es p2 . Como
d((−4, −4), (−6, −4)) = 2 entonces, p = 4. Por lo tanto, 2p = 8 y, como el foco está en el semieje negativo de las
x, la ecuación canónica de esta parábola es (y + 4)2 = −8(x + 4).
Observación 18 El pasaje de ecuación general a ecuación canónica, y viceversa, se realiza de idéntica manera
Anteriormente las excentricidades que medimos eran la razón entre la longitud de los semiejes y la distancia de los
focos al origen (para una curva centrada en el origen de coordenadas). Por un lado, consideramos como el semieje
de la parábola al segmento perpendicular a la directriz, que une la directriz con el origen de coordenadas (Figura
p
4.14). Ya vimos que la longitud de este segmento es 2 (donde p es la distancia de la directriz al foco). Por otro lado,
p
la distancia del foco al origen también es 2. Por lo tanto, la excentricidad de la parábola es 1, cualquiera sea la
parábola. Ahora podemos precisar un poco mejor qué mide realmente la excentricidad. Observen la Figura 4.15. Allí
se muestra como va cambiando la forma de la curva a medida que aumenta la excentricidad. La excentricidad mide
como es la curvatura de la curva cónica, en relación a la de una circunferencia. La única cónica con excentricidad 0
es la misma circunferencia, lo cual nos indica que es la curvatura “perfecta” (la curva siempre “va doblando” el
mismo ángulo en cada paso cuando la recorremos). La excentricidad también nos permite clasificar las cónicas. En
efecto, si es 0 entonces es una circunferencia. Si está estrictamente entre 0 y 1, entonces la curva es necesariamente
una elipse. Si es exactamente 1 entonces es una parábola; y si es mayor estricto que 1, es una hipérbola.
Estudiamos a la parábola como lugar geométrico de puntos: o sea, como el conjunto de puntos que se encuentran a la
misma distancia de un punto (el foco) y una recta (la directriz) dados.
Introducimos las ecuaciones canónicas de una parábola general.
II
Parte 2
8 Polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
8.1 ¿Qué es un polinomio?
8.2 División de polinomios
8.3 Raíces
8.4 Factorización de polinomios
10 Bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
5. Ecuaciones lineales, matrices y determinantes
En este capítulo estudiaremos cómo resolver eficientemente sistemas de ecuaciones lineales. Los sistemas de
ecuaciones lineales aparecen naturalmente en una inmensa cantidad de contextos, no solo en las teorías de las
ciencias exactas, sino también en otras ramas que van desde la Biología hasta la Economía.
La resolución de los sistemas de ecuaciones lineales se puede mecanizar mediante el uso de la teoría de matrices y
de determinantes, que son herramientas muy potentes del Álgebra Lineal. En particular, en este marco se puede
desarrollar software eficiente para resolver sistemas lineales muy complejos.
Vimos en el capítulo 2 que una ecuación que involucra las variables x, y se dice lineal si es de la forma ax + by = c
para ciertos a, b, c ∈ R. Esto es: cada variable aparece multiplicada por un número real, estos términos sumados y
esta suma igualada a otro número real. La misma idea vale para ecuaciones de tres variables x, y, z. En general,
tenemos la siguiente definición.
Definición 43 Una ecuación lineal en las variables x1 , . . . , xn es una relación de la forma:
a1 x1 + · · · + an xn = b,
114 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
donde a1 , . . . , an , b ∈ R. A las variables x1 , . . . , xn también se las llama las incógnitas de la ecuación y a los
números a1 , . . . , an que aparecen multiplicando a las variables se los llama coeficientes de la ecuación.
Cuando hablamos de resolver una ecuación lineal estamos intentando encontrar números c1 , . . . , cn que verifiquen
la ecuación; es decir, que al reemplazar xi con ci se obtenga la igualdad a1 c1 + · · · + an cn = b. En este caso,
decimos que c1 , . . . , cn son solución de la ecuación. Cabe destacar que importa el orden en el que escribimos los
ci , ya que no es lo mismo reemplazarlos en cualquier variable (pues los ai no son en general iguales). Por este
motivo conviene escribirlo como una n-upla (c1 , . . . , cn ) ∈ Rn y decir que el vector (c1 , . . . , cn ) es solución de la
ecuación. Por ejemplo, la ecuación implícita de un plano es una ecuación lineal que nos dice qué puntos (x, y, z) de
R3 pertenecen al plano (estos puntos son la solución de dicha ecuación implícita).
Como su nombre lo indica, un sistema de ecuaciones lineales es una colección de ecuaciones lineales que nos
interesa resolver simultáneamente. Vale decir, estamos buscando vectores (c1 , . . . , cn ) ∈ Rn que verifiquen varias
ecuaciones al mismo tiempo. Por ejemplo, la ecuación implícita de una recta en R3 es precisamente un sistema de
dos ecuaciones lineales, y los puntos de la recta son exactamente los puntos (x, y, z) ∈ R3 que son solución de
ambas ecuaciones simultáneamente. Definamos este concepto en general.
Definición 44 Un sistema de m ecuaciones lineales en las variables x1 , . . . , xn es una colección de m ecuacio-
donde a1 , . . . , an , b ∈ R. Nuevamente, nos referimos a las variables x1 , . . . , xn como las incógnitas del sistema
y a los números aij como los coeficientes del sistema. Los números bi se llaman los coeficientes libres del
sistema (son los que no acompañan a ninguna variable).
Pero, ¿qué es esta notación con tantos subíndices? Aunque no lo parezca a primera vista, es la manera más sencilla
de escribir un sistema de ecuaciones lineales de manera general. En efecto, cuando teníamos una sola ecuación en n
variables podíamos simplemente escribir:
a1 x1 + · · · + an xn ,
donde el subíndice i en el número ai indicaba que dicho número se encontraba multiplicando a la variable xi . Si
ahora tenemos un sistema de dos ecuaciones, entonces la variable xi va a estar multiplicada por un número ai en la
primera ecuación y por un número bi en la segunda ecuación. En este caso, podemos escribir el sistema como:
a x + ··· + a x = d1
1 1 n n
b x + ··· + b x = d
1 1 n n 2
Si hubiera tres ecuaciones podríamos usar ai , bi , ci . ¿Pero qué haríamos si hubiera cincuenta ecuaciones? Como no
alcanzan las letras del abecedario, deberíamos utilizar otros símbolos para representar a los coeficientes. Pero aún
cuando hiciéramos esto, ¿cómo podemos especificarle al lector que el símbolo @ corresponde a los coeficientes de
la ecuación 37 (ó cualquiera de ellas)? La manera más sencilla, entonces, es no utilizar distintas letras (o símbolos)
para los coeficientes de cada ecuación, sino usar la misma letra (o símbolo) para todas las ecuaciones pero agregando
un nuevo subíndice numérico que aclare cuál es la ecuación a la que pertenece dicho coeficiente. Por lo tanto, cuando
escribimos a36 estamos diciendo que este es el número que multiplica a x6 en la ecuación número 3. En general, el
Álgebra A. Sistemas de ecuaciones lineales. 115
primer subíndice de aij indica el número de ecuación a la que nos estamos refiriendo y el segundo subíndice indica
a qué variable está multiplicando. Por lo tanto, el coeficiente aij es el número que multiplica a xj en la i-ésima
ecuación. Observemos que, por este motivo, el subíndice i se mueve entre 1 y m y el subíndice j, entre 1 y n.
Como habrán notado, ¡ya estuvimos resolviendo sistemas de ecuaciones lineales! Las ecuaciones implícitas de las
rectas y los planos forman un sistema de ecuaciones lineales (a veces de una sola ecuación), cuya solución son
precisamente los puntos de la recta o el plano correspondiente. Además, cuando buscamos la intersección entre dos
rectas, dos planos o una recta y un plano, lo que estamos haciendo es armarnos un sistema de ecuaciones lineales
cuya solución, justamente, sean los puntos que se hallan en la intersección. El procedimiento que estudiamos para
resolver sistemas de ecuaciones lineales en capítulos anteriores, consistía en despejar una incógnita de una ecuación
y reemplazarla en la ecuación siguiente, donde con la nueva información, podíamos despejar otra incógnita para
seguir reemplazando en las siguientes ecuaciones. Existen otras “estrategias” que ahora vamos a analizar. Todas
estas maneras de resolver un sistema de ecuaciones lineales se dice que son “a mano” o “por la fuerza bruta”, ya que
uno ataca el problema de la manera que se le ocurre (que puede no ser necesariamiente eficiente). En el siguiente
apartado, vamos a simplificar los procedimientos para resolver este tipo de ecuaciones y hacerlos eficientes.
Vamos a mostrar las diferentes maneras de encarar la búsqueda de la solución por medio de un ejemplo. Supongamos
que tenemos el sistema de dos ecuaciones y dos incógnitas:
x + 2y = 5
2x − 3y = −1
Si utilizamos la estrategia que usamos en la primera parte del, podemos despejar x de la primera ecuación y obtener
x = 5 − 2y. Reemplazando esta nueva información en la segunda ecuación obtenemos 2(5 − 2y) − 3y = −1; es
11
decir, 10 − 7y = −1. Por lo tanto, depejando y se tiene y = 7 y, reemplazando esta información en x = 5 − 2y,
13
obtenemos x = 7 . Concluimos que el sistema tiene una única solución: el vector ( 13 11
7 , 7 ). Este método se suele
Este es el mismo sistema (sólo hemos reordenado los términos). Como la primera ecuación nos dice que x es igual a
una “cosa” y la segunda que x es igual a otra “cosa”, entonces en particular, las “cosas” deberían ser iguales entre
−1+3y
sí. Por lo tanto, debe suceder que 5 − 2y = 2 . Si pasamos el 2 del denominador de la fracción de la derecha
multiplicando a la izquierda, tenemos 10 − 4y = −1 + 3y. Al mover los números para un lado y las “y’s” para el
11
otro, tenemos 11 = 7y; de donde y = 7 , como habíamos hallado con el otro método. Nuevamente, al reemplazar
esta información en x = 5 − 2y o en x = −1+3y2 , nos da x = 13
7 . Este método se suele llamar método de igualación.
Finalmente, veamos una última estrategia de resolución. Es probable que no sea la primera en la que pensemos,
pero, sin embargo, es la más importante para nuestro propósito, ya que la usaremos para desarrollar una manera
mecánica de resolver sistemas de ecuaciones lineales. Comencemos nuevamente con nuestro sistema:
x + 2y = 5
2x − 3y = −1
116 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Pero (x+2y)+(2x−3y) = 3x−y, por lo cual, sumando la primera ecuación del sistema con la segunda obtenemos
una nueva ecuación 3x − y = 4. ¿Y qué relación tiene esta ecuación con las originales? Igual al caso donde a = 5 y
b = 7 forzaban a que a + b = 12, lo que dice x + 2y = 5 y 2x − 3y = −1 es que, necesariamente, 3x − y = 4.
Es decir, si x + 2y = 5 y 2x − 3y = −1, entonces, 3x − y = 4. ¿Por qué nos interesa tener esta información?
Porque al “sumar dos ecuaciones” obtenemos una nueva ecuación que es válida y que puede tener un formato más
sencillo para poder despejar las variables. Por ejemplo, despejando y de esta última ecuación hallada, tenemos
y = 3x − 4, que es mucho más ameno que despejar y de las ecuaciones originales (donde aparecen necesariamente
fracciones). Pero hay algo más que podemos hacer para obtener todavía una ecuación más sencilla. Y, nuevamente,
está basada en una observación trivial: si a = 5 entonces 2a = 2,5 = 10. En este caso, como x + 2y = 5 entonces
2(x + 2y) = 2,5 = 10; es decir, 2x + 4y = 10. Otra vez, hallamos otra ecuación que sigue siendo válida para
cualquier solución de la ecuación original (en el sentido de que si un vector (x, y) ∈ R2 es solución del sistema,
entonces también debe verificar esta nueva ecuación que construimos a partir de las originales). Tengamos en cuanta,
de todas formas, que esto es cierto si estamos multiplicando a una ecuación por un número distinto de 0 (multiplicar
una ecuación por 0 a ambos lados, simplemente, “mata” la ecuación). Al igual que el caso de la suma de ecuaciones,
multiplicar una ecuación por un número no nulo puede simplificar la ecuación y hacernos más fácil la tarea de
3
despejar variables: por ejemplo, la ecuación 10 x + 56 y = −2 puede simplificarse mucho al multiplicarla por 30.
Pero, en definitiva, es una combinación de ambas operaciones (sumar ecuaciones y multiplicarlas por un número no
nulo) que nos va a ayudar a resolver el sistema de manera más directa. En efecto, comencemos multiplicando la
primera ecuación por −2 para obtener −2x − 4y = −10. Ya dijimos que esta ecuación tiene que ser cierta (ya que
las originales lo eran). Y ahora, sumemos esta nueva ecuación con la segunda ecuación original:
Es decir, −7y = −11 (los términos que contienen a la variable x se cancelaron en la suma). De aquí, despejamos
11
muy sencillamente que y = 7 . ¿Qué es lo que hicimos? Primero multiplicamos por −2 la primera ecuación para
hacer que aparezca un −2 multiplicando a la x. Esto lo hicimos con la intención de que, al sumarle luego la segunda
ecuación, la variable x desaparezca (ya que aparece acompañada de un 2 en dicha ecuación). De esta manera, hemos
despejado y, operando con las ecuaciones. ¿Se les ocurre qué operaciones podríamos aplicarle a las ecuaciones del
sistema para eliminar la variable y en lugar de la x? Una posibilidad es multiplicar la primera ecuación por 3 y la
segunda ecuación por 2.Así, la variable y aparece con coeficiente 6 en la primera nueva ecuación y con coeficiente
−6 en la segunda. Al sumarlas, se cancelarán y podremos despejar x. Este método se lo suele llamar método de
eliminación y será el que utilizaremos para mecanizar el proceso de resolución de ecuaciones. A continuación, lo
desarrollaremos más en detalle.
Como vimos más arriba, si tenemos un sistema de ecuaciones lineales y hacemos algunas operaciones sobre sus
ecuaciones (multiplicarlas por algún número y sumarlas o restarlas entre sí) obtenemos nuevas ecuaciones que son
válidas.
Álgebra A. Sistemas de ecuaciones lineales. 117
Importante Cualquier ecuación que se pueda obtener de las ecuaciones de un sistema con las operaciones recién
descriptas, es una ecuación válida, en el sentido que las soluciones de la ecuación original deben verificar también
estas nuevas ecuaciones.
Si empezamos a armar nuevas ecuaciones, que en principio serán más sencillas que resolver que las originales,
tendremos muchas ecuaciones que se irán agregando (las originales más las nuevas que vamos armando). La
pregunta es ¿son necesarias considerar todas? Si revisamos el ejemplo que resolvimos utilizando el método de
eliminación, luego de armar la nueva ecuación, la sumamos a la segunda ecuación del sistema original (para poder
11
despejar y) y, luego, usamos la primera ecuación para reemplazar por y = 7 y despejar x. Observemos que no
volvimos a usar la segunda ecuación después de hacer la suma de ecuaciones. Es decir, terminamos resolviendo el
sistema:
x + 2y = 5
−7y = −11
En general, esto es lo que vamos hacer: ir reemplazando las “viejas” ecuaciones por “nuevas” ecuaciones más
sencillas, de manera de transformar el sistema original que teníamos en otro sistema (con nuevas ecuaciones), y que
este nuevo sistema tenga la misma cantidad de ecuaciones (o menor) y, además, que las soluciones de este nuevo
sistema sean las mismas que las del sistema original. Cuando dos sistemas de ecuaciones lineales tienen las mismas
soluciones se dice que son equivalentes. Por la misma definición, es igual resolver cualquiera de los dos sistemas
(ambos dan idénticas soluciones). Lo que vamos a hacer, entonces, es ir construyendo sistemas equivalentes al
original que sean más sencillos de resolver. En resumen:
Dos sistemas de ecuaciones lineales que tienen las mismas soluciones se llaman equivalentes (podemos
elegir cualquiera de los dos para resolver).
Multiplicar una ecuación por un número real no nulo deja un sistema equivalente al original (en el sentido
que reeplazamos una ecuación por la ecuación que se obtiene de la original multiplicando a ambos lados
por el mismo número no nulo).
Sumar dos ecuaciones y reemplazar alguna de las ecuaciones originales que sumamos por dicha suma deja
un sistema equivalente al original (por ejemplo, si sumamos las ecuaciones i y j, podemos reemplazar la
ecuación i por esta nueva ecuación obtenida de la suma entre las ecuaciones i y j).
¿Se les ocurre alguna otra operación entre ecuaciones que no altere las soluciones? Hay una que es tan obvia que a
veces se nos puede pasar:
Es decir, al escribir la ecuación i en el lugar donde estaba escrita la ecuación j y escribir la ecuación j donde estaba
escrita la ecuación i, deja un sistema equivalente (así como el sistema no cambia si lo escribimos en la computadora,
en una hoja de papel o pizarrón). Esta operación natural será sumamente útil a la hora de mecanizar el proceso de
resolución en los próximos apartados.
Observación 19 Destacamos que dos sistemas equivalentes no tienen porqué tener las misma cantidad de
ecuaciones. Por ejemplo, si a un sistema le agregamos una ecuación que resulte de la suma de dos ecuaciones
anteriores, entonces, el nuevo sistema sigue siendo equivalente al original (pues la ecuación que agregamos
se deduce de los anteriores, por lo que no es realmente una nueva restricción) pero tiene una ecuación más
118 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
que el original. Cuando nosotros hablamos de conseguir sistemas equivalentes “que tengan la misma cantidad
de ecuaciones que el original” pensamos en simplificar el procedimiento para resolver el sistema (por eso
reemplazamos ecuaciones y no solo las agregamos). Algo mejor aún que mantener la cantidad de ecuaciones
original es reducir dicha cantidad. ¡Y esto se puede hacer en muchos casos! Por ejemplo, consideren el siguiente
sistema:
2x + 5y = −1
−x + 3y = 4
−5x + 4y = 13
¡Hemos obtenido una ecuación que ya teníamos! Y esto lo hicimos “operando” con las primeras dos ecuaciones.
Esto nos indica que la tercera ecuación en realidad no era una nueva restricción del sistema, sino que ya
estaba contemplada en las dos primeras ecuaciones. En este sentido, la tercera ecuación original “está de más”
y podríamos removerla. Para pensarlo más analíticamente, podemos seguir haciendo operaciones entre las
ecuaciones para “eliminarla”. En efecto, multipliquemos ahora la segunda ecuación por −1:
−2x − 5y = 1
5x − 4y = −13
−5x + 4y = 13
Aquí vemos que, efectivamente, podemos hacer desaparecer la última ecuación (notar que una ecuación de la
forma @=@, donde @ representa cualquier fórmula no indica ningún tipo de restricción, ya que siempre algo es
igual a sí mismo). En este caso, podemos olvidarnos de esta expresión 0 = 0 y quedarnos con el sistema:
−2x − 5y = 1
5x − 4y = −13
Un tipo importante de sistemas de ecuaciones lineales son los que tienen todas sus ecuaciones igualadas a 0.
Definición 45 Un sistema de ecuaciones lineales se dice que es homogéneo si todas las ecuaciones del sistema
Estos sistemas están relacionados con las soluciones de todos los sistemas de ecuaciones lineales (no necesariamente
Álgebra A. Sistemas de ecuaciones lineales. 119
homogéneos). No entraremos en detalle de esta relación aquí. Simplemente mencionaremos que los sistemas lineales
homogéneos siempre tienen al (0, 0, . . . , 0) como solución.
Cuando buscábamos intersecciones entre subespacios lineales, en algunas ocasiones los objetos estudiados no se
cortaban: plano paralelos, plano y recta paralelos, rectas paralelas o alabeadas. Desde el punto de vista algebraico, lo
que sucedía con los sistemas de ecuaciones lineales que se armaron para buscar la intersección, es que al resolverlos,
nos devolvían una inconsistencia que era indicativa de que no había solución simultánea para las ecuaciones del
sistema. La primera clasificación entre sistemas de ecuaciones lineales es si tienen o no solución. Un sistema de
ecuaciones lineales que no tiene solución se llama un sistema incompatible. Por supuesto, la expresión proviene
del hecho de que las ecuaciones que forman parte del sistema son incompatibles entre ellas (no “compatibilizan”
en ningún punto). Por el contrario, los sistemas que admiten al menos una solución se llaman entonces sistemas
compatibles. Vimos también que cuando buscamos la intersección de un plano y una recta no paralelos entonces
la intersección es un punto solo. En este caso, algebraicamente despejamos todas las variables y obtenemos el
punto en cuestión. Por otro lado, cuando buscamos la intersección de dos planos no paralelos, dicha intersección
es necesariamente una recta (y, algebraicamente, obtenemos una ecuación vectorial para esa recta). En particular,
había infinitos puntos en la intersección (todos los puntos de la recta). Desde el punto de vista algebraico, esto
quería decir que había infinitos puntos que eran solución del sistema de ecuaciones lineales que armamos para
estudiar la intersección (que consistía en las ecuaciones implícitas de los planos involucrados). Por lo tanto,
hay una clasificación más específica para los sistemas compatibles: tienen una única solución o tienen infinitas
soluciones. En el primer caso, los sistemas de ecuaciones lineales que tienen una única solución se llaman sistemas
compatibles determinados, y los que tienen infinitas, sistemas compatibles indeterminados. Por supuesto, el término
“determinado” proviene del hecho que la solución a dicho sistema está completamente determinada: hay una sola. Por
el contrario, un sistema compatible indeterminado tiene solución (pues es compatible) pero no está unívocamente
determinada: hay infinitas. A continuación, resumimos esta clasificación.
Definición 46 Un sistema de ecuaciones lineales se dice que es:
Observación 20 Por lo visto a partir de la definición 45, los sistemas homogéneos no pueden ser incompatibles:
o tienen como única posible solución el vector nulo, o tiene infinitas soluciones
La única manera de clasificar un sistema es resolverlo. Y ya tenemos mucha experiencia resolviendo sistemas de
ecuaciones: la que adquirimos en el capítulo 2.
En los siguientes ejemplos vamos a mostrarles cómo clasificar y hallar las soluciones de un sistema de ecuaciones.
Si bien en estos casos no se está representando rectas o planos, el procedimiento algebraico es el mismo, por lo que
podrán seguir los razonamientos y entender los resultados.
Ejemplos 47 Vamos a clasificar distintos tipos de sistemas de ecuaciones lineales (en compatibles determinados,
1. Consideremos el sistema:
2x − 3y + 2z = 2
x + y − 2z = 0
2x − 4z = 1
Este sistema es homogéneo, por lo que seguro es compatible. Debemos determinar si es determinado (única
solución (0, 0, 0)) o indeterminado. De la tercera ecuación, despejamos z = −2x. Al reemplazar esta información
en la segunda: 5x + y = 0, de donde y = −5x. Finalmente, si reemplazamos estos despejes en la primera
ecuación: x − (−5x) + 3(−2x) = 0; es decir, 0 = 0. Como no hay más restricciones para imponer, entonces la
variable x queda libre, por lo que un vector de la forma (x, −5x, −2x) es solución del sistema, para cualquier
x ∈ R. Por ejemplo, (1, −5, −2) verifica las tres ecuaciones. El sistema es compatible indeterminado.
3. Consideremos finalmente el sistema:
x + 2z = 1
y−z =1
x + y + 3z = 6
2x − 3y + z = −4.
Introducimos los sistemas de ecuaciones lineales y estudiamos métodos “a mano” para resolverlos de manera directa.
Definimos lo que significa que dos sistemas sean equivalentes (que tengan las mismas soluciones) y vimos algunas
operaciones que se pueden realizar sobre las ecuaciones de un sistema para obtener otros sistemas equivalentes al
original.
Clasificamos los sistemas de ecuaciones lineales en compatibles determinados (poseen una única solución), compati-
bles indeterminados (poseen infinitas soluciones) e incompatibles (no poseen solución).
Álgebra A. Matrices. 121
5.2 Matrices
Vamos ahora a estudiar cómo mecanizar el problema de clasificar y/o resolver sistemas de ecuaciones lineales.
A grandes rasgos, una matriz es un “arreglo rectangular de números” como en el siguiente caso:
2 4 −1 − 12
√
2 −5
0 3
−12 52 0 1
Este arreglo tiene tres filas y cuatro columnas. En cada cruzamiento entre una fila y una columna hay un número,
que se llama entrada (no pueden quedar “huecos” vacíos). Por lo tanto, una matriz de n filas y m columnas siempre
tiene nm entradas. En este caso, tenemos 12 entradas. La manera de especificar una entrada determinada es dando
su ubicación en el arreglo, es decir, a qué fila y columna pertenece. En este ejemplo, la entrada 1 − 2 (primera fila,
segunda columna) es el número 4 y la entrada 3 − 3 (tercera fila, tercera columna), es el número 0. Si recordamos
lo visto en el apartado anterior, esta manera de especificar una entrada en una matriz es la misma que utilizamos
para especificar un coeficiente en un sistema de ecuaciones lineales. Esto, por supuesto, no es casualidad. Entonces,
¿cómo podemos escribir genéricamente una matriz de n filas y m columnas? De la siguiente manera:
a11 a12 a13 ··· a1m−1 a1m
a21 a22 a23 ··· a2m−1 a2m
.. .. .. .. ..
. . . . .
an−11 an−12 an−13 · · · an−1m−1 an−1m
an1 an2 an3 ··· anm−1 anm
Aquí, el símbolo aij representa la entrada i − j; es decir, el número en la i-ésima fila y j-ésima columna (como
hacíamos para los coeficientes de los sistemas lineales). Como hay n filas y m columnas entonces i toma los valores
entre el 1 y el n, y j los valores entre 1 y m. Una matriz de n filas y m columas se llama, abreviadamente, una
matriz de n × m. En este libro solo estudiaremos matrices donde las entradas son número reales. El conjunto de
todas las matrices de n × m con entradas reales se nota Rn×m y comenzaremos a escribir A ∈ Rn×m para decir
que A es una matriz de n filas y m columnas.
Ejemplo 48 Al pensarlas como “arreglos rectangulares”, las matrices pueden tener muchas formas. El ejemplo que
dimos antes el resultado es un rectángulo “acostado”; es decir, de más columnas que filas. Pero podemos tener una
matriz con la forma de un rectángulo “parado”: por ejemplo, la siguiente matriz de 4 filas y 2 columnas:
4 −1
√
3 2
5
2 0
0 −3
122 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
También, una matriz puede tener una única fila (o una única columna). En el primer caso, la matriz se parece a un vector
(sin las comas entre los coeficientes); y en el segundo caso, a un vector parado:
3
−5
2 .
2 1 −3 3 0
0
7
La matriz de la derecha se encuentra en R1×5 y la de la derecha en R4×1 . Finalmente, un tipo especial de matriz es la
matriz cuadrada: las que tienen igual cantidad de filas que de columnas. Más adelante veremos que este tipo de matrices
son muy importantes en la teoría de sistemas de ecuaciones lineales.
De forma muy sugerente, la especificación de entradas de una matriz es la misma que la de los coeficientes de un
sistema de ecuaciones lineales, por lo que no debería sorprendernos que lo que haremos será ubicar a los coeficientes
del sistema en una matriz (respetando su ubicación como coeficiente) y trabajar directamente (y solamente) con
la matriz. Retomemos el ejemplo utilizado en el apartado anterior para resolver un sistema de ecuaciones lineales
usando el método de eliminación.
x + 2y = 5
2x − 3y = −1
En esa ocasión, multiplicamos la primera ecuación por −2 y, después, la sumamos a la segunda ecuación para
obtener una ecuación que no tuviera la incógnita x (la eliminamos). Si lo pensamos gráficamente sucede lo siguiente:
después de multiplicar la primera ecuación por −2 obtenemos el sistema equivalente:
−2x − 4y = −10
2x − 3y = −1
Ahora bien, cuando sumamos, lo que hacemos es sumar los coeficientes correspondientes a las x, por un lado,
primero, a los correspondientes a las y, por otro, y a los coeficientes libres, por otro.
Cabe destacar que, en realidad, en este esquema geométrico de la suma de las ecuaciones, no estamos realmente
utilizando las incógnitas x e y, solo los coeficientes que las acompañan. Esto se debe a que, dentro de cada ecuación,
hemos escrito a los términos que contienen la variable x “a la izquierda” y los que contienen a las variable y “a la
derecha”; por lo cual se podría simplemente decir: “sumemos entre sí los términos que se encuentran en la columna
de la izquierda (en cada ecuación) y entre sí lo que se encuentran en la columna de la derecha (en cada ecuación)”.
De la misma forma, si tuviéramos un sistema con dos ecuaciones y tres incógnitas x, y, z. A cada ecuación, la
vamos a escribir de manera que el término de las x lo ubicaremos siempre primero (de izquierda a derecha), seguido
del de las y y, por último, el de las z. Entonces, cuando sumemos las ecuaciones, alcanza con sumar el primero
Álgebra A. Matrices. 123
coeficiente de la primera ecuación con el primero de la segunda (y el resultado va a ser el coeficiente que acompañe
a la incógnita x en la nueva ecuación), el segundo coeficiente de la primera ecuación con el segundo de la segunda
(que será el coeficiente que acompañe al de las y en la nueva ecuación) y el tercero de la primera con el tercero de la
segunda (el coeficiente que acompañe a z). Por supuesto, “del otro lado del igual” sumamos los coeficientes libres
entre sí. Por ejemplo, si queremos sumar las ecuaciones del sistema:
−x + 3y − 4z = 1
2x − 2y + z = −2
−1 + 3 + (−4) = 1
+ ↓ ↓ ↓ ↓
2 + (−2) + 1 = −2 ,
↓ ↓ ↓ ↓
1 + 1 + (−3) = −1
de donde obtenemos que la nueva ecuación es x + y − 3z = −1. Esta manera de ver la suma de ecuaciones pone en
evidencia la relación entre los sistemas lineales y las matrices: para resolver un sistema lineal podemos utilizar el
método de eliminación (que consiste en multiplicar las ecuaciones por números no nulos y sumar las ecuaciones
entre sí); y si acomodamos las variables en orden, no necesitamos representar las incóngnitas para hacer estas
operaciones, nos alcanza con los coeficientes. Por lo tanto, podemos condensar la información de un sistema de
ecuaciones lineales en una matriz, la matriz de los coeficientes del sistema, y trabajar más cómodamente solo con
estos números. Veamos esto en un ejemplo. Consideremos nuevamente el sistema:
x + 2y = 5
2x − 3y = −1
Aquí tenemos a la variable x ubicada en la primera posición (empezando desde la izquierda) de todas las ecuaciones.
Al considerar todas las ecuaciones al mismo tiempo podemos decir que las x están en la primera columna del
sistema. Por otro lado, las y quedan necesariamente en la segunda ecuación del sistema, y los coeficientes libres en
una tercera columna (del otro lado del igual). Por lo tanto, podemos asignarle a este sistema la siguiente matriz
ampliada:
1 2 5
2 −3 −1
Aquí, la barra | que separa la segunda y tercera columna de la matriz está marcando que la columna a la derecha
corresponde a los coeficientes “del otro lado del igual”; es decir, los que no son coeficientes de ninguna incóngnita.
Esta matriz se llama la matriz ampliada asociada al sistema. El término “ampliada” proviene del hecho de que es
una matriz con los coeficientes del sistema y además con los coeficientes libres (que se anotan del otro lado de la
barra). La matriz sin los coeficientes libres es lo que se conoce como matriz asociada al sistema (a secas). Más
adelante, veremos que la información pertinente del sistema está contenida en la matriz del sistema. ¿Cómo se lee la
matriz ampliada en relación con el sistema de ecuaciones lineales original? Pues como lo armamos:
Cada fila corresponde a cada ecuación del sistema: está formada por los coeficientes que acompañan a las
incógnitas (y los coeficientes libres en el caso de la ampliada).
Las entradas en la misma columna corresponden a los coeficientes de la misma incógnita.
124 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
La barra vertical nos está diciendo que las entradas a la derecha de la barra son los que corresponden a los
coeficientes libres del sistema.
Por ejemplo, si nos dan la matriz:
−3 4 0
11 −1 −2
entonces estamos pensando en el sistema:
−3x + 4y = 0
11x − y = −2.
De esta manera, podemos ir de la teoría de sistema de ecuaciones lineales a la teoría de matrices, y viceversa. Pero
¿para qué quisimos lograr esto? Porque de esta manera, las operaciones entre las ecuaciones se transforman en
operaciones entre las filas de la matriz. En efecto, multiplicar una ecuación por un número real no nulo equivale
a multiplicar la fila correspondiente a dicha ecuación por este número (donde multiplicar una fila por un número
consiste simplemente en multiplicar por dicho número cada entrada de esa fila únicamente), y sumar dos ecuaciones
corresponde a sumar las dos filas correspondientes a esas ecuaciones (sumando las entradas en la misma columna
entre esas dos filas). De esta manera, queda mecanizado el método de eliminación. Partamos una vez más de la
ecuación:
x + 2y = 5
2x − 3y = −1
Finalmente, sumamos las dos ecuaciones resultantes y reemplazamos la segunda ecuación por la suma de las
dos ecuaciones que teníamos. En este caso, dicha operación entre ecuaciones corresponde a sumar ambas filas y
reemplazar la fila 2 por esta suma. De esta manera, obtenemos:
−2 −4 −10
0 −7 −11
En función de los trabajado en el apartado anterior sobre sistemas de ecuaciones equivalentes, esta matriz corresponde
a un sistema de ecuaciones lineales que es equivalente al original. Observemos, de hecho, que la ecuación que se
desprende de la segunda fila de la matriz es precisamente −7y = −11, como habíamos despejado originalmente.
Por lo tanto, el sistema asociado a esta matriz es:
−2x − 4y = −10
−7y = −11
que ya vimos que es más fácil de resolver. El procedimiento utilizado recién se puede notar:
1 2 5 multiplicar fila 1 por 2 −2 −4 −10
−−−−−−−−−−−→ −→
2 −3 −1 2 −3 −1
Álgebra A. Matrices. 125
reemplazar fila 2 por fila 1+fila 2 −2 −4 −10
−−−−−−−−−−−−−−−−−→ .
0 −7 −11
Por lo tanto, al hacer operaciones de filas en la matriz asociada a un sistema, encontramos otro sistema equivalente
al original. Para terminar con este apartado, vamos a mostrar cómo se puede llevar “hasta el final” esta metodología
de hacer operaciones en las filas de una matriz para resolver completamente el sistema original. Retomemos donde
dejamos la matriz:
−2 −4 −10
0 −7 −11
Ahora, multipliquemos la segunda fila por − 17 :
−2 −4 −10
11
0 1 7
Es decir, ¡usando operaciones de fila en la matriz ampliada asociada al sistema hemos resuelto completamente el
sistema! La notación del procedimiento que hicimos fue la siguiente:
1 2 5 multiplicar fila 1 por 2 −2 −4 −10
− −−−−−−−−−−→ −→
2 −3 −1 2 −3 −1
reemplazar fila 2 por fila 1+fila 2 −2 −4 −10
−−−−−−−−−−−−−−−−−→ −→
0 −7−11
mult. fila 2 por − 71 −2 −4 −10 mult. fila 2 por 4 −2 −4 −10
−−−−−−−−−−→ − −−−−−−−→ −→
11 44
0 1 7 0 41 7
26 13
reempl. fila 1 por fila 1+fila 2 −2 0 − 7 mult. fila 1 por − 1
2
1 0 7
−−−−−−−−−−−−−−−→ −−−−−−−−− −→ .
44 y fila 2 por 1 11
0 4 7
4 0 1 7
En el siguiente apartado veremos que en este procedimiento hemos hecho un montón de cuentas y pasos de más de
los que realmente necesitamos (en este ejemplo concreto, con cuatro pasos puede obtenerse la matriz final). Lo
hicimos de esta manera para poner en evidencia las ideas que existen detrás de este método de resolución.
126 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
En este apartado, se establecerán las bases de la mecanización de la resolución de sistemas de ecuaciones lineales,
utilizando matrices. A este proceso se denomina triangulación de la matriz.
Más arriba vimos que la idea para resolver un sistema de ecuaciones lineales era contruir la matriz asociada al
sistema y realizar operaciones entre las filas hasta hallar una matriz que represente un sistema de ecuaciones
equivalente, más sencillo para resolver. Pero ¿qué tanto más sencillo? Al final del apartado anterior, vimos cómo
obtener una matriz con unos “1” en la diagonal, lo que traducido al campo de las ecuaciones, daba directamente las
soluciones. Esta es, obviamente, la ecuación más útil pero a veces, lograr que una matriz tenga esta forma implica
muchos cómputos. Existe una situación intermedia en la que no hay que hacer tantas operaciones de fila pero, sin
embargo, la matriz que obtenemos nos provee un sistema fácil de terminar de resolver. Para ver cuál es, consideren
el siguiente sistema:
2x − 3y + 2z = 4
−y + 5z = −13
3z = −9
Este es un sistema de tres ecuaciones y tres incógnitas x, y, z. Tiene la peculiaridad que, en la segunda ecuación, no
aparece la variable x (o, en realidad, el coeficiente a21 que acompaña a la variable x en la segunda ecuación es 0)
y en la tercera ecuación no aparecen ni la variable x ni la y (los coeficientes a31 y a32 son 0). Notemos que este
sistema puede resolverse por sustitución de manera directa. En efecto, de la última ecuación simplemente podemos
despejar z = −3 y reemplazar esto en la segunda ecuación para obtener −y + 5(−3) = −13, de donde podemos
despejar y = 2. Finalmente, al reemplazar por z = −3 e y = 2 en la primera ecuación, obtenemos 2x − 6 − 6 = 4,
de donde x = 8. ¿Cómo es la matriz (no ampliada) asociada a un sistema de esta forma? En nuestro ejemplo:
2 −3 2
0 −1 5
0 0 3
Veamos que debajo de la diagonal formada por las entradas a11 , a22 , a33 hay solo ceros. Esta diagonal (de arriba a
la izquierda a abajo a la derecha), se llama diagonal principal de la matriz. Una matriz de esta forma se denomina
matriz triangular, pues debajo de la diagonal queda gráficamente un triángulo de ceros. Llevamos nuestra matriz
del sistema a una matriz triangular, en consecuencia obtenemos un sistema que es muy directo de resolver (como
explicamos recién mediante el método de sustitución). Por este motivo el método de resolución que vamos a
desarrollar se llama triangulación: porque vamos a “triangular” la matriz es decir, llevarla a una matriz triangular.
5.2.4 ¿Cuáles son las operaciones que podemos hacer con las filas de una matriz?
Antes de empezar a triangular matrices debemos tener en claro cuáles son las operaciones que podemos aplicar a las
filas de una matriz de manera tal que, los sistemas asociados a las nuevas matrices, sigan siendo equivalentes al
sistema original. Ya vimos que es posible multiplicar una matriz por un número no nulo y reemplazar una fila por la
suma de otras filas. Vamos a hacer bien precisas y más generales estas operaciones y, además, incluir la posibilidad
de intercambiar ecuaciones. Estas operaciones se llaman operaciones elementales de fila:
Importante Sea A una matriz de n filas y m columnas y llamemos F1 , . . . , Fn las n filas de A (F1 es la primer
fila, F2 la segunda, etc). Las siguientes operaciones en las filas de A no cambian la equivalencia del sistema de
ecuaciones lineales asociado:
Álgebra A. Matrices. 127
1. Intercambiar dos filas. Para cualquier elección de 1 ≤ i, j ≤ n, cambiamos la matriz A por la matriz B
que es igual a A, salvo que en la fila i de B está la fila Fj de A y en la fila j de B está la fila Fi de A.
2. Multiplicar una fila por un número no nulo. Para cualquier número λ ∈ R distinto de cero y cualquier
elección de 1 ≤ i ≤ n, cambiamos la matriz A por la matriz B que es igual a A, salvo que en la fila i de B
aparece la fila Fi de A multiplicada por λ.
3. Cambiar una fila por ella misma más un múltiplo de otra fila. Para cualquier elección de 1 ≤ i, j ≤ n y
cualquier número λ ∈ R, cambiamos A por la matriz B que es igual a A, salvo que en la fila i de B está la
fila que se arma haciendo la cuenta Fi + λFj (es decir, donde antes estaba la fila Fi en A ahora aparece
dicha fila pero sumado λ veces la fila j de A).
Algunos comentarios importantes. En primer lugar, la primera operación que definimos sobre intercambiar dos filas
de la matriz, que no veníamos utilizando, es la que traduce a este contexto la idea de “intercambiar la posición
de las ecuaciones” en el sistema de ecuaciones. En segundo lugar, ya vimos que multiplicar una ecuación por un
número no nulo no alteraba la ecuación. Esto es precisamente lo que dice la segunda operación. Finalmente, la
tercera operación válida para operar con las filas de una matriz es un poco diferente a lo que veníamos haciendo. El
motivo es que la escribimos de una manera más general (para poder ahorrarnos cuentas a futuro). Vamos a explicar
esto: lo que dice la tercera operación es que podemos reemplazar una fila por “ella misma” sumada a un “múltiplo
de otra fila”. Si repasan el sistema que resolvimos al final del apartado anterior, habíamos comenzado multiplicando
la primera fila por −2 para lograr que apareza un −2 en la entrada a11 con el objetivo de que, al sumar luego las
filas F1 y F2 , se eliminara la entrada en la posición a21 (que era un 2). Pero cabe destacar que, en realidad, no nos
importa poner un −2 en el lugar a11 para que quede allí; solo lo ponemos temporalmente para poder eliminar el
2 de a21 (fíjense de hecho que al final del proceso con la matriz terminamos multiplicando la fila 1 por − 12 para
volver a obtener el 1 que teníamos en a11 al principio). Justamente, la tercera operación que acabamos de definir
nos permite la eliminación del a21 sin modificar la fila F1 . En efecto, lo que podemos hacer es reemplazar la fila
F2 por ella misma más −2 veces la fila F1 . Tengamos en cuenta que esta operación solo afecta la fila F2 . Es decir,
estamos reemplazando F2 por F2 − 2F1 . De esta manera, condensamos dos pasos en uno solo. Esta operación es la
más importante de las tres, ya que es la que nos permitirá eliminar entradas para llegar a triangular la matriz).
Para simplificar la escritura del proceso de triangulación de una matriz, vamos a escribir las diferentes operaciones
de la siguiente manera:
Intercambiar las filas Fi y Fj , se nota Fi × Fj .
Multiplicar la fila Fi por λ, se nota λFi .
Reemplazar la fila Fi por Fi + λFj , se nota Fi → Fi + λFj .
Veamos con un ejemplo el proceso de triangulación de una matriz. Consideremos la matriz:
1 2 1
1 −1 3
−2 −2 6
Ahora, interpreten las operaciones que le vamos haciendo a la matriz para triangularla.
1 2 1 1 2 1 1 2 1
F →F +(−1)F
2 2 1 F3 →F3 +2F1
1 −1 3 −−−−−−−−−−→ 0 −3 2 −−−−−−−−→ 0 −3
2
−2 −2 6 −2 −2 6 0 2 8
128 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
1 2 1 1 2 1 1 2 1
1
2 F3
F lF
2 3 F3 →F3 +3F2
−− −→ 0 −3 2 −−−−→ 0 4 −−−−−−−−→ 0 4 .
1 1
0 1 4 0 −3 2 0 0 14
Y hemos llegado a una matriz triangulada.
A continuación, explicaremos en detalle el procedimiento que hicimos. Recuerden que el objetivo es lograr ceros
debajo de la diagonal principal. En primer lugar, conseguimos los ceros de la primera columna (debajo de la entrada
a11 ), luego, ceros de la segunda columna (debajo de la entrada a22 ) y así, en adelante. Empezamos buscando poner
un 0 en la posición a21 ; para esto, alcanza con restarle a la fila F2 la fila F1 (ya que las entradas en la columna
1 son 1 para las dos filas). Por lo tanto, le sumamos a la fila F2 la fila F1 multiplicada por −1 (esta es la manera
de restar: sumar multiplicando por −1). Observemos que el resto de las filas quedan iguales: solo modificamos la
fila F2 . A continuación, y siguiendo nuestro plan, necesitamos conseguir un 0 en el lugar a31 , donde hay un −2.
Entonces, podemos sumarle a la fila F3 el doble de la fila F1 : F3 → F3 + 2F1 pues 2F1 tiene un 2 en el primer
lugar y sumado al −2 del primer lugar de F3 nos da el 0 buscado. Bien, hemos conseguido ceros debajo de la
primera columna. Ahora debemos buscar el cero debajo de la segunda columna (hay uno solo que ubicar, el del
lugar a32 ). Pero antes de hacer esto, nosotros hicimos un par de operaciones que nos facilitarán las cuentas por
venir. En efecto, la siguiente operación llevada a cabo es multiplicar la fila F2 por 12 . El objetivo es simplificar
los números de la matriz: como todas las entradas de la fila F3 eran múltiplos de 2 podemos dividir todos por 2
y obtener números más pequeños. Además de este ajuste, también hacemos el intercambio de filas F2 y F3 . El
objetivo de este intercambio es dejar un 1 en la posición a22 , de manera tal que nos permita que la última operación,
que ubica un 0 en la posición a32 , sea F3 → F3 + 3F1 . Cabe destacar que si hubiéramos querido conseguir un cero
en dicha posición sin intercambiar las filas, tendríamos que haber utilizado la siguiente operación:
1 2 1 1 2 1
F →F + 1 F
3 3 3 2
0 −3 2 −−−−−−−−→ 0 −3 2 .
14
0 1 4 0 0 3
Al intercambiar filas, evitamos hacer cuentas con fracciones. Finalmente, conseguimos un 0 en la posición a32 al
reemplazar la última fila por ella misma más tres veces la segunda (observemos que tener un 1 en la posición a22
hace que esta operación sea directa y no involucre fracciones). Tengamos en cuenta que, si bien ya obtuvimos la
1
matriz triangulada, podemos multiplicar la fila 3 por 14 para obtener una matriz con unos (1) en la diagonal (para la
que sería mucho más fácil de resolver el sistema lineal asociado).
En los ejemplos presentados, triangulamos matrices de 2 × 2 y 3 × 3, que son casos de matrices cuadradas. El
proceso de triangulación puede llevarse a cabo para cualquier tipo de matriz (aunque no sea cuadrada), pero el
concepto de qué significa una matriz triangular que no sea cuadrada quizá no esté claro aún. Por esta razón, a
continuación, precisaremos las nociones de triangulación.
Definición 47 Sea A ∈ Rn×m .
La diagonal determinada por las entradas a11 , a22 , etc... se llama diagonal principal de la matriz.
A se dice triangular si solo hay ceros debajo de la diagonal principal; es decir, las entradas aij son 0 para
i > j.
Álgebra A. Resolución y clasificación de sistemas de ecuaciones lineales. 129
Observación 21 La diagonal principal es la diagonal que empieza en la entrada que está en la primera fila y
en la primera columna, y que se mueve hacia la derecha y hacia abajo en cada paso. Si la matriz no es cuadrada,
no va a terminar en la esquina inferior derecha: si A tiene más filas que columnas, la diagonal se “choca con el
piso de la matriz”; si tiene más columnas que filas, se “choca con el paréntesis derecho de la matriz”.
Es importante tener en cuenta que consideramos que una matriz es triangular si tiene los ceros debajo de la diagonal
independientemente de las entradas que tenga en la diagonal o arriba de ella (podría tener ceros (0) en la diagonal
principal, o arriba de ella). Cerramos este apartado, dando ejemplos de triangulación de varios tipos de matrices.
Para resolver y clasificar sistema de ecuaciones lineales, retomemos los aspectos teóricos que acabamos de
desarrollar. Veremos que, para clasificar un sistema, no necesitamos calcular las soluciones: al terminar el proceso
de triangulación de la matriz, será posible determinar de qué tipo se trata.
A continuación, mostraremos cómo se resuelven algunos sistemas de ecuaciones lineales mediante el método de
triangulación. Comencemos por el siguiente sistema:
x − x2 − 2x3 = −1
1
4x1 + 2x2 − x3 = 0
2x − 5x + 3x = −2
1 2 3
Luego, triangulamos:
1 −1 −2 −1 1 −1 −2 −1 1 −1 −2 −1
F lF
F2 →F2 −4F1 2 3
4 2 −1 0 −−−−−−−−→ 0 −7 4 −−−−→ 0 −3
6 7 0
F3 →F3 −2F1
2 −5 3 −2 0 −3 7 0 0 6 −7 4
1 −1 −2 −1
F →F +2F2
−−3−−−3−−−→ −3
0 7 0
0 0 7 4
El sistema asociado a esta matriz triangulada es:
x − x2 − 2x3 = −1
1
−3x2 + 7x3 = 0
7x = 4
3
De la última ecuación podemos despejar x3 = 47 . Si reemplazamos esta igualdad en la segunda ecuación, obtenemos
−3x2 + 7( 74 ) = 0; donde podemos despejar x2 = 43 . Finalmente, reemplazando en la primera ecuación los valores
4 4 4 8 31
hallados para x2 y x3 , obtenemos x1 − 3 −2· 7 = −1; donde x1 = −1 + 3 + 7 = 21 . Por lo tanto, el sistema es
31 4 4
compatible determinado y su única solución es ( 21 , 3 , 7 ).
Consideremos ahora el siguiente sistema:
x + x2 − 2x3 + x4 = −2
1
3x1 − x2 + x3 + 5x4 = 3
x − x + x + 2x = 2
1 2 3 4
La última ecuación nos dice x3 = 1. Al reemplazar esta información en la segunda ecuación hallamos que
−2x2 + 3 + x4 = 4, donde podemos despejar x4 = 2x2 + 1. Esto nos dice que x4 depende de x2 (por lo que
si conocemos x2 , el valor de x4 quedará determinado de manera unívoca). Finalmente, reemplacemos toda la
información que tenemos en la primera ecuación (es decir, x3 = 1 y x4 = 2x2 + 1) para obtener x1 + 3x2 − 1 = −2.
De aquí, podemos despejar x1 = −3x2 − 2. Lo que hemos conseguido hasta aquí es que x3 = 1, y que tanto x1 y
x4 dependen de x2 de cierta manera. Y como no tenemos más ecuaciones que fuercen a x2 a ser algún número en
particular, esto quiere decir que no hay restricciones sobre esta variable. Es decir, para cualquier x2 ∈ R, mientras
que x1 = −3x2 − 2, x3 = 1 y x4 = 2x2 + 1, el vector (x1 , x2 , x3 , x4 ) será solución del sistema. Vale decir, los
vectores que son solución son de la forma (−3x2 − 2, x2 , 1, 2x2 + 1) para cualquier x2 ∈ R. Notemos que podemos
reescribir a un vector de esta forma como x2 (−3, 1, 0, 2) + (−2, 0, 1, 1), como hacíamos en el capítulo 2 al buscar
la ecuación vectorial de una recta a partir de su ecuación implícita. En general, escribiremos la solución de un
sistema compatible indeterminado de esta manera. Formalmente, el conjunto de soluciones del sistema es entonces
{λ(−3, 1, 0, 2) + (−2, 0, 1, 1) : λ ∈ R}. Por supuesto, se trata de una recta en R4 .
Veamos otro ejemplo. Consideremos ahora el sistema:
x + x2 + x3 − 2x4 + x5 = 1
1
x1 − 3x2 + x3 + x4 + x5 = 0
3x − 5x + 3x + 3x
= 0
1 2 3 5
1 1 1 −2 1 1 1 1 1 −2 1 1
F2 →F2 −F1
−3 1 0 −−−−−−−−→ 0 −4 0 −1 −→
1 1 1 0 3
F3 →F3 −3F1
3 −5 3 0 3 0 0 −8 0 6 0 −3
1 1 1 −2 1 1
F →F −2F2
−−3−−−3−−−→ −4 0 −1
0 0 3
0 0 0 0 0 −1
Aquí obtenemos una contradicción en la ecuación asociada a la última fila: 0 = −1. Por lo tanto, el sistema original
es incompatible.
Resolver sistemas de ecuaciones homogéneos es un poco más sencillo que sistemas no homogéneos porque no
hace falta ampliar la matriz con una columna de términos independientes. Esto se debe a que ninguna operación
elemental de filas altera una columna de ceros “0”, y pueden chequearlo ustedes mismos. Veamos entonces como
resolver un sistema homogéneo.
x + x2 + x3 + x4 = 0
1
x1 + 3x2 + 2x3 + 4x4 = 0
2x + x − x = 0
1 3 4
132 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
De la segunda ecuación podemos despejar x3 = −2x2 − 3x4 ; y al reemplazar esta igualdad en la primera
ecuación obtenemos x1 + x2 + (−2x2 − 3x4 ) + x4 = 0. Es decir, x1 − x2 − 2x4 = 0. Al despejar, por ejemplo,
x1 = x2 + 2x4 , tenemos que x1 y x3 dependen de x2 y x4 , y estas últimas incógnitas no tiene restricciones. Por
lo tanto, los vectores de R4 que son solución del sistema son de la forma (x2 + 2x4 , x2 , −2x2 − 3x4 , x4 ) con
x2 , x4 ∈ R cualesquiera. Este vector lo escribimos como x2 (1, 1, −2, 0) + x4 (2, 0, −3, 1), por lo que el conjunto
de soluciones es {λ(1, 1, −2, 0) + µ(2, 0, −3, 1) : λ, µ ∈ R}. Observemos que, geométricamente, los vectores que
son solución pertenecen a un plano que pasa por el origen.
Finalmente, consideremos el siguiente sistema:
−x + 2z = 0
2x + 2y + 3z = 0
2y = 0
x+y+z =0
−1 0 2 −1 0 2
F3 →F3 −F2 0 2 1 F4 →F4 + 52 F3 0 2 1
−−−−−−−1−→ −−−−−−−−→
F4 →F4 − 2 F2 0 0 −1 0 −1
0
0 0 25 0 0 0
De este modo, hemos arribado a una matriz triangular. Vemos que la última ecuación ha desaparecido (poniendo en
evidencia que era una ecuación que se deducía de las otras, por lo que no introducía nuevas restricciones al sistema).
El sistema asociado a esta última matriz (que sabemos que es equivalente al original) es:
−x + 2z = 0
2y + z = 0
−z = 0
Anteriormente, arribamos a sistemas como este último y observamos que es posible ir despejando las variables
“de abajo hacia arriba” (primero z, después y y finalmente x) de manera de obtener una única solución al sistema.
Estamos en condiciones de hacerlo porque las entradas en la diagonal principal de la matriz son no nulas. Esto nos
permite “pasar dividiendo” cada uno de los coeficientes que multiplican a las incógnitas (si fuesen 0, no podríamos
hacer dicha división). Tengamos en cuenta que no importa cuáles son los términos independientes del sistema; este
despeje siempre se puede hacer. Esto nos indica que la información sobre si el sistema es compatible determinado
está contenida en la matriz no ampliada del sistema. Con lo visto recién podemos arribar a la primera conclusión.
Importante Si tenemos un sistema de ecuaciones lineales de igual cantidad de ecuaciones que de incógnitas
y, al triangular la matriz no ampliada asociada al sistema, todos los términos de la diagonal principal son no
nulos, entonces el sistema es compatible determinado (independientemente de cuales sean los coeficientes
independientes).
De esta manera, es posible clasificar (en parte) un sistema sin necesidad de calcular las soluciones del mismo:
triangulamos la matriz asociada al sistema y vemos si aparece algún 0 en la diagonal principal. Si no aparece
ninguno, el sistema es compatible determinado. Veamos entonces qué podemos decir si aparece un 0 en dicha
diagonal. Supongamos que la matriz triangulada asume alguna de las siguientes formas:
0 1 −1 a 2 7 −1 a 2 7 −1 a
A1 = 0 2 1 b A2 = 0 0 1 b A3 = 0 5 2
b
0 0 3 c 0 0 3 c 0 0 0 c
Aquí hemos puesto coeficientes independientes genéricos a, b, c ∈ R. A1 tiene un 0 en la primera entrada de la
diagonal (coeficiente a11 ), A2 tiene un 0 en la segunda entrada de la diagonal a22 y A3 en la última a33 . Observemos
qué sucede en cada caso y analicemos en primer lugar, el caso de A3 . Aquí, el sistema asociado es:
2x + 7y − z = a
5y + 2z = b
0=c
hemos hallado que z depende de y y que x depende de y, pero no hay restricciones para y. Por lo tanto, para
19y b−5y
cada y ∈ R podemos armarnos una solución de la forma ( a2 + b
4 − 4 , y, 2 ), entonces, hay infinitas
soluciones.
Si c 6= 0, entonces, llegamos a una contradicción, lo que nos indica que el sistema no tiene ninguna solución.
Por lo tanto, es incompatible.
Veamos que sucede con el caso de A2 . Tengamos en cuenta que podemos “seguir triangulando” la matriz A2
para obtener un sistema mucho más sencillo que el que nos da directamente. En efecto, haciendo el reemplazo
F3 → F3 − 3F2 , obtenemos:
2 7 −1 a
A2 = 0
0 1 b
0 0 0 c − 3b
Aquí nuevamente caben dos posibilidades:
Si c − 3b = 0, entonces, desaparece la última fila y el sistema asociado queda:
2x + 7y − z = a
z=b
Importante Si tenemos un sistema de ecuaciones lineales de igual cantidad de ecuaciones que de incógnitas y,
al triangular la matriz no ampliada asociada al sistema, algún término de la diagonal principal es nulo, entonces
el sistema es compatible indeterminado o incompatible. Para saber de cuál de los dos casos se trata, debemos
analizar el sistema teniendo en cuenta los coeficientes independientes.
Por supuesto que, si el sistema original es homogéneo, entonces nunca puede darse una situación de un sistema
incompatible. En este caso, la clasificación es mucho más sencilla.
Álgebra A. Resolución y clasificación de sistemas de ecuaciones lineales. 135
Importante Si tenemos un sistema de ecuaciones lineales homogéneo de igual cantidad de ecuaciones que de
incógnitas y triangulamos su matriz asociada, se pueden presentar las siguientes situaciones:
Si ninguna entrada de la diagonal principal es nula, entonces, el sistema es compatible determinado.
Si alguna entrada de la diagonal principal es nula, entonces, el sistema es compatible indeterminado.
Los sistemas con parámetros son sistemas lineales donde no se conocen todos los coeficientes del sistema; esto es,
uno o más coeficientes no están determinados, ya que son variables. Veamos cómo resolver y clasificar sistemas con
parámetros por medio de varios ejemplos. Comencemos el siguiente sistema:
x + kx2 + x3 = 0
1
2x1 + x3 = 0
2x + kx + kx
1 2 3 = 0
donde k ∈ R. Los coeficientes a12 , a32 y a33 son desconocidos, aunque sabemos que son todos iguales (son iguales
a cierto número real k). Para resolver el sistema, seguimos los mismos pasos que aprendimos: en primer lugar,
armamos la matriz asociada al sistema (que en este caso no hace falta ampliarla pues el mismo es homogéneo) y, en
segundo lugar, triangulamos. Al parámetro k lo tratamos como un número real más:
1 k 1 1 k 1 1 k 1
F lF
F2 →F2 −2F1 2 3
1 −−−−−−−−→ 0 −2k −1 −−−−→ 0 −k k − 2 →
2 0
F3 →F3 −2F1
2 k k 0 −k k−2 0 −2k −1
1 k 1
F →F −2F2
−−3−−−3−−−→ −k k−2
0
0 0 −2k + 3
De esta manera hemos arribado a una matriz triangulada. Como vimos en el apartado anterior, si ninguna entrada en
la diagonal es nula entonces el sistema es compatible determinado, independientemente del resto de las entradas de
la matriz. Las únicas maneras de que se anule una entrada de la diagonal es que −k = 0, que anula la entrada a22 ,
o que −2k + 3 = 0, que anula la entrada a33 . En el primer caso, k = 0, y en el segundo, k = 23 . Por lo tanto, ya
podemos concluir que, salvo para los casos k = 0 y k = 32 , el sistema es compatible determinado. Observemos que
no nos importa que en k = 2 se anula la entrada a23 , pues no está en la diagonal y, por lo tanto, no va a influir en el
tipo de sistema. Con este procedimiento, hemos reducido el problema: ya sabemos el tipo de sistema para todo los
valores reales que puede tener k a excepción de estos dos valores puntuales. Como el sistema es además homogéneo,
3
sabemos que para los casos k = 0 y k = 2 el sistema es compatible indeterminado. Tengamos en cuenta que,
simplemente triangulando la matriz, ya podemos clasificar completamente el sistema para cada posible k ∈ R.
Hallemos las soluciones para cada k. Como el sistema es homogéneo, para los casos en los que el sistema queda
compatible determinado, sabemos que la única solución es (0, 0, 0) ∈ R3 . Solo nos resta exhibir las soluciones para
los k que lo hacen indeterminado.
136 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
y el sistema asociado:
x + x3 = 0
1
−2x3 = 0
3x
3 = 0
mientras que la matriz obtenida al reemplazar el valor de k en la matriz triangulada nos deja:
3
1 2 1
0 − 23 − 12
0 0 0
A partir de esto último queda en evidencia la conveniencia de evaluar el k en la matriz triangulada en lugar del
sistema original. La segunda ecuación nos dice x3 = −3x2 , y al reemplazar en la primera ecuación, hallamos
que x1 = − 29 x2 . Las soluciones en este caso son {t(− 92 , 1, −3) : t ∈ R}.
Álgebra A. Resolución y clasificación de sistemas de ecuaciones lineales. 137
Cabe destacar que en este sistema, el parámetro k aparece de varias maneras (sólo, restado por 2 y elevado al
cuadrado). Armamos la matriz ampliada y triangulamos.
1 k −1 1 1 k −1 1
F2 →F 2 +F 1
−1 1 k2 −1 −−−−−−−→ 0 k2 − 1
1+k 0
F3 →F3 −F1
1 k k−2 2 0 0 k−1 1
El sistema ya quedó triangulado sin necesidad de más operaciones. La diagonal se anula en k = 1 y k = −1, por lo
cual, para todo k ∈ R distinto de estos valores, el sistema será compatible determinado. Como este sistema no es
homogéneo, no sabemos a priori si para los casos k = 1 y k = −1, el sistema resulta compatible indeterminado o
incompatible. Debemos analizar cada caso por separado.
Si k = −1 entonces al reemplazar en la matriz triangulada obtenemos:
1 −1 −1 1
0 0 0 0
0 0 −2 1
De aquí despejamos x3 = − 21 y x1 = 1
2 + x2 . Por lo tanto, las soluciones son de la forma (x1 , x2 , x3 ) =
( 12 + x2 , x2 , − 12 ) = x2 (1, 1, 0) + ( 12 , 0, − 21 ), con x2 ∈ R. Es decir, son el conjunto {t(1, 1, 0) + ( 12 , 0, − 12 ) :
t ∈ R}.
Si k = 1 la matriz queda:
1 1 −1 1
0 2 0 0
0 0 0 1
Tengamos en cuenta que la última ecuación del sistema asociado es 0 = 1, lo cual es un absurdo. Esto quiere
decir que, en este caso, el sistema es incompatible.
A veces podemos encontrar parámetros en los coeficientes independientes. Por ejemplo, resolvamos el sistema:
x1 + kx2 + 2x3 − x4 = k + 2
x − 7x + x = −4
2 3 4
x1 + kx2 − 2x3 = 2
−4x + k 2 x = −3k − 2
3 4
1 k 2 −1 k+2
−7 −4
F4 →F4 −F3 0 1 1
−− −−−−−→
−4 −k
0 0 1
2
0 0 0 k −1 −2k − 2
Este sistema solo puede anularse en la entrada a44 si k = 1 o k = −1. Analizamos ambos casos.
Si k = −1,la matriz queda:
1 −1 2 −1 1
−7 −4
0 1 1
−4
0 0 1 1
0 0 0 0 0
Como el término independiente −2k − 2 se anula también en −1 el resultado es que se ha anulado una
ecuación, pero no hemos creado ninguna inconsistencia. Es fácil ver ahora que el sistema es compatible
indeterminado.
Si k = 1 la matriz queda:
1 1 2 −1 3
−7 −4
0 1 1
−4 −1
0 0 1
0 0 0 0 −4
En este caso, el término −2k − 2 no se anula en k = 1 por lo que obtenemos una inconsistencia 0 = −4 en
la última ecuación y el sistema resulta incompatible.
Finalmente, supongamos que queremos clasificar un sistema con dos parámetros como el siguiente:
(a + 1)x + y + z = 1
x + (a + 1)y + z = b
= b2
x + y + (a + 1)z
Cabe destacar que será necesario considerar todas las posibilidades para a, b ∈ R por separado y ver cómo
interactuan entre sí en cada caso. Armamos entonces la matriz (ampliada) asociada al sistema y triangulamos.
a+1 1 1 1 1 1 a+1 b2
F lF
1 3
b −−−−→ 1
1 a+1 1 a+1 1 b
1 1 a+1 b2 a+1 1 1 1
1 1 a+1 b2
F2 →F2 −F1
−− −−−−−→ −a b − b2 −→
0 a
a+1 1 1 1
1 1 a+1 b2
F3 →F3 −(a+1)F1
−−−−−−−−−−−→ 0 a −a b−b 2 −→
0 −a −a2 − 2a 1 − (a + 1)b2
1 1 a+1 b2
F3 →F3 +F2
−− −−−−−→ 0 a −a b−b 2 −→
0 0 −a2 − 3a 1 − (a + 1)b2 + b − b2
Álgebra A. La teoría de matrices. 139
1 1 a+1 b2
= 0 −a b − b2
a
0 0 −a(a + 3) 1 − (a + 2)b2 + b
La diagonal se anula en a = 0 (en dos lugares) y a = −3, por lo cual ya sabemos que si a no es ninguno de esos
números, entonces, el sistema es compatible determinado. Con esto ya hemos reducido drásticamente el problema a
tres posibilidades para el número a. Para b aún estamos considerando todas las posibles opciones. Estudiemos los
distintos casos para a.
Si a = 0 queda:
1 1 1 b2
b − b2
0 0 0
0 0 0 1 − 2b2 + b
Para que el sistema sea compatible debe suceder (al mismo tiempo) b − b2 = 0 y −2b2 + b + 1 = 0. Como
b − b2 = (1 − b)b y −2b2 + b + 1 = −2(b + 12 )(b − 1), entonces, el sistema es compatible solo si b = 1.
Como nos queda una única ecuación (no nula) y tres incógnitas, en este caso, el sistema es (compatible)
indeterminado.
Si a = −3 queda:
1 1 −2 b2
−3 b − b2
0 3
0 0 0 b2 + b + 1
Para que el sistema sea compatible debe suceder b2 + b + 1 = 0. Pero b2 + b + 1 > 0 para todo b ∈ R. Por lo
tanto, en este caso, el sistema es incompatible para todo b.
Arribamos a nuestra respuesta:
El sistema es compatible determinado cuando a 6= 0, −3 y b ∈ R cualquiera.
El sistema es compatible indeterminado cuando a = 0 y b = 1.
El sistema es incompatible cuando a = 0 y b 6= 1, y cuando a = −3 y b ∈ R cualquiera.
Cuando estudiemos “Determinantes”, veremos una manera más directa y mecánica de clasificar sistemas con
parámetros.
Así como los vectores de Rn se pueden sumar entre sí y multiplicar por escalares λ ∈ R, las matrices también. Y la
definición es prácticamente la misma: lo hacemos “coordenada a coordenada”.
Definición 48 Sean A, B ∈ Rn×m las matrices:
a11 a12 ··· a1m b11 b12 ··· b1m
a21 a22 ··· a2m b21 b22 ··· b2m
A=
.. .. ..
B=
.. .. ..
. . . . . .
an1 an2 ··· anm bn1 bn2 ··· bnm
a11 + b11 a12 + b12 ··· a1m + b1m
a21 + b21 a22 + b22 ··· a2m + b2m
• A+B =
.. .. ..
. . .
an1 + bn1 an2 + bn2 ··· anm + bnm
λa11 λa12 ··· λa1m
λa21 λa22 ··· λa2m
• λA =
.. .. ..
. . .
λan1 λan2 ··· λanm
Es decir, la matriz A + B vuelve a ser una matriz de n filas por m columnas y la entrada ij de esta matriz es la
suma de la entrada ij de la matriz A con la entrada ij de la matriz B. Por otro lado, la matriz λA también vuelve a
ser una matriz en Rn×m cuya entrada ij es la entrada ij de A multiplicada por λ. Es importante remarcar que dos
matrices se pueden sumar solo si tienen el mismo tamaño.
Ejemplos 50
2 3 −1
, ( 0 1 4 ) ∈ R2×3 es:
−1 3 −1
La suma de las matrices −5 0 8
2 3 −1 −1 3 −1 2−1 3+3 −1 − 1 1 6 −2
+ = =
−5 0 8 0 1 4 −5 + 0 0+1 8+4 −5 1 12
Álgebra A. La teoría de matrices. 141
2 3
−5 8
El producto de la matriz 1 3 ∈ R4×2 por el número λ = 7 es:
−2 1
2 3 7,2 7,3 14 21
−5 8 7(−5) 7,8 −35 56
7
=
=
1 3 7,1 7,3 7 21
−2 1 7(−2) 7,1 −14 7
Vimos en el capítulo 3, que los subespacios vectoriales en Rn consistían en conjuntos de vectores con la
propiedad que establece que la suma de vectores y el producto de un vector por un escalar daban como
resultado vectores del mismo conjunto. Acabamos de verificar que el conjunto de matrices de n × m también
posee operaciones de suma y producto por escalar. ¿Habrá subconjuntos de matrices que tengan las mismas
propiedades de los subespacios vectoriales de Rn ? ¡La respuesta es sí! Las matrices de Rn×m también poseen
subespacios en este mismo sentido. En realidad, un espacio vectorial genérico es un conjunto de objetos (no
necesariamente vectores de Rn ) con las operaciones de “suma de objetos” y “multiplicación de un objeto por
un escalar” que, además, cumplen ciertas propiedades. Por ejemplo, tomando a las matrices como objetos y
las operaciones que acabamos de definir, se puede mostrar que Rn×m es un espacio vectorial. Si bien en esta
cursada solo estudiamos espacios vectoriales definidos para el caso en el cual los objetos son vectores de Rn ,
la teoría es inmensamente más rica.
Así como existe un vector nulo en Rn , también existe una matriz nula en Rn×m para cada n y m fijos. Esta matriz
se nota 0, y sus entradas son todas 0. Las propiedades de las operaciones de matrices recién introducidas son las
mismas que las de las operaciones para vectores. Las enunciamos a continuación para matrices A, B, C ∈ Rn×m y
λ, λ1 , λ2 ∈ R.
1. A + (B + C) = (A + B) + C
2. A + B = B + A
3. Si λ ∈ R, λ(A + B) = λA + λB
4. Si λ1 ∈ R y λ2 ∈ R, (λ1 + λ2 )A = λ1 A + λ2 A y (λ1 λ2 )A = λ1 (λ2 A)
5. 0 + A = A
6. 1A = A
7. A + (−1)A = 0
8. 0A = 0
Les proponemos corroborar estas propiedades para matrices elegidas al azar (por ejemplo, las matrices en R2×3 del
ejemplo anterior).
En este apartado, vamos a definir una manera de multiplicar matrices entre sí, de forma que el resultado de la
multiplicación sea nuevamente una matriz. Por un lado, si bien esta operación guarda alguna correlación con el
producto entre números reales, no comparte la mayoría de las propiedades de la multiplicación que conocemos. Por
ejemplo, no cualesquiera dos matrices pueden ser multiplicadas entre sí (existen ciertas restricciones de tamaño
para poder multiplicar dos matrices). Por otro lado, la matriz que resulta de la multiplicación, no tiene en general
el mismo tamaño que ninguna de ellas. Por último, el producto de matrices no es conmutativo. Por esta razón,
tendremos especial cuidado al trabajar con la multiplicación de matrices.
142 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Comencemos estableciendo cuál es la condición necesaria para poder multiplicar una matriz A con una matriz B.
Lo único que necesitamos es que la cantidad de columnas de A se igual a la cantidad de filas de B, es decir: que
A ∈ Rn×m y B ∈ Rm×r , para algunos n, m, r ∈ N. A partir de la definición de multiplicación de matrices, esta
condición es necesaria.
Definición 49 Sea A ∈ Rn×m y B ∈ Rm×r . Llamemos aij a las entradas de A y bij a las entradas de B.
Entonces, el producto de A con B es la matriz A · B ∈ Rn×r , cuya entrada en el lugar ij es el número
ai1 b1j + ai2 b2j + · · · + aim bmj .
Esto puede parecer muy complicado a primera vista pero en realidad no lo es. Lo explicaremos en detalle. En
primer lugar, lo que nos dice la definición es que el resultado de multiplicar una matriz de tamaño n × m por una de
tamaño m × r, es una matriz de tamaño n × r. Es decir, tiene la misma cantidad de filas que A y la misma cantidad
de columnas que B. ¿Cómo se arma entonces esta matriz de n × r? Progresivamente, primero completando las
entradas de la primera fila, luego de la segunda, y así hasta la última fila. Llamamos cij a las entradas de la matriz
A · B ¿Cómo averiguamos cuál es la entrada cij ? Si vemos la formula de la definición, observamos que es una
combinación de algunas entradas de A y algunas entradas de B. Pero, ¿qué entradas? y ¿qué combinación? Pues,
el primer subíndice de cij nos indica que consideremos la i-ésima fila de A y, el segundo subíndice, la j-ésima
columna de B; y la combinación es simplemente multiplicar la primera entrada de la fila i de A con la primera
entrada de la columna j de B, la segunda entrada de la fila i de A con la segunda entrada de la columna j de B,
y así hasta multiplicar la última entrada de la fila i de A con la última entrada de la columna j de B (las filas de
A y las columnas de B tienen el mismo largo: m). Una vez que hicimos estas multiplicaciones por separado, las
sumamos todas para obtener un único número: ese número es cij . Veamos un ejemplo.
Supongamos que queremos calcular el producto A · B entre las siguientes dos matrices:
−5 2
1 3 −2
A= B = −1 7
4 0 5
2 1
La multiplicación se puede llevar a cabo ya que A tiene tres columnas y B tiene tres filas. Vamos armando las
entradas cij de A · B. Como A tiene dos filas y B dos columnas, entonces A · B ∈ R2×2 . Debemos calcular
c11 , c12 , c21 y c22 . ¿Qué entrada es c11 ? Consideramos la primera fila de A (1 3 − 2) y la primera fila de B
(−5 −1 2). Y ahora, multiplicamos lugar a lugar estas filas/columnas:
(1 3 −2)
(−5 −1 2)
↓ ↓ ↓
(−5) 3(−1) (−2)2
Finalmente, sumamos todos estos números: −5 − 3 − 4 = −12. Por lo tanto, c11 = −12. Vamos a calcular c12 :
tomemos la primera fila de A (1 3 − 2) y la segunda columna de B (2 7 1), y multiplicamos sus entradas
lugar a lugar:
(1 3 −2)
(2 7 1)
↓ ↓ ↓
2 21 −2
Álgebra A. La teoría de matrices. 143
Por lo tanto, c12 = 2 + 21 − 2 = 21. Al aplicar el mismo procedimiento, para c21 consideramos la segunda fila de A
(4 0 5) y la primera columna de B (−5 −1 2) y tenemos c21 = 4(−5) + 0(−1) + 5,2 = −10. Finalmente,
c22 = 4,2 + 0,7 + 5,1 = 13. Entonces hemos calculado:
−12 21
A·B =
−10 13
¿Pueden darse cuenta qué estamos haciendo al multiplicar lugar a lugar las entradas de las filas de A con las
columnas de B y después sumarlas? ¿No les recuerda a una operación que hicimos anteriormente con vectores?
¡Sí, el producto escalar de vectores! Si consideramos a las filas y columnas como vectores, entonces, la cuenta
que estamos haciendo es el producto escalar entre una fila/vector de A y una columna/vector de B. Es decir, en
la entrada cij de A · B va el producto escalar entre la fila i de A y la columna j de B (considerando a estas filas
y columnas como vectores). En el ejemplo anterior, c11 = (1, 3, −2) · (−5, −1, 2), c12 = (1, 3, −2) · (2, 7, 1),
c21 = (4, 0, 5) · (−5, −1, 2) y c22 = (4, 0, 5) · (2, 7, 1). Esta es otra manera de recordar cómo se calculan las
entradas de la matriz producto.
Ejemplos 51
−13
2 3 −1
∈ R3×2 y ∈ R2×3 es
El producto entre las matrices 0 4 −5 0 8
2 −2
−1 3 −17 −3 25
2 3 −1
4 · =
−20
0 0 32
−5 0 8
2 −2 14 6 −18
Como comentamos al comienzo del apartado, el producto de matrices no tiene las mismas propiedades que el
producto de números reales que conocemos. En primer lugar, no siempre podemos hacer el producto entre dos
matrices cualesquiera (la cantidad de columnas de la primera matriz debe coincidir con la cantidad de filas de
la segunda). En particular, esto nos indica que el producto de matrices no es conmutativo. Es decir, no es cierto
que A · B = B · A pues B · A podría no ser posible de calcular al no cumplirse los requisitos de la cantidad de
columnas de B con las de A. Por ejemplo, si A ∈ R2×4 y B ∈ R4×3 , entonces el producto A · B se puede llevar a
cabo pero el producto B · A no. Pero este no es el único motivo por el que no es conmutativo el producto: puede
suceder que tanto A · B como B · A sean operaciones válidas pero ¡podrían no ser matrices del mismo tamaño!
(mucho menos iguales). Por ejemplo, si A ∈ R3×4 y B ∈ R4×3 , entonces, tanto A · B como B · A, son válidas.
Pero A · B ∈ R3×3 y B · A ∈ R4×4 . Hay además otro motivo por el cual el producto no es conmutativo: podría
suceder que A · B y B · A sean operaciones válidas y que den lugar a matrices del mismo tamaño, pero que de
todas formas A · B 6= B · A. Por ejemplo, si:
1 2 1 1
A= yB =
3 4 0 0
entonces,
1 1 4 6
A·B = yB·A=
3 3 0 0
144 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Más allá de esto, el producto de matrices sí posee la propiedad distributiva respecto de la suma. Es decir, para
A, B, C ∈ Rn×m se tiene:
(A + B) · C = A · C + B · C
C · (A + B) = C · A + C · B
Es importante remarcar que, cuando hacemos la distribución de C dentro del paréntesis, nos aseguramos de ubicar
a C del mismo lado que estaba fuera del paréntesis. Es decir, si C esta a la derecha del paréntesis (como en la
primera ecuación de arriba), entonces cuando distribuimos C queda multiplicando a A y B a la derecha. Esto por
supuesto es fundamental tenerlo presente ya que, como vimos recién, el producto no es conmutativo. Por este motivo
consideramos dos formulas de distribución (para C multiplicando a derecha y a izquierda por separado).
Para las matrices A ∈ R1×n y B ∈ Rn×1 , de distinto tamaño, estudien los resultados de las multiplicaciones
A · B y B · A.
Un tipo muy especial de matrices son las matrices cuadradas: aquellas que tienen igual cantidad de filas y de
columnas. Dada esta coincidencia, a una matriz cuadrada de n filas por n columnas se la suele llamar simplemente
matriz cuadrada de tamaño n. Una de las ventajas de trabajar con matrices de Rn×n es que pueden ser siempre
multiplicadas entre sí; y, además, el resultado vuelve a ser una matriz de tamaño n. Entonces cuando se trabaja
con matrices cuadradas, se presenta una situación más parecida a trabajar con números, en el sentido que todas
las operaciones entre matrices vuelven a dar matrices del mismo conjunto. Otra ventaja de estas matrices es que
admiten un elemento neutro para la multiplicación (el equivalente al 1 en los números reales). Esta matriz se llama
matriz identidad y es la matriz cuadrada que tiene todas sus entradas 0 salvo en la diagonal principal, que tiene
todos 1. A continuación, la definimos con mayor precisión.
Definición 50 La matriz identidad de Rn×n , también llamada matriz identidad de n × n, es la siguiente matriz
In de n filas y n columnas:
1 0 0 ··· 0
0 1 0 ··· 0
In = 0 0 1 ··· 0
.. .. .. ..
. . . .
0 0 0 ··· 1
Para cada n ∈ N hay una matriz identidad de tamaño n. Las primeras cuatros son:
1 0 0
1 0
I1 = 1 ∈ R I2 = ∈ R2×2 I3 = 0 1 0 ∈ R3×3
0 1
0 0 1
1 0 0 0
0 1 0 0
I4 = ∈ R4×4
0 0 1 0
0 0 0 1
En general, no especificaremos el tamaño de la matriz identidad que estamos considerando con el subíndice “n”
correspondiente y solamente escribiremos I para respresentarla (el tamaño que tiene quedará claro del contexto en
Álgebra A. La teoría de matrices. 145
el que estemos trabajando). Pueden chequear fácilmente que, si I ∈ Rn×n , entonces A · I = A, y que I · A = A
para toda matriz cuadrada de tamaño n. En particular, la matriz identidad conmuta con todas las matrices de n × n.
Todos los números reales, a excepción del 0, tienen un inverso multiplicativo; esto es, para todo x ∈ R distinto de 0,
existe y ∈ R tal que xy = 1. Como sabemos que este número y es único, lo solemos escribir x−1 o x1 . En la teoría
de matrices sucede algo parecido, aunque no para todas las matrices. Para algunas matrices cuadradas A ∈ Rn×n
existe otra matriz del mismo tamaño B ∈ Rn×n tal que A · B = I. Se las conoce como matrices inversibles y
tienen propiedades muy útiles.
Definición 51 Una matriz cuadrada A ∈ Rn×n se dice inversible si existe una matriz B ∈ Rn×n tal que
A · B = I y B · A = I.
Que una matriz sea inversible nos brinda mucha información sobre el sistema de ecuaciones lineales asociado. Por
ejemplo, indica que es compatible determinado. También, en algunos casos, permite resolver ecuaciones matriciales
de manera muy efectiva. Ambas situaciones las estudiaremos en los siguientes apartados.
Recién afirmamos que no todas las matrices cuadradas no nulas son inversibles. Por ejemplo, la matriz:
1 0
A= ∈ R2×2
0 0
no tiene inversa. En efecto, una inversa para A debería ser otra matriz B tal que A · B = I. Al no conocer B,
podemos escribir genéricamente B = ac db . Por lo tanto, A · B = I quiere decir:
1 0 a b 1 0
· =
0 0 c d 0 1
Si calculamos el producto entre A y B tenemos que es ( a0 0b ). Es decir, siempre la segunda fila de A · B es nula
(cualquiera sea B). En particular, ningún producto de A por otra matriz va a dar como resultado un 1 en la posición
a22 . Por lo tanto, no hay manera de multiplicar a A por otra matriz y obtener la identidad. Esto muestra que A no
tiene inversa.
Veamos cómo calcular la inversa de una matriz inversible. Supongamos que queremos encontrar la inversa de la
matriz:
1 2 −1
3×3
−2 ∈ R
1 1
2 0 2
En principio no tenemos porqué saber si A es o no inversible. El procedimiento que vamos a llevar a cabo nos
devolverá la inversa de A (si existe) o nos avisará que A no es inversible. A partir de la matriz A, construirnos una
matriz ampliada donde agregamos la identidad del otro lado de la barra. Es decir, consideramos:
1 2 −1 1 0 0
1 1 −2 0 1 0
2 0 2 0 0 1
Ahora, utilizaremos las operaciones de filas que conocemos para llevar la matriz original a la matriz identidad del
lado izquierdo de la barra (aplicando las mismas operaciones a la matriz identidad del lado derecho de la barra). Las
146 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
operaciones de filas que transforman una matriz A en la matriz identidad son exactamente las operaciones de fila
que debemos hacerle a la matriz identidad para tranformarla en la inversa de A. Por este motivo, ampliamos la
matriz original con la identidad: en lugar de tener que ir anotando las operaciones que le vamos a hacer a A para
transformarla en la identidad (para después aplicárselas a I), ¡hacemos todo al mismo tiempo! A continuación, les
mostramos de qué modo.
En primer lugar, hay que llevar la matriz A a la matriz identidad, al igual que al triangular. De hecho, comenzaremos
triangulando la matriz (poniendo ceros debajo de la diagonal) y, luego, agregaremos ceros arriba de la diagonal.
Empezamos triangulando la parte derecha de la matriz:
1 2 −1 1 0 0 1 2 −1 1 0 0
F2 →F2 −F1
1 1 −2 0 1 0 −−−−−−−−→ 0 −1 −1 −1
1 0
F3 →F3 −2F1
2 0 2 0 0 1 0 −4 4 −2 0 1
Tengamos presente, cómo hemos aplicado las operaciones de fila a toda la matriz ampliada (también a la identidad
de la derecha).
1 2 −1 1 0 0 1 2 −1 1 0 0
F3 →F3 −4F2
−1 −1 −1 0 −−−−−−−−→ 0 −1 −1 −1
0 1 1 0
0 −4 4 −2 0 1 0 0 8 2 −4 1
Aquí ya tenemos la matriz A triangulada. Ahora buscamos los ceros arriba de la diagonal. Para facilitar las cuentas,
nos conviene multiplicar la última fila por 18 .
1 2 −1 1 0 0 1 2 −1 1 0 0
1F
8 3
−1 −1 −1 0 −−−→ 0 −1 −1 −1
0 1 1 0
1
0 0 8 2 −4 1 0 0 1 4 − 21 1
8
Así como usábamos la entrada a11 para generar los 0 debajo de la diagonal principal en la primera columna, ahora
utilizaremos la entrada a33 para generar los ceros arriba de la diagonal principal en la tercera columna.
5 1 1
1 2 −1 1 0 0 1 2 0 4 − 2 8
F2 →F2 +F3 3 1 1
0 −1 −1 −1 1 − −− −− −−→ 0 −1 0 − 4 −→
0 2 8
F1 →F1 +F3
1
0 0 1 4 − 12 18 0 0 1 1
4 − 12 18
1 0 0 − 14 1
2
3
8 1 0 0 − 14 1
2
3
8
(−1)F
F →F +2F2 2
−−1−−−1−−−→ −1 − 34 1 1 −−−−→ 0 3
− 12 − 18
0 0 2 8 1 0 4
1
0 0 1 4 − 21 1
8 0 0 1 1
4 − 12 1
8
Finalmente, hemos alcanzado la identidad en el lado izquierdo de la matriz ampliada. Lograr esta transformación
nos muestra que la matriz A es inversible. Y la inversa es precisamente la matriz que aparece del lado derecho de la
matriz ampliada:
− 14 1
2
3
8
3
− 21 − 81
4
1
4 − 21 1
8
La manera de saber si hemos llevado a cabo bien las cuentas es chequear si efectivamente esta matriz es la inversa
de A; es decir, chequear que el producto de A por esta matriz da la identidad de R3×3 .
Álgebra A. La teoría de matrices. 147
Vayamos a otro ejemplo de este procedimiento para una matriz que no es inversible. Consideremos la matriz:
−1 3 5
B = 1 0 −4 ∈ R3×3
2 3 −7
Armamos entonces la matriz ampliada y empezamos a triangular la matriz B dentro de esta matriz:
−1 3 5 1 0 0 −1 3 5 1 0 0
F2 →F2 +F1
1 0 −4 0 1 0 −−−−−−−−→ 0 3 1 1 1 0 −→
F3 →F3 +2F1
2 3 −7 0 0 1 0 9 3 2 0 1
−1 3 5 1 0 0
F →F −3F2
−−3−−−3−−−→ 3 −1
0 1 1 0
0 0 0 −1 −3 1
Pero aquí debemos deternernos. Si durante el procedimiento aparece una fila de ceros quiere decir que la matriz
no es inversible. La explicación de este fenómeno la brindaremos más adelante, cuando veamos el rango de una
matriz. En conclusión, este procedimiento de ampliar la matriz con la matriz identidad y triangular la matriz original,
devolverá la inversa de la matriz (si existe), o producirá una fila de ceros durante la triangulación (que indica que la
matriz no era inversible en primer lugar).
Experimento 27 Este experimento explica porqué funciona el procedimiento para hallar la inversa que
explicamos recién. Lo aplicamos sobre el primer ejemplo que vimos. La matriz es:
1 2 −1
A = 1 1 −2 ∈ R3×3
2 0 2
Si uno no tiene más información o herramientas, la manera más directa y “a mano” de encarar el problema de
hallar la inversa de una matriz es considerar una matriz genérica:
a b c
B = d e f ∈ R3×3
g h i
y tratar de ver cómo tienen que ser sus entradas para que resulte la inversa de A. Es decir, queremos ver quiénes
tienen que ser a, b, c, d, e, f, g, h, i ∈ R para que A · B = I. Al resolver la cuenta, buscamos que:
1 2 −1 a b c 1 0 0
1 1 −2 · d e f = 0 1 0
2 0 2 g h i 0 0 1
Les proponemos que calculen el producto de matrices de la izquierda, de manera de obtener una igualdad entre
dos matrices (la de la izquierda, llena de letras, y a la derecha, la identidad). Como dos matrices son iguales si
sus entradas son iguales, entonces igualando entrada a entrada vamos a obtener un sistema de 9 ecuaciones y 9
incógnitas. Por ejemplo, la ecuación correspondiente a la igualación de las entradas a11 es a + 2d − g = 1, y la
correspondiente a la igualación de las entradas a32 es b + h = 0. Analicemos con detenimiento este sistema.
148 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Si bien parece muy grande, en realidad, las únicas ecuaciones que utilizan las incógnitas a, d, g son las tres
ecuaciones correspondientes a la igualación de las entradas de la primera columna de A · B. Lo mismo sucede
con las incógnitas b, e, h (sólo aparecen en las tres ecuaciones correspondientes a la igualación de las entradas
de la segunda columna de A · B) y con c, f, i (tres ecuaciones correspondientes a la tercera columna). Por lo
tanto, este sistema podemos pensarlo como tres sistemas separados de tres ecuaciones y tres incógnitas cada
uno en lugar de concebirlo como un gran sistema de 9 × 9. Pero hay algo más: veamos los tres sistemas que
acabamos de separar. ¿Cómo són las matrices asociadas a estos sistemas? ¿Pueden darse cuenta ahora por qué
funciona el razonamiento? (no es tan directo, requiere pensarlo).
Ejemplos 52
1 2 −1 1 1 2
t
Si A = 1 −2 entonces A = 2
1 1 0
2 0 2 −1 −2 2
1 −1
1 3 −2
Si A = entonces At =
3
5
−1 5 −4
−2 4
1 2
t
1 3 5
Si A = 3 4 entonces A =
2 4 6
5 6
En Matemática es muy común asignarle números a objetos que nos brinden información sobre los mismos. Por
ejemplo, la norma de un vector es un número que le asignamos a cada vector y que nos informa sobre su longitud.
Un caso muy importante en la teoría de matrices, tan importante que le dedicamos el próximo apartado entero, es el
determinante de una matriz, que nos dice, entre otras cosas, si las matriz es o no inversible (sin tener que pasar por
el cálculo de la inversa que estudiamos recientemente). En este apartado, vamos a introducir otro de este tipo de
números: el rango de una matriz.
Consideremos el siguiente sistema de ecuaciones lineales homogéneo:
2x + 5y − z = 0
−x + 3y + 4 = 0
−5x + 4y + 13 = 0
Álgebra A. La teoría de matrices. 149
Veamos qué sucede al tratar de resolverlo por el método de triangulación. La matriz del sistema es:
2 5 −1
−1 3 4
−5 4 13
Triangulamos:
2 5 −1 −1 3 4 −1 2 4
F lF
1 2 F2 →F2 +2F1
−1 4 −−−−→ 2 5 −1 −−−−−−−−→ 0 7 −→
3 11
F3 →F3 −5F1
−5 4 13 −5 4 13 0 −11 −7
−1 2 4
F3 →F3 +F2
−− −−−−−→ 0 11 7
0 0 0
El sistema asociado a esta matriz tiene una ecuación menos que el sistema original. Pero, ¿qué nos indica esta fila
de ceros en la matriz (respecto de la matriz en sí)? Pensemos a las filas de la matriz original como vectores. En este
caso, vectores de R3 . Los llamamos ~v1 = (2, 5, −1), ~v2 = (−1, 3, 4) y ~v3 = (−5, 4, 13). Ahora bien, volvamos a
realizar la triangulación de la matriz pero llevando cuenta de las operaciones que estamos haciendo implícitamente
entre estos vectores (representado a la derecha de cada matriz).
2 5 −1 ~v1 −1 3 4 ~v
F1 lF2
2
−1 3 4 ~v2 −−−−→ 2 5 −1 ~v1 −→
−5 4 13 ~v3 −5 4 13 ~v3
−1 2 4 ~v
2
F2 →F2 +2F1
−−−−−−−−→ 0 7 ~v1 + 2~v2 −→
11
F3 →F3 −5F1
0 −11 −7 ~v3 − 5~v2
−1 2 4 ~v
2
F3 →F3 +F2
−−−−−−−→ 0 11 7 ~v1 + 2~v2
0 0 0 ~v3 − 5~v2 + (~v1 + 2~v2 )
Las operaciones que figuran a la derecha de las matrices van mostrando cómo fueron cambiando las filas, vistas
como vectores, a lo largo de la triangulación. En la matriz triangulada, la interpretación de lo que está en la fila 2 es
que ~v1 + 2~v2 = (0, 11, 7). Y, en particular, la fila 3 dice ~v3 − 5~v2 + (~v1 + 2~v2 ) = (0, 0, 0). Es decir:
¡Entonces ~v3 es combinación lineal de los vectores ~v1 y ~v2 ! Cuando triangulamos una matriz y se anula una fila lo
que está sucediendo es que la fila que se anuló es “combinación lineal de las otras filas” (viendo a las filas como
vectores). Y la anulación de una fila de una matriz asociada a un sistema nos indica que la ecuación correspondiente
a dicha fila desaparece (puede removerse sin alterar las soluciones del sistema); es decir, la ecuación removida es
“combinación lineal de las otras ecuaciones” del sistema.
Observemos que saber cuántas filas de la matriz son independientes es de gran utilidad. Este número es lo que se
conoce como rango de una matriz.
150 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
rg(A).
Notemos que rg(A) es un número entero positivo (que solo es cero para la matriz nula). En el ejemplo que vimos
recién, el rango de la matriz asociada al sistema es 2. Veamos algunos otros ejemplos.
Ejemplos 53
1 2 −3
∈ R2×3 es 1 (sus filas son múltiplos).
El rango de −2 −4 6
1 0 −1
!
1 −1 0
El rango de 0 1 −1 ∈ R5×3 es 3. (Las filas 1, 2 y 4 son linealmente independientes entre sí.)
0 1 1
1 0 1
Cuando una matriz tiene una fila que es combinación lineal de las otras, dicha combinación podemos encontrarla
utilizando el procedimiento antes descripto (de nombrar a las filas v1 , . . . , vn y seguir las operaciones que vamos
realizando en la triangulación al costado de la matriz). Lo importante de las operaciones elementales de filas es
que no alteran el rango de la matriz. Es decir, el rango de una matriz antes y después de hacerle una operación
elemental de fila es el mismo. Se lo dejamos para mostrar en el próximo experimento.
¿Cuál es la manera de calcular el rango de una matriz? Notemos que, para conocer el rango, solo nos interesa saber
cuántas filas linealmente independientes tiene, no cuáles son ni cuál es la combinación lineal que las relaciona. Por
lo tanto, para calcular el rango de una matriz nos alcanza con triangular la matriz y, cuando obtengamos una
matriz triangular, contar cuántas filas no nulas nos quedan.
Ejemplos 54
La cantidad de filas linealmente independientes de una matriz cualquiera de Rn×m es igual a la cantidad de
columnas linealmente independientes de la misma. Por esta razón, el rango puede definirse también como la
cantidad de columnas linealmente independientes.
El rango es un dato especialmente útil cuando trabajamos con matrices cuadradas. Recordemos que, para hallar
la inversa de una matriz de n × n (si la tuviere), debíamos triangular la matriz hasta convertirla en la identidad
I ∈ Rn×n . Pero acabamos de ver que las operaciones de filas que utilizamos para triangular no alteran el rango de
la matriz. Como el proceso termina en la matriz identidad de n × n, cuyo rango es n, concluimos que, si una matriz
de n × n es inversible, entonces su rango debe ser necesariamente n. De igual manera, si una matriz de n × n tiene
rango n entonces es necesariamente inversible. Para chequear que esto último es válido observemos que, al tener
rango n, todas las filas son linealmente independientes. Por lo tanto, triangulando nunca se nos anulará ninguna fila
y podremos alcanzar una matriz triangular con entradas no nulas en la diagonal principal. A partir de aquí, no es
difícil continuar la triangulación “de la parte de arriba de la matriz” y poner unos (1) en la diagonal, de manera de
obtener la matriz identidad. El estudiante puede hacer un ejemplo concreto, con una matriz de 3 × 3 por ejemplo,
para convencerse que siempre que llegue a una matriz cuadrada triangular sin entradas nulas en la diagonal puede
seguir triangulando hasta obtener la identidad.
El rango es entonces una excelente manera de determinar si una matriz cuadrada es o no inversible sin tener que
hacer muchas cuentas. Por ejemplo, la matriz:
−1 2 4
0 1 2
2 −4 8
no puede ser inversible, pues la última fila es −2 veces la primera (por lo que el rango de la matriz no es 3; en este
caso, es 2). La matriz:
1 1 1
1 1 1
1 1 1
tampoco es inversible, pues las últimas dos filas son combinación lineal de la primera (son idénticas de hecho). En
este caso, el rango es 1. La matriz:
−4 2 3
−1
12 7
3 10 4
tiene rango 2 (la segunda fila es combinación lineal de las otras dos filas), por lo que tampoco puede ser inversible.
152 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Como último resultado sobre el rango, mencionamos una propiedades que nos puede resultar útil a la hora de
calcularlo: el rango de una matriz no se altera si la multiplicamos por otra matriz que es inversible (a derecha o
izquierda). Es decir, si A, B ∈ Rn×n y B es inversible, entonces, rg(A · B) = rg(A) y rg(B · A) = rg(A). Esto
no es cierto si la matriz B no es inversible. Por ejemplo, si A = ( 11 23 ) y B = ( 10 10 ), entonces, A · B = ( 11 11 ). En
este caso, rg(A) = 2 pero rg(A · B) = 1 (B no es inversible: su rango es 1).
Estudien qué sucede con el rango de la matriz An si A es una matriz inversible. Tengan en cuenta que An
representa la potencia n-ésima de la matriz A.
La teoría de matrices tiene muchas aplicaciones y puede utilizarse en el Álgebra para interpretar muchas situaciones.
Aquí hemos visto cómo podemos utilizar matrices para resolver sistemas de ecuaciones lineales. Pero podemos
también “enmarcar” la teoría de sistemas de ecuaciones lineales dentro de la teoría de matrices. En consecuencia,
retomemos el sistema que consideramos al principio del capítulo:
x + 2y = 5
2x − 3y = −1
Este sistema puede representarse a nivel matricial (haciendo uso del producto de matrices) de la siguiente manera:
1 2 x 5
· =
2 −3 y −1
Dada esta identificación, podemos considerar a los sistemas de ecuaciones lineales como ecuaciones con matrices.
Interpretar un sistema de ecuaciones de esta manera es, en general, muy conveniente dado que, por un lado, convierte
un sistema de varias ecuaciones en una única ecuación y, por otro, nos deja a disposición las herramientas algebraicas
que posee la teoría de matrices. Muchas veces, esto nos permitirá usar razonamientos parecidos a los utilizados
cuando resolvemos ecuaciones en los reales. En efecto, si tenemos que resolver la ecuación 5x = 3, entonces
“pasamos dividiendo” el 5 para hallar x = 35 . Esto es posible porque podemos dividir por 5; es decir, 5 tiene inverso.
Consideremos ahora una ecuación matricial:
x1
b1
x 2 b2
A·
.. = ..
. .
xn bn
donde A ∈ Rn×n . Si la matriz A es inversible, entonces, podemos multiplicar a izquierda, a ambos lados de la
igualdad, por la inversa A−1 de A, de forma de obtener:
x1 b1
x2 b
−1 2
A−1 · A ·
.. = A · ..
. .
xn bn
Es decir, ¡despejamos la solución como hacíamos en el caso de las ecuaciones reales! Esto nos dice, por un lado,
que si la matriz asociada al sistema es cuadrada e inversible, entonces el sistema es compatible determinado (pues
tiene una única solución que debe ser A−1 B) y, por otro lado, que podemos hallar dicha solución calculando la
inversa A−1 de la matriz y multiplicando a izquierda a la matriz B de términos independientes por esta inversa.
Esto nos ahorra el tener que triangular y despejar “a mano” las soluciones del sistema.
2x − 2y + 2z = 2
x + y − 2z = 0
2x − 4z = 1
2 −2 2 1 1 −2 1 1 −2
F lF
1 2 F2 →F2 −2F1
−2 −−−−→ 2 −2 2 −−−−−−−−→ 0 −4 6 −→
1 1
F3 →F3 −2F1
2 0 −4 2 0 −4 0 −2 0
1 1 −2 1 1 −2
F2 lF3
F3 →F3 −2F2
−−−−→ 0 −2 0 −−−−−−−−→ 0 −2
0
0 −4 6 0 0 6
1 2 1
!
3 3
−6
Aquí vemos que el rg(A) = 3, por lo que es inversible. La inversa de A es 0 1 −1
2 , por lo que la solución del
1 1 −1
6 3 3
sistema es:
1 2
2 − 16 2 1
3 3 2
A−1 · 0 = 0 − 12 · 0 = − 12
1
1 1
1 6 3
− 13 1 0
Estudiamos las operaciones básicas entre matrices: la suma y el producto por escalar.
Introducimos la multiplicación de matrices y vimos sus propiedades más importantes. Particularmente, no es
conmutativa.
Estudiamos las matrices cuadradas e introducimos la matriz identidad.
Definimos qué significa que una matriz cuadrada sea inversible y aprendimos a calcular la inversa de una matriz
inversible (o detectar si la matriz no es inversible).
Definimos el rango de una matriz y vimos su relación con la inversibilidad de la matriz (en el caso que sean cuadradas).
Vimos cómo escribir matricialmente un sistema de ecuaciones lineales y, además, aprendimos a resolver un sistema
cuadrado cuya matriz asociada es inversible.
5.5 Determinantes
A una matriz cuadrada podemos asociarle un número llamado el determinante de la matriz. Esta magnitud es una de
las herramientas más importantes de la teoría de matrices y nos provee muchísima información sobre estas.
En el apartado anterior, vimos que toda matriz tiene asociado un número llamado rango del que podemos extraer
información de la matriz. El determinante es otro tipo de número que nos da información sobre las matrices
cuadradas. La característica principal (que utilizaremos con más frecuencia) es la siguiente: una matriz es inversible
sí, y solo sí, su determinante es un número distinto de 0. En próxima unidad estudiaremos otras características del
determinante.
Álgebra A. Determinantes. 155
El determinante se calcula a partir de una fórmula que involucra sumas y multiplicaciones de las entradas de la
matriz. Esta fórmula no es, en principio, ni sencilla ni natural, pero veremos que, de todas formas, es fácil de calcular
recordando unos pocos procedimientos. Comenzaremos definiéndolo para las matrices más pequeñas primero.
Al tener en cuenta que queremos que el determinante sea distinto de cero exactamente para las matrices inversibles,
¿podemos deducir cuál debería ser este número en el caso de matrices de 2 × 2? Consideremos una matriz genérica
A = ac db ∈ R2×2 . Cuando estudiamos rango de matrices cuadradas, vimos que una matriz de n × n es inversible
sí, y solo sí, su rango es n. Por lo tanto, A será inversible si tiene rango 2. Veamos, entonces, cuándo tiene A rango
2. Supongamos primero que a 6= 0. Entonces:
a b F2 →F2 − ac F1 a b
−−−−−−−−→
c d 0 d − ac b
Para que rg(A) = 2 no tiene que anularse la segunda fila. Es decir, rg(A) = 2 sí, y solo sí, d− ac b 6= 0. Notemos que
d − ac b = ad−bc
a ; y un cociente es 0 si el numerador es cero. Concluimos que rg(A) = 2 sí, y solo sí, ad − bc 6= 0.
Hemos visto que una matriz (para la cual la entrada a11 es no nula) es inversible sí, y solo sí, ad − bc 6= 0.
Justamente, buscábamos un número que caracterice de esta forma la inversibilidad de matrices. Veremos en breve
que, precisamente, ab − bc es el determinante de una matriz de ac db ∈ R2×2 . ¿Qué sucede en caso que la entradad
1 − 1 sea 0? Pues hay dos opciones.
Si c 6= 0 entonces, para triangular, podemos primero intercambiar las filas y después proceder de idéntica
manera:
a b F1 lF2 c d F2 →F2 − ac F1 c d
−−−−→ −−−−−−−−→ .
c d a b 0 b − ac d
Observemos que la fórmula del determinante para matrices de 2×2 surge de hacer el mismo “movimiento elemental”
que hacíamos para calcular el producto vectorial de vectores en R3 . Lo transcribimos en la Figura 5.1 nuevamente
para rápida referencia.
156 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Estudien cómo se define el determinante de una matriz de dimensión 1 × 1 para que verifique que la matriz es
inversible, sí y solo sí, dicho número no es nulo.
En general, hay varias maneras de definir el determinante de una matriz. Por supuesto, todas ellas dan lugar al
mismo número (el determinante de una matriz es único). En este libro estudiaremos la que se llama desarrollo por
filas o columnas y consiste en reducir el problema de calcular el determinante de una matriz de n × n al de calcular
varios determinantes de matrices de (n − 1) × (n − 1). En el caso de una matriz A ∈ R3×3 , veremos que podemos
expresarlo como una combinación de determinantes de “submatrices” de A de tamaño 2 × 2 (para las cuales ya
sabemos calcularlo). ¿Cómo es este procedimiento? Lo mostramos en un ejemplo para la matriz:
2 −3 5
A= 1
3 0
−2 7 −1
Lo que primero tenemos que saber es que a cada entrada de la matriz le corresponde un “signo”, + o −,
dependiendo de su ubicación. Esto es lo que debemos considerar mientras hacemos la cuenta del determinante. La
distribución de los signos en una matriz de 3 × 3 es la siguiente:
+ − +
− + −
+ − +
¿En qué consiste entonces la fórmula del determinante de una matriz de 3 × 3? Pues primero debemos elegir al azar
una fila o una columna de A. Supongamos que elegimos la fila F1 . Ahora, vamos a ir recorriendo las entradas de la
fila (en alguna dirección que elijamos); por ejemplo, de izquierda a derecha. Comenzamos: la primera entrada es
2. El signo asociado a esta entrada es +. Este signo indica que no debemos cambiarle el signo al número. Lo que
hacemos, a continuación, es “tachar” la fila y la columna en la que está ubicada nuestra entrada actual: en este caso,
como estamos en la posición a11 , debemos tachar la primera fila y la primera columna. Observemos que, al hacer
esto, queda naturalmente una matriz de 2 × 2 en la esquina inferior derecha. En nuestro ejemplo, se trata de 37 −1
0
.
Lo que hacemos, entonces, es multiplicar el número 2 de la entrada a11 (que en este caso no fue modificado por el
signo que le corresponde a la ubicación) por el determinante de esta submatriz menor 37 −10
:
3 0
Cálculo del determinante de A: 2
...
7 −1
Álgebra A. Determinantes. 157
Ahora pasamos a la segunda entrada de la fila F1 . En este caso, se trata de un −3. El signo que le corresponde a
esta ubicación es −. Esto nos dice que debemos cambiarle el signo a dicha entrada. Por lo cual, consideraremos el
número 3 para este paso. Ahora, nuevamente, tachamos la fila y la columna a la que pertenece la entrada. Es decir,
tachamos la fila 1 y la columna 2. Nuevamente, obtenemos una submatriz de A de tamaño 2 × 2: aquella que se
forma al quedarnos con las entradas de la matriz que no tachamos (en el mismo orden que aparecen). En nuestro
1 0
ejemplo, es la matriz −2 −1 . Entonces, multiplicamos el número 3 que teníamos en la entrada a12 (le habíamos
cambiado el signo por orden del − que le corresponde a dicha ubicación) por el determinante de esta matriz de
2 × 2, y sumamos este resultado a la cuenta que ya teníamos antes:
3 0 1 0
Cálculo del determinante de A: 2 + 3 ...
7 −1 −2 −1
El último que paso que falta es idéntico a los anteriores. Consideramos la entrada siguiente de la fila, la a13 , que es
el número 5 y no le alteramos el signo pues el que le corresponde a dicha ubicación es +. Tachamos la primera
1 3
fila y la tercera columna y nos queda la submatriz −2 7 . Multiplicamos 5 por el determinante de esta matriz y
por lo cual:
−3 −3
2 2
Cálculo del determinante de A: (−1) + 0 ...
−2
1 3 7
158 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
1 3
Finalmente, a la entrada 5 no hay que cambiarle el signo y la submatriz queda −2 7 . Concluimos entonces que:
2 −3 2 −3
1 3
det(A) = (−1)
+0
+5
= (−1)9 + 5,13 = 56.
−2 7 −2 7
1 3
| {z } | {z } | {z }
=9 =20 =13
Les proponemos hacer otros ejemplos (eligiendo otras filas o columnas) para ver que siempre se obtiene el mismo
número. En general, hay elecciones de filas o columnas que hacen las cuentas más sencillas. En efecto, notemos en
este último desarrollo que hicimos (por la última columna) que, cuando estábamos en la posición a23 , tuvimos que
2 −3
hacer 0 −2 7
= 0. Es decir, como la entrada a23 es nula entonces el término correspondiente que le corresponde
Concluimos, entonces, que, nos conviene siempre desarrollar un determinante por una fila o columna que tenga
muchas entradas nulas. En el ejemplo anterior, también podríamos haber desarrollado por la segunda fila (que
tiene un 0 en la posición a23 ). Como una observación fundamental de este hecho, observemos que es muy sencillo
(casi inmediato) calcular el determinante de las matrices triangulares. Les proponemos descubrirlo en el siguiente
experimento.
¿Por qué fila o columna conviene desarrollar el determinante? ¿Cuál es el resultado que obtienen? ¿Qué pueden
concluir del determinante de las matrices de esta forma?
Vamos ahora a generalizar lo hecho para el caso 3 × 3. El procedimiento es exactamente el mismo: elegimos una
fila (o columna), la recorremos en cualquier dirección y vamos multiplicando cada entrada de esa fila (o columna),
modificada por el signo que le corresponde dada su ubicación, por el determinante de la matriz de un tamaño más
pequeño que obtenemos al tachar la fila y columna a la que pertenece la entrada en cuestión. La asignación del signo
en el caso general es la siguiente:
+ − + ··· ±
− + − · · · ∓
+ − + · · · ±
.. .. .. ..
. . . .
± ∓ ± ··· ±
Aquí, el símbolo ± indica que irá un + o un −: será un + si el signo anterior en la fila es un − y será un − si el
signo anterior es un + (lo mismo se puede decir del signo siguiente de la columna; por este motivo, el signo de la
posición a2n aparece como ∓, en lugar de ±, para remarcar que es el signo opuesto). Observemos que, en cada fila
Álgebra A. Determinantes. 159
o columna, los signos van alternándose. ¿Cómo recordar esta distribución? El lugar a11 siempre tiene un +, a partir
de ahí ya sea que nos movamos sobre la fila o sobre la columna los signos se alternan.
Otra manera de saber qué signo va en cada lugar es la siguiente regla: el signo que va en la posición aij es “+” si
i + j es un número par y es “−” si i + j es un número impar. Por ejemplo, a la posición a32 le corresponde un “−”
pues 3 + 2 = 5 es impar. La posición a13 le corresponde un “+” pues 1 + 3 = 4 es par. Tengamos en cuenta que a
las entradas de la diagonal siempre le corresponden el signo +.
Antes de mostrar la fórmula general del determinante, hagamos un ejemplo para una matriz de tamaño 4 × 4.
Supongamos que queremos calcular el determinante de la siguiente matriz:
2 2 1 −2
−3
0 4 1
A=
−1
1 1 5
0 −2 1 3
Al igual que el caso de matrices de 3 × 3, nos conviene desarrollar por una fila o columna que tenga la mayor
cantidad de entradas nulas. Por ejemplo, podemos elegir la segunda fila. Entonces:
−2 −2
2 1 2 2 2 2 1
det(A) = 3 −1 − 4 + 1 1 −1 .
1 5 1 1 5 1
−2 −2 −2
1 3 0 3 0 1
↑ ↑
cambio cambio
de signo de signo
2 1 −2
1 −1
= 2 −1
5 1 5
1 3 − −2 3 − 2 −2 1
1 −1 5 = 2(−8) − 13 − 2(−1) = −27
−2 1 3
2 −2
2 1 5 2 −2
3 − −2 3
1 1 5 = 2 −2 = 2,13 − 2 = 24
0 −2 3
2 2 1
1 −1 2 1
= 2 −2 1 − −2 1 = 2(−1) − 4 = −6
1 −1
1
0 −2 1
En el primer determinante desarrollamos por la primera fila y, en los últimos dos, por la primera columna (que
poseía un cero en la posición 3 − 1). Por lo tanto, hemos hallado que:
Hasta aquí vimos que, cuanto más grande la matriz, más difícil es calcular su determinante. Por ejemplo, en una
matriz de 5 × 5, el procedimiento descompone el determinante en suma de múltiplos de varios determinantes de
4 × 4, y tendremos que calcular estos determinantes de 4 × 4 descomponiendo cada uno en suma de múltiplos
de determinantes de 3 × 3 (que a su vez se descomponen en suma de múltiplos de determinantes de 2 × 2). Más
adelante, estudiaremos algunas propiedades del determinante que nos permitirán simplificar el cálculo del mismo
sin tener que hacer todas estas cuentas.
¿Cómo se define, en general, el determinante de una matriz de n × n? Supogamos, que tenemos A ∈ Rn×n y
llamemos Aij a la submatriz de A de tamaño (n − 1) × (n − 1) que se obtiene al sacar la fila i y la columna j de A
160 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Aquí, los aij son las entradas de la matriz A. Entonces, eligiendo la fila 1 para desarrollar, el determinante de A es
el número:
det(A) = a11 det(A11 ) − a12 det(A12 ) + a13 det(A13 ) + · · · ± a1n det(A1n )
El símbolo ± al final dice que el signo + o − será determinado por el tamaño de la matriz: si n es impar, entonces,
será un + y si n es par será un −. Esto se debe simplemente a que estamos modificando cada entrada de la primera
fila teniendo en cuenta el signo que le corresponde por su ubicación. Una manera más formal de decirlo es que la
entrada aij aparece multiplicada por (−1)i+j . Por supuesto, podemos desarrollar por cualquier fila o columna y
obtendremos el mismo resultado. En general, si desarrollamos por la fila k entonces el determinante es la suma de
los términos (−1)k+j akj Akj para todos los j entre 1 y n. Es decir:
det(A) = (−1)k+1 ak1 det(A11 ) + (−1)k+2 ak2 det(A12 ) + · · · + (−1)k+n akn det(Akn )
Observación 22 Notemos que el determinante de la matriz identidad (de cualquier tamaño) es 1. También,
al igual que el resultado del Experimento 29, el determinante de una matriz triangular es el producto de las
entradas de la diagonal.
Vamos a estudiar algunas propiedades del determinante. Esto nos permitirá, en general, simplificar el cálculo de
este número y, a veces, evitarlo completamente. Queremos estudiar ¿cómo cambia el determinante luego de una
operación elemental de fila?
Vimos que el rango de una matriz no se altera al hacer una operación elemental de fila (o columna). En el caso del
determinante, sí se altera y es posible decir exactamente de qué manera.
Intercambio de filas: Si B es la matriz que se obtiene de A al intercambiar las posición de dos filas, entonces,
det(B) = − det(A). Es decir:
a11 ... a1n a11 ... a1n
.. .. .. ..
. .
. .
ai1 ... ain
aj1 ... ajn
.. ..
= − .. ..
. . . .
aj1 ... ajn
ai1 ... ain
.. .. .. ..
. .
. .
an1 ... ann an1 ... ann
Álgebra A. Determinantes. 161
Multiplicación de fila por un real no nulo: Si B es la matriz que se obtiene de A al multiplicar una fila por un
λ 6= 0, entonces, det(B) = λ det(A). Es decir:
a ... a1n a ... a1n
11 11
. .. . ..
. .
. . . .
= λ ai1
λai1 ... λain ... ain
. .. . ..
.. ..
.
.
an1 ... ann an1 ... ann
Suma a una fila un múltiplo de otra: Si B es la matriz que se obtiene de A al sumar a una fila un múltiplo de
otra, entonces det(B) = det(A); vale decir, en este caso el determinante no cambia:
a11 ... a1n a
11 ... a1n
.. .. .
. ..
. . . .
= ai1
ai1 + λaj1 ... ain + λajn ... ain
.. .. .
.. ..
. . .
an1 ... ann an1 ... ann
Las mismas propiedades valen si intercambiamos la palabra “fila” por “columna” en los items anteriores.
Calculen el determinante de la matriz λA para λ ∈ R, teniendo en cuenta que todas las entradas de la matriz
λA están multiplicadas por λ..
Estas operaciones pueden utilizarse para simplificar el cálculo del determinante. Por ejemplo, consideren la matriz:
14 21 42
A = 32 52 90 ∈ R3×3
18 15 38
Esta matriz tiene números muy grandes y va a ser incómodo hacer cuentas con estos números. Observemos que las
entradas de la primera fila son todos múltiplos de 7. Por lo tanto, podemos utilizar la segunda propiedad enunciada
arriba para escribir:
14 21 42 7,2 7,3 7,6 2 3 6
90 = 32 90 = 7 32
32 52 52 52 90
18 15 38 18 15 38 18 15 38
Ahora, como restar a una fila un múltiplo de otra no altera el determinante, entonces podemos hacer las operaciones
F2 → F2 − 16F1 y F3 → F3 − 9F1 y obtener:
14 21 42 2 3 6
32 52 90 = 7 0 −6
4
−12 −16
18 15 38 0
Este último determinante es más sencillo de calcular; podemos desarrollar por la primera columna y obtener:
2 3 6
−6
4
0 4 −6
= 2 = 2(−64 − 72) = −272
−12 −16
0 −12 −16
162 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Por lo tanto,
14 21 42
90 = 7(−272) = −1904
32 52
18 15 38
Tengamos en cuenta que, en el ejemplo recién visto, apuntamos a conseguir ceros en la primera columna para
poder desarrollar por allí y ahorrarnos cuentas (al solo tener que calcular un determinante de 2 × 2). Una posible
estrategia para calcular el determinante de una matriz puede ser la siguiente: triangular la matriz (utilizando las
operaciones elementales de filas) llevando la cuenta de cómo va cambiando el determinante según la operación
que utilicemos. Como el determinante de una matriz triangular es, simplemente, el producto de las entradas en la
diagonal, solo debemos multiplicar este último determinante por los factores que fueron alterando el determinante
original mientras hacíamos las operaciones de filas. Por ejemplo, en el ejemplo anterior habíamos visto que:
14 21 42 2 3 6
32 52 90 = 7 0 −6
4
0 −12 −16
18 15 38
Por ejemplo, a la última matriz que obtuvimos del ejemplo anterior, podemos hacerle F3 → F3 + 3F2 y obtener el
determinante de una matriz triangular (nuevamente, esta operación no cambia el determinante que teníamos):
14 21 42 2 3 6
32 52 90 = 7 0 4 −6 = 7,2,4.(−34) = −1904
0 0 −34
18 15 38
Ejemplifiquemos cómo fueron los pasos que hicimos para tener presente cómo y cuándo fue cambiando el de-
terminante original. Notaremos con Ai a las matrices que vamos obteniendo en cada paso de la triangulación.
1
Observemos que “sacar el factor 7” de la primera fila de la matriz original equivale a multiplicar por 7 la primer fila
de dicha matriz:
1
7 F1 F →F −16F F →F +3F
A −− −→ A1 −−2−−−2−−−−→
1
A2 −−3−−−3−−−→
2
A3
F3 →F3 −9F1
Como A3 está triangulada, entonces su determinante es el producto de sus entradas en la diagonal. ¿Cómo se
relacionan el determinante que buscamos (el de A) con el de A3 ? Analizamos los pasos que hicimos para triangular
A. El primer paso consistió en multiplicar F1 por 17 . Esto quiere decir, precisamente, que la primera fila de A es
7 veces la primera fila de A1 . Por lo tanto, det(A) = 7 det(A1 ), según nos dice la propiedad del determinante
respecto de esta operación elemental. Por otro lado, a partir de A1 , las operaciones siguientes que hicimos no alteran
el determinante. Por lo tanto, det(A1 ) = det(A2 ) = det(A3 ). Concluimos que det(A) = 7 det(A1 ) = 7 det(A3 ).
Como el determinante de A3 es 2,4.(−34) = −272, entonces, det(A) = −1904.
Hagamos un ejemplo más de cómo calcular el determinante triangulando la matriz. Consideremos la matriz:
5 −5 2
A = 3 −2 −15 ∈ R3×3
1 3 6
La triangulamos:
5 −5 2 1 3 6 1 3 6
F lF
1 3 F2 →F2 −3F1
−2 −15 −−−−→ 3 −2 −15 −−−−−−−−→ 0 −11 −33 −→
3
F3 →F3 −5F1
1 3 6 5 −5 2 0 −20 −28
| {z } | {z } | {z }
A A1 A2
Álgebra A. Determinantes. 163
1 36 1 3 6
1
− 11 F2
F3 →F3 −5F2
−−− −→ 0 1 3 −−−−−−−−→ 0
1 3
− 14 F3
0 5 7 0 0 −8
| {z } | {z }
A3 A4
Hemos llegado, entonces, a una matriz triangulada y es sencillo ver que su determinante es −8. Analicemos cómo
fue cambiando el determinante durante las operaciones de la triangulación. Veremos que es conveniente empezar
desde atrás.
Como la operación A3 → A4 no altera el determinante, entonces, det(A4 ) = det(A3 ).
Como A2 se obtiene de A3 al multiplicar la fila F2 por −11 y la fila F3 por −4, entonces, det(A2 ) =
(−11)(−4) det(A3 ).
Como las operaciones en A1 → A2 no alteran el determinante, entonces, det(A2 ) = det(A1 ).
Como en A → A1 intercambiamos filas, entonces, det(A) = − det(A1 ).
“Desandando” toda esta información de abajo hacia arriba, obtenemos:
1. ¿Cuál es el determinante de una matriz que tiene una fila (o columna) de ceros?
2. ¿Cúal es el determinante de una matriz que tiene dos filas (o dos columnas) iguales?
3. ¿Cuál es el determinante de una matriz de n × n que tiene rango menor a n?
Desde un comienzo precisamos que la propiedad que más nos importa del determinante es que el mismo establece
cuándo una matriz es inversible. Lo dejamos anunciado:
Esto ya lo trabajamos para matrices de 2 × 2. Una manera de convencerse que también es válido para matrices
de cualquier tamaño es la siguiente: en el apartado anterior vimos que, si triangulamos una matriz, entonces el
determinante de la matriz triangulada es modificado por algunos cambios de signo y por productos por números
reales no nulos. Observemos que estas modificaciones no afectan si el determinante es o no 0; es decir, si el
determinante de la matriz original es no nulo, entonces el de la matriz triangulada también; y viceversa. Sabemos
que el determinante de una matriz triangular es el producto de las entradas de la diagonal y, cuando estudiamos
rango, vimos que una matriz es inversible sí, y solo sí, cuando la triangulamos, no le quedan entradas nulas en la
diagonal. Por lo tanto, ¡una matriz es inversible sí, y solo sí, su determinante es no nulo!
4+kk 7
Ejemplo 56 ¿Para que valores de k ∈ R es inversible 3 k 6 ∈ R3×3 ? La matriz es inversible sí, y solo sí, su
3−k 0 k
164 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Este determinante se anula para k = 0, k = 1 y k = −3. Esto quiere decir que la matriz es inversible para todo k
distinto de esos valores.
La última propiedad que vamos a estudiar del determinante es cómo se comporta respecto de la multiplicación de
matrices.
Es decir, “el determinante del producto de dos matrices es el producto de los determinantes de dichas matrices”.
Esto tiene muchas consecuencias que les dejamos para que averigüen en el siguiente experimento.
Experimento 31 Sea A ∈ Rn×n . Usando la Proposición 24, respondan las siguientes preguntas.
Ya sabemos que un sistema de ecuaciones lineales con igual cantidad de ecuaciones que de incógnitas es compatible
determinado sí, y solo sí, su matriz asociada es inversible. Podemos entonces concluir que un sistema de ecuaciones
lineales con igual cantidad de ecuaciones que de incógnitas es compatible determinado sí, y solo sí, su matriz
asociada tiene determinante no nulo. Por lo tanto, para clasificar un sistema, el determinante nos indica de manera
directa si es o no compatible determinado. En caso que el determinante sea nulo, tendremos que estudiarlo de otra
manera para determinar si se trata de un sistema compatible indeterminado o un sistema incompatible.
El determinante es espacialemente útil a la hora de resolver sistemas de ecuaciones lineales con parámetros. En
efecto, consideremos nuevamente el sistema de la página 135:
x + kx2 + x3 = 0
1
2x1 + x3 = 0
2x + kx + kx
1 2 3 = 0
En lugar de triangular este sistema y analizar para qué valor de k se anula alguna entrada de la diagonal, podemos
directamente calcular el determinante (por la segunda columna, por ejemplo):
1 k 1
det 2 0 1 = −k(2k − 2) − k(1 − 2) = −k(2k − 2 − 1) = −k(2k − 3).
2 k k
El número −k(2k − 3) se anula para los valores k = 0 y k = − 32 . Por lo tanto, para los valores de k distintos de 0
y − 32 , el sistema es compatible determinado. Observemos qué sencillo fue hallar estos valores de k, sin necesidad
Álgebra A. Determinantes. 165
de triangular la matriz con el k como entrada. Por supuesto, debemos aún analizar los casos k = 0 y k = − 32 por
separado para determinar si en esos casos el sistema es incompatible o compatible indeterminado.
Hagamos un último ejemplo. Clasifiquemos nuevamente el sistema con dos parámetros de la página 138 utilizando
determinantes:
(a + 1)x + y + z = 1
x + (a + 1)y + z = b
= b2
x + y + (a + 1)z
Ya sabemos que, para que el sistema sea compatible determinado, depende solo de la matriz (no ampliada) asociada
al sistema. Por lo tanto, calculamos el determinante (desarrollando por la primera fila):
a+1 1 1
det = (a + 1)((a + 1)2 − 1) − ((a + 1) − 1) + (1 − (a + 1))
1 a+1 1
1 1 a+1
= (a + 1)(a2 + 2a) − 2a = a(a + 1)(a + 2) − 2a
Caso k = 0 Caso k = −3
1 1 1 1 −2 1 1 1
−2
1 1 1 b 1 1 b
1 1 1 b2 1 1 −2 b2
En el primer caso, las tres ecuaciones asociadas a la matriz son la misma ecuación. Por lo tanto, para que el sistema
no sea incompatible, lo que está del otro lado de la igualdad (los coeficientes independientes) deben ser iguales. Es
decir, para que el sistema sea compatible indeterminado debe suceder 1 = b = b2 , cuya única solución es b = 1.
Para b 6= 1, el sistema es incompatible. En el segundo caso, ya no es tan inmediato darse cuenta quien tiene que ser
b para que el sistema no sea incompatible. Debemos triangular:
−2 1 1 1 1 1 −2 b2
F lF
1 3
1 −2 1 b −−−−→ 1 −2 1 b −→
1 1 −2 b2 −2 1 1 1
1 1 −2 b2 1 1 −2 b2
F →F2 −F1 F3 →F3 +F2
−−2−−−− −−→ 0 −3 3 b − b2 −−−−−−−→ 0 −3 3 b − b2
F3 →F3 +2F1
0 3 −3 1 + 2b2 0 0 0 b2 + b + 1
Por lo tanto, el sistema será compatible indeterminado sí, y solo sí, b2 + b + 1 = 0. Pero como este número siempre
es mayor a cero (cualquiera sea el b ∈ R), entonces el sistema es incompatible siempre. De esta manera, arribamos
a las mismas conclusiones que en nuestra resolución original (de la página 139), solo que haciendo menos cuentas.
166 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Las transformaciones lineales son un tipo de funciones entre espacios vectoriales, que preservan su geometría
lineal. Las mismas sirven para modelar una gran variedad de operaciones geométricas, tales como rotaciones,
simetrías, proyecciones, etc. En este capítulo estudiaremos su definición, propiedades y aplicaciones.
La idea fundamental de una transformación lineal es que envía un espacio lineal a otro espacio lineal, respetando
las operaciones (de suma y producto por escalar) definidas en estos espacios. Por ejemplo, envía una recta L a
otra recta L0 , pero lo hace de forma tal que, entre otras cosas, si el punto P ∈ L es enviado al punto P 0 ∈ L0 y, el
punto Q ∈ L, a Q0 ∈ L0 , entonces el punto medio entre P y Q es enviado al punto medio entre P 0 y Q0 . ¿Qué
característica de una función nos garantiza tener esta propiedad? Sabemos que el punto medio entre P y Q se
P +Q
calcula 2 . Tengamos en cuenta que, si solicitamos que la función en cuestión envíe “sumas en sumas” (en el
sentido que a un punto P + Q lo envíe a P 0 + Q0 ) y que, además, envíe “múltiplos en múltiplos” (en el sentido que
a un múltiplo λP lo envíe a λP 0 ), entonces tendremos garantizado que el punto medio entre P y Q también sea
168 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
P +Q
enviado al punto medio entre P 0 y Q0 . En efecto, 2 = 12 (P + Q), por lo cual es enviado al múltiplo de 1
2 del
0 0
destino de P + Q, que es precisamente P + Q . Estas propiedades de respetar la suma y el producto por escalar
son, entonces, las propiedades características de las transformaciones lineales.
Definición 55 Una función T : Rn → Rm es una transformación lineal si cumple las siguientes dos condiciones:
1. T (λ~v ) = λT (~v ) para todo λ ∈ R y para todo ~v ∈ Rn .
2. T (~v + w)
~ = T (~v ) + T (w) ~ ∈ Rn .
~ para todo ~v , w
Observación 25 Las dos propiedades definitorias de las transformaciones lineales (contenidas en la definición
anterior) pueden expresarse informalmente diciendo que “sacan escalares afuera” y “abren sumas”.
Como una transformación lineal es una función entre un espacio Rn y un espacio Rm , entonces, a cada punto
(x1 , . . . , xn ) ∈ Rn , le asigna un punto (y1 , . . . , ym ) ∈ Rm . Si llamamos T a la transformación lineal, entonces
T (x1 , . . . , xn ) respresenta al punto (y1 , . . . , ym ) (al igual que f (x) suele representar la imagen del punto x por
la función real f ). Al igual que las funciones de valores reales, el espacio de salida Rn se lo llama el dominio
de la transformación lineal y al espacio de llegada Rm , el codominio. Como (y1 , . . . , ym ) depende de quién es
(x1 , . . . , xn ), entonces cada coordenada de (y1 , . . . , ym ) depende de las coordenadas x1 , . . . , xn . Veremos en breve
que esta dependencia es por medio de una relación lineal. Por ejemplo, la función T : R2 → R3 , definida por
T (x1 , x2 ) = (x1 + x2 , 5x2 , 3x1 − 2x2 ), es una transformación lineal entre R2 y R3 . El punto (1, 2) ∈ R2 es
enviado al punto:
T (|{z} 2 ) = (1 + 2 , 5,2 , 3,1 − 2,2) = (3, 10, −1) ∈ R3
1 , |{z}
| {z } |{z} | {z }
x1 x2 x1 +x2 5x2 3x1 −2x2
Ejemplo 57
Si T : R3 → R2 está definida por T (x1 , x2 , x3 ) = (2x1 +x2 −x3 , x1 −4x3 ), entonces T es una transformación
lineal. Veamos que cumple las dos condiciones de la definición. Para saber que saca escalares afuera, veamos
cuánto es T (λ(x1 , x2 , x3 )) para cualquier λ ∈ R:
Nuestro objetivo es ver que esta última expresión es igual a λT (x1 , x2 , x3 ). Para ello, saquemos λ de factor
común:
T (λ(x1 , x2 , x3 )) = (2λx1 + λx2 − λx3 , λx1 − 4λx3 )
= λ(2x1 + x2 − x3 ), λ(x1 − 4x3 )
= λ(2x1 + x2 − x3 , x1 − 4x3 )
= λT (x1 , x2 , x3 )
Esto prueba que T cumple la primera condición para ser transformación lineal. Veamos ahora que T también
abre sumas:
Debemos comprobar que esta última expresión es igual a T (x1 , x2 , x3 ) + T (y1 , y2 , y3 ). Para ello, agrupemos,
Álgebra A. La transformación lineal. 169
por un lado, las coordenadas con x1 , x2 o x3 y, por el otro, las que tienen y1 , y2 o y3 . Entonces:
Los siguientes son ejemplos de funciones, estudiadas en la escuela secundaria, que siempre son transformaciones
lineales:
Ejemplo 58
Experimento 32 Muestren que una transformación lineal T : Rn → Rm cumple las siguientes propiedades:
T (~0) = ~0;
T (−~v ) = −T (~v ) para todo ~v ∈ Rn ;
T (~v − w)
~ = T (~v ) − T (w) ~ ∈ Rn ;
~ para todo ~v , w
T (α1~v1 + α2~v2 + · · · + αr v~r ) = α1 T (~v1 ) + α2 T (~v2 ) + · · · + αr T (v~r ) para todo α1 , α2 , · · · , αr ∈ R
y ~v1 , ~v2 , · · · , v~r ∈ Rn .
Observación 26 La última propiedad del experimento anterior dice que las transformaciones lineales mandan
una combinación lineal de los v1 , . . . , vr en la misma combinación lineal en los T (v1 ), . . . , T (vr ) (en el sentido
que los coeficientes son los mismos).
Analicemos la tranformación lineal T : R3 → R2 del primer ejemplo del apartado anterior con más detalle.
Recordemos la fórmula: T (x1 , x2 , x3 ) = (2x1 + x2 − x3 , x1 − 4x3 ). Esta es la forma funcional de la transformación
lineal (está escrita en forma de función). Recordemos que la base canónica de Rn es la base de este espacio compuesta
por los vectores {(1, 0, 0, . . . , 0, 1), (0, 1, 0, . . . , 0, 1), . . . , (0, 0, 0, . . . , 0, 1)}. En particular, la base canónica de R3
es {(1, 0, 0), (0, 1, 0), (0, 0, 1)}. Veamos qué hace T con los vectores de esta base.
¿Qué pasó al final? ¡Volvimos a la fórmula original! Es que, al saber lo que hace una transfomación lineal en una
base del dominio, se puede deducir lo que hace con un vector cualquiera. Volveremos sobre esta idea en el siguiente
apartado. Por otra parte, observemos que la última expresión se puede reescribir en forma matricial de la siguiente
manera:
x1
2 1 −1
(2x1 + x2 − x3 , x1 − 4x3 ) = ·
x2 .
1 0 −4
x3
2 1 −1
La matriz A = 1 0 −4 es la matriz asociada a la transfomación lineal T . En sus columnas tiene, en orden, las
imágenes de los vectores de la base canónica. Notemos que, como T va de R3 a R2 , entonces A ∈ R2×3 .
Definición 56 Dada una transformación lineal T : Rn → Rm , existe una única matriz A ∈ Rm×n tal que T
Si ahora consideramos una matriz A ∈ Rm×n y definimos una función T : Rn → Rm por medio de la fórmula:
x1
..
T (x1 , . . . , xn ) = A · .
xn
, entonces es fácil ver que T resulta una transformación lineal. Por lo tanto, a cada transformación lineal le
corresponde una matriz (su matriz asociada canónica) y a cada matriz le corresponde una transformación lineal (la
determinada por la multiplicación de un vector por la matriz). Por lo tanto, la forma funcional y la forma matricial
son maneras equivalentes de representar una misma transformación lineal.
Ejemplos 59
1 1
La matriz asociada a la transformación lineal T (x1 , x2 ) = (x1 + x2 , 5x2 , 3x1 − 2x2 ) es: 0 5 . Por lo tanto,
3 −2
Álgebra A. La transformación lineal. 171
Observación 27 Observemos que, cuando la transformación lineal es dentro del mismo espacio Rn , entonces
la matriz asociada es cuadrada.
Tal como establecimos en el apartado anterior, una transformación lineal queda completamente determinada por los
valores que toma en una base de su dominio. Veamos un ejemplo. Hallemos, si es posible, una transformación lineal
T que vaya de R2 a R3 tal que T (1, 0) = (1, 0, 1) y T (0, 1) = (1, 2, 3). Luego, buscamos la expresión funcional de
T . Dado (x1 , x2 ) ∈ R2 cualquiera, se puede escribir:
Como estamos buscando una transformación lineal, entonces debemos requerir que T abra sumas y saque escalares
afuera. Por lo tanto, si abrimos primero la suma y, luego, sacamos los escalares x1 , x2 afuera, obtenemos lo siguiente:
T (x1 , x2 ) = x1 (1, 0, 1) + x2 (1, 2, 3) = (x1 , 0, x1 ) + (x2 , 2x2 , 3x2 ) = (x1 + x2 , 2x2 , x1 + 3x2 )
Esta es la forma funcional de una transformación lineal. Observemos que T quedó unívocamente determinada por
los valores T (1, 0) y T (0, 1): la transformación lineal tiene que ser necesariamente T (x1 , x2 ) = (x1 + x2 , 2x2 , x1 +
3x2 ). Esto tiene que ver con que tenemos el dato de cuanto vale T en los vectores de una base. ¿Qué hubiera
sucedido si nos hubieran dado los valores de T en una base que no es canónica? Miren el siguiente ejemplo.
Ejemplo 60 Hallemos, si es posible, una transformación lineal T : R2 → R3 tal que T (1, 1) = (1, 0, 1) y
T (−1, 1) = (1, 2, 3). En este caso, nos dan como dato los valores de la transformación lineal en la base {(1, 1), (1, −1)},
que no es la base canónica. Pero esto no representa inconveniente alguno, ya que podemos realizar el mismo razonamiento
que acabamos de hacer más arriba. Dado (x1 , x2 ) ∈ R2 cualquiera, como {(1, 1), (1, −1)} es base de R2 , se puede
escribir:
(x1 , x2 ) = α1 (1, 1) + α2 (1, −1)
En este caso, hay que trabajar un tanto más pues debemos hallar α1 y α2 . Si desarrollamos la expresión anterior, queda:
Si igualamos coordenada a coordenada, obtenemos un sistema de dos ecuaciones y dos incógnitas del que queremos
172 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
despejar α2 y α2 :
α1 + α2 = x1
α1 − α2 = x2
x1 + x2 x1 − x2
Observamos que α1 = y α2 = . Entonces, podemos escribir:
2 2
x1 + x2 x1 − x2
(x1 , x2 ) = (1, 1) + (1, −1).
2 2
x1 +x2 x1 −x2
T (x1 , x2 ) = 2
T (1, 1) + 2
T (1, −1) =
x1 +x2 x1 −x2
= 2
(1, 0, 1) + 2
(1, 2, 3) =
x1 −x2
x1 +x2
, 0, x1 +x , 2 x1 −x , 3 x1 −x
2
2 2
= 2 2
+ 2 2 2
=
1 1 1 1
x2 , 12 x1 1
+ 23 x1 − 32 x2 =
= x
2 1
+ x
2 2
+ x
2 1
− x , x1
2 2
− + x
2 2
= (x1 , x1 − x2 , 2x1 − x2 )
El razonamiento que hicimos en el ejemplo anterior se puede realizar en una transformación lineal T : Rn → Rm
general: si {~v1 , ~v2 , · · · , ~vn } es una base de Rn , entonces todo ~v ∈ Rn se escribe como combinación lineal de la
base:
~v = α1~v1 + α2~v2 + · · · + αn~vn .
Si aplicamos T a ambos miembros y usamos las propiedades definitorias de las transformaciones lineales, obtenemos:
Por lo tanto, para calcular T (~v ), para cualquier ~v ∈ Rn , solo necesitamos conocer T (v1 ), T (v2 ), . . ., T (vn ).
Teorema 28 Si {v1 , v2 , . . . , vn } es una base de Rn y w1 , w2 , . . . , wn son vectores (no necesariamente dis-
tintos) en Rm , entonces hay una única transformación lineal T : Rn → Rm tal que T (v1 ) = w1 , T (v2 ) =
w2 , . . . , T (vn ) = wn .
Tengamos en cuenta que, en el enunciado del teorema anterior, no hay restricciones sobre quienes pueden ser los
w1 , . . . , wn ∈ Rn . Pueden ser vectores cualesquiera. Por ejemplo, hallemos, si es posible, una transformación
lineal T tal que T (1, 0, 0) = (1, 1, 2), T (0, 1, 0) = (−1, 2, 3) y T (2, 2, 1) = (0, 1, 2). Este caso es análogo a la
construcción que realizamos en el ejemplo anterior, dado que {(1, 0, 0), (0, 1, 0), (2, 2, 1)} es una base de R3 . Si
(x1 , x2 , x3 ) ∈ R3 es un elemento cualquiera, entonces:
x1 − 2x3 x2 − 2x3
La única solución de este sistema es α1 = , α2 = y α3 = x3 . Por lo tanto,
2 2
x1 − 2x3 x2 − 2x3
(x1 , x2 , x3 ) = (1, 0, 0) + (0, 1, 0) + x3 (2, 2, 1).
2 2
Álgebra A. La transformación lineal. 173
x1 −2x3
T (x1 , x2 , x3 ) = 2 T (1, 0, 0) + x2 −2x
2
3
T (0, 1, 0) + x3 T (2, 2, 1) =
x1 −2x3
= 2 (1, 1, 2) + x2 −2x
2
3
(−1, 2, 3) + x3 (0, 1, 2) =
x1 −x2 x1 +2x2 −4x3 2x1 +3x2 −6x3
= 2 , 2 , 2
una transformación lineal que verifique los datos pedidos, o bien existe, pero no es es única.
Ejemplos 61
Hallemos, si es posible, una transformación lineal T : R3 → R3 tal que T (1, 0, 0) = (1, 1, 2), T (0, 1, 0) =
(−1, 2, 3) y T (2, 2, 0) = (0, 1, 3). Notemos que {(1, 0, 0), (0, 1, 0), (2, 2, 0)} no es una base de R3 . En efecto,
Si existiera una transformación lineal que verifique los datos proporcionados debería, por las propiedades de las
transformaciones lineales, preservar esa relación:
Concluimos que no existe una transformación lineal verificando los datos proporcionados: las condiciones
impuestas son incompatibles.
Hallemos ahora, y si es posible, una transformación lineal T : R3 → R3 tal que: T (1, 0, 0) = (1, 1, 2),
T (0, 1, 0) = (−1, 2, 3) y T (2, 2, 0) = (0, 6, 10). Observemos que los datos para construir la transformación
lineal, en este caso, son idénticos a los del ejemplo anterior, salvo que, ahora, el vector (2, 2, 0) va a parar al
(0, 6, 10) (en lugar del (0, 1, 3)). Si revisamos el ejemplo anterior, vemos que ahora sí es compatible el valor que
toma (2, 2, 0) con los valores que asumen los otros dos vectores dato. ¿Qué sucede en este caso? El último dato
no nos aporta información ni restricciones sobre la transformación lineal T que estamos buscando. Como vimos
antes, podría determinar que no exista la transformación lineal (si fuese incompatible con las otras), pero si es
compatible, no nos dice nada. Entonces, ¿cómo definimos una T que satisfaga los datos requeridos? La forma
más fácil de definir una transformación lineal es decir qué valores toma en una base. Extendamos, entonces, el
conjunto {(1, 0, 0), (0, 1, 0)} (que son los vectores linealmente independientes de los cuales podemos utilizar los
datos proporcionados) a una base de R3 ; por ejemplo, a la base canónica {(1, 0, 0), (0, 1, 0), (0, 0, 1)}. Dado
que T (1, 0, 0) = (1, 1, 2) y T (0, 1, 0) = (−1, 2, 3), nos falta determinar T (0, 0, 1). Pero el valor de T (0, 0, 1)
lo podemos elegir sin restricciones. Esto indica que existen infinitas posibles transformaciones lineales que
verifiquen lo pedido: las condiciones impuestas son compatibles pero no la determinan de manera única. Por
ejemplo, podemos decidir T (0, 0, 1) = (0, 0, 0). En ese caso, nos quedaría la transformación lineal:
.
174 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Aprendimos la idea detrás de la noción de transformación lineal: una función que preserva la estructura de los espacios
lineales.
Trabajamos la definición formal de transformación lineal: “abre sumas” y “saca escalares afuera”.
Conocimos las propiedades básicas de las transformaciones lineales.
Desarrollamos la forma funcional y la forma matricial de una transformación lineal.
Vimos cómo construir transformaciones lineales.
Muchas propiedades de una transformación lineal se pueden estudiar a partir de su comportamiento respecto de
ciertos subespacios del dominio o del codominio.
6.2.1 Imagen
Im(T ) = T (Rn ) = {w
~ ∈ Rm : w
~ = T (~v ) para algún ~v ∈ Rn }
La imagen de una transformación lineal es, entonces, el conjunto de todos los valores que puede tomar T .
El experimento anterior nos dice que una transformación lineal manda subespacios en subespacios. En particular,
dado que Rn es un subespacio de sí mismo, entonces Im(T ) = T (Rn ) es un subespacio de Rm .
¿Cómo hallar la imagen de una transformación lineal? Consideremos la transformación lineal T : R3 → R3
definida por T (x1 , x2 , x3 ) = (x1 + x2 , x2 − x3 , 2x1 − 3x2 + x3 ). Por definición, un elemento (y1 , y2 , y3 ) ∈ R3
pertenece a Im(T ) si, y sólo si, se puede escribir como (y1 , y2 , y3 ) = T (x1 , x2 , x3 ) para algún (x1 , x2 , x3 ) ∈ R3 .
Como T (x1 , x2 , x3 ) = (x1 + x2 , x2 − x3 , 2x1 − 3x2 + x3 ), entonces buscamos los (y1 , y2 , y3 ) ∈ R3 tales que:
Pero:
(x1 + x2 , x2 − x3 , 2x1 − 3x2 + x3 ) = (x1 , 0, 2x1 ) + (x2 , x2 , −3x2 ) + (0, −x3 , x3 )
= x1 (1, 0, −2) + x2 (1, 1, −3) + x3 (0, −1, 1)
Entonces, concluimos que (y1 , y2 , y3 ) = x1 (1, 0, −2) + x2 (1, 1, −3) + x3 (0, −1, 1); es decir, (y1 , y2 , y3 ) =
h(1, 0, −2), (1, 1, −3), (0, −1, 1)i = h(1, 0, −2), (1, 1, −3)i, pues (1, 0, −2) − (1, 1, −3) = (0, −1, 1). Por lo
tanto, hemos hallado que Im(T ) = h(1, 0, −2), (1, 1, −3)i.
Podemos dar otra manera de calcular Im(T ). Consideremos la definición de imagen siguiente:
Sabemos que {(1, 0, 0), (0, 1, 0), (0, 0, 1)} es una base de R3 , y todo vector (x1 , x2 , x3 ) ∈ R3 se escribe como
combinación lineal de esta base de la siguiente manera:
es decir, ¡los vectores de la imagen son las combinaciones lineales de {T (1, 0, 0), T (0, 1, 0), T (0, 0, 1)}! Por lo
tanto:
Img(T ) = T (Rn ) = hT (1, 0, 0), T (0, 1, 0), T (0, 0, 1)i
= h(1, 0, −2), (1, 1, −3), (0, −1, 1)i
= h(1, 0, −2), (1, 1, −3)i
Este último procedimiento para calcular la imagen de una transformación lineal se puede realizar en forma general,
a partir de la definición del siguiente teorema:
Teorema 29 Sea T : Rn → Rm , una transfomación lineal. Si B = {~
v1 , ~v2 , . . . , ~vn } es una base de Rn , entonces
{T (~v1 ), T (~v2 ), . . . , T (~vn )} es un sistema de generadores de Im(T ).
Importante Si B = {~
v1 , ~v2 , · · · , ~vn } es una base, entonces {T (~v1 ), T (~v2 ), · · · , T (~vn )} no necesariamente es
una base de Im(T ); los vectores T (~v1 ), . . . , T (~vn ) podrían resultar linealmente dependientes.
Ejemplo 62 Sean S y W dos subespacios de R3 definidos por S = h(1, 2, −1), (0, 1, 3)i y W = {(x1 , x2 , x3 , x4 ) ∈
V = {(x1 , x2 , x3 , x4 ) ∈ R4 : x1 + x2 = 0, x3 − 2x4 = 0}
= {(x1 , x2 , x3 , x4 ) ∈ R4 : x1 = −x2 , x3 = 2x4 }
= {(−x2 , x2 , 2.x4 , x4 ) ∈ R3 : x2 , x4 ∈ R}
= {x2 (−1, 1, 0, 0) + x4 (0, 0, 2, 1) : x2 , x4 ∈ R}
= h(−1, 1, 0, 0), (0, 0, 2, 1)i
Para definir una transformación lineal T : R3 → R4 , basta especificar los valores que toma en una base del
dominio (en este caso, R3 ). Como queremos asegurarnos que T (S) = W , debemos “manipular” conveniente-
176 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
mente las imágenes de los vectores de la base de S. Extendemos la base de S a una base de R3 ; por ejemplo,
B = {(1, 2, −1), (0, 1, 3), (0, 0, 1)} es una posible base de R3 . Ahora, definimos:
T (1, 2, −1) = (−1, −1, 0, 0)
T (0, 1, 3) = (0, 0, 2, 1),
lo cual nos garantiza que T (S) ⊂ W . ¿Qué sucede con T (0, 0, 1)? Dado que (0, 0, 1) ∈
/ S, no hay restricciones para
determinar T (0, 0, 1). Podemos elegir, por ejemplo, T (0, 0, 1) = (0, 0, 0, 1). Dado que:
T (S) = hT (1, 2, −1), T (0, 1, 3)i = h(−1, −1, 0, 0), (0, 0, 2, 1)i = W,
(x1 , x2 , x1 + x2 ). Verifiquen que la matriz canónica asociada a T tiene, en sus columnas, a las imágenes por T
de los vectores de a base canónica de R2 .
Observación 30 Notemos que, del experimento anterior, podemos concluir que Im(T ) está generada por los
6.2.2 Núcleo
T −1 (W ) = {~v ∈ Rn : T (~v ) ∈ W }.
En particular, nos interesará calcular el conjunto de vectores del dominio donde la transformación lineal se anula.
Este conjunto se denomina núcleo de T , y se puede pensar como el “conjunto de ceros” de la función T .
Definición 58 Si T : Rn → Rm es una transformación lineal, el núcleo de T es el conjunto:
Observemos que, del experimento anterior, dado que {0} es un subespacio de Rm , entonces N u(T ) = T −1 (0) es
siempre un subespacio de Rn .
Álgebra A. Imagen y núcleo. 177
Observemos que, para hallar N u(T ), tuvimos que resolver el sistema de ecuaciones:
x1 − x2 = 0
x2 − x3 = 0
que proviene de igualar a cero cada coordenada de la expresión de T . La expresión matricial de este sistema es:
x
1
1 −1 0
· x2
0 1 −1
x3
1 −1 0
¡Notemos que la matriz 0 1 −1 es la matriz AT asociada a T !
Si T : Rn → Rm es una transformación lineal, N u(T ) es un subespacio del dominio e Im(T ) es un subespacio del
codominio; es decir, estos subespacios “viven” en lugares distintos. Sin embargo, hay una relación muy fuerte entre
sus dimensiones:
Teorema 32 [Teorema de la dimensión] Para cualquier transformación lineal T : Rn → Rm , vale que:
Es decir, la suma de la dimensión del núcleo y la dimensión de la imagen coincide con la dimensión del dominio
de la transformación lineal.
Vamos a estudiar cómo se clasifican las transformaciones lineales según sean suryectivas, inyectivas o biyectivas.
Definición 59 Decimos que una transformación lineal T : Rn → Rm es:
Verificar la inyectividad en una función f : Rn → Rm cualquiera puede resultar bastante complicado, pues hay que
verificar que a cada vector de la imagen de f proviene de un único vector del dominio. En otras palabras, la función
~ ∈ Im(f ), f −1 (w)
f es inyectiva si, para cada w ~ tiene un único elemento.
Para las transformaciones lineales, verificar la inyectividad es más simple. Sabemos que toda transformación lineal
T tiene al vector nulo ~0 ∈ Rm en la imagen, y que T (~0) = ~0. Si T es monomorfismo, entonces ~0 ∈ Rn debe ser el
178 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
único vector del dominio que llegue a ~0. Es decir, T −1 (0) = N u(T ) debe ser igual al subespacio nulo {~0}. Pero
aún nos faltaría verificar que T −1 (w)
~ tiene un único elemento para el resto de los vectores w
~ en la imagen. La
buena noticia es que, para transfomaciones lineales, esto no es necesario.
N u(T ) = {~0}.
No es difícil demostrar esta proposición. Es claro que, si T es monomorfismo, entonces N u(T ) = {~0}. Para ver la
otra implicación, supongamos que N u(T ) = {~0} pero que existe un vector no nulo w
~ ∈ Rm que es imagen de dos
vectores ~v1 , ~v2 distintos. ¿Qué sucede con el vector ~v1 − ~v2 ? ¿Cuál es su imagen? Usando las propiedades de la
tranformación lineal tenemos:
Es decir, el vector ~v1 − ~v2 ∈ N u(T ). Pero este vector no es el vector nulo, pues estábamos asumiedo que ~v1 y ~v2
eran distintos. Esto contradice que N u(T ) = {~0}, que era una de nuestras hipótesis. Esto prueba la proposición
anterior.
Anteriormente, vimos que si {~v1 , ~v2 , . . . , ~vr } es linealmente independiente, entonces no necesariamente {T (~v1 ),
T (~v2 ),. . ., T (~vr )}, resulta linealmente independiente. Se puede mostrar que, si la transformación lineal es un
monomorfismo, entonces sí se verifica esta condición:
Proposición 35 Sea T : Rn → Rn una transformación lineal. Entonces T es isomorfismo sí, y solo sí, T manda
bases en bases; es decir, si {~v1 , ~v2 , . . . , ~vn } es una base de Rn , {T (~v1 ), T (~v2 ), . . . , T (~vn )} también es una base de
Rn .
Ejemplos 64
Hallemos, si es posible, una transformación lineal T : R2 → R3 tal que N u(T ) = {(x1 , x2 ) ∈ R2 : 2x1 −x2 =
0} e Im(T ) = h(1, 0, 1)i. Escribamos un sistema de generadores de N u(T ):
Definamos la transformación lineal buscada exhibiendo las imágenes por T de una base del dominio. Extendamos
{(1, 2)} a una base de R2 ; por ejemplo, {(1, 2), (0, 1)}. Dado que (1, 2) ∈ N u(T ) y (1, 0, 1) ∈ Im(T ),
podemos decir:
• T (1, 2) = (0, 0, 0)
• T (0, 1) = (1, 0, 1)
Álgebra A. Interpretación geométrica del efecto de una transformación lineal. 179
Sabemos que, entonces, existe una única transfomación lineal que cumple estas asignaciones. Verifiquemos que
se cumplen las condiciones pedidas. Por un lado, tenemos:
Im(T ) = hT (1, 2), T (0, 1)i = h(0, 0, 0), (1, 0, 1)i = h(1, 0, 1)i.
Por otro lado, veamos que N u(T ) = h(1, 2)i. Por definición, (1, 2) ∈ N u(T ) y, entonces, h(1, 2)i ⊆ N u(T ).
¿Puede ocurrir que N u(T ) sea “más grande” que el subespacio h(1, 2)i? Si recordamos el Teorema de la
dimensión (en la página 177), se tiene que dim(N u(T )) + dim(Im(T )) = dim(R2 ) = 2. Dado que
dim(Im(T )) = 1, resulta necesariamente dim(N u(T )) = 1. Por lo tanto, h(1, 2)i = N u(T ).
Hallemos ahora, si es posible, una transformación lineal T : R3 → R3 tal que T sea epimorfismo y N u(T ) =
h(1, 1, 2)i. En este caso, si existiera una tal transformación lineal, debería verificarse, nuevamente, por el Teorema
de la dimensión, que dim(N u(T )) + dim(Im(T )) = 3. Pero en las condiciones pedidas, dim(N u(T )) = 1,
y como T debe ser epimorfismo, Im(T ) = R3 , es decir, dim(Im(T )) = 3. De esta manera, obtendríamos
dim(N u(T )) + dim(Im(T )) = 1 + 3 = 4, lo cual es imposible. Por lo tanto, podemos concluir que no existe
la transformación lineal pedida.
Supongamos que tenemos una transformación lineal T : Rn → Rn ; es decir, con el mismo codominio que dominio.
¿Qué sucede si T es monomorfismo? En este caso, N u(T ) = {~0} o, lo que es equivalente, dim(N u(T )) = 0. El
Teorema de la dimensión nos dice que 0 + dim(Im(T )) = n. Pero como Im(T ) ⊂ Rn y ambos subespacios tienen
la misma dimensión entonces Im(T ) = Rn . Por lo tanto, concluimos que T es epimorfismo. ¿Qué sucede si, ahora,
supiéramos que T es epimorfismo? El mismo razonamiento nos muestra que, entonces, dim(N u(T )) = 0, y esto
quiere decir que T es monomorfismo. Notamos entonces que estas características están muy ligadas entre sí para
transformaciones lineales con el mismo dominio y codominio. Lo enunciamos a continuación:
Proposición 36 Sea T : Rn → Rn una transformación lineal. Entonces son equivalentes, ya que T es:
Monomorfismo.
Epimorfismo.
Isomorfismo.
Introducimos la definición de imagen de una transformación lineal T : Rn → Rm como el conjunto de los vectores
de Rm que provienen de un vector de Rn por T .
Definimos el núcleo de una transformación lineal, que consta de todos los vectores del dominio que son mandados al
0 por la transformación lineal.
Estudiamos la clasificación de transformaciones lineales en epimorfismos (suryectivas), monomorfismos (inyectivas)
e isormofismos (biyectivas) y su relación con el núcleo y la imagen de la transformación.
Muchas de las construcciones que estudiamos como proyecciones y simetrías en el capítulo 2 son realmente
tranformaciones lineales. Por otro lado, algunas transformaciones lineales T de R2 en R2 o de R3 en R3 pueden
interpretarse geométricamente como rotaciones, proyecciones, simetrías, etc. En este apartado veremos cómo
construirlas y clasificarlas.
180 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Comencemos por las Rotaciones en R2 . Consideremos un instante las agujas de un reloj. Si miramos el reloj en dos
momentos distintos, el movimiento de cada aguja se puede modelar con una transformación lineal. Basta imaginar
que la aguja es un vector y el reloj, el plano R2 . Supongamos, entonces, que queremos rotar el vector (x, y) ∈ R2
un ángulo θ > 0 en el sentido contrario a las agujas del reloj, y que el vector obtenido luego de la rotación es
el (x0 , y 0 ). Si ||(x, y)|| = r y α es el ángulo entre el vector (x, y) y el vector (r, 0) entonces, por trigonometría,
x y
cos(α) = r y sin(α) = r (Figura 6.1). Es decir:
x = r cos(α)
y = r sin(α)
Por otra parte, rotar no cambia longitud del vector, por lo que ||(x0 , y 0 )|| = r. Haciendo un razonamiento análogo
0
x0
al anterior, tenemos que cos(α + θ) = r y sin(α + θ) = yr . Es decir:
x0 = r cos(α + θ)
y 0 = r sin(α + θ)
x0 = r cos(α + θ)
= r cos(α) cos(θ) − sin(α) sin(θ)
= r cos(α) cos(θ) − r sin(α) sin(θ)
= x cos(θ) − y sin(θ)
y 0 = x sin(θ) + y cos(θ)
sentido contrario al de las agujas del reloj, entonces la matriz canónica asociada a T es:
cos(θ) − sin(θ)
AT =
sin(θ) cos(θ)
¿Qué sucede ahora si queremos rotar en el sentido de las agujas del reloj? En este caso, decimos que rotamos en un
ángulo −θ. Es decir, el signo del ángulo indicará la orientación de la rotación.
Rotar el vector (x, y) ∈ R2 un ángulo θ > 0 en el sentido de las agujas de reloj, para obtener (x0 , y 0 ) corresponde
entonces a la siguiente operación:
x0 cos(−θ) − sin(−θ) x
= ·
y0 sin(−θ) cos(−θ) y
π
Experimento 36 ¿Cuál es la matriz de la transformación lineal que rota un vector (x, y) en 4 en el
sentido contrario a las agujas del reloj? ¿En qué vector se transforma el vector (1, 1) luego de dicha rotación?
Represéntelo también gráficamente.
¿Qué sucede con rotaciones en R3 ? Imaginemos nuevamente un reloj pero, esta vez, considerémoslo como habitando
el espacio tridimensional; es decir, pensémoslo colgado sobre una pared en una habitación. En este caso, las agujas
también rotan, pero lo hacen respecto del eje perpendicular al reloj. Es decir, si pensamos a las agujas como
contenidas en el plano xy, la dirección que sale perpendicularmente del reloj correspondería al eje z; y la rotación de
las agujas es respecto de este eje. En este libro, sólo estudiaremos rotaciones tridimensionales respecto de uno de los
ejes. Para este caso, la interpretación de este efecto como transformación lineal es muy sencilla, ya que, realmente,
sólo se modifican las coordenadas x e y de los vectores (x, y, z) ∈ R3 (la coordenada z queda inalterada). Además,
la manera cómo se tranforman las coordenadas x e y es, exactamente, como una rotación del plano xy. En definitiva,
arribamos a la siguiente definición:
Definición 61 Si T : R3 → R3 es la transformación lineal que representa la rotación de ángulo θ > 0 en el
sentido contrario al de las agujas del reloj respecto del eje z, entonces la matriz canónica asociada a T es:
cos(θ) − sin(θ) 0
AT = sin(θ) cos(θ) 0
0 0 1
La matriz AT se interpreta de la siguiente manera: en la “submatriz” cuadrada de entradas a11 , a12 , a21 y a22 ,
aparece una rotación en un plano que contiene a las coordenadas x, y y, el coeficiente 1 en el lugar a33 , nos dice que
182 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
la coordenada z no es alterada.
Siguiendo el mismo razonamiento, podemos ver que la matriz asociada a una rotación tridimensional de ángulo θ,
en el sentido contrario al de las agujas del reloj, respecto del eje x es:
1 0 0
AT = 0 cos(θ) − sin(θ)
0 sin(θ) cos(θ)
Mientras que la matriz asociada a una rotación en R3 de ángulo θ, en el sentido contrario al de las agujas del reloj,
respecto del eje y es:
cos(θ) 0 sin(θ)
AT = 0
1 0
− sin(θ) 0 cos(θ)
Ahora, estudiaremos las transformaciones lineales asociadas a las simetrías en R2 y R3 ya vistas en el capítulo 2.
Importante Las simetrías que pueden ser caracterizadas por transformaciones lineales son aquellas que se
definen con respecto de rectas y planos que pasan por el origen. Esto es debido a que las transformaciones lineales
son funciones entre subespacios vectoriales y, como vimos en el capítulo 3, los espacios vectoriales contienen el
“cero”, que en la geometría del plano y el espacio es el origen.
- - - - -
-
-
-
-
Por un lado, que los vectores que pertenecen a la recta L quedan fijos por la simetría. En particular, T (~v ) = ~v . Por
el otro lado, los vectores perpendiculares al vector director de la recta se transforman en sus inversos; es decir, el
simétrico de (x, y) es (−x, −y) en este caso (pueden comprobarlo por su cuenta). Por lo tanto, si w
~ es un vector
~ = −w.
ortogonal a ~v , entonces T (w) ~ ¿Por qué nos interesan estos casos particulares de vectores? Porque {~v , w}
~
es una base de R2 . Por lo tanto, para saber cuál es la transformación lineal que modela una simetría, alcanza con
determinar las imágenes de los vectores ~v y w,
~ ¡Es lo que acabamos de hacer!
Definición 62 Si T : R2 → R2 es la transformación lineal que representa la simetría respecto de la recta L de
~ = −w
T (w) ~
base de R3 , por lo que alcanza con definir a T en esta base de la siguiente manera:
T (v) = v
T (w) = w
T (N ) = −N
Las transformaciones del plano o del espacio que hemos estudiado hasta ahora no modifican el “tamaño” de los
vectores. Pero es muy usual realizar transformaciones que sí lo hagan. Por ejemplo, si tenemos un dibujo en
tamaño A4 y hacemos una fotocopia que reduce su tamaño a la mitad, entonces la transformación de los puntos
del dibujo original al dibujo reducido, se puede modelar con un tipo especial de transformaciones lineales: las
homotecias. En este ejemplo, la transformación de reducción de la fotocopia se modela con la transformación lineal
T (x, y) = 12 (x, y). Una ampliación al doble de tamaño se traduce en la transformación lineal T (x, y) = 2(x, y).
Definición 63 Una transformación lineal T : R2 → R2 se dice homotecia si T (x, y) = k(x, y), con k > 0 fijo.
La constante k se llama el factor de la homotecia. Si 0 < k < 1, la homotecia se denomina contracción y si
k > 1, se denomina dilatación. Notemos que si k = 1, la transformación es la identidad.
Observación 38 Es fácil convencerse que la matriz canónica asociada a una homotecia T de factor k es:
k 0
AT = .
0 k
Otro tipo de homotecia consiste en modificar el tamaño de los vectores de modo no homogéneo, es decir, mediante
una dilatación o contracción en una dirección determinada (horizontal o vertical).
Definición 64 Una transformación lineal T : R2 → R2 se dice homotecia de factor k en la dirección x si
T (x, y) = (kx, y); y se dice homotecia de factor k en la dirección y si T (x, y) = (x, ky). En ambos casos, si
184 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Observación 39
Una contracción o dilatación de vectores en el caso tridimensional tiene exactamente el mismo significado que para
las homotecias en R2 . Las definiciones en este caso, son idénticas:
Definición 65 Una transformación lineal T : R3 → R3 se dice homotecia si T (x, y, z) = k(x, y, z), con k > 0
fijo. La constante k se llama el factor de la homotecia. Si 0 < k < 1, la homotecia se denomina contracción y si
k > 1, se denomina dilatación. Notemos que si k = 1, la transformación es la identidad.
Experimento 38 Encuentren la forma que tienen las matrices canónicas de las homotecias en las direcciones
x, y y z.
Los deslizamientos cortantes son maneras de “inclinar” los vectores del plano de forma paralela a uno de los ejes.
La idea básica de este tipo de transformaciones es enviar el vector (x, y) a (x + ky, y). En este caso, se llama un
deslizamiento cortante de factor k en la dirección x. Notemos que la inclinación arriba referida tiene que ver con el
hecho que la coordenada x está siendo alterada en una cantidad proporcional a la coordenada y, por lo que, cuando
mayor sea el valor de y, más grande será la traslación del punto. Esta es la diferencia con una simple traslación en el
sentido x (que tiene la forma (x, y) → (x + k, y)). La matriz asociada a este tipo de transformaciones es:
1 k
AT =
0 1
Observemos que, no tendrán problemas en escribir la matriz asociada a un deslizamiento cortante en la dirección y.
Las ideas básicas de estas transformaciones quedarán mejor evidenciadas cuando veamos como afectan al cuadrado
unitario.
Las proyecciones ortogonales que estudiamos en el capítulo 2 también son transformaciones lineales. Comencemos
estudiando proyecciones en R2 .
Sea L la recta de R2 de ecuación vectorial X = t~v , queremos construir la proyección ortogonal T : R2 → R2 sobre
Álgebra A. Interpretación geométrica del efecto de una transformación lineal. 185
la recta L. Claramente, los vectores de la recta L quedan fijos. Si L0 es la recta ortogonal a la recta L que pasa por
el origen, entonces los vectores de L0 tendrán como imagen por T al vector (0, 0) (Figura 6.3).
- - - - -
-
-
-
-
T (w) = (0, 0)
Ejemplo 65 Veamos cuál es la fórmula de la proyección ortogonal sobre la recta L = {(x, y) ∈ R2 : x = y}. La
ecuación vectorial de la recta sobre la que estamos proyectando es X = λ(1, 1). Un vector ortogonal a ~v = (1, 1) es,
~ = (1, −1). Definimos T : R2 → R2 por:
por ejemplo, w
T (1, 1) = (1, 1)
Hallemos ahora la fórmula de T . Un vector (x, y) ∈ R2 se escribe como combinación lineal de los vectores de la base
{(1, 1), (1, −1)} de la siguiente forma:
x+y x−y
(x, y) = (1, 1) + (1, −1)
2 2
Por lo tanto,
x+y x−y x+y x + y x + y
T (x, y) = T (1, 1) + T (1, −1) = (1, 1) = ,
2 2 2 2 2
Esta es la fórmula de la transformación lineal que representa la proyección ortogonal buscada.
Transformando el cuadrado unitario. Para tener una idea más precisa de qué hacen realmente todas estas trans-
formaciones geométricas sobre R2 , vamos a estudiar el efecto de cada una de ellas sobre el cuadrado unitario
C de R2 ; es decir, el cuadrado de vértices (0, 0), (0, 1), (1, 0) y (1, 1). Como comentamos al comienzo de la
unidad, una de las consecuencias que se desprende de las propiedades de las tranformaciones lineales, es que
un segmento P Q es enviado al segmento T (P )T (Q). En efecto, todos los puntos del segmento P Q se pueden
escribir de la forma tP + (1 − t)Q, donde 0 ≤ t ≤ 1. Una transformación lineal T envía a estos puntos a
T (tP + (1 − t)Q) = tT (P ) + (1 − t)T (Q), que son precisamente todos los puntos del segmento T (P )T (Q) (ya
que 0 ≤ t ≤ 1). Por lo tanto, para saber cuál es la imagen del cuadrado unitario C por una transformación lineal
T : R2 → R2 , solo debemos calcular a qué puntos envía T a los vértices del C, ya que, necesariamente, el segmento
que une dos de sus vértices, será enviado al segmento que une sus imágenes. Por ejemplo, la imagen por T del
segmento que une el (0, 0) con el (0, 1) es el segmento que une T (0, 0) con T (0, 1). En la Figura 6.4 podemos ver
el efecto sobre el cuadrado unitario de todas las transformaciones estudiadas al comienzo de este apartado.
Figura 6.4: Tranformaciones del cuadrado unitario de R2 (en orden de aparición): rotación, simetría respecto de la recta L,
homotecia de factor k, homotecia de factor k en la dirección x, deslizamiento cortante de factor k en la dirección x y proyección
sobre la recta L.
También podemos estudiar el efecto de una tranformación lineal R3 sobre el cubo unitario: el cubo de vértices
(0, 0, 0), (1, 0, 0), (0, 1, 0), (0, 0, 1), (1, 1, 0), (0, 1, 1), (1, 0, 1) y (1, 1, 1). El procedimiento en este caso es idéntico:
los segmentos entre estos puntos serán enviados a los segmentos entre sus imágenes. En particular, los cuadrados que
forman los lados del cubo son enviados por T a los trapezoides cuyos vértices son las imágenes de los vértices del
cuadrado en cuestión. Por ejemplo, el cuadrado de vértices (0, 0, 0), (1, 0, 0), (0, 1, 0) y (1, 1, 0) tiene por imagen
el trapezoide T (0, 0, 0), T (1, 0, 0), T (0, 1, 0) y T (1, 1, 0).
Álgebra A. Interpretación geométrica del efecto de una transformación lineal. 187
Experimento 40 Como hicimos en la Figura 6.4, hagan el dibujo del efecto sobre el cubo unitario de R3 de
todas las transformaciones estudiadas al comienzo de esta sección.
Como vimos, en el capítulo 5, el determinante de una matriz cuadrada tiene una interpretación algebraica como
un número indicativo de la inversibilidad de una matriz. Sorprendentemente, también posee una interpretación
geométrica: pensando a la matriz como asociada a una transformación lineal, nos dice cómo cambia el área o
volumen de una figura al aplicarle la transformación lineal. Veamos algunos ejemplos para clarificar esta aserción.
Supongamos que tenemos una homotecia T de factor k en R2 . Sabemos que la matriz asociada a esta transformación
lineal es AT = k0 k0 . Tal como vimos en la Figura 6.4, si aplicamos esta homotecia al cuadrado unitario C ⊂ R2 ,
entonces obtenemos un cuadrado cuyos lados tienen medida k. ¿Cuál es el área de este nuevo cuadrado T (C)?
Como el área de un cuadrado se mide multiplicando la longitud de la base por la altura, entonces es k 2 . Es decir,
el cuadrado C de área 1 fue transformado en una figura (que en este caso es un cuadrado también) de área k 2 .
Notemos que k 2 es, precisamente, el determinante de AT mutiplicado por 1. ¿Qué sucede si, ahora, aplicamos la
misma homotecia al cuadrado C2 de vértices (0, 0), (0, 2), (2, 0) y (2, 2)? Obtenemos el cuadrado de vértices (0, 0),
(0, 2k), (2k, 0) y (2k, 2k), cuyos lados miden 2k, por lo que su área es (2k)2 = 4k 2 . ¿Cuál es el área del cuadrado
original? Pues, 22 = 4. Por lo tanto, vemos que:
Esto es algo que sucede siempre, para cualquier transformación lineal dentro de R2 (no solo las homotecias). Lo
enunciamos a continuación.
Proposición 40 Sea T : R2 → R2 una transformación lineal y sea F ⊂ R2 una figura cualquiera. Entonces:
Esta proposición dice que el módulo del determinante de la matriz asociada a T nos da el factor por el que se
modifica el área de una figura al aplicarle T . Por ejemplo, ¿qué sucede con las rotaciones? Geométricamente,
estamos girando una figura; no le alteramos el área. ¿Cuál es el determinante de una matriz de rotación θ? Pues:
cos(θ) − sin(θ)
det = cos(θ)2 + sin(θ)2 = 1.
sin(θ) cos(θ)
Por lo tanto, ¡hemos redescubierto que el área antes y después de la rotación no se altera!
Ejemplo 66 Estudiemos cómo se modifica el área del círclo D de radio r = 3 centrado en el origen al aplicarle
una homotecia T de factor 12 . Sabemos que el área de D es 2πr = 6π. La Proposición 40 nos dice que, luego de
1 0
aplicar la homotecia T , el área de T (D) es 6π det(AT ). Como det(AT ) = det 02 1 , entonces T (D) tiene área
2
1 2 3
2
6π = 2
π.
Para transformaciones lineales en R3 vale la misma propiedad pero, en este caso, el determinante nos dice cómo se
modifica el volumen de una figura tridimensional.
Al igual que para R2 , esta proposición dice que el módulo del determinante de la matriz asociada a T nos da el
factor por el que se modifica el volumen de una región al aplicarle T .
Ejemplo 67 ¿Qué transformación hay que aplicarle al cubo unitario C de R3 para “agrandarlo” a un cubo de volumen
7? Lo primero que se nos viene a la mente es transformarlo por medio de una homotecia T . ¿Qué factor k debe tener la
homotecia para alcanzar el volumen deseado? Sabemos que volumen de T (C) = (Volumen de C) det(AT ). Como el
k 0 0
volumen de C es 1, debemos hallar k tal que det(AT ) sea 7. Como AT = 0 k 0 , entonces det(AT ) = k3 . Por lo
0 0 k
√
tanto, k debe ser 3 7.
Esta propiedad del determinante vale, en realidad, para una transformación lineal dentro de Rn para cualquier
n ∈ N. En este caso, lo que marca dicho determinante es cómo se altera el volumen n-dimensional de la región.
Claro que, para n ≥ 4, ya no podemos imaginarnos qué interpretación geométrica tiene dicho “volumen”.
Estudiamos las simetrías y las proyecciones ortogonales en R2 y R3 desde el punto de vista de las transformaciones
lineales.
Estudiamos la interpretación geométrica de ciertas tranformaciones lineales: rotaciones, simetrías, proyecciones,
homotecias y deslizamientos cortantes. En cada caso, estudiamos la forma que tienen sus matrices asociadas.
Vimos el efecto de una transformación lineal dentro de R2 sobre el cuadrado unitario de R2 y el de una transformación
lineal dentro de R3 sobre el cubo unitario de R3 .
Dimos una interpretación geométrica del determinante de una matriz cuadrada, como el factor de deformación del
área (o volumen) de una región en R2 (o R3 ).
Supongamos que tenemos dos funciones f, g : R → R. Componer f con g es una nueva función f ◦ g : R → R
que se obtiene al aplicar primero g y después f ; es decir, la función compuesta f ◦ g en el punto x toma el valor
f (g(x)) (aplico g a x y obtengo g(x), y a este valor le aplico f ). Componer no es otra cosa que “aplicar una función
a continuación de la otra”. Por ejemplo, si f (x) = x2 y g(x) = x + 1 entonces (f ◦ g)(x) = (x + 1)2 . En efecto,
al aplicar g a x obtenemos x + 1. Y a este último valor le aplicamos f ; es decir, calculamos f (x + 1) = (x + 1)2 .
Notemos que importa el orden en que componemos las funciones. En general f ◦ g no es la misma función que
g ◦ f . En el ejemplo de recién, g ◦ f (x) = x2 + 1, y esta función no es igual a f ◦ g (en x = 1, por ejemplo, toman
distintos valores).
Álgebra A. Composición e inversa de transformaciones lineales. 189
En general, podemos componer funciones cuyo dominio y codominio no coincidan. Lo único que tendremos
presente es que, para que esté definida f ◦ g, “el conjunto donde cae g debe estar contenido en el conjunto donde
sale f ”; es decir, el codominio de g debe estar contenido en el dominio de f . Esta es una condición necesaria ya
que f ◦ g quiere decir que, para un x en el dominio de g, primero aplicamos g y después f ; pero f solo podemos
aplicarlo si g(x) está en el dominio de f . Más concretamente: si f : A → B y g : B → C son dos funciones entre
conjuntos cualesquiera, entonces, podemos definir g ◦ f : A → C. Notemos que f cae en B y g sale de B, por lo
que al valor f (x) podemos aplicarle g. También, tengamos en cuenta que g ◦ f es una función cuyo dominio es el
dominio de f y cuyo codominio es el codominio de g. La regla para recordar qué función se aplica primero en la
notación g ◦ f es leerla de derecha a izquierda: en este caso, primero f y luego g.
Las transformaciones lineales son, en particular, funciones, por lo que podemos componerlas. Si T : Rn → Rm y
T 0 : Rm → Rk , entonces podemos armar la composición T ◦ T 0 : Rn → Rk , que consiste en aplicar primero T 0 y,
luego, T . Es decir:
(T ◦ T 0 )(~v ) = T (T 0 (~v ))
Por ejemplo, si T : R2 → R3 está dada por T (x, y) = (x + y, 2x, 2y) y T 0 : R3 → R2 está dada por T 0 (x, y, z) =
(x − y − 2z, 2x − z), entonces, tanto T ◦ T 0 : R3 → R3 como T 0 ◦ T : R2 → R2 están definidas. Para calcular T ◦ T 0
debemos aplicar, primero, T 0 a un (x, y, z) genérico y, luego, aplicar al resultado la transformación lineal T . Por un
lado, T 0 (x, y, z) = (x − y − 2z, 2x − z). ¿Qué significa aplicar T a este resultado? Pues que la primera coordenada
es x − y − 2z y la segunda coordenada es 2x − z. Es decir que, en la fórmula T (x, y) = (x + y, 2x, 2y) que define
T , el papel de x lo hace x − y − 2z y, el de y, lo hace 2x − z. Por lo tanto, debemos calcular T (x − y − 2z, 2x − z):
Entonces, hemos hallado que T ◦ T 0 (x, y, z) = (3x − y − 3z, 2x − 2y − 4z, 4x − 2z). Por otro lado:
T 0 ◦ T (x, y) = T 0 (x + y , |{z}
2x , 2y )
| {z } |{z}
“x” “y” “z”
= ((x + y ) − (|{z}
2x ) − 2( 2y ), 2(x + y ) − ( 2y ))
| {z } |{z} | {z } |{z}
“x” “y” “z” “x” “z”
= (−x − 3y, 2x)
¿Qué sucede a nivel matricial? Sabemos que toda transformación lineal puede representarse de manera canónica
por medio de una matriz, donde el resultado de evaluar un vector en la transformación equivale a multiplicar dicho
vector por la matriz. Por este motivo, no nos debería sorprender que componer dos tranformaciones lineales equivale,
a nivel matricial, a multiplicar sus matrices asociadas. En efecto, supongamos que T : Rn → Rm y T 0 : Rm → Rk .
Si queremos calcular T 0 ◦ T en un vector ~v , entonces sabemos que T (~v ) = AT · ~v y T 0 (~v ) = AT 0 · ~v . Por lo tanto,
AT 0 ◦T = AT 0 ◦ AT
Retomemos los ejemplos anteriores. Teníamos que T : R2 → R3 estaba dada por T (x, y) = (x + y, 2x, 2y) y
T 0 : R3 → R2 por T 0 (x, y, z) = (x − y − 2z, 2x − z). Calculamos:
1 1
1 −1 −2
AT = 2 0 AT 0 =
2 0 −1
0 2
Es decir, (T 0 ◦T )(x, y) = (−x−3y, 2x), y descubrimos la misma fórmula que conseguimos haciendo la composición
directamente. En el siguiente experimento, los invitamos a hacer el cálculo de la composición para el otro lado.
La composición nos permite ampliar el conjunto de transformaciones lineales que estudiamos en el apartado anterior.
Ahora, podemos construirnos funciones que transformen de manera más general regiones del plano o el espacio.
Por ejemplo, supongamos que queremos armar una transformación lineal en R3 que, dada una región, la dilate
manteniendo sus proporciones, de forma que tenga el doble de su área original y, también, la rote 45o en el sentido
de las agujas del reloj. Sabemos que la transformación que agranda el área de una región en 2 es:
√
H = 02 √02
mientras que la transformación que rota una región 45o en el sentido horario es:
cos(− π ) − sin(− π )
R = sin(− π4 ) cos(− π4)
4 4
Por lo tanto, la transformación buscada es la composición de ambas transformaciones. Pero, ¿en qué orden debemos
aplicarlas? Notemos que la misma naturaleza de las transformaciones nos dice que no importa, ya que las rotaciones
no afectan el área y las homotecias no afectan la “inclinación” de la región. Elegimos H ◦ R:
√ √ √
π π π π
2 0 cos(− 4 ) − sin(− 4 ) 2 cos(− 4 ) − 2 sin(− 4 )
A(H◦R) = √ · π π
= √ √
0 2 sin(− 4 ) cos(− 4 ) 2 sin(− π4 ) 2 cos(− π4 )
Por lo tanto, la transformación lineal buscada es:
√ √
2 cos(− π4 ) − 2 sin(− π4 )
(H ◦ R) · ~v = √ √ · ~v
2 sin(− π4 ) 2 cos(− π4 )
− cos(θ) sin(θ) −1 0
= ·
sin(θ) cos(θ) 0 1
cos(θ) sin(θ)
=
− sin(θ) cos(θ)
Ahora, debemos recordar que cos(θ) = cos(−θ) y sin(θ) = − sin(−θ) para todo θ. Por lo tanto, esta última matriz
podemos reescribirla:
cos(−θ) − sin(−θ)
AT ◦T 0 ◦T =
sin(−θ) cos(−θ)
que es, precisamente, la matriz asociada a la transformación lineal que rota en θ en el sentido horario. Esto confirma
nuestra hipótesis.
Recordemos que, si tenemos una función entre conjuntos f : A → B que es biyectiva, entonces, podemos definir la
función inversa, f −1 : B → A, que envía al elemento f (x) ∈ B al elemento x ∈ A; es decir, lo devuelve al mismo
punto de donde lo envió f . Formalmente, esto se escribe f −1 ◦ f (x) = x. La función f −1 se llama la inversa de
f y es única (es la única función que verifica esta igualdad). Algunas transformaciones lineales también admiten
inversa. Por ejemplo, la inversa de la transformación que rota los vectores en 90o en el sentido antihorario es la
transformación que rota los vectores 90o en el sentido horario. Por otro lado, la inversa de una simetría es ella
misma, pues el simétrico de un simétrico es el punto original. Finalmente, la inversa de dilatar por un factor k > 1
es contraer por k1 . En todos estos casos, la inversa de una transformación lineal vuelve a ser una transformación
lineal. Veremos que esto es siempre así.
Antes de dar la definición de inversa de una transformación lineal observemos que, para que exista la inversa, la
transformación debe ser biyectiva. Esto es siempre un requerimiento para que tenga sentido buscar una inversa. Las
transformaciones lineales biyectivas son necesariamente isormorfismos, por lo que una tranformación lineal admite
inversa sí, y solo sí, es un isomorfismo. En particular, el dominio y el codominio deben ser el mismo espacio.
192 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
No es difícil ver que la inversa de T es única; es decir, no hay otra transformación lineal con esas caracteríticas. Por
este motivo, la llamamos T −1 (pues no crea ambigüedad).
¿Cómo se calcula la inversa de un isomorfismo? Veamos un ejemplo. Consideremos el isomorfismo T : R3 → R3
dado por T (x, y, z) = (x − y − z, x − 2y − 4z, 2x − z). Recordemos que, para construir una transformación lineal,
alcanza con definir cúales son los valores que esta toma en una base. Pero, ¿qué base nos conviene considerar?
Tengamos en cuenta que:
T (1, 0, 0) = (1, 1, 2)
T (0, 1, 0) = (−1, −2, 0)
T (0, 0, 1) = (−1, −4, −1)
Como T es isomorfismo y {(1, 0, 0), (0, 1, 0), (0, 0, 1)} es una base de R3 , entonces
3
{(1, 1, 2), (−1, −2, 0), (−1, −4, −1)} también es una base de R (por la Proposición 35). Notemos que, entonces,
definir la inversa es automático a partir de esta observación. La inversa T −1 debe verificar:
T −1 (1, 1, 2) = (1, 0, 0)
T −1 (−1, −2, 0) = (0, 1, 0)
T −1 (−1, −4, −1) = (0, 0, 1)
Si ahora queremos encontrar la expresión funcional de T −1 , podemos proceder como mostramos en el apartado
6.1.3. Sin embargo, este procedimiento para hallar la forma funcional de una transformación lineal definida en una
base involucra, en general, una gran cantidad de cuentas. Por suerte, existe una manera más directa de calcular la
inversa de una transformación lineal: calcular la forma matricial de T −1 . A esta altura, no debería sorprendernos
que ¡la forma matricial de la inversa de T es la matriz inversa de AT ! Esto es evidente ya que, si (T −1 ◦ T )(~v )
para todo ~v ∈ Rn , entonces (AT −1 · AT ) · ~v = ~v para todo ~v ∈ Rn . Esto fuerza a que AT −1 · AT = I. ¿Se
dan cuenta por qué sucede esto? Concluimos, entonces, que AT −1 = A−1
T . Por lo tanto, para hallar la inversa de
2
− 15 y + 25 z, − 57 x + 15 y + 53 z, 45 x − 25 y − 15 z
= 5x
Observamos que, del ejemplo anterior, podemos deducir la siguiente propiedad de los isomorfismos:
Álgebra A. Composición e inversa de transformaciones lineales. 193
Proposición 43 Una transformación lineal T es un isomorfismo sí, y solo sí, su matriz canónica asociada AT es
inversible.
(3x − 2y, 2x − y). Para decidir si esta transformación lineal tiene inversa, debemos verificar si es o no un isomorfimo.
Nos armamos la matriz canónica asociada:
3 −2
AT =
2 −1
Como det(AT ) = 1 6= 0, entonces AT es inversible y, por lo tanto, T es un isomorfismo. Ahora que sabemos que T
tiene inversa, la calculamos. Buscamos entonces la inversa de AT :
3 −2 1 0 F2 →F2 − 2
3
F1 3 −2 1 0 3F2 3 −2 1 0
− −−−−−−−− → −−→
1
2 −1 0 1 0 3
− 23 1 0 1 −2 3
F1 →F1 +2F2 3 0 −3 6 1F
3 1
1 0 −1 2
−−−−−−−−→ −−−→
0 1 −2 3 0 1 −2 3
Esta última matriz es, entonces, AT −1 , por lo que la forma funcional de T −1 es:
−1 2 x −x + 2y
T −1 (x, y) = · = .
−2 3 y −2x + 3y
Es decir, T −1 (x, y) = (−x + 2y, −2x + 3y). Para verificar que este cálculo es correcto, calculemos T ◦ T −1 :
Estudiamos la composición de transformaciones lineales y vimos que la matriz canónica asociada a una composición
es el producto de las matrices canónicas asociadas a las transformaciones originales. Usamos estas propiedades para
mostrar cómo construir tranformaciones lineales que sean composiciones de rotaciones, simetrías, homotecias, etc.
Definimos la inversa de un isomorfismo y vimos que la matriz canónica asociada a la transformación inversa es la
matriz inversa de la matriz asociada al isomorfismo original.
7. Números complejos
Los números complejos forman un conjunto numérico más grande que los números reales, que surgen ante la
necesidad de encontrar soluciones a ecuaciones cuadráticas con coeficientes en R. En este sentido, son la “extensión”
necesaria (más pequeña) que garantiza que todas estas ecuaciones tienen solución. Si bien los números complejos,
como objeto matemático, son una abstracción, surgieron en el estudio de ciertos problemas geométricos y en la
resolución de ecuaciones polinomiales.
Los números naturales son los números que utilizamos para contar, de allí su nombre. Supongamos que queremos
resolver ecuaciones con estos números. Por ejemplo, x + 3 = 5 puede ser resuelta sin problema: la solución es
x = 2. Pero ¿qué sucede si queremos resolver x + 3 = 1? Esta ecuación no tiene solución en números naturales (no
hay ningún número natural tal que, al sumarle 3, nos dé como resultado 1). ¿Qué podemos hacer? Pues podemos
introducir los números naturales negativos para resolver este tipo de ecuaciones. Creamos, entonces, los números
enteros, que constan de los números naturales y sus inversos aditivos (y del 0, ya que vamos a tener que poder
representar 1 − 1, por ejemplo). De esta manera, ya podemos resolver x + 3 = 1; la solución es el número entero −2.
¿Y si quisiéramos ahora resolver 2x + 3 = 4? ¿Podemos? ¡No! Esta ecuación no tiene solución con los números
196 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
enteros. Necesitamos nuevamente ampliar el conjunto de números con el que trabajamos. Entonces, construimos
los cocientes entre números enteros: los números racionales. Con estos últimos, es posible resolver este tipo de
ecuaciones. En este caso, la solución de la ecuación es el número racional 12 . ¿Qué sucede ahora si queremos resolver
la ecuación cuadrática x2 = 2? Pues sucede que esta ecuación no tiene solución con los números racionales. Como
√ √
bien sabemos ahora, las posibles soluciones a dicha ecuación son 2 y − 2, y estos números no se pueden escribir
como cociente de números enteros (la demostración de este hecho se puede ver como información complementaria
sobre el Teorema de Gauss del próximo capítulo). Entonces, llegamos a definir los números reales, que son los
números que conocemos y utilizamos todo el tiempo. Lamentablemente, especificar cuáles son los números reales
no es tan sencillo como lo es especificar los números enteros (a partir de los naturales) o los números racionales (a
partir de los enteros). Podemos decir que, informalmente, los números reales constan de los números racionales
más los números que se encuentran entre los racionales en la recta real (es decir, los números necesarios para llenar
la recta y que no queden huecos). ¿Llegamos al final del camino? ¿Son estos los últimos números que vamos a
necesitar? Miremos la ecuación x2 + 1 = 0. ¿Existe algún número real que, elevado al cuadrado y sumado con
1, nos de 0? ¡No! Sabemos que el cuadrado de cualquier número real es un número positivo, por lo que no es
posible que, al sumarle 1 a un número positivo, obtengamos algo más pequeño que 1 (mucho menos, el 0). Es, en
este contexto, que necesitamos agrandar aún más el conjunto de números con el que trabajamos. Y aquí es donde
aparecen los números complejos: nos permiten, en particular, resolver la ecuación x2 = −1. Para ello, vamos a
tener que introducir un número que elevado al cuadrado de como resultado −1: el famoso número i.
Tal como mencionamos en el párrafo anterior, buscamos que el conjunto de números complejos sea una extensión de
los reales que, además, contenga un elemento i que verifique i2 = −1. Esta “ampliación” del conjunto R debemos
realizarla de manera que las operaciones que de suma y multiplicación en este nuevo conjunto sean coherentes
con las que llevamos a cabo en los números reales. Vamos a describir al conjunto C de números complejos de la
siguiente manera:
C = {z = a + bi : a, b ∈ R}
donde establecimos que el nuevo “número” i verifica i2 = −1. Es decir, un número complejo es la suma de un
número real a y de un múltiplo real b de i. Notemos que el conjunto R es efectivamente un subconjunto de C ya que
puede escribirse de la siguiente manera:
R = {z = a + bi ∈ C : b = 0}
Ahora que sabemos qué forma tienen los números complejos, debemos aprender a sumarlos y multiplicarlos.
Como dijimos, estas operaciones tienen que coincidir con las operaciones que ya conocemos de R cuando estemos
trabajando con números reales vistos como subconjuntos de C:
Definición 68 Dados números complejos z = a + bi, w = c + di ∈ C, definimos la suma y el producto entre
Observemos que la suma de números complejos consiste, simplemente, en sumar entre sí a los números reales
que no están multiplicando a i y, entre sí, a los que están multiplicando a i. Por otro lado, si bien la fórmula del
Álgebra A. El plano complejo. 197
producto de números complejos parece complicada, esta surge de aplicar la propiedad distributiva y recordando que
el número i al cuadrado es −1:
Ejemplo 69
3i − (1 + 2i) = (0 − 1) + (3 − 2)i = −1 + i.
(4 + 5i)(1 + 3i) = 4 − 15 + (12 + 5)i = −11 + 17i.
3,5 = (15 − 0,0) + (0,5 + 3,0)i = 15.
Nos preguntamos ahora, ¿cuáles son los números complejos inversibles? Sabemos que todo número real λ distinto
de 0 tiene inverso: el número λ1 . ¿Qué sucede con un número complejo a + bi distinto de 0? Podríamos proponer
1
como inverso de este número a a+bi ; pero, ¿es esto un número complejo? En realidad, sí lo es, solo que no está
1
escrito de una forma que lo reconozcamos como tal. ¿Cómo podemos hacer para reescribir a+bi de la manera como
a−bi
definimos a los números complejos? Pues multiplicamos esta expresión por a−bi , ¡que es simplemente 1! (por lo
que no la estamos cambiando). ¿Cuál es el resultado de esta cuenta?:
1 a − bi a − bi a − bi a −b
. = = 2 2
= 2 2
+ 2 i
a + bi a − bi (a + bi)(a − bi) a +b a +b a + b2
a
Esta última expresión está escrita en la forma en la que definimos a los números complejos (un números real a2 +b2
b
sumado a un número real − a2 +b 2 multiplicado por i). Verifiquemos que, efectivamente, este número es el inverso
de a + bi:
a −b a −b −b a
(a + bi) + 2 i = a −b 2 + a +b 2 i
a2 + b2 a + b2 a2 + b2 a + b2 a2 + b2 a + b2
a2 + b2 −ab + ab
= 2 2
+ 2
a +b a + b2
= 1 + 0i
= 1
De esta manera podemos concluir que todos los números complejos no nulos son inversibles.
Mostramos la necesidad para definir y trabajar con números complejos (nos brindan soluciones a ecuaciones que no
tienen soluciones reales).
Definimos el conjunto de números complejos junto con su suma y multiplicación, estudiamos sus propiedades y
vimos que eran coherentes con las operaciones de los números reales.
Vimos que todos los números complejos no nulos son inversibles y estudiamos una manera de calcular dicho inverso.
conveniente pensar un número complejo z = a + bi como el vector (a, b) ∈ R2 . Este proceso nos permite obtener
una representación gráfica de los números complejos e interpretar geométricamente las operaciones de suma y
producto.
Podemos, entonces, identificar un número complejo a + bi con el vector (a, b) ∈ R2 . Es decir, la primera coordenada
del vector asociado corresponde a la componente real que no multiplica al número i, y la segunda coordenada, a
la componente real que multiplica i. Esta identificación es biyectiva: a cada número complejo le corresponde un
único vector de R2 y, a cada vector de R2 , le corresponde un único número complejo. Cuando pensemos a R2
representando a los números complejos, lo llamaremos el plano complejo.
Observación 44 Notemos que, el vector de R2 que le corresponde a la suma z + w de los números complejos
z, w ∈ C, es el vector que se obtiene al sumar los vectores asociados a z y w. Es decir, si (a, b) es el vector
asociado a z y (c, d) el vector asociado a w, entonces el vector asociado a z +w es (a, b)+(c, d) = (a+c, b+d).
Por otro lado, el vector asociado al producto zw es (ac − bd, ad + bc).
y escribiremos a = Re(z), b = Im(z). Siempre que un número complejo esté escrito de esta manera, diremos
que está en forma binómica.
Ejemplo 70
Para z = 4 + 3i, ¿cuánto valen Re(z), Im(z)? Como z ya está en forma binómica, podemos ver directamente
que Re(z) = 4, Im(z) = 3.
Si ahora z es z = i(3 + 2i)2 , para hallar Re(z), Im(z), primero necesitamos ponerlo en forma binómica.
Desarrollemos el cuadrado:
Ahora efectuamos la multiplicación de los dos números complejos que nos quedaron y obtenemos
z = −12 + 5i
que resulta la forma binómica de z. Por lo tanto, la respuesta es Re(z) = −12, Im(z) = 5.
Importante Notemos que las partes real e imaginaria de un número complejo siempre son números reales. Por
ejemplo, Im(i) = 1 y no i.
Álgebra A. El plano complejo. 199
Un punto importante, que quizás escapa a primera vista, es que llevar números complejos a su forma binómica
nos permite decidir si dos números dados son iguales. ¿De qué manera? Es claro que, si z = 2i, w = 2i, entonces
z = w. Pero si fuera z = 2i(4 + i) y w = i(8 − 2i), no es tan inmediato responder si z = w o z 6= w. Sucede que
dos números complejos z y w son iguales sí, y solo sí,
Dado que tenemos que z = 2i(4 + i) = −2 + 8i y w = i(8 − 2i) = 2 + 8i. Como Re(z) = 2 6= −2 = Re(w),
podemos afirmar que z 6= w.
Traducir la igualdad de números complejos en términos de partes real e imaginaria es una herramienta más poderosa
de lo que parece. Veamos un ejemplo de esto.
Ejemplo 71
Supongamos que queremos averiguar cuáles son los números complejos z que satisfacen (3 + i)z = 4 − 2i.
Llamemos z = a + bi, con a, b ∈ R, y operemos:
Por lo tanto, tenemos que (3 + i)z = 4 + 2i sí, y solo sí, 3a − b = 4 y a + 3b = −2. ¡Este es un sistema de
ecuaciones lineales con coeficientes reales! Es fácil calcular que las soluciones son a = 1 y b = −1.
Busquemos ahora los números complejos z tales que Re(z(1 − 2i)) + 4i = zIm(z). Escribimos z = a + bi,
con a, b ∈ R, y reemplazamos en la ecuación original. El lado izquierdo de la igualdad queda:
a + 2b = ab y b2 = 4
4
De aquí, vemos que b = 2 o b = −2. En el primer caso, a = 4 y, en el segundo caso, a = 3
. Concluimos,
4
entonces, que hay dos soluciones a la ecuación original: z1 = 4 + 2i y z2 = 3
− 2i.
Norma de un número complejo. Una propiedad importante que conocíamos de los vectores en R2 es su longitud,
que llamamos en general norma. En el caso de un número complejo z = a + bi, llamaremos módulo a la norma del
vector de R2 asociado.
Definición 70 Dado un número complejo z = a + bi en forma binómica, su módulo es el número real
√
|z| = a2 + b2 . Gráficamente, este número representa la longitud del vector de R2 asociado al número complejo
z.
Ejemplo 72
√
El módulo del número complejo z = 2i es |z| = 02 + 22 = 2. Esto es claro si pensamos que el vector asociado
200 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
a z es (0, 2).
¿Cuál es el módulo de zw, donde z = 3 + 2i y w = −1 + 5i? Hallemos la forma binómica de zw:
Como el módulo de un número complejo se define a partir de su representación en el plano, entonces sus propiedades
con relación a la suma y a la multiplicación por escalar real son las mismas que para la de la norma de vectores
en R2 . Sin embargo, los números complejos pueden multiplicarse entre sí (operación que no está definida para
vectores). Nos preguntamos, ¿existe alguna propiedad que verifique el módulo respecto del producto de números
complejos? La respuesta es sí, y dado que conciste en hacer las mismas cuentas que ya hicimos, se las dejamos para
desarrollar en el siguiente experimento.
Experimento 44 Sean z = a + bi y w = c + di. Muestren que |zw| = |z||w| (o sea, el módulo del producto
Comentamos en el párrafo anterior que, para un número complejo a + bi, el número a − bi es de mucha importancia.
Entre otras cosas, este número está relacionado sutilmente con el módulo. Lo definimos a continuación:
Definición 71 Dado un número complejo z = a + bi, escrito en forma binómica, definimos el conjugado de z,
Notemos que, si (a, b) es el vector asociado a z, entonces (a, −b) es el vector asociado a z. Gráficamente, z es el
simétrico de (a, b) respecto del eje x.
Ejemplo 73
Veremos que el conjugado de un número complejo z aparece muchas veces relacionado a propiedades de z. El
siguiente experimento muestra algunas de las mismas.
Experimento 45
1. Consideren z = 2 + 3i. Calculen zz. ¿Qué relación tiene este producto con |z|? ¿Y para un número
complejo en general?
2. Verifiquen las siguientes propiedades de la conjugación para números complejos z, w:
z=z
z + w = z + w.
zw = z w.
z + z = 2Re(z), z − z = 2Im(z).
|z| = |z|.
Observemos que, del experimento anterior, podemos deducir que todo número complejo distinto de 0 es inversible.
z
Más aún, podemos calcular directamente el inverso por medio de z −1 = 2 .
|z|
Ejemplo 74 Calculemos z −1 para z = (3 + i). De acuerdo a la fórmula que acabamos de ver necesitamos, en
√ √
primer lugar, hallar |z| y z. Por un lado |z| = 32 + 12 = 10. Por otro lado, z = 3 − i. Por lo tanto, tenemos
−1 3−i 3 1
z = 10
= 10
− 10
i.
¿Qué más nos permite hacer el módulo de números complejos? Podemos medir la distancia entre dos números
complejos z, w de la misma manera que hacíamos con los vectores de R2 .
Definición 72 Dados dos números complejos z y w, definimos la distancia entre z y w como el número real
|z − w|.
Por supuesto, la distancia entre z y w es, simplemente, la distancia en el plano complejo entre sus vectores asociados.
Ejemplo 75
¿Cuál es el conjunto C = {z ∈ C : |z − (3 + i)| = 2}? Pues son los números que distan en 2 unidades del
número 3 + i. Gráficamente, en el plano complejo, C es la circunferencia de radio 2 y centro (3, 1).
Consideremos ahora el conjunto L = {z ∈ C : |z − 1| = |z − i|}. ¿Qué significa la condición que define al
conjunto? Los elementos de L son los números complejos que distan de 1 lo mismo que de i. Gráficamente, en el
plano complejo, son los puntos que distan de (1, 0) en lo mismo que de (0, 1). Si lo pensamos un rato, podemos
convencernos de que este conjunto es una recta (que pasa por 0). Hagamos el cálculo formal para confirmarlo.
Tomemos z ∈ L y escribamos z = a + bi. Si reemplazamos en la ecuación que define a L, tenemos:
|a + bi − 1| = |a + bi − i|
(a − 1)2 + b2 = a2 + (b − 1)2
Si expandimos los cuadrados y operamos, descubrimos que la igualdad de arriba equivale a a = b. Concluimos
que un número complejo z = a + bi pertenece a L sí, y solo sí, a = b, es decir, es de la forma a + ai. Podemos
entonces escribir:
L = {a + ai : a ∈ R} = {a(1 + i) : a ∈ R}.
Esto nos dice que L consiste en todos los números complejos múltiplos de 1 + i. Gráficamente, el vector asociado
a 1 + i es el (1, 1), por lo que, visto en el plano complejo, el conjunto L es el conjunto
L = {a(1, 1) : a ∈ R}.
Dado que hay una identificación natural entre los vectores de R2 y los números complejos, ¿cómo se traducen las
transformaciones geométricas que vimos en el capítulo anterior en el lenguaje de números complejos? En este
apartado las estudiaremos.
Empecemos por las traslaciones. Una de las transformaciones más simples en R2 consiste en “trasladar” un vector
~v por medio de otro vector w
~ = (a, b). Por ejemplo, si a y b son números positivos, esto consiste en desplazar al
vector ~v en a unidades a la derecha y en b unidades hacia arriba. La fórmula de la traslación Tw~ : R2 → R2 por el
vector w
~ está dada por:
Tw~ (x, y) = (x + a, y + b) = (x, y) + (a, b)
Si pensamos en la misma transformación en el plano complejo, esta consiste en sumar, a un número complejo dado,
el número w = a + bi. Es decir, la traslación Tw : C → C por un número complejo w = a + bi está dada por:
Tw (z) = z + w = z + (a + bi)
Como vimos en el capítulo anterior, una homotecia consiste en cambiar la longitud de cada vector multiplicándolo
por un número r > 0 fijo, llamado la razón de la homotecia. Si r < 1, la homotecia de razón r “acorta” vectores y,
si es r > 1, los “alarga”. Una homotecia Hr : R2 → R2 de razón r en R2 tiene fórmula:
Una homotecia en el plano complejo se traduce, entonces, a multiplicar por el número complejo r + 0i. Es decir, es
la función Hr : C → C dada por:
Las rotaciones en R2 consisten en girar a cada vector un ángulo fijo en determinado sentido. En el capítulo anterior,
vimos que la rotación Rθ : R2 → R2 de ángulo θ > 0, en sentido contrario a las agujas del reloj, está dada por la
fórmula:
Rθ (x, y) = (x cos(θ) − y sin(θ), x sin(θ) + y cos(θ))
Álgebra A. El plano complejo. 203
Consideremos el número complejo ω = cos(θ) + i sin(θ). ¿Qué características tiene? En primer lugar, su módulo
es 1:
q √
|ω| = cos2 (θ) + sin2 (θ) = 1=1
¡Notemos que el vector asociado a esta última expresión es exactamente Rθ (x, y)! Por lo tanto, concluimos que, en
el plano complejo, la fórmula de rotación de ángulo θ > 0, en sentido antihorario, es:
Rθ : C → C , Rθ (z) = zω,
Importante La deducción que acabamos de realizar muestra una propiedad geométrica muy interesante de los
números complejos: multiplicar por un número complejo de módulo 1 es una rotación por cierto ángulo.
Veamos ahora las simetrías. Recordemos, del capítulo 2, que en R2 teníamos dos tipos de simetrías: respecto de un
punto y respecto de una recta. Para el plano complejo, sólo consideraremos simetrías respecto de puntos. En general,
una simetría S : C → C respecto de un número complejo w es la correspondiente simetría S : R2 → R2 respecto
del vector asociado a w. Por ejemplo, como la simetría S : R2 → R2 respecto del origen de coordenadas tiene por
fórmula a S(x, y) = −(x, y) = (−x, −y), entonces la simetría respecto del número complejo 0 tiene es la función
S(z) = −z. Si bien no desarrollaremos simetrías respecto de rectas, recordemos que ya hemos estado trabajando
con una: el conjungado z de un número complejo z es el simétrico de z respecto de la recta dada por el eje x.
Ejemplo 76
de varias transformaciones sucesivas de las que hemos estudiado. En efecto, lo primero que hace T a un número
complejo z es rotarlo un ángulo de π4 en sentido antihorario; luego, “agranda” el resultado por medio de una
√
homotecia de razón 2. Finalmente, traslada lo obtenido tres unidades a la izquierda.
¿Cuál es la fórmula de la simetría S respecto del número w = 3 + 2i? Veremos que podemos reducir el cálculo
de S(z), para z ∈ C, al caso conocido de la simetría respecto de 0. Notemos que, si realizamos una translación
por el número −w, entonces dos números simétricos respecto de w van a parar, necesariamente, a dos números
simétricos respecto de 0 (pues esta traslación manda w a 0). Como z y S(z) son simétricos respecto de w, esto
dice que:
Tw (z) = z − w = −(Tw (S(z))) = −(S(z) − w) = −S(z) + w
ax2 + bx + c = 0 con a, b, c ∈ R, a 6= 0
son de la forma: √
−b ± b2 − 4ac
2a
El principal aprendizaje de este apartado es que la misma expresión vale para ecuaciones cuadráticas con coeficientes
complejos.
¿Qué es la raíz cuadrada de un número real x > 0? Muchas veces se dice que es “otro número y tal que y 2 = x.”
Pero esta definición no es correcta. Lo que entendemos por “raíz cuadrada de un número real x > 0” es el único
número positivo y tal que y 2 = x. Por ejemplo, si bien tanto 2 como −2 verifican que, al elevarlos al cuadrado,
dan como resultado 4, la raíz cuadrada de 4 es 2. Esta unicidad de la raíz cuadrada y de x es lo que nos permite
√ √
escribirla como y = x: si no convenimos que siempre es positiva, no sabríamos si 4 representa al 2 o al −2.
¿Cómo se traslada la definición de raíz cuadrada a números complejos? Los números complejos no tienen noción de
orden, por lo cual, en particular, no se pueden diferenciar entre positivos (mayores a 0) o negativos (menores a 0).
Por este motivo, en los números complejos, no existe esta unicidad de la raíz cuadrada.
Definición 73 Una raíz cuadrada de z ∈ C es un número complejo w tal que w2 = z.
A diferencia de los reales, donde los números negativos no poseen raíz cuadrada, cualquier número complejo
siempre tiene raíces cuadradas (aunque sea un real negativo). Veremos, de hecho, que siempre tiene exactamente
dos. Analicemos cómo calcularlas “a mano” por medio de algunos ejemplos.
Álgebra A. Ecuaciones cuadráticas. 205
Ejemplos 77
¿Cuáles son las raíces cuadradas de −4? Para que un número complejo w sea una raíz cuadrada de −4 debe
suceder que w2 = −4. Si escribimos w = a + bi, esto se traduce en pedir:
w2 = (a + bi)2 = a2 − b2 + 2abi = −4
Al igualar las partes real e imaginaria, deducimos que a2 − b2 = −4 y 2ab = 0. La segunda condición nos dice
que, o bien a = 0, o bien b = 0. Si a = 0 entonces b2 = 4, de donde b = 2 o b = −2. Concluimos que w = 2i
y 2 = −2i son raíces cuadradas de −4. En el caso que fuera b = 0, entonces debería ser a2 = −4. Pero a ∈ R,
y no hay números reales cuyo cuadrado sea −4. Por lo tanto, todas las raíces cuadradas de −4 son 2i y −2i.
Hallemos todas las raíces cuadradas de z = 4 + 3i. Es decir, busquemos todos los números complejos w tales
que w2 = 4 + 3i. Si, como antes, escribimos w = a + bi, entonces se tiene:
w2 = (a + bi)2 = a2 − b2 + 2abi = 4 + 3i
Esto implica que a2 − b2 = 4 y 2ab = 3. Esta vez, parece más difícil resolver estas ecuaciones simultáneas
3
(notemos que no son lineales). Si despejamos, por ejemplo, a = 2b
de la segunda ecuación y la reemplazamos
2 2
3
en la primera, obtenemos (2b)2
− b = 4. Esto nos dice que debemos buscar un número b que verifique
4 2
9 − 4b = 16b . Si bien esto no es muy difícil (lo aprenderemos a hacer en el capítulo ocho), existe una manera
más fácil de resolver nuestro problema. Observemos que podemos extraer más información de los datos del
problema. En efecto, como el w buscado debe verificar w2 = 4 + 3i, entonces, en particular, |w2 | = |4 + 3i| = 5.
√
Como |w2 | = |w|2 (por Experimento 44), entonces debemos tener |w| = 5. En términos de a y b, esto quiere
decir que a2 + b2 = 5. Esta es una nueva ecuación que nos va a facilitar el despeje los valores de a y b. Tenemos:
a2 − b2 = 4
2ab = 3
a2 + b2 = 5
es una buena idea verificar si la respuesta hallada es efectivamente una solución al problema:
2
3 1 9 1 3 1
w12 = √ + √ i = − + 2 √ √ = 4 + 3i
2 2 2 2 2 2
Por otro lado, notemos que w2 = −w1 , por lo que w22 = (−w1 )2 = w12 = 4 + 3i.
Observación 45 Como muestran los ejemplos anteriores, si z es un número complejo distinto de 0, entonces z
tiene exactamente dos raíces cuadradas y, además, una es la inversa aditiva de la otra.
az 2 + bz + c = 0,
−b + w
z1 , z2 = ,
2a
donde w es una raíz cuadrada (compleja) de b2 − 4ac. El término b2 − 4ac se llama discriminante y se lo nota
∆ = b2 − 4ac. Tengamos en cuenta que, en esta fórmula, no tenemos la necesidad de utilizar el símbolo ±, ya que
sabemos que, si w es raíz cuadrada de b2 − 4ac, también lo es −w.
Ejemplos 78
Hallemos los números complejos z que satisfacen z 2 + 2iz − 3 = 0. Para esto, busquemos las raíces cuadradas
√ √
de ∆ = (2i)2 − 4(−3) = −4 + 12 = 8. Se trata entonces de 8 y − 8. Por lo tanto, las soluciones de la
ecuación son: √ √
−2i + 8 −2i − 8
y
2 2
√ √
Simplificando estas fracciones: 2 − i y − 2 − i.
Encontremos las soluciones de z 2 + (3 + i)z + (1 + 34 i) = 0. Debemos encontrar las raíces cuadradas de:
3
∆ = (3 + i)2 − 4 1 + i = 9 − 1 + 6i − 4 − 3i = 4 + 3i
4
3 1 3 1
w1 = √ + √ i y w2 = − √ − √ i
2 2 2 2
Por lo tanto, las soluciones de la ecuación original son:
−(3 + i) + w1 −(3 + i) + w2
y
2 2
Estudiamos el concepto de “raiz cuadrada” de un número complejo. Vimos que todo número complejo tiene dos
raíces (siendo una la inversa aditiva de la otra) y mostramos cómo hallarlas.
Aprendimos a resolver ecuaciones cuadráticas en los números complejos (utilizando al fórmula resolvente conocida).
En el apartado anterior vimos cómo resolver ecuaciones cuadráticas con coeficientes complejos. ¿Pero qué sucede
con las ecuaciones cúbicas, cuartas o de grados mayores? Supongamos, por ejemplo, que buscamos un número
complejo z que cumpla z 4 = 1. Una manera directa de encarar este problema es plantear un número complejo
Álgebra A. Formas polar y exponencial. 207
genérico z = a + bi (con a, b, ∈ R), calcular (a + bi)4 e intentar despejar a y b. Si hacemos estas cuentas tenemos,
primero:
z 2 = (a + bi)(a + bi) = (a2 − b2 ) + 2abi
Luego,
z 3 = z 2 z = ((a2 − b2 ) + 2abi)(a + bi) = a3 − 3ab2 + (3a2 b − b3 )i
Finalmente,
En este punto, resulta claro que este camino no es muy ameno, tanto por la complejidad de la ecuación como por la
cantidad de cuentas que hay que llevar a cabo para arribar a la misma. Por suerte, hay otra forma mucho más simple
de encarar este problema. Esta consiste en utilizar otra manera de representar números complejos: la forma polar.
Hasta este punto, el único modo que utilizamos para especificar un vector ~v ∈ R2 es por medio de sus coordenadas.
Pero existen otros. Uno consiste en dar la longitud de ~v (su norma) y la inclinación que tiene respecto del semieje
positivo de las x (Figura 7.1, lado izquierdo). Dadas las coordenadas del vector, ya sabemos como calcular su
norma. ¿Cómo encontramos el ángulo de ~v respecto del semieje positivo de las x? Notemos que, si ~v está en el
semiplano superior {(x, y) ∈ R2 : y ≥ 0} (es decir, el semiplano determinado por todos los puntos del plano cuya
coordenada y es mayor o igual a 0) entonces el ángulo buscado es, simplemente, el ángulo θ entre ~v y el vector
(1, 0) (o cualquier vector con extremo en el semieje positivo de las x, en realidad; Figura 7.1, lado izquierdo). Por
otro lado, si ~v está en el semiplano inferior {(x, y) ∈ R2 : y ≤ 0} de los puntos cuya coordenada y es menor o
igual a 0, entonces el ángulo buscado es 2π − θ, donde θ es, nuevamente, el ángulo entre ~v y el (0, 1) (Figura 7.1,
lado derecho).
=
=
Por otro lado, dados la norma y ángulo α respecto del semieje positivo de las x del vector ~v , ¿cómo podemos
hallar las coordenadas a, b de ~v ? Supongamos primero que el vector tiene norma 1. En este caso, es fácil ver que
a = cos(α) y b = sin(α), de forma que ~v = (cos(α), sin(α)). Si ahora ||~v || es cualquier valor, entonces podemos
~
v
considerar el vector w
~= v || ,
||~ que es un vector con la misma dirección que ~v pero de norma 1. Por el razonamiento
208 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
argumento de z, y lo vamos a notar arg(z), al ángulo que forma (a, b) con el semieje positivo de las x. Observar
que 0 ≤ arg(z) < 2π. De esta manera, vale:
z = |z|(cos(arg(z)) + i sin(arg(z)))
Un número complejo escrito de esta manera se dice que está en forma polar. Si |z| = 1, suele omitirse en la
expresión.
Notemos que hemos definido el argumento de un número complejo basados en la fuerte relación geométrica entre C
y el subespacio R2 . Existe, de todas formas, una manera puramente algebraica de especificarlo: el argumento de un
número complejo z = a + bi 6= 0 es el único ángulo arg(z) que satisface, simultáneamente, que arg(z) ∈ [0, 2π),
a b
|z| = cos(arg(z)) y |z| = sin(arg(z)). Esta manera de definirlo no requiere conocimientos de cálculo de ángulos
entre vectores, pero suele involucrar más cuentas.
Observación 46 Si z = |z|(cos(α) + i sin(α)) está dado en forma polar, es muy fácil encontrar sus partes real
e imaginaria. Como z = |z| cos(α) + i|z| sin(α) y, tanto |z| cos(α) como |z| sin(α) son números reales, se tiene
Re(z) = |z| cos(α) y Im(z) = |z| sin(α).
Ejemplos 79
√ √
Hallemos la forma polar de z = (1 − i). En primer lugar, el módulo de z es |z| = 12 + 12 = 2. Por otro
lado, el vector asociado a z en el plano complejo es (1, −1), el cual se encuentra en el semiplano inferior del
plano, por lo arg(z) = 2π − θ, donde θ es el ángulo entre (1, −1) y (1, 0). Este ángulo es;
(1, −1) · (1, 0) 1 π
θ = arc cos = arc cos √ =
||(1, −1)||||(1, 0)|| 2 4
√
Por lo tanto, arg(z) = 2π − π4 = 74 π, y la forma polar de z es 2(cos( 47 π) + i sin( 74 π)).
¿Cuál es la forma polar de z = 3 cos − π4 + i sin − π4 ? A primera vista, podría parecer que este número
ya está escrito en forma polar, pero hay una condición que falla: − π4 no está en el intervalo [0, 2π). Por lo tanto,
esta no es la escritura polar de z. Notemos, sin embargo, que 3 sí es el módulo de z, pues:
r π π r π π √
2
|z| = 9 cos − 2 + 9 sin − = 9 cos2 − + sin2 − = 9=3
4 4 4 4
Ahora, tenemos que Re(z) = 3 cos − π4 y Im(z) = 3 sin − π4 . Como cos(− π4 ) = √12 y sin(− π4 ) = − √12 ,
entonces el vector asociado a z es ( √32 , − √32 ). Este vector está en el semiplano inferior, por lo que arg(z) =
Álgebra A. Formas polar y exponencial. 209
2π − θ, donde θ es el ángulo entre ( √32 , − √32 ) y el (1, 0). Dicho ángulo es:
π 7
Por lo tanto, arg(z) = 2π − 4
= 4
π, y la forma polar de z resulta 3(cos( 74 π) + i sin( 74 π)). Observemos
que el argumento que acabamos de hallar es el mismo que el del ejemplo anterior. Esto no es casualidad, ya
que ( √32 , − √32 ) y (1, −1) forman el mismo ángulo con el semieje positivo de las x (porque son múltiplos).
Como para calcular ángulos no nos importan las longitudes de los vectores involucrados, siempre podemos
reemplazar los vectores por múltiplos convenientes de ellos. En este ejemplo concreto, podríamos haber calculado
el argumento de z utilizando el ángulo entre (1, −1) y (1, 0), cosa que nos hubiera simplificado las cuentas.
√
Busquemos ahora la forma polar de z = −1 + 3i. Un cálculo rápido muestra que |z| = 2. El vector asociado a
√
z es (−1, 3), el cual se encuentra en el semiplano superior. Por lo tanto, el argumento de z es el ángulo entre
√
(−1, 3) y el (1, 0). Dicho ángulo es:
√
(−1, 3) · (1, 0) −1 2
θ = arc cos √ = arc cos = π
||(−1, 3)||||(1, 0)|| 2 3
Observación 47 En el segundo de los ejemplos anteriores, vimos que el número z = 3 cos − π4 + i sin − π4
7 7
tenía por forma polar a 3 cos 4π + i sin 4π . Estas son dos maneras de escribir al mismo número. De
hecho, si reemplazamos el argumento 74 π por cualquier otro número en el cual el seno y coseno tomen el mismo
valor que toma este argumento (en cualquier número de la forma 74 π + 2kπ, para cualquier k ∈ Z), entonces
vemos que existen infinitas maneras de representar al número z. Pero la forma polar es la única expresión de esta
forma que tiene al ángulo entre 0 y 2π. Además, la norma de z no depende del argumento. Por estos motivos,
podemos concluir que: dos números complejos z, w son iguales sí, y solo sí, sus formas polares son idénticas; es
decir, z = w sí, y solo sí, |z| = |w| y arg(z) = arg(w).
Una de las características más importantes de la forma polar de los complejos es la interpretación del producto.
Supongamos que z y w son números complejos no nulos, y sean z = |z|(cos(α) + i sin(α)) y w = |w|(cos(β) +
i sin(β)) sus escrituras en forma polar, respectivamente. Si hacemos el producto entre z y w, se tiene:
i sin(α)) y w = |w|(cos(β) + i sin(β)), para ciertos ángulos α y β (que no necesariamente estén en el intervalo
[0, 2π)), entonces:
zw = |z||w|(cos(α + β) + i sin(α + β))
¡Este resultado es realmente maravilloso! Dice que el módulo de zw es el producto de los módulos de z y w (que ya
sabíamos de antes), pero, también, que el ángulo de zw respecto del eje de las x es la suma de los ángulos de z y
210 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
w. Esto muestra que, gráficamente, el efecto de multiplicar un número complejo z por otro w es el de modificar
el módulo de vector determinado por z en la proporción |w| y rotar el vector determinado por z en el sentido
y magnitud especificada por arg(w). En particular, si multiplicamos a z por un número complejo de módulo 1,
entonces el efecto es simplemente de rotación.
Los siguientes resultados son consecuencia directa del Teorema de De Moivre:
1. z −1 = 1
|z| (cos(−α) + i sin(−α)).
2. z = |z|(cos(−α) + i sin(−α)).
3. z n = |z|n (cos(nα) + i sin(nα)).
Por ejemplo, veamos por qué vale la primera propiedad enunciada en el corolario. Tenemos que verificar que
z −1 = 1
|z| (cos(−α) + i sin(−α)). Si llamamos w = 1
|z| (cos(−α) + i sin(−α)) entonces, por el Teorema de De
Moivre:
1
zw = |z| (cos(α − α) + i sin(α − α)) = 1(cos(0) + i sin(0)) = 1
|z|
Esto demuestra que z −1 = w.
Aun existe otra forma de representar un número complejo. Esencialmente, es equivalente a la forma polar, pero
tiene la ventaja que es más “cómoda” para su notación.
Definición 76 Para un número real x, definimos eix = cos(x) + i sin(x). Usando esta notación, si z es un
número complejo no nulo con forma polar z = |z|(cos(α) + i sin(α)), tenemos que z = |z|eiα . A esta escritura
la llamaremos forma exponencial de z.
¿Qué ganamos con esta nueva escritura? En primer lugar, da una expresión más concisa que la forma polar para
un número complejo. En segundo lugar, nos permite reescribir el Teorema de De Moivre, y sus consecuencias, de
manera que es consistente con la propiedad de la exponencial en R de transformar sumas en productos (es decir, la
conocida identidad ex+y = ex ey para números reales x, y). Enunciamos a continuación la “versión exponencial” de
los resultados y propiedades que vimos para números complejos dados en forma polar. Si z = |z|eiα y w = |w|eiβ ,
entonces:
1. zw = |z|eiα |w|eiβ = |z||w|eiα+iβ = |z||w|ei(α+β) (este es el Teorema de De Moivre).
2. z −1 = 1 −iα
|z| e .
3. z = |z|e−iα .
4. z n = |z|n einα , para cualquier número natural n.
Definimos la forma polar de un número complejo (módulo y argumento) y estudiamos sus propiedades e interpretación
geométrica.
Enunciamos el teorema de De Moivre que establece cómo se obtiene la forma polar de un producto de números
complejos a partir de los módulos y argumentos de los números involucrados.
Introdujimos la forma exponencial de un número complejo.
Álgebra A. Resolución de ecuaciones generales. 211
En el apartado 7.3 estudiamos las raíces cuadradas de un número complejo z, que son los w ∈ C tales que w2 = z,
y vimos que saber calcular raíces cuadradas nos permite resolver ecuaciones cuadráticas generales. En es apartado
vamos a aprender a resolver ecuaciones que tengan grado n mayor a dos y, para ello, en muchas ocasiones será
útil poder encontrar las raíces n-ésimas de un número z, es decir, los w ∈ C tales que wn = z. Esta es una
generalización de la noción de raíz cuadrada a cualquier número natural n. Lo definimos a continuación:
Definición 77 Si n es un número natural, una raíz n-ésima de z ∈ C es un número complejo tal que wn = z.
Observación 50 Así como todo número complejo no nulo tiene, exactamente, dos raíces cuadradas, veremos
que todo número complejo no nulo tiene, exactamente, n raíces n-ésimas distintas.
¿Cómo hacemos para encontrar las raíces n-ésimas de un número complejo z 6= 0 dado? Para empezar a buscar una
manera, pensemos por un momento, la situación “al revés”. Supongamos que sabemos de antemano que w1 y w2
son raíces n-ésimas de z. ¿Qué podemos decir de la relación entre ellas? Observemos que, como w1n = w2n = z
(por definición de “raíz n-ésima”), entonces:
n
w1
=1
w2
w0
Esto dice que, entonces, w1 es una raíz n-ésima del número 1. Además indica que podría haber alguna relación
entre las raíces en n-ésimas de un número complejo cualquiera y las raíces n-ésimas del número 1. Esto no debería
sorprendernos, ya que lo mismo sucede para las raíces cuadradas: si w es una raíz cuadrada de z entonces −w es la
otra; pero −w se obtiene al multiplicar a w por la “otra” raíz cuadrada de 1: −1.
Comencemos entonces, estudiando cuáles son raíces cuadradas del número 1; las llamaremos raíces n-ésimas de la
unidad.
Ejemplos 80
Busquemos las raíces cuartas de la unidad, es decir, los ω ∈ C tales que ω 4 = 1. Lo primero que notamos es que la
norma de ω debe ser 1. Esto se debe a que |ω 4 | = |ω|4 , y el único número real positivo que elevado a la cuarta da
1 es el mismo 1 (de hecho, esto sucede para cualquier potencia n). Por otro lado, como ω = 0 no es una posible
raíz, podemos escribir ω = |ω|(cos(α) + i sin(α)) = cos(α) + i sin(α) (en forma polar). Aquí, hemos escrito
arg(ω) = α y ya hemos hecho el reemplazo |ω| = 1. Si reemplazamos en la ecuación ω 4 = 1 obtenemos, por De
Moivre:
cos(4α) + i sin(4α) = 1
212 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Recordemos que dos números complejos escritos en forma polar son iguales sí, y solo sí, sus módulos coinciden
y sus argumentos coinciden. ¡Pero cuidado! ¡No sabemos si la expresión de ω 4 en esta última igualdad es su
forma polar! Por ejemplo, si α fuera π entonces 4α = 4π, el cual no es un argumento válido. Debemos, entonces,
averiguar cual es realmente el argumento de ω 4 para poder igualarlo a 0 (que es el argumento de 1). Notemos
que, en caso que 4α fuera mayor a 2π deberíamos ir restándole múltiplos de 2π hasta arribar a un número del
intervalo [0, 2π); o si fuera menor a 0, sumándole múltiplos de 2π. Por lo tanto, el argumento de ω 4 será de la forma
4α + k2π para cierto k ∈ Z, donde k representa el múltiplo mencionado, y será positivo o negativo dependiendo de
si hay que sumar o restar el 2π. Ahora que sabemos que arg(ω 4 ) es de esta forma (para cierto k), podemos igualarlo
al argumento de 1 y escribir 4α + k2π = 0. ¿Qué nos dice esta ecuación? Nos dice que el argumento α de ω que
estamos buscando debe ser tal que, al multiplicarlo por 4 y, luego, sumarle un múltiplo de 2π, el resultado debe ser
0. Pero, ¿qué múltiplo? No importa. Alguno. Mientras 4α + k2π sea igual a 0 para cierto k, el α correspondiente
será un argumento válido para el ω que estamos buscando. De hecho, veremos que existen varios múltiplos que
nos servirán, dando lugar a varios posibles argumentos α para ω. Esto no debería soreprendernos, ya que debemos
hallar cuatro raíces n-enésima de la unidad. recién mencionado, el múltiplo k no es importante, y solo nos interesará
hallar los α. Si despejamos la última ecuación que encontramos, obtenemos:
kπ
α=−
2
por lo que α ∈ [0, 2π). Entonces, ¿para qué valores de k ∈ Z vale que − kπ
2 esté en dicho intervalo? Si vamos
π
haciendo la prueba, vemos que para k = 0 queda α = 0, para k = −1 queda α = 2, para k = −2 queda α = π
y para k = −3 queda α = 32 π. Para un k ∈ Z distinto de estos valores, los ángulos determinados caen fuera del
intervalo [0, 2π). Como dijimos antes, no nos importan cuáles son estos múltiplos k; solo nos importan cuáles son
los posibles argumentos α. Hay cuatro posibles argumentos para ω, por lo que encontramos las cuatro raíces cuartas
de la unidad:
ω0 = cos(0) + i sin(0) = 1
ω1 = cos π2 + i sin π2 = i
ω2 = cos 4π 4π
n + i sin n
Álgebra A. Resolución de ecuaciones generales. 213
..
.
2(n−1)π 2(n−1)π
ωn−1 = cos n + i sin n .
2tπ 2tπ
Notemos que los subíndices de los ωt los hemos elegido de manera que ωt = cos n + i sin n .
Sea z ∈ C no nulo. Supongamos que conocemos de antemano una raíz n-ésima de z. Llamémosla η. Por un lado, si
η̃
η̃ es otra raíz n-ésima de z, entonces vimos que η es raíz n-ésima de la unidad. Por otro lado, si ω es una raíz de la
unidad, entonces ωη es una raíz n-ésima de z, pues:
(ωη)n = |{z}
ωn ηn = z
|{z}
=1 =z
Por lo tanto, acabamos de ver que, fijada una raíz n-ésima de z particular, a cada raíz n-ésima de z da lugar a una
raíz n-ésima de la unidad y, a su vez, cada raíz n-ésima de la unidad da lugar a una raíz n-ésima de z. Por lo tanto,
para hallar todas las raíces n-ésimas de z, nos alcanza con encontrar una en particular y, luego, multiplicarla por
cada una de las raíces n-ésimas de la unidad. Ahora, si z = |z|(cos(α) + i sin(α)) es la forma polar de z, entonces
p
una posible raíz n-ésima de z es η0 = n |z|(cos( α α
n ) + i sin( n )) (pueden comprobarlo elevando esta expresión a la
i sin( α+2tπ
n )).
Ejemplo 81 Calculemos las raíces sextas de 1 + i. Por lo visto recién, vamos a necesitar calcular las raíces sextas de
p
la unidad y una raíz sexta de 1 + i particular. Sabemos que una tal raíz es η0 = 6 |1 + i|(cos( α6 ) + i sin( α6 )), donde
√ √
α = arg(1 + i). Como |1 + i| = 2 y α = π4 , entonces η0 = 12 2(cos( 24 π π
) + i sin( 24 )). Por otro lado, las raíces
2tπ 2tπ
sextas de la unidad son los números complejos de la forma ωt = cos 6 + i sin 6 para t = 0, 1, 2, 3, 4, 5. Por
lo tanto, las raíces sextas de 1 + i son:
√ π π
η0 = η0 ω0 = 12 2(cos( 24 ) + i sin( 24 ))
√
12 9π 9π
η1 = η0 ω1 = 2(cos( 24 ) + i sin( 24 ))
√
η2 = η0 ω2 = 12
2(cos( 17π
24
) + i sin( 17π
24
))
√
12 25π 25π
η2 = η0 ω2 = 2(cos( 24 ) + i sin( 24 ))
√
η2 = η0 ω2 = 12
2(cos( 33π
24
) + i sin( 33π
24
))
√
12 41π 41π
η2 = η0 ω2 = 2(cos( 24 ) + i sin( 24 ))
Estos números en general tienen partes reales e imaginarias muy complicadas de escribir, por lo que los dejaremos
expresados en forma polar. Por ejemplo, η0 ≈ 1, 059460329406 + 0, 002420479749i
Vamos a aprender a resolver ecuaciones con coeficientes complejos que incorporan todo lo que aprendimos en la
unidad: raíces n-ésimas, módulos y conjugados. Mostramos las ideas principales de resolución en dos ejemplos.
Busquemos, primero, todos los números complejos z ∈ C que cumplan z 3 = (1 + i)(3 − 2i)3 . Un posible camino
214 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
es llevar a cabo las operaciones indicadas en el lado derecho de la igualdad (es decir, calcular el cubo de 3 − 2i y
multiplicarlo por 1 + i) y, luego, hallar las raíces cúbicas del resultado. Este camino es efectivamente factible, pero
muchas veces se pueden “reordenar” ciertas expresiones para hacer más fáciles los cálculos (o, directamente, nos
lo podemos ahorrar). En este caso, como hay una potencia cúbica a cada lado de la igualdad, pasar el (3 − 2i)3
dividiendo y reescribir:
3
z
=1+i
3 − 2i
z
Esto nos está diciendo que el número 3−2i es una raíz cúbica de 1 + i. Ya sabemos calcular raíces n-ésimas para
cualquier n, así que podemos hallar que las raíces cúbicas de 1 + i son:
√ π
π
η0 = 6 2 cos 12 + i sin 12
√
η1 = 6 2 cos 9π 9π
12 + i sin 12
√
η2 = 6 2 cos 17π 17π
12 + i sin 12
z
Por lo tanto, estas son las tres posibilidades para 3−2i . Si pasamos multiplicando el 3 − 2i hallamos los z buscados:
√ π
π
z0 = (3 − 2i) 6 2 cos 12 + i sin 12
√
z1 = (3 − 2i) 6 2 cos 9π 9π
12 + i sin 12
√
z2 = (3 − 2i) 6 2 cos 17π 17π
12 + i sin 12
Supongamos ahora que queremos hallar todos los z ∈ C que satisfacen z 4 + z 2 (2 − 2i)|z| = 0. Siempre es una
posibilidad plantear z en forma binomial, llevar a cabo las operaciones que indican la ecuación y tratar de despejar
la parte real e imaginaria de z. Pero, como vimos en ejemplos anteriores, en general, la forma binomial no es muy
cómoda a la hora de calcular potencias grandes de números. Elijamos, entonces, la forma polar. Recuerden que la
forma polar de un número complejo está definida sólo para números no nulos, por lo que, siempre que resolvamos
ecuaciones apelando a esta forma, debemos tratar por separado el caso z = 0. En este caso, es claro que z = 0 es
una solución de esta ecuación. Ahora que ya la registramos como posible solución, la dejamos de lado y estudiamos
si alguno de los números no nulos es también solución. Escribimos z = |z|(cos(α) + i sin(α)), con α = arg(z), y
reemplazamos en la ecuación para obtener:
¿Cómo seguimos? Vimos que, por el Teorema de De Moivre, es muy sencillo multiplicar las formas polares de
dos números complejos, pero no hay ningún resultado que nos diga cómo es la suma de este tipo de expresiones.
Sí sabemos cómo lidiar con una igualdad de formas polares: sus módulos y argumentos deben coincidir. Por este
motivo, lo mejor que podemos hacer, en este caso, es pasar uno de los términos de la suma al otro lado de la
igualdad, con el fin de “deshacernos” de la suma y llevar la ecuación a una expesión de igualdad entre formas
polares. Entonces, obtenemos:
Aquí hemos juntado |z|2 con el |z| del final de la expresión y hemos incluido el signo “−” que aparece por haber
pasado restando, dentro del paréntesis del número 2 − 2i (por este motivo aparece −2 + 2i en su lugar). Ahora,
6 0, pues descartamos el caso z = 0, entonces podemos cancelar el |z|3 a ambos lados de la igualdad (lo
como |z| =
√
que deja solo un |z| del lado izquierdo). Por otro lado, −2 + 2i tiene por forma polar a 8(cos( 3π 3π
4 ) + i sin( 4 )),
por lo cual, luego de hacer la multiplicación por (cos(2α) + i sin(2α)), la igualdad nos queda:
√
3π 3π
|z|(cos(−4α) + i sin(−4α)) = 8 cos 2α + + i sin 2 + α
4 4
Álgebra A. Resolución de ecuaciones generales. 215
Esta última, se asemeja a una igualdad de formas polares, pero ya sabemos que no lo es. Los ángulos involucrados
no verifican ser posibles argumentos (pues podrían no estar dentro del rango [0, 2π)). Como este problema lo
tenemos en ambos términos de la igualdad, sería muy complicado relacionar todos los posibles argumentos del
término de la derecha con los posibles argumentos de la izquierda. ¡En este caso, lo más conveniente es volver a
acudir al Teorema de De Moivre! ¿Cómo? ¡Pues podemos pasar dividiendo el término de la derecha! Recordemos
que, al dividir números escritos en forma polar, se resta el argumento del divisor al del dividendo. Por lo tanto,
nuestra ecuación equivale a:
|z| 3π 3π
√ cos −6α − + i sin −6α − =1
8 4 4
Ahora procedemos de manera análoga a cuando hallamos las raíces cuartas de la unidad (en la página 211). No
3π
sabemos si −6α − 4 es un argumento válido ya que no podemos garantizar que caiga en el intervalo [0, 2π). Por
lo tanto, debemos sumarle a esta expresión algún múltiplo entero de 2π para llevarlo a dicho intervalo. Como el
argumento de 1 es 0, entonces al igualar argumentos nos queda la igualdad:
3π
−6α − + k2π = 0
4
En este capítulo vamos a introducir uno de los principales objetos de estudios del Álgebra: los polinomios. Los
polinomios poseen una estructura algebraica muy rica que es similar a la teoría de números enteros (mejor
conocida como Teoría de números) y aparecen prácticamente en todas las ramas de la Matemática. En este curso,
estudiaremos los resultados más relevantes de esta teoría.
Los polinomios suelen ser considerados como un tipo especial de funciones reales. Si bien esta interpretación es
válida, los polinomios poseen una estructura muy regular, lo que permite realizar operaciones entre ellos y tratarlos
como objetos algebraicos. Los polinomios constan de una única variable x, que es elevada a distintas potencias, cada
una de estas potencias es multiplicada por una constante (número) y, finalmente, todos estos términos son sumados
entre sí. Si lo relacionamos con la noción de combinación lineal que estudiamos en el capítulo 3, se lo puede
pensar como una combinación lineal de potencias de x. Veremos más adelante que esta interpretación es, de hecho,
bastante acertada. La importancia de los polinomios desde el punto de vista algebraico, es que admiten operaciones
conocidas, como la suma, multiplicación y división, y, en cada caso, el resultado vuelve a ser un polinomio. En este
sentido, el conjunto de estas funciones no es simplemente un conjunto, sino que es lo que se conoce como un anillo
218 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
de la forma:
P (x) = an xn + an−1 xn−1 + ... + a2 x2 + a1 x + a0 ,
donde los a0 , . . . , an son números complejos. Si todos los ai son números reales, decimos que P (x) es un
polinomio con coeficientes en R y si todos los ai son racionales, que P (x) es un polinomio con coeficientes en
Q. El índice i más grande tal que ai 6= 0 se llama el grado del polinomio y se nota gr(P ).
Las constantes a0 , a1 , ..., an se llaman coeficientes del polinomio. Al coeficiente a0 se le da el nombre de término
independiente y al coeficiente an , el de coeficiente principal. Cuando el coeficiente principal es 1, al polinomio se le
llama mónico. El conjunto de polinomios con coeficientes complejos se nota C[x], el de polinomios con coeficientes
reales, R[x], y el de polinomios con coeficientes racionales, Q[x]. Por supuesto, Q[x] ⊂ R[x] ⊂ C[x].
Importante En general, vamos a usar K para representar alguno de los conjuntos numéricos Q, R o C, de
forma que K[x] representará el conjunto de polinomios con coeficientes en K. De esta manera, vamos a poder
enunciar resultados de manera más sencilla (utilizando el K), en lugar de tener que escribir un enunciado para
cada conjunto numérico Q, R o C.
Ejemplo 82
P (x) = 1 es un polinomio donde el único coeficiente no nulo es el término independiente (no aparece explícita-
mente la variable x). En general, un polinomio P (x) = λ ∈ C, con λ 6= 0, se llama polinomio constante. El
grado de un polinomio constante es 0.
Observemos que, en el caso de los polinomios constantes, hemos descartado la posibilidad que la constante sea el
0. El polinomio P (x) = 0 es un polinomio especial que se llama polinomio nulo y no tiene grado. Entenderemos
esta diferenciación con los polinomios constantes cuando veamos el producto de polinomios.
Q(x) = 2x − 5 es un polinomio de grado 1. Su coeficiente principal es 2 y su término independiente es −5. A
los polinomios de grado 1 se los llama polinomios lineales.
R(x) = − 25 x2 − 3x + 7 es un polinomio de grado 2. Su coeficiente principal es − 25 y su término independiente
es 7. A los polinomios de grado 2 se los llama polinomios cuadráticos. Tengamos en cuenta que las ecuaciones
cuadráticas que estuvimos resolviendo en el apartado 3 del capítulo anterior, son precisamente polinomios
cuadráticos en C[x].
N (x) = x4 +1 y M (x) = 3x4 −2x3 +5x2 −x son polinomios de grado 4. El primero es mónico (su coeficiente
principal 1); el segundo, no. Consideremos que el término independiente de M (x) es 0.
S(x) = x3 − 3ix2 + (1 − 2i)x + 7i es un polinomio con coeficientes complejos. A diferencia de los ejemplos
anteriores, este polinomio no está en R[x].
podemos considerar los números complejos como contenidos en los polinomios con coeficientes complejos; es
decir, C ⊂ C[x]. La identificación, por supuesto, es interpretar a C como el conjunto de polinomios constantes;
es decir, C = {an xn + · · · + a1 x + a0 ∈ C[x] : an = an−1 = · · · = a2 = a1 = 0}. De la misma manera,
podemos considerar R ⊂ R[x] y Q ⊂ Q[x].
Álgebra A. ¿Qué es un polinomio?. 219
Comentamos en el comienzo del capítulo que los polinomios se pueden sumar, multiplicar e, inclusive, dividir.
Primero veamos suma y resta de polinomios. Para sumar (o restar) dos polinomios, se agrupan los términos
de igual grado y se suman (o restan) sus coeficientes. Por ejemplo, si P (x) = 2x4 − 5x3 + x − 7 y Q(x) =
6x4 + x3 − 2x2 − 6x + 9, el polinomio P (x) + Q(x) se calcula:
Prosigamos con Multiplicación de polinomios. Para multiplicar dos polinomios, basta aplicar la propiedad distributiva
y las leyes de la multiplicación y de las potencias. Es decir, se multiplica cada término de uno de los polinomios por
cada término del otro y se suman todas estas multiplicaciones. Por ejemplo, para P (x) = 2x4 − 5x3 + x − 7 y
Q(x) = 2x2 − x + 1, el producto P (x)Q(x) se calcula:
tienen grado, entonces ninguno es el polinomio nulo). Este experimento explica, en parte, la diferenciación que
hacemos entre los polinomios constantes (de grado 0) y el polinomio nulo (que no tiene grado).
Igualdad de polinomios. ¿Cuándo dos polinomios son iguales? Cuando tienen el mismo grado y sus coeficientes
coinciden término a término. Es decir, decimos que el polinomio P (x) = an xn + · · · + a1 x + a0 es igual al
polinomio Q(x) = bn xn +· · ·+b1 x+b0 si ai = bi para todo i entre 0 y n. Por ejemplo, los polinomios x2 +3x−2 y
x3 +x−1 no son iguales porque tienen distinto grado. También, los polinomios x3 −4x2 −x+9 y x3 −4x2 +3x+9
son distintos, pues el coeficiente que acompaña a x en el primero es −1, mientras que en el segundo es 3.
Una característica a tener en cuenta es lo que se denomina evaluación de polinomios. Un hecho importante sobre los
polinomios es que se los puede evaluar en números (racionales, reales, complejos). Esto da lugar a una función (que
es, seguramente, la manera más común de considerarlos). Por supuesto, la evaluación de un polinomio P (x) ∈ K[x]
en un número b ∈ C consiste simplemente en reemplazar la indeterminada x por el número b en la expresión del
polinomio y llevar a cabo la cuenta indicada por el polinomio. Por lo tanto, evaluar un polinomio da como resultado
220 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Por ejemplo, si P (x) = x3 − 4x2 + 3x + 9, entonces P (−2) = (−2)3 − 4(−2)2 + 3(−2) + 9 = −21.
Un monomio es un tipo especial de polinomio que solo tiene un coeficiente que no es cero. Dicho de otra manera,
un monomio es un polinomio de la forma P (x) = axn con a 6= 0. La importancia de los monomios es que todo
polinomio es una suma de monomios.
De hecho, la expresión polinomio expresa que es un objeto que consta de varios monomios. Cabe aclarar que
los polinomios constantes se consideran monomios de grado 0 (pues a = ax0 ). Veremos, más adelante, que los
monomios son muy útiles a la hora de llevar a cabo muchas operaciones. Esto no debería sorprendernos, ya que
sumando monomios podemos “generar” todos los polinomios.
La palabra “generar” utilizada en la última oración no es casualidad. Sucede que C[x] también es un espacio
vectorial (donde la suma es la suma de polinomios y el producto por escalar es el producto de un polinomio
por otro polinomio constante). Un sistema de generadores natural para el espacio de todos los polinomios
consta de los monomios de todas los grados: {1, x, x2 , x3 , . . . , xn , . . .}. Noten que, pensado de esta manera,
los polinomios son precisamente las combinaciones lineales de los monomios.
Definimos a los polinomios como objetos algebraicos y las operaciones entre polinomios (suma y multiplicación).
Vimos que estas operaciones cumplen propiedades idénticas a las operaciones con números reales o complejos.
Determinamos cuándo dos polinomios son iguales y desarrollamos la idea de evaluar un polinomio en un número.
Definimos los monomios como los polinomios de la forma axn .
El algoritmo de división.
Teorema del resto.
La división de polinomios se define de manera análoga a la división entre números enteros. ¿Qué hacíamos para
dividir dos números enteros? Pues dividir a ∈ Z por b ∈ Z consistía en encontrar enteros q, r ∈ Z tales que
a = qb + r para 0 ≤ r < b. El número q se llamaba el cociente de la división y el número r el resto. También, el
número a era el dividendo y el número b el divisor. El propósito de dividir el número a por b es ver cuántas veces
“entra” en a el número b (dado por el cociente q) y, si no entra “justo”, cuánto “sobra” antes de poder completar
a (el resto r). El hecho que pidamos que el resto sea mayor a cero y menor que el divisor hace que haya únicos
Álgebra A. División de polinomios. 221
enteros q, r ∈ Z que verifiquen a = qb + r. Por ejemplo, la división de 572 por 12 tiene por cociente q = 47 y
por resto r = 8. En efecto, 572 = 12,47 + 8 y el resto 8 es mayor a cero y menor que 12. Conocemos ya desde la
escuela primaria una manera de llevar a cabo a mano la división de dos números enteros, ¡y la manera de hacerlo
con polinomios es prácticamente igual! De hecho, veremos que en cierta forma es mucho más sencillo.
Primero, veamos a qué nos referimos específicamente con “división de dos polinomios”. Consideremos el siguiente
teorema:
Teorema 52 Dados polinomios P, Q ∈ K[x], con Q 6= 0, existen únicos polinomios C y R en K[x] tales que:
P = QC + R y
o bien, R = 0 (el polinomio nulo) o bien, gr(R) < gr(Q).
Notemos que el Teorema 52 es un resultado análogo a lo que vale en el caso de los números enteros: el cociente de
la división de P por Q nos dice cuantas veces “entra” el polinomio Q dentro de P y, si no entra “justo”, el resto nos
indica “cuánto le sobra” para entrar justo. Observemos que, también, en lugar de pedir que el resto sea un número
mayor o igual a cero y menor estricto que el divisor, pedimos que el resto sea un polinomio de grado mayor o igual
que cero o menor o igual que el grado del divisor. Esto es porque no hay un orden natural entre los polinomios, pero
sí hay un orden natural entre los grados de los polinomios. A lo largo del texto hablaremos de polinomios “más
pequeños” o “más grandes”, estas frases deben entenderse como una definición a partir del hecho de que dados dos
polinomios, no iguales, el grado de uno es mayor que el del otro. Entonces al mayor se lo denomina “más grande”
mientras que al de menor grado “más pequeño”. El estudiante debe tener en cuenta, mientras lee, que debe llegar a
familiarizarse con estas formas de expresión típicas. También, al igual que el caso de los enteros, el polinomio P (x)
es llamado el dividendo, el polinomio Q(x), el divisor, el polinomio C(x), el cociente y el polinomio R(x), el resto.
Por lo tanto, cuando nos referimos a “hacer la división entre dos polinomios” lo que vamos a querer hallar es el
cociente y el resto de dicha división.
Observación 53 Observemos que si P, Q tienen coeficientes en K entonces su cociente y resto también.
La forma para llevar a cabo el cálculo de la división entre dos polinomios se conoce como Algoritmo de división.
Veamos con un ejemplo cómo se procede. Supongamos que queremos dividir el polinomio P (x) = 3x5 − 2x3 +
7x2 − 2x por el polinomio Q(x) = x3 + 3x2 − 1. Al igual que para números enteros, los ubicamos gráficamente
así:
Vamos a empezar a armar el cociente calculando los monomios que lo constituyen uno a la vez (de hecho, del más
grande al más chico). Lo que debemos hacer es considerar el monomio de potencia más grande del divisor Q (en
este caso es x3 ), el monomio más grande del polinomio que estamos dividiendo (3x5 ) y preguntarnos: ¿por qué otro
monomio debo multiplicar a x3 para “llegar” a 3x5 ? La respuesta es, por supuesto, 3x2 . Este es, entonces, el primer
monomio de cociente.
Y ahora hacemos lo mismo que en la división de enteros: multiplicamos el divisor por el monomio que acabamos de
agregar al cociente y ponemos el resultado debajo del dividendo:
Luego, restamos el dividendo por este nuevo polinomio que ubicamos bajo él:
Es importante tener en cuenta que la idea central en este último punto es la de realizar la resta de dos polinomios,
con lo cual al principio de su aprendizaje tal vez sea útil que, como cálculo auxiliar, escriba explícitamente dicha
operación,
(3x5 − 2x3 + 7x2 − 2x) − (3x5 + 9x4 − 3x2 ) = −9x4 − 2x3 + 10x2 − 2x
¿Qué hemos logrado con este procedimiento? ¡Pues ahora nos quedó un polinomio de menor grado en el sector
donde estaba el dividendo (en este caso, de grado 4)! Esto nos indica que este procedimiento va a ir disminuyendo
los grados de los polinomios bajo el dividendo y, por lo tanto, eventualmente arribaremos a un polinomio de grado
menor al divisor (y habremos terminado el cálculo, pues esta es la característica que buscamos en el resto).
Veamos cómo seguimos. En el lugar del dividendo, nos quedó el polinomio −9x4 −2x3 +10x2 −2x, cuyo monomio
principal es −9x4 . Nos preguntamos nuevamente, ¿por qué monomio tenemos que multiplicar a x3 para llegar a
−9x4 ? La respuesta es −9x. Entonces, sumamos este monomio al cociente:
Hacemos a continuación la multiplicación de este monomio (y solo este monomio) por Q y lo ubicamos debajo del
último polinomio que calculamos:
Como este último polinomio obtenido aún no tiene grado menor al grado del divisor, continuamos. ¿Por qué
monomio tenemos que multiplicar x3 para “deshacernos” del 25x3 ? Por 25 (recuerden que las constantes también
Álgebra A. División de polinomios. 223
Y ahora sí, como en el lugar del dividendo arribamos a un polinomio de grado menor a 3, terminamos con la
división. El resultado obtenido es que el cociente de la división entre P y Q es C(x) = 3x2 − 9x + 25 y el resto
R(x) = −65x2 − 11x + 25. Pueden corroborar que:
¿Qué sucede si el grado del dividendo P es menor que el grado del divisor Q? ¡En este caso la división es obvia!
El cociente es 0 y el resto es P (de forma que P = 0.Q + P ). Notemos que el cociente y el resto, así definidos,
cumplen las condiciones del Teorema 52. Además, la interpretación de este hecho es natural: si gr(Q) > gr(P ),
entonces Q no puede “entrar” siquiera una vez dentro de P , por lo que el cociente es 0. Les dejamos para pensar en
el siguiente experimento otra situación especial del algoritmo de división.
mismo grado?
Veamos otro ejemplo del algoritmo de división. Supongamos que queremos hacer la división entre P (x) =
−x3 + 12x2 − 47x + 60 por Q(x) = x − 4. Escribimos todo junto el procedimiento.
En este caso, el resto es el polinomio 0, lo que nos dice que P (x) = Q(x)(−x2 + 8x − 15). Esto es análogo al caso
cuando obteníamos resto 0 en la división de número enteros. Por ejemplo, el resto de dividir 455 por 13 es 0, lo
que quiere decir que 455 es múltiplo de 13 (o que 13 divide a 455). De la misma manera, se dice que un polinomio
Q(x) divide a P (x), o que el polinomio P (x) es divisible por el polinomio Q(x), si el resto de la división entre
P (x) y Q(x) es el polinomio nulo R(x) = 0. Veremos al final de la unidad cómo descomponer a los polinomios
como producto de sus divisores más pequeños (llamados factores).
En algunas situaciones, existe una manera de conocer el polinomio resto con antelación a efectuar la división entre
dos polinomios. Y esto resulta útil dado que se puede conocer si la división será exacta (es decir, con resto 0) sin la
224 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
necesidad de efectuarla. El Teorema del resto permite averiguar el valor del resto de la división entre un polinomio
P (x) por otro polinomio de la forma Q(x) = x − a, con a ∈ C, sin necesidad de hacer la división.
Teorema 54 — Teorema del resto. El resto de dividir el polinomio P (x) ∈ K[x] por el polinomio x − a, con
a ∈ C, es igual a P (a).
Observemos que, como estamos dividiendo por un polinomio de grado 1, entonces el resto de la división entre
P (x) y x − a será el polinomio nulo o un polinomio constante. Lo que dice el teorema es que esta constante será
precisamente el número P (a). La demostración de este hecho no es complicada: si C(x) y R(x) son el cociente y el
resto, respectivamente, de la división entre P (x) y x−a, entonces P (x) = (x−a)C(x)+R(x). Si ahora evaluamos
al polinomio P (x) en x = a, resulta: P (a) = (a − a)C(a) + R(a) = R(a). Como R(x) es un polinomio nulo o
un polinomio constante, entonces toma el mismo valor cualquier número en lo que lo evaluemos. En particular,
R(x) = R(a), que es lo que queríamos demostrar.
Como el divisor es de la forma x − a, entonces podemos usar el Teorema del resto y hallar que el resto es P (3) =
33 − 5(32 ) + 6,3 = 27 − 45 + 18 = −18 + 18 = 0.
Estudiamos cómo dividir polinomios (de manera análoga a la división de números enteros).
Introducimos el concepto de que un polinomio P sea divisible por otro Q (que el resto de la división de P por Q sea
el polinomio nulo).
Enunciamos y demostramos el Teorema del resto, que nos dice cuál es el resto de la división de un polinomio P por
un polinomio de la forma x − a.
8.3 Raíces
Estudiemos, ahora, cómo hallar los ceros de los polinomios; esto es, los números que, al evaluarlos en el polinomio,
lo anulan.
En este apartado estudiaremos...
Ya sabemos que las ecuaciones cuadráticas que resolvimos en el capítulo anterior son, en realidad, ecuaciones
polinomiales (determinadas por un polinomio de grado 2). Probablemente ya estén al tanto de que los ceros de una
ecuación cuadrática se llaman también raíces de la ecuación. Este concepto de raíz es común a todos los polinomios
y, ahora, vamos a definirlo de manera general.
Álgebra A. Raíces. 225
Es decir, las raíces son los números donde el polinomio se anula. Notemos que, según el Teorema del resto, el resto
de la división entre P (x) y x − a se obtiene como P (a). En particular, si el resto de esta división es 0 ∈ C[x],
entonces P (a) = 0. Esto quiere decir que x = a es raíz del polinomio P (x). Por otro lado, si x = a es raíz de
P (x), entonces P (a) = 0 (por definición de raíz). El Teorema del resto nos dice que el resto de dividir P (x) por
x − a es, entonces, P (a) = 0, por lo que concluimos que x − a divide a P (x). Hemos hallado, así, que vale la
siguiente propiedad:
Importante Un número a ∈ C es raíz del polinomio P (x) si, y solo si, x − a divide a P (x).
Experimento 50 Supongan que el polinomio Q(x) divide al polinomio P (x). ¿Qué relación hay entre las
Supongamos ahora que a y b son raíces distintas del polinomio P . Esto, en particular, nos dice que tanto x − a
como x − b dividen a P . ¿Es cierto que el polinomio cuadrático (x − a)(x − b) = x2 − (a + b)x + ab también
divide a P ? ¡Sí! Como x − a divide a P (x) entonces P (x) = (x − a)Q(x) para cierto polinomio Q(x). Ahora,
como b es raíz de P , entonces P (b) = 0. Pero P (b) = (b − a)Q(b). Como estamos suponiendo que b 6= a, entonces
b − a 6= 0, por lo que, para que (b − a)Q(b) = 0, debe ser Q(b) = 0. Esto nos dice que b es raíz de Q(b) y, por
lo tanto, (x − b) divide a Q. Entonces, podemos escribir Q(x) = (x − b)R(x) para cierto polinomio R. De esta
manera, hallamos que
Observemos que, si seguimos repitiendo el razonamiento para R(x), podemos probar que, si tenemos varias raíces
distintas λ1 , . . . , λt de P (x), entonces el producto (x−λ1 )(x−λ2 ) . . . (x−λt ) divide a P (x). Lo dejamos asentado
en el siguiente lema.
Lema 55 Si varios polinomios de la forma x − λ1 , . . . , x − λt dividen a P y todos los λi son distintos entre sí,
entonces el producto (x − λ1 ) . . . (x − λt ) también divide a P .
Encontrar raíces de polinomios es un problema central del Álgebra y el Análisis Matemático. Ahora bien, ¿cómo
encontramos las raíces? La primera observación que podemos hacer es que ya sabemos cómo encontrar las raíces
de polinomios lineales y cuadráticos. En efecto, para un polinomio lineal a1 x + a0 (con a1 6= 0) solo debemos
despejar x de la ecuación a1 x + a0 = 0. O sea, la única raíz es x = − aa01 . Por otro lado, a un polinomio cuadrático
a2 x2 + a1 x + a0 (con a2 6= 0), también sabemos calcularle las raíces: utilizamos la fórmula resolvente:
p
−a1 + a21 − 4a2 a0
x1 , x2 =
2a2
para la cual ya vimos, en el capítulo anterior, que siempre tiene dos soluciones en los números complejos. Para
polinomios de grados mayores, ya no tenemos procedimientos o fórmulas directas para hallar las raíces. La estrategia
general es ir hallando progresivamente las raíces de un polinomio P (x) de la siguiente manera:
Conseguir (de alguna manera) una raíz a ∈ C de P (x).
Como sabemos que x − a divide a P (x), hallar el cociente C(x) de dicha división, de manera que P (x) =
(x − a)C(x). Recuerden que C(x) tiene grado menor a P (x).
226 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Si C(x) tiene grado 1 o 2, calcular, usando las fórmulas conocidas, las raíces de C(x) (que también son raíces
de P (x)). Si el grado de C(x) es mayor a 2, repetir el procedimiento para C(x).
Notemos que esta estrategia pide conseguir una raíz de alguna manera para comenzar. Algunas veces, las raíces se
pueden identificar rápidamente (por ejemplo, si el polinomio no tiene término independiente entonces x = 0 es raíz)
y otras veces son datos del problema. El siguiente teorema, debido a Gauss, nos permite anticipar las posibles raíces
racionales de un polinomio con coeficientes enteros.
Teorema 56 — Teorema de Gauss. Sea P (x) = an xn + · · · + a1 x + a0 con an , . . . , a1 , a0 ∈ Z. Si el número
p p
racional q es raíz del polinomio (q 6= 0), siendo q una fracción irreducible, entonces p divide a a0 y q divide a an .
En particular, si P (x) es un polinomio mónico (el coeficiente principal an = 1), las posibles raíces racionales
del polinomio son los divisores del término independiente a0 .
Es importante remarcar que este teorema no nos dice que un polinomio con coeficientes enteros tiene raíces
racionales. Lo que dice es que, de existir raíces racionales, estas deben forzosamente ser de una manera determinada.
Es decir, “si tiene, son de esta forma”. Es por esta razón para determinar si tiene raíces racionales, debemos probar
con los números racionales que tienen la forma anticipada por el teorema. Pero podría ser que ninguno sea raíz, y
por lo tanto, el polinomio en cuestión no tendría raíces racionales (solo reales y complejas).
Ejemplos 84
Consideremos el polinomio P (x) = x3 − 3x2 − 2x + 6. Como tiene coeficientes enteros, el Teorema de Gauss
nos indica que, de tener una raíz racional pq , debe suceder que p debe dividir al término independiente 6 y q debe
dividir al coeficiente principal 1. En este caso, las únicas posibilidades para q son 1 y −1. Por otro lado, las
posibilidades para p son los posibles divisores de 6: 1, −1, 2, −2, 3, −3, 6, −6. Probando con todos encontramos
que P (3) = 0. Hemos hallado, entonces, una raíz racional (de hecho, entera) de P (x).
Consideremos ahora el polinomio Q(x) = 2x4 − 10x2 + 12. Nuevamente, como tiene coeficientes enteros,
podemos utilizar el Teorema de Gauss para ver si tiene alguna raíz racional pq . En este caso, p debe dividir a 12 y
q a 2. Las opciones para q son 1, −1, 2, −2 y las opciones para p son 1, −1, 2, −2, 3, −3, 4, −4, 6, −6, 12, −12.
p
Por lo tanto, todas las posibles opciones para q
se obtienen eligiendo un numerador p entre las doce opciones
disponibles y un denominador q entre las cuatro opciones disponibles. Esto da un total de 12,4 = 48 posibles
opciones a considerar. Sin embargo, hay muchas combinaciones que dan como resultado el mismo número
1 −1 4
racional. Por ejemplo, −1
y 1
; o 2
y 21 . Al mirar con detenimiento se puede advertir que las opciones que hay
que chequear son las siguientes:
p 1 1 3 3
= 1, −1, 2, −2, 3, −3, 4, −4, 6, −6, 12, −12, , − , , − .
q 2 2 2 2
Al verificar todas estas posibilidades, no se encuentra ningún número que anule al polinomio. Por lo tanto, P (x)
no tiene raíces racionales.
√
Un dato interesante sobre el Teorema de Gauss es que proporciona una demostración del hecho que 2 no es
√
un número racional. En efecto, consideremos el polinomio P (x) = x2 − 2. Claramente, 2 es raíz de P (x).
√
Pero 2 no puede ser racional pues el Teorema de Gauss nos dice que, si un racional pq es raíz de P , entonces
p divide a 2 y q divide a 1. Como las únicas posibilidades para q son 1 o −1 entonces una raíz racional pq es en
√
realidad un número entero. Por lo tanto, si 2 fuera racional debería ser un número entero (que sabemos que
no es).
Álgebra A. Raíces. 227
Vamos a ver ahora qué es la multiplicidad de una raíz. Consideremos el polinomio P (x) = x2 − 2x + 1. El Teorema
de Gauss nos dice que las únicas posibles raíces racionales de P (x) son 1 o −1. Es fácil ver que x = 1 es una raíz
P (x). Por lo visto en el apartado 8.3.1, sabemos que x − 1 divide a P (x). Si ahora hacemos la división entre P (x)
y x − 1, hallamos que el cociente de la división es también x − 1. Es decir, se tiene que:
El hecho de que P (x) “sea divisible” dos veces de x − 1 se interpreta diciendo que x = 1 es raíz doble de P (x) o
que es una raíz de multiplicidad 2. Definimos esta noción de manera general a continuación:
Definición 80 Sea P (x) ∈ K[x]. Un número a ∈ C se dice una raíz de multiplicidad k de P (x) si el polinomio
(x − a)k divide a P (x), pero el polinomio (x − a)k+1 , no. Dicho de otra manera, existe un polinomio C(x) tal
que C(a) 6= 0 y P (x) = (x − a)k C(x). Si k = 1, entonces a recibe el nombre de raíz simple y si k > 1, raíz
múltiple.
Ejemplo 85 El polinomio P (x) = x5 + 7x4 + 18x3 + 20x2 + 8x tiene 5 raíces: la raíz x = −2 con multiplicidad
3, la raíz x = −1 con multiplicidad 1 y la raíz x = 0, también con multiplicidad 1. Pueden verificar que P (x) =
(x + 2)3 (x + 1)x.
Si conocen la noción de derivada de una función, podrán advertir que la derivada de un polinomio (visto
como función) es nuevamente un polinomio (de un grado menos). Una definición alternativa del concepto
de multiplicidad es la siguiente: una raíz de P (x) tiene multiplicidad k si también es raíz de los primeros k
polinomios derivados P 0 (x), P 00 (x), . . . , P (k) (x) de P (x), pero no de la derivada (k + 1)-ésima de P (x).
En este punto queremos poder responder la pregunta ¿Cuántas raíces tiene un polinomio? El Teorema de Gauss nos
ayuda a encontrar raíces racionales. En algunos casos las hallamos y en otros, no. Si queremos buscar todas las
raíces de un polinomio, ¿cómo sabemos cuándo parar? ¿Cuántas raíces puede tener un polinomio? ¿Puede no tener
ninguna? No es difícil ver que un polinomio de grado n no puede anularse en más de n números. Se los dejamos
para pensar en el siguiente experimento:
Experimento 51 Sea P (x) ∈ K[x] de grado n. Vamos a ver que P (x) no puede tener más de n raíces.
Si P (x) no tiene raíces, entonces lo que estamos tratando de ver es cierto (si no tiene ninguna raíz, no tiene
más de n). Supongamos que posee al menos una raíz a. Sabemos que x − a divide a P (x) y que, por lo tanto,
P (x) = (x − a)C(x), donde C(x) es el cociente de la división. ¿Qué grado tiene C(x)? Observemos que si,
ahora, C(x) no tiene raíces, entonces, nuevamente, hemos visto que P (x) no tiene más de n raíces. ¿Qué harían
si C(x) tiene al menos una raíz? ¿Cómo seguirían el razonamiento? ¿Cómo concluyen el resultado? Recuerden
el Experimento 50.
Sabemos, entonces, que un polinomio de grado n tiene, a lo sumo, n raíces. Pero, ¿puede haber polinomios sin
raíces? El siguiente teorema, que fue probado por Gauss, contesta esta pregunta. Es llamado (ni más ni menos) el
Teorema fundamental del Álgebra.
Teorema 57 Todo polinomio P (x) ∈ C[x] [Teorema fundamental del Álgebra (TFA)] de grado mayor a cero
En este teorema hemos remarcado que la raíz es compleja (lo que abarca, por supuesto, enteros, racionales y reales)
pues, de lo contrario, el resultado no vale. Por ejemplo, ya vimos que el polinomio x2 + 1 no tiene ninguna raíz real.
228 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Pese a que el TFA habla de la existencia de, al menos, una raíz, podemos, en realidad, dar un enunciado más preciso
de este resultado (que se deduce de este teorema que hemos escrito) y decir cuántas raíces tiene exactamente un
polinomio de grado n.
Teorema 58 [Enunciado equivalente del TFA] Todo polinomio P (x) ∈ C[x] de grado n > 0 tiene exactamente
n raíces complejas (no necesariamente distintas; es decir, contadas con multiplicidad).
Aunque este último enunciado parezca más “fuerte” que el del TFA, ambos teoremas se deducen uno del otro. En
efecto, si vale el enunciado equivalente al TFA, entonces todo polinomio de grado n tiene exactamente n raíces.
Pero esto quiere decir que, en particular, tiene al menos una. Por lo tanto, se tiene que vale el TFA. Les dejamos en
un experimento para que vean que se deduce dicha equivalencia.
Experimento 52 Sea P (x) un polinomio de grado n > 0. Veamos, usando el TFA, que P (x) tiene
exactamente n raíces. Precisamente por el TFA sabemos que P (x) tiene al menos una raíz a ∈ C. Por lo tanto,
x − a divide a P (x) y se tiene P (x) = (x − a)C(x). ¿Qué harían ahora? ¿Cómo seguirían el razonamiento?
Observación 59 Notemos que el Teorema fundamental del Álgebra es un resultado de existencia de raíces: solo
nos dice qué cantidad debemos buscar, pero no nos dice cómo buscarlas.
Ejemplos 86
Hallemos todas las raíces del polinomio P (x) = x4 + 2x3 − 7x2 − 8x + 12. Por el TFA debemos buscar
cuatro raíces. El polinomio P tiene como coeficiente principal 1 y como término independiente 12. Según el
Teorema de Gauss, las posibles raíces son los divisores de 12: 1, −1, 2, −2, 3, −3, 4, −4, 6, −6, 12, −12.
Si evaluamos en x = −1 obtenemos P (−1) = (−1)4 + 2(−1)3 − 7(−1)2 − 8(−1) + 12 = 1 − 2 −
7 + 8 − 12 = −12. Concluimos que x = −1 no es raíz de P (x). Si ahora evaluamos en x = 1 se tiene
P (1) = (1)4 + 2(1)3 − 7(1)2 − 8(1) + 12 = 1 + 2 − 7 − 8 + 12 = 0. Entonces, x = 1 es raíz de P (x).
Haciendo la división de P por (x − 1), obtenemos P (x) = (x − 1)(x3 + 3x2 − 4x − 12). El Teorema de Gauss
puede ser aplicado nuevamente el polinomio de grado 3. Si evaluamos el polinomio Q(x) en x = −2 resulta
Q(−2) = (−2)3 + 3(−2)2 − 4(−2) − 12 = −8 + 12 + 8 − 12 = 0. Haciendo la división de Q(x) y x + 2 se
tiene Q(x) = (x + 2)(x2 + x − 6). Aquí podemos utilizar la fórmula de la resolvente para hallar que las raíces
de x2 + x − 6 son 2 y −3. Concluímos que las raíces de P son 1, −2, 2 y 3.
Busquemos ahora la raíces del polinomio Q(x) = −2x3 −10x2 −2x−10. El TFA nos dice que tiene que tener tres
raíces complejas. Por el Teorema de Gauss, las posibles raíces son 10, −10, 5, −5, 52 , − 52 , 2, −2, 1, −1, 12 , − 12 .
Si evaluamos Q(−5) = −2(−5)3 − 10(−5)2 − 2(−5) − 10 = 250 − 250 + 10 − 10 = 0. Dividiendo Q(x)
por x + 5 obtenemos Q(x) = (x + 5)(−2x2 − 2). Observemos que −2x2 − 2 es un polinomio que no tiene
raíces reales (siempre toma valores negativos, por lo que no se anula en ningún valor de x). Para hallar sus raíces
complejas podemos utilizar la fórmula de la resolvente o, también, simplemente igualar a 0 (que es más directo
en este caso ya que el polinomio no tiene término lineal):
−2x2 − 2 = 0
⇒ −2x2 = 2
⇒ x2 = 2
−2
⇒ x2 = −1
Proposición 60 Si P (x) con coeficientes reales y z ∈ C es raíz de P (x), entonces z también es raíz de P (x).
Ejemplo 87 Supongamos que queremos hallar todas las raíces de P (x) = x4 − 7x3 + 18x2 − 22x + 12 y sabemos
que 1 + i es raíz de P . Como P tiene coeficientes reales, entonces 1 + i = 1 − i también será raíz de P . Luego,
x − (1 + i) y x − (1 − i) dividen a P y, como 1 + i 6= 1 − i, entonces (x − (1 + i))(x − (1 − i)) = x2 − 2x + 2 divide
a P (por Lema 55). Si llevamos a cabo la división, hallamos que P (x) = (x2 − 2x + 2)(x2 − 5x + 6). Finalmente,
podemos calcular las raíces de x2 − 5x + 6 utilizando la fórmula de la resolvente y hallar que todas las raíces de P son
1 + i, 1 − i, 2, 3.
Existen polinomios de grado 2 que no tienen raíces. Analicen si es posible que esto suceda con los polinomios
de grado 3 cuyos coeficientes son números reales.
Definimos qué son las raíces de los polinomios y las clasificamos según su multiplicidad.
Vimos que si a es raíz de P entonces x − a divide a P .
Dimos un procedimiento para encontrar todas las raíces de un polinomio.
Enunciamos el Teorema de Gauss para buscar raíces racionales en polinomios con coeficientes enteros.
Enunciamos el Teorema Fundamental del Álgebra que dice que un polinomio de grado n > 0 tiene necesariamente n
raíces en los números complejos.
La descomposición en factores primos es una herramienta fundamental de la teoría de números enteros. ¿En qué
consiste? Recordemos que un número primo es un número entero cuyos únicos divisores positivos son el 1 y él
mismo. Los primeros números primos positivos son 2, 3, 5, 7, 11, 13, 17, . . . El 6, por ejemplo, no es primo, pues 2
divide a 6 (por lo que 6 tiene un divisor distinto de 1 y 6). Es un hecho soprendente que los números que no son
primos se pueden escribir como producto de potencias de números primos. Tomemos, por ejemplo, el número 60,
que se puede escribir como 22 ,3,5; es decir, es producto potencias de 2, 3 y 5, que son números primos. La expresión
22 ,3,5 se llama la descomposición en números primos del número 60, y es única: no existe otra descomposición
del 60 que use otros números primos (u otras potencias de estos mismos primos). Con los polinomios sucede algo
prácticamente idéntico: todo polinomio puede descomponerse en factores irreducibles (los análogos a los primos en
este contexto); y la característica que tiene estos factores irreducibles es que no pueden escribirse como producto de
polinomios más pequeños (de allí el nombre “irreducibles”).
230 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Definición 81 Un polinomio P (x) ∈ K[x], de grado mayor a 0, se dice irreducible en K (o irreducible en K[x])
si no se puede escribir como producto de dos polinomios de grados mayores a 0 que pertenecen a K[x]. Un
polinomio que no es irreducible se dice reducible.
Por ejemplo, el polinomio Q(x) = x2 − 5x + 6 no es irreducible en Q[x], ya que Q(x) = (x − 2)(x − 3), y tanto
x − 2 como x − 3 tienen grado mayor a 0 y pertenecen a Q[x]. Por otro lado, el polinomio P (x) = x2 + 1 es
irreducible en R[x], pues no se puede escribir como producto de polinomios de grado mayor a 0. En efecto, sabemos
que sus raíces son i y −i, por lo cual, tanto x − i como x + i, dividen a P (x). Es fácil verificar que P (x) es,
exactamente, (x − i)(x + i). Pero los polinomios x − i y x + i no pertenecen a R[x] (pues su término independiente
es un número no real). Por lo tanto, P (x) no se puede escribir como producto de polinomios más pequeños que
pertenecen a R[x]. Lo que notamos es que P (x) se puede escribir como producto de polinomios más pequeños que
pertenecen a C[x]. Por lo tanto, el polinomio P (x) sí es reducible en C[x]. Observemos que, de este último ejemplo,
podemos concluir lo siguiente: que un polinomio sea o no irreducible depende de dónde lo estemos considerando.
Por supuesto, si un polinomio es irreducible en C[x], entonces también lo es en R[x] y en Q[x] (y si es irreducible
en R[x], también lo es en Q[x]). ¿Se dan cuenta por qué?
Ejemplos 88
El polinomio P (x) = x2 − 2 es irreducible en Q[x], pues lo únicos polinomios de grado mayor a 1 que lo
√ √
dividen son x − 2 y x + 2, que no tienen coeficientes racionales. En particular, sí es reducible en R[x], dado
√
que 2 ∈ R. Como es reducible en R[x], también lo es en C[x].
El polinomio Q(x) = x3 − x2 + 4x − 4 es reducible en Q[x], ya que puede escribirse como (x2 + 4)(x − 1),
y ambos polinomios en este producto grado mayor a cero y coeficientes racionales. También resulta, entonces,
reducible en R[x] y C[x].
El polinomio R(x) = x2 +4 es irreducible en Q[x] y R[x]. Es reducible en C[x] ya que R(x) = (x−2i)(x+2i).
Consideremos que, en la definición de polinomio irreducible, hemos dejado afuera a los polinomios constantes.
Estos no son considerados polinomios irreducibles ni reducibles. También, de la misma definición, es fácil deducir
que todos los polinomios de grado 1 son irreducibles en cualquier K[x].
Veamos como escribir cualquier polinomio como descomposición en factores irreducibles. Así como todos los
números enteros pueden descomponerse en producto de potencias de primos, los polinomios pueden descomponerse
en producto de potencias de polinomios irreducibles. En este sentido, los polinomios irreducibles son los “números
primos” de los polinomios. Como mecionamos en el párrafo anterior, la reducibilidad o irreducibilidad de un
polinomio varía dependiendo en qué conjunto numérico K estemos considerando la factorización. Por lo tanto,
cuando busquemos la descomposición en factores irreducibles de un polinomio, deberemos especificar respecto de
qué conjunto numérico K la estamos buscando. Por ejemplo, consideremos el polinomio T (x) = −x4 − 3x3 +
9x2 − 3x + 10. Su descomposición en Q[x] es −(x − 2)(x + 5)(x2 + 1). Está también es su descomposición en
R[x]. Sin embargo, su descomposición en factores irreducibles en C[x] es (x − 2)(x + 5)(x − i)(x + i). Por lo
tanto, tiene tres factores irreducibles en Q y R pero cuatro en C.
Definición 82 Una descomposición en factores irreducibles en K[x] de un polinomio P (x) ∈ K[x] es una
Por ejemplo, una descomposición de P (x) = 4x3 − 8x2 + 4x en Q[x] es (4x)(x − 1)2 . En este caso, los factores
irreducibles son 4x y x − 1 (este último aparece elevado al cuadrado). Notemos que esta descomposición no es
Álgebra A. Factorización de polinomios. 231
única, pues también podríamos escribir P (x) = x(2x − 2)2 , y aquí los factores irreducibles resultarían x y (2x − 2).
Lo que sucede en este caso es que hemos “reordenado” el coeficiente principal para que aparezca en un factor o en
otro (en el primer caso, en el factor 4x y, en el segundo caso, en 2x − 2, donde el 4 aparece al elevar al cuadrado este
factor). Este “intercambio” del coeficiente principal no influye en la naturaleza de la factorización y es, de hecho,
irrelevante en qué lugar aparezca situado. Para simplificar las cosas, hacemos, entonces, la siguiente convención.
una descomposición en producto de potencias de polinomios irreducibles mónicos, todo multiplicado por una
constante de K. En el ejemplo anterior, escribimos P (x) = 2x(x − 1)2 y consideramos que los componentes
irreducibles son x y x − 1, y la constante que multiplica todo es 2.
Tengamos en cuenta que, con esta convención, la descomposición en factores irreducibles de un polinomio es
única. ¿Se dan cuenta por qué? En general, trabajaremos con polinomios mónicos, por lo que no aparecerá la
constante correspondiente al coeficiente principal. El objetivo de este apartado es, entonces, aprender a calcular la
descomposición en factores irreducibles de un polinomio. A esta tarea se la conoce como factorizar el polinomio.
Observación 61 Notemos que los polinomios lineales (de grado 1) son siempre irreducibles en cualquier
conjunto K[x]. Esto es inmediato de la definición de polinomio irreducible y las propiedades del grado de un
producto de polinomios.
Factoricemos el polinomio P (x) = x3 − 5x2 + 6x en cada uno de los tres conjuntos de polinomios con los que
trabajamos: Q[x], R[x] y C[x]. Como P (x) no tiene término independiente, entonces x = 0 es una raíz de él.
Aquí no necesitamos hacer la división de P por x − 0, ya que podemos, simplemente, sacar x de factor común:
P (x) = x(x2 − 5x + 6). Ahora, buscamos las raíces de x2 − 5x + 6, que podemos hallar mediante la fórmula de la
resolvente: x = 2 y x = 3. Por lo tanto, utilizando el Lema 55, se deduce que P (x) = x(x − 2)(x − 3). Como todos
los polinomios en este producto tienen grado 1 entonces son irreducibles en C[x] (y, por lo tanto, también en R[x] y
Q[x]). Como, además, estos polinomios tienen coeficientes en Q, entonces x(x − 2)(x − 3) es la factorización de
P (x) en Q. Esta también es la factorización en R[x] y C[x].
Consideremos ahora el polinomio T (x) = −x4 − 3x3 + 9x2 − 3x + 10. El Teorema de Gauss nos dice que las
posibles raíces racionales, de existir, son 1, −1, 2, −2, 5, −5, 10, −10. Evaluando el polinomio en estos números,
obtenemos que 2 y −5 son raíces de T (x). Dividiendo T (x) por (x − 2)(x + 5) = x2 + 3x − 10 hallamos que
T (x) = (x2 +3x−10)(x2 +1). Sabemos que x2 +1 no tiene raíces racionales, por lo que es un polinomio irreducible
en Q. Por lo tanto, la descomposición de T (x) en Q[x] es precisamente (x − 2)(x + 5)(x2 + 1). Como x2 + 1
tampoco tiene raíces reales, entonces la descomposición en R[x] es la misma. Por otro lado, x2 + 1 se descompone
como (x − i)(x + i) en C[x], por lo que la descomposición de T (x) en C[x] es (x − 2)(x + 5)(x − i)(x + i).
Estudiemos, finalmente, cómo factorizar el polinomio Q(x) = x6 + x5 − 3x4 + 2x3 + x2 − 3x + 1 sabiendo que
232 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
√ √
1 3 1 3
2 + 2 es una de sus raíces. Notemos que, como Q(x) tiene coeficientes en Q, el hecho que 2 + 2 sea raíz
√
1 3
de Q(x) implica que su conjugada 2 − 2 también debe ser raíz de Q(x) (por la Proposición 60). Por lo tanto,
concluímos que el polinomio
√ !! √ !!
1 3 1 3
x− + x+ + = x2 − x + 1
2 2 2 2
Para factorizar x4 + 2x3 − 2x2 − 2x + 1 en Q[x] recurrimos al Teorema de Gauss, donde vemos que las únicas
posibilidades son 1 y −1. Como ambos números anulan a x4 + 2x3 − 2x2 − 2x + 1 podemos concluir que (x2 − 1)
divide a x4 + 2x3 − 2x2 − 2x + 1. Hacemos esta división.
Observemos que x2 + 2x − 1 es irreducible en Q[x] pues, nuevamente por Teorema de Gauss, las únicas posibles
raíces racionales son 1 y −1, y ninguna anula a x2 + 2x − 1. Por lo tanto, la factorización de Q(x) en Q[x] es
precisamente (x2 − x + 1)(x − 1)(x + 1)(x2 + 2x − 1).
Ahora, como x2 − x + 1 es irreducible en R[x] (pues sus raíces son complejas no reales), entonces, para hallar la
factorización de Q(x) en R[x], debemos chequear la reducibilidad de x2 + 2x − 1. Las raíces de este polinomio
vienen dadas por: √
−2 + 4+4 √
= −1 + 2∈R
2
Álgebra A. Factorización de polinomios. 233
√
−2 − 4+4 √
= −1 − 2∈R
2
Luego, la factorización de Q(x) en R[x] es:
√ √
(x2 − x + 1)(x − 1)(x + 1)(x + 1 − 2)(x + 1 + 2)
Definimos los polinomios irreducibles en K[x] como los polinomios que no se pueden escribir como producto de dos
(o más) polinomios de grados mayores a 0.
Estudiamos cómo hallar la descomposición en factores irreducibles en Q[x], R[x] y C[x] de polinomios en K[x].
9. Experimentos resueltos
~ = (2, 6), ~v − w
Los calculos para el punto b dan ~v + w ~ = (−2, 8), 12 ~v = ( 23 , 1) y
~ = (4, −2), −~v = (−3, −2), 2w
~ − 12 ~v = (− 72 , 7)
2w
En la siguiente imagen vemos todos los vectores pedidos, junto con las sumas:
y multiplicados por 12 :
2. Vemos que al duplicar el vector se duplica el módulo y al dividirlo por dos el módulo tambien se divide por
dos.
√ √
~ = 2 5 ≤ 5 + 5 = ||~v || + ||w||
3. ||~v + w|| ~
Experimento Resuelto 6 (pág. 37)
1. Tres vectores ortogonales a (2, 3): (−3, 2), (6, −4) y (−5, 10
3 ). El producto escalar entre los vectores y (2, 3)
siempre es cero.
2. Los vectores ortogonales a (2, −2) serán de la forma (k, k) con k ∈ R, entonces como nos piden norma 1
√ √ √ √
tenemos que k 2 + k 2 = 2k 2 = |k| 2, con lo cual para que la norma sea 1 necesitamos que |k| = 22 ,
√ √ √ √
2 2 2 2
por lo tanto los vectores ortogonales a (2, −2) con norma 1 son ( 2 , 2 ) y (− 2 , − 2 ).
3. Dos vectores ortogonales a (1, 2, 1) no paralelos entes si pueden ser (2, −1, 0) y (0, 1, −2).
4. Los vectores simultaneamente ortogonales a (1, 2, 1) y (1, −3, 0) serán multiplos del vector (3, 1, −5).
Experimento Resuelto 7 (pág. 48)
1. Los puntos del plano Π0 son de la forma (s − 3, t + 1, t − 2s), al reemplazarlos en la ecuación de Π obtenemos
2(s − 3) − (t + 1) + (t − 2s) = 13 lo cual es −7 = 13, absurdo. Por lo tanto tenemos que Π ∩ Π0 = ∅.
2. Los puntos del plano Π00 son de la forma (2k − l + 5, 2k + l, −2k − 3l + 3), al reemplazarlos en la ecuación
de Π obtenemos 2(2k − l + 5) − (2k + l) + (−2k − 3l + 3) = 13 con lo cual tenemos −6l + 13 = 13, o
sea l = 0, con lo cual Π ∩ Π00 = {X ∈ R3 : X = k(2, 2, −2) + (5, 0, 3), k ∈ R}
Experimento Resuelto 11 (pág. 62)
1. Los puntos del plano Π0 son de la forma (−3k + l + 1, − 12 k + l + 3, 2k − 3l − 1), al igualarlos con los que
surjen de la ecuación de Π obtenemos:
−3k + l + 1 = 2t − s + 2
− 12 k + l + 3 = t
2k − 3l − 1 = −4t + s − 3
resolviendo ese sistema obtenemos 0 = −2, absurdo. Por lo tanto tenemos que Π ∩ Π00 = ∅.
z = 1
A partir de las dos primeras ecuaciones tenemos que 1 + z = 1, pero esto es z = 0. Con lo cual el sistema es
contradictorio. No tiene solución, luego Π ∩ L = ∅.
2. Mientras que la recta L0 es:
x − 2y = 2
y + z = 1
240 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Para hallar el plano Π perpendicular a L, tomamos como vector normal al plano al vector director de la recta L:
Π : 1 · x + 2 · y − 3 · z + d = 0. Nos falta hallar d. Para eso reemplazamos en esta ecuación por el punto P :
1 · 1 + 2 · 0 − 3 · 1 + d = 0 → 1 − 3 + d = 0 → d = 2. Luego: Π : x + 2y − 3z + 2 = 0
Para hallar el punto Q de intersección entre L y Π, reemplazamos las ecuaciones paramétricas de L en Π:
(t) + 2(2t + 1) − 3(−3t + 5) + 2 = 0 → 14t = 11 → t = 11 11 18 37
14 . Luego: Q = 14 ; 7 ; 14
q 2 2 2 √
Solo nos resta hallar la distancia d(P ; Q) = 11
14 − 1 + 18
7 −0 + 37
14 − 1 = 183414
Primero vamos a escribir la ecuación del plano Π en su forma implícita. Para ello, averiguamos el vector normal al
~ = (−6; 1; −10).
plano como el producto vectorial entre los vectores (2, 2, −1) y (5, 0, −3) y nos da: N
Luego: Π : −6x + y − 10z + d = 0. Si reemplazamos por el punto del plano (2; 0; 0) obtenemos que d = 12.
Entonces Π : −6x + y − 10z + 12 = 0
Para escribir L perpendicular a Π y que pase por P = (−1; −2; 4), usamos como vector director de L la normal la
plano:
241
L : X = k(−6; 1; −10) + (−1; −2; 4). Expresamos esta recta en sus ecuaciones paramétricas y las reemplaza-
mos en la ecuación del plano para encontrar el punto Q intersecciónn:
24
→ Q = − 281 250 308
−6(−6k − 1) + (k − 2) − 10(−10k + 4) + 12 = 0 → k = 137 137 ; − 137 ; 137
Para probar que los planos son paralelos, podemos buscar el vector normal al plano Π calculando en producto
vectorial entre los vectores contenidos en él: (−2; 1; 1) y (0; −3; 4).
~ = (7; 8; 6). Para comprobar que el plano Π es paralelo Π verificamos que las coordenadas
Este vector normal es:N
de los vectores normales son proporcionales (porque son paralelos): en este caso basta con ver que tienen el mismo
vector normal.
Para construir la recta L perpendicular a ambos planos, podemos definirla con el vector normal a los planos como
vector director (se verifica la condición de perpendicularidad pedida) y que pase, por ejemplo, por un punto del
plano Π:
L : X = k(7; 8; 6) + (5; −1; 0). De esta forma nos ahorramos el paso de calcular P dado que ese punto es
P = (5; −1; 0) Ahora buscamos la intersección entre L y Π y a ese punto lo llamamos Q. ¿Cómo? Reemplazando
las ecuaciones paramétricas de L en Π:
29 542 381 174
7(7k + 5) + 8(8k − 1) + 6(6k) = −2 → k = − 149 . Luego Q = 149 ; − 149 ; − 149
√
29 149
Solo nos resta calcular d(P ; Q) = 149 . Este número representa la distancia entre los planos.
Primero vamos a expresar a la reecta L1 en su ecuación vectorial. Como viene dada por la intersección de dos
planos, elegimos despejar la variable y de ambas ecuaciones e igualarlas.
De ello resulta que: 2x − z − 4 = 4x − 2z − 9 y si se despeja z se obtiene: z = 2x − 5. Al volver con esta igualdad
a una de las ecuaciones de los planos -puede ser cualquiera- se obtiene que y = 1.
Luego, todo punto de la forma (x; 1; 2x − 5) es un punto de la recta L1 . Separando lo que tiene x de lo que no,
resulta que una posible ecuación vectorial de L1 es:
L1 : X = k(1; 0; 2) + (0; 1; −5). Ustedes pueden observar que el vector director de L1 es el mismo vector
director de L2 . Esto nos garantiza que las rectas son paralelas.
Para encontrar una ecuación de Π perpendicular a L2 , tomamos el vector director de esta recta como la normal al
plano:
1 · x + 0 · y + 2 · z + d = 0. Luego reemplazamos por el punto P = (1; 2; −3) y obtenemos d:
1 + 2(−3) + d = 0 → d = 5. Entonces: Π : x + 2z + 5 = 0.
Para encontrar Q, reemplazamos las ecuaciones paramétricas de L1 en Π: (k) + 2(2k − 5) + 5 = 0 → k = 1 →
Q = (1; 1; −3)
Solo nos resta hallar d(P ; Q), que es la distancia entre las rectas paralelas. Pero como P = Q ¡son el mismo punto!,
dicha distancia vale 0 (cero).
Para probar que L es perpendicular a Π basta con mostrar que el vector director de la recta es ortogonal al vector
normal al plano, es decir: el producto escalar entre ambos es nulo:
~ = 0 → (−1; 0; 1)(1; 1; 1) = −1 + 0 + 1 = 0. ¡Comprobado!
v~L · N
242 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
Para encontrar L0 ortogonal a Π, se toma como vector director de esta recta la normal al plano Π y si, además, debe
pasar por P = (1; 1; 2) reuslta:
L0 : X = k(1; 1; 1) + (1; 1; 2). Si esta recta la expresamos en sus coordenadas cartesianas y la reemplazamos
en Π resulta:
(k + 1) + (k + 1) + (k + 2) = 1 → k = −1. Luego Q = (0; 0; 1).
√
La distancia d(P ; Q) = d(L; Π) = 3.
1. Para probar que las rectas L1 y L2 son alabeadas debemos comprobar que su intersección es vacía y que no
son paralelas.
Si reemplazamos las ecuaciones paramétricas de L2 en L1 resulta que:
x − y − z = 1 → 2λ + 3λ + 1 = 1 → 5λ = 0 → λ = 0
x − 2y + z = −2 → 2λ + 6λ − 1 = −2 → −1 = −2 es absurdo (pues λ = 0). Entonces la intersección
entre las rectas es vacía.
Ahora bien, si escribimos la ecuación vectorial de L1 resulta: (x; y; z) = k(3; 2; 1) + (4; 3; 0). Como el vector
director de L2 es (2; −3; 0) es sencillo comprobar que las coordenadas de los vectores de ambas rectas no
son proporcionales.
Por lo tanto, comprobamos que las rectas no son paralelas. Luego: las rectas son alabeadas.
2. La ecuación vectorial de la recta L1 es k(3, 2, 1) + (4, 3, 0). Entonces los planos buscados serán de la forma:
Π1 = {λ(3, 2, 1) + β(2, −3, 0) + (4, 3, 0), λ, β ∈ R}
Π2 = {λ0 (3, 2, 1) + β 0 (2, −3, 0) + (0, 0, −1)λ0 , β 0 ∈ R}
3. Para encontrar la distancia entre los planos, primero buscamos la recta perpendicular a Π2 que pasa por
(0, 0, 1).
Para
esto encontramos
la normal al plano:
i j k
2 1 = (3, 2, −13)
3
2 −3 0
Para encontrar una recta L que pase por P = (1; 2; 3) y sea perpendicular al plano Π : x + 2y + 2z = 0 utilizamos
~ = (1; 2; 3) como vector director de la recta. Es decir:
el punto P como punto de la recta y la normal al plano N
L : (x; y; z) = k(1; 2; 3)+(1; 2; 3). Luego, reemplazamos las ecuaciones paramétricas de la recta en la ecuación
del plano para enocntrar las coordenadas del punto R:
(k + 1) + 2(2k + 2) + 3(3k + 3) = 0 → 14k + 14 = 0 → k = −1 entonces R = (0; 0; 0)
Como R es el punto medio entre P y Q podemos plantear que:
x +x y +y z +z
(xR ; yR ; zR ) = P 2 Q ; P 2 Q ; P 2 Q
1+xQ 2+yQ 3+zQ
(0; 0; 0) = 2 ; 2 ; 2
1. Si P ∈ L → P = t1 · ~v y si Q ∈ L → Q = t2 · ~v
Sumamos miembro a miembro ambas igualdades y resulta: P + Q = t1 · ~v + t2 · ~v
Luego: P + Q = (t1 + t2 ) · ~v → P + Q ∈ L
Si P ∈ L → P = t1 · ~v y multiplicamos miembro a miembro por λ ∈ R resulta:
λP = λt1 · ~v → λP = (λt1 ) · ~v → λP ∈ L
2. Si P ∈ Π → P = s1 · w
~ + r1 · ~u
Si Q ∈ Π → Q = s2 · w
~ + r2 · ~u
Si sumamos miembro a miembro resulta:
P + Q = s1 · w
~ + r1 · ~u + s2 · w
~ + r2 · ~u
Si se extraer como factor común los vectores w
~ y ~u resulta:
P + Q = (s1 + r1 ) · ~u + (s2 + r2 ) · ~u → P + Q ∈ Π
Si P ∈ Π → P = s1 · w
~ + r1 · ~u y multiplicamos miembro a miembro por λ ∈ R resulta:
λP = λ(s1 · w
~ + r1 · ~u)
Si se distribuye λ resulta: λP = (λ · s1 ) · w
~ + (λ · r1 )~u)
Entonces: λP ∈ Π.
Experimento Resuelto 23 (pág. 85)
1. Todo vector del subespacio S = (x1 ; x2 ; x3 ; x4 ; x5 ) ∈ R5 : x5 = 0 puede ser escrito como (a; b; c; d; 0) con
a, b, c, d ∈ R.
Para probar que el conjunto < (1; 0; 0; 0; 0); (0; 1; 0; 0; 0); (0; 0; 1; 0; 0); (0; 0; 0; 1; 0) > genera S debo
mostrar que (a; b; c; d; 0) puede ser escrito como combinación lineal de los vectores del conjunto dado:
(a; b; c; d; 0) = a(1; 0; 0; 0; 0) + b(0; 1; 0; 0; 0) + c(0; 0; 1; 0; 0) + d(0; 0; 0; 1; 0) siendo a, b, c, d ∈ R.
¡Así queda probado que el conjunto dado genera S!
2. En este caso, debemos probar que: < (1; 0; 0; 0; 0); (1; 1; 0; 0; 0); (1; 1; 1; 0; 0); (1; 1; 1; 1; 0) > genera S.
Luego:
(a; b; c; d; 0) = (a − b)(1; 0; 0; 0; 0) + (b − c)(1; 1; 0; 0; 0) + (c − d)(1; 1; 1; 0; 0) + d(1; 1; 1; 1; 0) siendo
a, b, c, d ∈ R.
¡Así queda probado que el conjunto dado genera S!
3. En este caso, debemos probar que
< (1; 0; 0; 0; 0); (0; 1; 0; 0; 0); (0; 0; 1; 0; 0); (0; 0; 0; 1; 0); (1; 2; 3; 4; 0) >
genera S. Luego:
(a; b; c; d; 0) = a(1; 0; 0; 0; 0) + b(0; 1; 0; 0; 0) + c(0; 0; 1; 0; 0) + d(0; 0; 0; 1; 0) + 0(1; 2; 3; 4; 0) siendo
a, b, c, d ∈ R.
¡Así queda probado que el conjunto dado genera S!
Experimento Resuelto 24 (pág. 98)
244 N. Capitelli, R. M. Escayola, X. Fernández, G. Rossi
(x−2)2 (y+1)2
16 − 9 =1
Como se ve bastante feo, pero los sistema que salen de esa igualdad son:
Cómo se observa, son muchas cuentas. Lo cual nos deja en claro que el método para encontrar la inversa nos
facilita el trabajo. La idea detrás de esto es que al irse alternando la fila que tiene al 1 en cada sistema al hacer
la triángulación por el método de Gauss estaremos reproduciendo de forma ordenada los despejes que, de todas
formas, deberiamos hacer para resolver los tres sistemas.
diente entonces:
implica que αi = 0 para todo i, por la definición de independencia lineal. Pero entoces como cualquier reordena-
miento de una suma finita da el mismo resultado, tenemos que:
tenemos:
pero (α1 + λα2 ) = 0, pues ambos αi lo son, con lo cual {~v1 , ~v2 + λ~v1 , . . . , ~vk } ⊂ Rn es L.I.
Conviene desarrollar por la última fila o la primer columna. Dado que son las que contienen la mayor cantidad de
ceros. Si desarrollamos el determinante obtenemos a1 1 · a2 2 · a3 3. Con lo cual la conclusión es que el determinante
de una matriz triangular se obtiene multiplicando los elementos de la diagonal de dicha matriz.
1. Calculemos el determinante de una matriz que tiene una fila de ceros, en el caso de columna es lo mismo. Para
fijar ideas pensemos en la primer fila, en caso de ser otra es lo mismo. En ese caso al momento del calculo
obtenemos 0 · |A11 | − 0 · |A12 | + 0 · |A13 | − · · · + (−1)n · · · 0 · |A1n |, como vemos todos los terminos de
la suma son |A1 i| donde este es el determinante del menos de la matriz, por cero. Sea cual sea el resultado
del determinate del menor lo estoy multiplicando por cero, con lo cual obtengo una suma de ceros, lo que
obviamente es cero.
2. Para el caso de una matriz con dos filas o columnas iguales, en este caso para fijar ideas las primera y
segunda, debemos tener en cuenta la propiedad que dice que el determinante de una matriz es el mismo que el
determinante que surje de reemplazar una fila por el resultado de la resta de dos filas de la matriz, que nos da:
a11 a12 ... a1n a11 a12 ... a1n
a1n a11 − a11 a12 − a12 a1n − a1n
a11 a12 ... ...
=
... ...
an1 an2 ... ann an1 an2 ... ann
Pero al hacer esa resta tenemos que nos queda una fila de ceros, lo cual hace que el determinante de cero:
a11 a12 ... a1n a11 a12 ... a1n
a11 a12 ... a1n 0 0 ... 0
= =0
... ...
an1 an2 ... ann an1 an2 ... ann
3. Para que una matriz de nxn tenga rango menor que n debe tener una, o más, filas o columnas todas
conformadas por ceros. Pero en este caso, por el ítem 1 tenemos que el determinante da cero.
Experimento Resuelto 31 (pág. 164)
T (~v − w)
~ = T (~v + (−w)) ~ = T (~v ) − T (w)
~ = T (~v ) + T (−w) ~
Para dos vectores tenemos T (α1~v1 + α2~v2 ) = T (~v1 + ~v1 + · · · + ~v1 + ~v2 + ~v2 + · · · + ~v2 ) = T (~v1 ) +
T (~v1 ) + · · · + T (~v1 ) + T (~v2 ) + T (~v2 ) + · · · + T (~v2 ) = α1 T (~v1 ) + α2 T (~v2 ). Este razonamiento puede
extenderse en general para la suma de r vectores.
Experimento Resuelto 33 (pág. 174)
Como S es subespacio entonces si v, w ∈ S ⇒ T (v), T (w) ∈ T (S), pero entonces T (v) + T (w) = T (v + w) ∈
T (S). Del mismo modo λT (v) = T (λv) ∈ T (S), pues λv ∈ S. Finalmente, ~0 = T (~0) ∈ T (S). Por lo tanto T(S)
cumple las tres condiciones con las que definimos un subespacio. Luego T (S) ⊂ (R)m es un subespacio de (R)m .
Experimento Resuelto 41 (pág. 190) Primero calculamos el producto de las matrices AT y A0T :
1 1 3 −1 −3
1 −1 −2
AT · A0T = 2 0 · = −2 −4
2
2 0 −1
0 2 2 0 −2
Una vez que tenemos esto veamos que el producto de la matriz resultante por el vector de variables nos da lo mismo
que la forma funcional de la composición T oT 0 , es decir:
3 −1 −3 x
−2 −4 y = (3x − y − 3z, 2x − 2y − 4z, 2x − 2z)
2
2 0 −2 z
Vemos que se recupera la expresión funcional de la composición.
Si z = a + bi y w = c + di entonces:
z + w = (a + bi) + (c + di) = (a + c) + i(b + d). Luego:
249
1. Si z = 2 + 3i entonces z = 2 − 3i
Luego: z · |z| = (2 + 3i)(2 − 3i) = 22 − (3i)2 por ser una diferencia de cuadrados.
z · z = 4 − 9i2 = 4 + 9 = 13. Este valor coincide con |z|2 .
En general, sucede que si z = a + bi entonces z = a − bi. Entonces:
z · z = |z|2 .
2. Si z = a + bi y w = c + di son dos números complejos, se verifica que:
z = a + bi = a − bi = a + bi = z
z + w = a + bi + c + di = (a + c) − i(b + d) = (a − ib) + (c − id) = z + w
zw = (a + bi)(c + di) = (ac − bd) + i(ad + bc) = (ac − bd) − i(ad + bc) = ac − bd − iad − ibc =
(a − bi)(c − di) = zw
z + z = (a + bi) + (a − bi) = 2a = 2Re(z) ; z − z = (a + bi) − (a − bi) = 2bi = 2Im(z)
√ p
|z| = a2 + b2 = a2 + (−b)2 = |z|
Experimento Resuelto 46 (pág. 210)
gr(P · Q) = n + m
Si se realiza la división entre dos polinomios del mismo grado, el cociente y el resto son polinomios de grado 0, es
decir, funciones constantes.
Si el polinomio Q(x) divide al polinomio P (x) entonces las raíces de Q(x) son raíces también de P (x).
Sea P (x) un polinomio de grado n > 0. Por el TFA, sabemos que P (x) tiene al menos una raíz a ∈ C. Por lo
tanto, x − a divide a P (x) y se tiene P (x) = (x − a)C(x). Calculando las raíces de C(x) puede repetirse el
procedimiento y, con el experimento 50, sabemos que las raíces de C son raíces de P . Luego, P tiene como máximo
n raíces: la raíz x = a y las n − 1 raíces de C.
10. Bibliografía