Varian
Varian
Método de Agregación
Definición:
Estos métodos buscan optimizar, en cada etapa, la dispersión de las clases de la partición
obtenida por agregación de dos objetos.
En lugar de reunir dos clases que presenten la menor «distancia» (según un criterio dado para
medir la semejanza entre clases), estas estrategias agregan dos clases de manera tal que la clase
resultante tenga la dispersión mínima con respecto a todas las clases que pudieran ser formadas
en una etapa del algoritmo de agregación.
Para aplicar este método, es necesario que la comparación entre los objetos a clasificar se evalúe
con una distancia (euclidiana, euclidiana reducida, del Chi2,...).
Notación:
3
Teorema de Huygens:
4
A partir de una distancia cuadrática d (x,y) entre objetos, se define las inercias
intraclases de todas las clases compuestas por agregación de dos clases de un solo
objeto.
En la etapa inicial, la inercia intraclases es nula. La inercia interclases es igual a I.
En la etapa final, la inercia interclases es nula. La inercia intra-clase es igual a I.
En cada etapa, la inercia intraclases aumenta y la inercia interclases disminuye.
En cada etapa, el algoritmo define una partición tal que la varianza intraclases sea
mínima y la varianza entre las clases sea máxima.
Para que la inercia intraclases aumente lo menos posible en cada etapa, es necesario
minimizar la pérdida de inercia interclases que resulta de la agregación de dos
elementos...
Sean: {x}, de masa mx e {y}, de masa my, dos clases de una partición Ps en s clases.
Sea: {t}, de masa mt = mx + my, una clase de una partición Ps-1, en s-1 clases, resultante de la
agregación de {x} e {y}.
Criterio de agregación:
Se busca en cada etapa los elementos que hagan mínimo el valor ∆s.
Ejemplo:
1.
2.
3.
4.
7
5.