fbpx
Wikipedia

Algoritmo de agrupamiento

Un algoritmo de agrupamiento (en inglés, clustering) es un procedimiento de agrupación de una serie de vectores de acuerdo con un criterio. Esos criterios son por lo general distancia o similitud. La cercanía se define en términos de una determinada función de distancia, como la euclídea, aunque existen otras más robustas o que permiten extenderla a variables discretas. La medida más utilizada para medir la similitud entre los casos es la matriz de correlación entre los nxn casos. Sin embargo, también existen muchos algoritmos que se basan en la maximización de una propiedad estadística llamada verosimilitud.

Generalmente, los vectores de un mismo grupo (o clústers) comparten propiedades comunes. El conocimiento de los grupos puede permitir una descripción sintética de un conjunto de datos multidimensional complejo. De ahí su uso en minería de datos. Esta descripción sintética se consigue sustituyendo la descripción de todos los elementos de un grupo por la de un representante característico del mismo.

En algunos contextos, como el de la minería de datos, se lo considera una técnica de aprendizaje no supervisado puesto que busca encontrar relaciones entre variables descriptivas pero no la que guardan con respecto a una variable objetivo.

Aplicaciones

Las técnicas de agrupamiento encuentran aplicación en diversos ámbitos.

  • En biología para clasificar animales y plantas.
  • En medicina para identificar enfermedades.
  • En marketing para identificar personas con hábitos de compras similares.
  • En teoría de la señal pueden servir para eliminar ruidos.
  • En biometría para identificación del locutor o de caras.

Algoritmos

Existen dos grandes técnicas para el agrupamiento de casos:

  • Agrupamiento jerárquico, que puede ser aglomerativo o divisivo.
  • Agrupamiento no jerárquico, en los que el número de grupos se determina de antemano y las observaciones se van asignando a los grupos en función de su cercanía. Existen los métodos de k-mean y k-medoid.

Existen diversas implementaciones de algoritmos concretos. Por ejemplo, el de las k-medias, de particionamiento. Es uno de los más antiguos, pero de uso extendido a pesar de sus carencias y falta de robustez.

El paquete clúster de R-lenguaje[1]​ implementa una serie de algoritmos de particionamiento como agnes, mona y diana, jerárquicos, y pam, clara y fanny, de particionamiento.

Véase también

Referencias

  1. Rousseeuw, P.J.; Kaufman, L. (1990). Finding Groups in Data: An Introduction to Clúster Analysis. Wiley. 

Enlaces externos

  •   Wikimedia Commons alberga una galería multimedia sobre Algoritmo de agrupamiento.
  • Implementación Real en C del algoritmo EM para Clustering con Gaussian Mixture Models (GMMs).
  • Recuperación de Información el 21 de marzo de 2015 en Wayback Machine.
  •   Datos: Q24953001

algoritmo, agrupamiento, algoritmo, agrupamiento, inglés, clustering, procedimiento, agrupación, serie, vectores, acuerdo, criterio, esos, criterios, general, distancia, similitud, cercanía, define, términos, determinada, función, distancia, como, euclídea, au. Un algoritmo de agrupamiento en ingles clustering es un procedimiento de agrupacion de una serie de vectores de acuerdo con un criterio Esos criterios son por lo general distancia o similitud La cercania se define en terminos de una determinada funcion de distancia como la euclidea aunque existen otras mas robustas o que permiten extenderla a variables discretas La medida mas utilizada para medir la similitud entre los casos es la matriz de correlacion entre los nxn casos Sin embargo tambien existen muchos algoritmos que se basan en la maximizacion de una propiedad estadistica llamada verosimilitud Generalmente los vectores de un mismo grupo o clusters comparten propiedades comunes El conocimiento de los grupos puede permitir una descripcion sintetica de un conjunto de datos multidimensional complejo De ahi su uso en mineria de datos Esta descripcion sintetica se consigue sustituyendo la descripcion de todos los elementos de un grupo por la de un representante caracteristico del mismo En algunos contextos como el de la mineria de datos se lo considera una tecnica de aprendizaje no supervisado puesto que busca encontrar relaciones entre variables descriptivas pero no la que guardan con respecto a una variable objetivo Indice 1 Aplicaciones 2 Algoritmos 3 Vease tambien 4 Referencias 5 Enlaces externosAplicaciones EditarLas tecnicas de agrupamiento encuentran aplicacion en diversos ambitos En biologia para clasificar animales y plantas En medicina para identificar enfermedades En marketing para identificar personas con habitos de compras similares En teoria de la senal pueden servir para eliminar ruidos En biometria para identificacion del locutor o de caras Algoritmos EditarExisten dos grandes tecnicas para el agrupamiento de casos Agrupamiento jerarquico que puede ser aglomerativo o divisivo Agrupamiento no jerarquico en los que el numero de grupos se determina de antemano y las observaciones se van asignando a los grupos en funcion de su cercania Existen los metodos de k mean y k medoid Existen diversas implementaciones de algoritmos concretos Por ejemplo el de las k medias de particionamiento Es uno de los mas antiguos pero de uso extendido a pesar de sus carencias y falta de robustez El paquete cluster de R lenguaje 1 implementa una serie de algoritmos de particionamiento como agnes mona y diana jerarquicos y pam clara y fanny de particionamiento Vease tambien EditarInteligencia de enjambre Analisis de gruposReferencias Editar Rousseeuw P J Kaufman L 1990 Finding Groups in Data An Introduction to Cluster Analysis Wiley Enlaces externos Editar Wikimedia Commons alberga una galeria multimedia sobre Algoritmo de agrupamiento Implementacion Real en C del algoritmo EM para Clustering con Gaussian Mixture Models GMMs Recuperacion de Informacion Archivado el 21 de marzo de 2015 en Wayback Machine Datos Q24953001 Obtenido de https es wikipedia org w index php title Algoritmo de agrupamiento amp oldid 134189368, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos