fbpx
Wikipedia

Clasificación estadística

En aprendizaje automático y estadística, la clasificación estadística es el problema de identificar a cuál de un conjunto de categorías (subpoblaciones) pertenece una nueva observación, sobre la base de un conjunto de datos de formación que contiene observaciones (o instancias) cuya categoría de miembros es conocida. Un ejemplo sería asignar a un correo electrónico dado la clasificación de "spam" o "no spam", o asignar un diagnóstico a un paciente dado según las características observadas del paciente (sexo, género, presión arterial, presencia o ausencia de ciertos síntomas, etc.). La clasificación es un ejemplo reconocimiento de patrones.

En la terminología de aprendizaje automático, la clasificación está considerada como un caso de aprendizaje supervisado, es decir, un aprendizaje en el que se dispone de un conjunto de observaciones correctamente identificadas.[1]​ El procedimiento no supervisado se conoce como clustering, e implica agrupar los datos e categorías basadas en alguna medida de similitud o distancia inherente.

A menudo, las observaciones individuales se analizan en un conjunto de propiedades cuantificables, conocidas como variables explicativas o características. Estas propiedades pueden ser categórica(por ejemplo,"A","B","AB" u "O", para el grupo sanguíneo), ordinales (por ejemplo,"grande","mediano" o "pequeño"), de número entero (por ejemplo, el número de ocurrencias de una palabra en particular en un mensaje de correo electrónico) de número real (por ejemplo, una medición de la presión arterial). Otros clasificadores trabajan comparando observaciones contra observaciones anteriores mediante la función de similitud o de distancia.

Un algoritmo que implementa la clasificación, especialmente en una implementación concreta, se conoce como un clasificador. El término "clasificador" algunas veces refiere a la función matemática, implementada por un algoritmo de clasificación, que asocia los datos de entrada a una categoría.

La terminología a través de los diferentes campos es muy variada. En estadística, cuando la clasificación se hace a menudo con regresión logística o con un procedimiento similar, las propiedades de las observaciones se denominan variables explicativas (o variables independientes, regriones, etc.), y las categorías a predecir se conocen como clases, que se consideran posibles valores de la variable dependiente. En el aprendizaje automático, las observaciones se conocen a menudo como instancias, las variables explicativas se denominan características (agrupadas en un vector de características) y las posibles categorías a predecir son clases. Otros campos pueden utilizar terminologías diferentes: por ejemplo, en ecología de comunidades, el término "clasificación" se refiere normalmente al análisis de grupos, es decir, a un tipo de aprendizaje no supervisado, en lugar del aprendizaje supervisado descrito en este artículo.

Ámbitos de aplicación

La clasificación tiene muchas aplicaciones. En algunos de estos está empleado como procedimiento de minería de datos, mientras que en otros se lleva a cabo un modelado estadístico más detallado.

Véase también

Referencias

  1. Alpaydin, Ethem (2010). Introduction to Machine Learning. MIT Press. p. 9. ISBN 978-0-262-01243-0. 

Enlaces externos

  • Clasificación de COLEGA Suite escrito en Java.
  • kNN Y energía Potencial (Applet), Universidad de Leicester
  • scikit-Aprender un paquete ampliamente utilizado en python
  • Weka Un paquete basado en java con una variedad extensa de algoritmos.
  •   Datos: Q1744628
  •   Multimedia: Statistical classification

clasificación, estadística, aprendizaje, automático, estadística, clasificación, estadística, problema, identificar, cuál, conjunto, categorías, subpoblaciones, pertenece, nueva, observación, sobre, base, conjunto, datos, formación, contiene, observaciones, in. En aprendizaje automatico y estadistica la clasificacion estadistica es el problema de identificar a cual de un conjunto de categorias subpoblaciones pertenece una nueva observacion sobre la base de un conjunto de datos de formacion que contiene observaciones o instancias cuya categoria de miembros es conocida Un ejemplo seria asignar a un correo electronico dado la clasificacion de spam o no spam o asignar un diagnostico a un paciente dado segun las caracteristicas observadas del paciente sexo genero presion arterial presencia o ausencia de ciertos sintomas etc La clasificacion es un ejemplo reconocimiento de patrones En la terminologia de aprendizaje automatico la clasificacion esta considerada como un caso de aprendizaje supervisado es decir un aprendizaje en el que se dispone de un conjunto de observaciones correctamente identificadas 1 El procedimiento no supervisado se conoce como clustering e implica agrupar los datos e categorias basadas en alguna medida de similitud o distancia inherente A menudo las observaciones individuales se analizan en un conjunto de propiedades cuantificables conocidas como variables explicativas o caracteristicas Estas propiedades pueden ser categorica por ejemplo A B AB u O para el grupo sanguineo ordinales por ejemplo grande mediano o pequeno de numero entero por ejemplo el numero de ocurrencias de una palabra en particular en un mensaje de correo electronico de numero real por ejemplo una medicion de la presion arterial Otros clasificadores trabajan comparando observaciones contra observaciones anteriores mediante la funcion de similitud o de distancia Un algoritmo que implementa la clasificacion especialmente en una implementacion concreta se conoce como un clasificador El termino clasificador algunas veces refiere a la funcion matematica implementada por un algoritmo de clasificacion que asocia los datos de entrada a una categoria La terminologia a traves de los diferentes campos es muy variada En estadistica cuando la clasificacion se hace a menudo con regresion logistica o con un procedimiento similar las propiedades de las observaciones se denominan variables explicativas o variables independientes regriones etc y las categorias a predecir se conocen como clases que se consideran posibles valores de la variable dependiente En el aprendizaje automatico las observaciones se conocen a menudo como instancias las variables explicativas se denominan caracteristicas agrupadas en un vector de caracteristicas y las posibles categorias a predecir son clases Otros campos pueden utilizar terminologias diferentes por ejemplo en ecologia de comunidades el termino clasificacion se refiere normalmente al analisis de grupos es decir a un tipo de aprendizaje no supervisado en lugar del aprendizaje supervisado descrito en este articulo Indice 1 Ambitos de aplicacion 2 Vease tambien 3 Referencias 4 Enlaces externosAmbitos de aplicacion EditarLa clasificacion tiene muchas aplicaciones En algunos de estos esta empleado como procedimiento de mineria de datos mientras que en otros se lleva a cabo un modelado estadistico mas detallado Vision de ordenador Imagen medica y analisis de imagen medica Reconocimiento optico de caracteres Seguimiento de objetos Descubrimiento de farmacos y desarrollo Toxicogenomica Estructura cuantitativa y estructura actividad Geoestadistica Reconocimiento del habla Reconocimiento de escritura a mano Biometria Taxinomia Procesamiento de lengua natural estadistico Clasificacion de documentos Motores de busqueda de internet El credito que puntua Reconocimiento de patrones Micro Clasificacion de variedadVease tambien EditarInteligencia artificial Clasificacion binaria Probabilidades de afiliacion de la clase Regla de clasificacion Procesamiento de plazo compuesto Mineria de datos Almacen de datos Logica difusa Busqueda y recuperacion de informacion Lista de datasets para busqueda de aprendizaje de la maquina Aprendizaje automatico Sistema de recomendacionReferencias Editar Alpaydin Ethem 2010 Introduction to Machine Learning MIT Press p 9 ISBN 978 0 262 01243 0 Enlaces externos EditarClasificacion de COLEGA Suite escrito en Java kNN Y energia Potencial Applet Universidad de Leicester scikit Aprender un paquete ampliamente utilizado en python Weka Un paquete basado en java con una variedad extensa de algoritmos Datos Q1744628 Multimedia Statistical classificationObtenido de https es wikipedia org w index php title Clasificacion estadistica amp oldid 133838920, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos