fbpx
Wikipedia

Aprendizaje automático

El aprendizaje automático o aprendizaje automatizado o aprendizaje de máquinas (del inglés, machine learning) es el subcampo de las ciencias de la computación y una rama de la inteligencia artificial, cuyo objetivo es desarrollar técnicas que permitan que las computadoras aprendan. Se dice que un agente aprende cuando su desempeño mejora con la experiencia y mediante el uso de datos; es decir, cuando la habilidad no estaba presente en su genotipo o rasgos de nacimiento.[1]​ "En el aprendizaje de máquinas un computador observa datos, construye un modelo basado en esos datos y utiliza ese modelo a la vez como una hipótesis acerca del mundo y una pieza de software que puede resolver problemas".[2]

En muchas ocasiones el campo de actuación del aprendizaje automático se solapa con el de la estadística inferencial, ya que las dos disciplinas se basan en el análisis de datos. Sin embargo, el aprendizaje automático incorpora las preocupaciones de la complejidad computacional de los problemas. Muchos problemas son de clase NP-hard, por lo que gran parte de la investigación realizada en aprendizaje automático está enfocada al diseño de soluciones factibles a esos problemas. El aprendizaje automático también está estrechamente relacionado con el reconocimiento de patrones. El aprendizaje automático puede ser visto como un intento de automatizar algunas partes del método científico mediante métodos matemáticos. Por lo tanto es un proceso de inducción del conocimiento.

El aprendizaje automático tiene una amplia gama de aplicaciones, incluyendo motores de búsqueda, diagnósticos médicos, detección de fraude en el uso de tarjetas de crédito, análisis del mercado de valores, clasificación de secuencias de ADN, reconocimiento del habla y del lenguaje escrito, juegos y robótica.

Resumen

Algunos sistemas de aprendizaje automático intentan eliminar toda necesidad de intuición o conocimiento experto de los procesos de análisis de datos, mientras otros tratan de establecer un marco de colaboración entre el experto y la computadora. De todas formas, la intuición humana no puede ser reemplazada en su totalidad, ya que el diseñador del sistema ha de especificar la forma de representación de los datos y los métodos de manipulación y caracterización de los mismos. Sin embargo, las computadoras son utilizadas por todo el mundo con fines tecnológicos muy buenos.

Modelos

El aprendizaje automático tiene como resultado un modelo para resolver una tarea dada. Entre los modelos se distinguen[3]

  • Los modelos geométricos, construidos en el espacio de instancias y que pueden tener una, dos o múltiples dimensiones. Si hay un borde de decisión lineal entre las clases, se dice que los datos son linealmente separables. Un límite de decisión lineal se define como w * x = t, donde w es un vector perpendicular al límite de decisión, x es un punto arbitrario en el límite de decisión y t es el umbral de la decisión.
  • Los modelos probabilísticos, que intentan determinar la distribución de probabilidades descriptora de la función que enlaza a los valores de las características con valores determinados. Uno de los conceptos claves para desarrollar modelos probabilísticos es la estadística bayesiana.
  • Los modelos lógicos, que transforman y expresan las probabilidades en reglas organizadas en forma de árboles de decisión.

Los modelos pueden también clasificarse como modelos de agrupamiento y modelos de gradiente. Los primeros tratan de dividir el espacio de instancias en grupos. Los segundos, como su nombre lo indican, representan un gradiente en el que se puede diferenciar entre cada instancia. Clasificadores geométricos como las máquinas de vectores de apoyo son modelos de gradientes.

Tipos de algoritmos

 
Una máquina de vectores de soporte

Los diferentes algoritmos de Aprendizaje Automático se agrupan en una taxonomía en función de la salida de los mismos. Algunos tipos de algoritmos son:

Aprendizaje supervisado
El algoritmo produce una función que establece una correspondencia entre las entradas y las salidas deseadas del sistema. Un ejemplo de este tipo de algoritmo es el problema de clasificación, donde el sistema de aprendizaje trata de etiquetar (clasificar) una serie de vectores utilizando una entre varias categorías (clases). La base de conocimiento del sistema está formada por ejemplos de etiquetados anteriores. Este tipo de aprendizaje puede llegar a ser muy útil en problemas de investigación biológica, biología computacional y bioinformática.
Aprendizaje no supervisado
Todo el proceso de modelado se lleva a cabo sobre un conjunto de ejemplos formado tan solo por entradas al sistema. No se tiene información sobre las categorías de esos ejemplos. Por lo tanto, en este caso, el sistema tiene que ser capaz de reconocer patrones para poder etiquetar las nuevas entradas.
Aprendizaje semisupervisado
Este tipo de algoritmos combinan los dos algoritmos anteriores para poder clasificar de manera adecuada. Se tiene en cuenta los datos marcados y los no marcados.
Aprendizaje por refuerzo
El algoritmo aprende observando el mundo que le rodea. Su información de entrada es el feedback o retroalimentación que obtiene del mundo exterior como respuesta a sus acciones. Por lo tanto, el sistema aprende a base de ensayo-error.
El aprendizaje por refuerzo es el más general entre las tres categorías. En vez de que un instructor indique al agente qué hacer, el agente inteligente debe aprender cómo se comporta el entorno mediante recompensas (refuerzos) o castigos, derivados del éxito o del fracaso respectivamente. El objetivo principal es aprender la función de valor que le ayude al agente inteligente a maximizar la señal de recompensa y así optimizar sus políticas de modo a comprender el comportamiento del entorno y a tomar buenas decisiones para el logro de sus objetivos formales.
Los principales algoritmos de aprendizaje por refuerzo se desarrollan dentro de los métodos de resolución de problemas de decisión finitos de Markov, que incorporan las ecuaciones de Bellman y las funciones de valor. Los tres métodos principales son: la Programación Dinámica, los métodos de Monte Carlo y el aprendizaje de Diferencias Temporales.[4]
Entre las implementaciones desarrolladas está AlphaGo, un programa de IA desarrollado por Google DeepMind para jugar el juego de mesa Go. En marzo de 2016 AlphaGo le ganó una partida al jugador profesional Lee Se-Dol que tiene la categoría noveno dan y 18 títulos mundiales. Entre los algoritmos que utiliza se encuentra el árbol de búsqueda Monte Carlo, también utiliza aprendizaje profundo con redes neuronales. Puede ver lo ocurrido en el documental de Netflix “AlphaGo”.
Transducción
Similar al aprendizaje supervisado, pero no construye de forma explícita una función. Trata de predecir las categorías de los futuros ejemplos basándose en los ejemplos de entrada, sus respectivas categorías y los ejemplos nuevos al sistema.
Aprendizaje multi-tarea
Métodos de aprendizaje que usan conocimiento previamente aprendido por el sistema de cara a enfrentarse a problemas parecidos a los ya vistos.

El análisis computacional y de rendimiento de los algoritmos de aprendizaje automático es una rama de la estadística conocida como teoría computacional del aprendizaje.

El aprendizaje automático las personas lo llevamos a cabo de manera automática ya que es un proceso tan sencillo para nosotros que ni nos damos cuenta de cómo se realiza y todo lo que implica. Desde que nacemos hasta que morimos los seres humanos llevamos a cabo diferentes procesos, entre ellos encontramos el de aprendizaje por medio del cual adquirimos conocimientos, desarrollamos habilidades para analizar y evaluar a través de métodos y técnicas así como también por medio de la experiencia propia. Sin embargo, a las máquinas hay que indicarles cómo aprender, ya que si no se logra que una máquina sea capaz de desarrollar sus habilidades, el proceso de aprendizaje no se estará llevando a cabo, sino que solo será una secuencia repetitiva.

Técnicas de clasificación

Árboles de decisiones

Este tipo de aprendizaje usa un árbol de decisiones como modelo predictivo. Se mapean observaciones sobre un objeto con conclusiones sobre el valor final de dicho objeto.

Los árboles son estructuras básicas en la informática. Los árboles de atributos son la base de las decisiones. Una de las dos formas principales de árboles de decisiones es la desarrollada por Quinlan de medir la impureza de la entropía en cada rama, algo que primero desarrolló en el algoritmo ID3 y luego en el C4.5. Otra de las estrategias se basa en el índice GINI y fue desarrollada por Breiman, Friedman et alia. El algoritmo de CART es una implementación de esta estrategia.[5]

Reglas de asociación

Los algoritmos de reglas de asociación procuran descubrir relaciones interesantes entre variables. Entre los métodos más conocidos se hallan el algoritmo a priori, el algoritmo Eclat y el algoritmo de Patrón Frecuente.

Algoritmos genéticos

Los algoritmos genéticos son procesos de búsqueda heurística que simulan la selección natural. Usan métodos tales como la mutación y el cruzamiento para generar nuevas clases que puedan ofrecer una buena solución a un problema dado.

Redes neuronales artificiales

Las redes de neuronas artificiales (RNA) son un paradigma de aprendizaje automático inspirado en las neuronas de los sistemas nerviosos de los animales. Se trata de un sistema de enlaces de neuronas que colaboran entre sí para producir un estímulo de salida. Las conexiones tienen pesos numéricos que se adaptan según la experiencia. De esta manera, las redes neurales se adaptan a un impulso y son capaces de aprender. La importancia de las redes neurales cayó durante un tiempo con el desarrollo de los vectores de soporte y clasificadores lineales, pero volvió a surgir a finales de la década de 2000 con la llegada del aprendizaje profundo.

Máquinas de vectores de soporte

Las MVS son una serie de métodos de aprendizaje supervisado usados para clasificación y regresión. Los algoritmos de MVS usan un conjunto de ejemplos de entrenamiento clasificado en dos categorías para construir un modelo que prediga si un nuevo ejemplo pertenece a una u otra de dichas categorías.

Algoritmos de agrupamiento

El análisis por agrupamiento (clustering en inglés) es la clasificación de observaciones en subgrupos —clusters— para que las observaciones en cada grupo se asemejen entre sí según ciertos criterios.

Las técnicas de agrupamiento hacen inferencias diferentes sobre la estructura de los datos; se guían usualmente por una medida de similitud específica y por un nivel de compactamiento interno (similitud entre los miembros de un grupo) y la separación entre los diferentes grupos.

El agrupamiento es un método de aprendizaje no supervisado y es una técnica muy popular de análisis estadístico de datos.

Redes bayesianas

Una red bayesiana, red de creencia o modelo acíclico dirigido es un modelo probabilístico que representa una serie de variables de azar y sus independencias condicionales a través de un grafo acíclico dirigido. Una red bayesiana puede representar, por ejemplo, las relaciones probabilísticas entre enfermedades y síntomas. Dados ciertos síntomas, la red puede usarse para calcular las probabilidades de que ciertas enfermedades estén presentes en un organismo. Hay algoritmos eficientes que infieren y aprenden usando este tipo de representación.

Conocimiento

En el aprendizaje automático podemos obtener 3 tipos de conocimiento, que son:

1. Crecimiento
Es el que se adquiere de lo que nos rodea, el cual guarda la información en la memoria como si dejara huellas.
2. Reestructuración
Al interpretar los conocimientos el individuo razona y genera nuevo conocimiento al cual se le llama de reestructuración.
3. Ajuste
Es el que se obtiene al generalizar varios conceptos o generando los propios.

Los tres tipos se efectúan durante un proceso de aprendizaje automático pero la importancia de cada tipo de conocimiento depende de las características de lo que se está tratando de aprender.

El aprendizaje es más que una necesidad, es un factor primordial para satisfacer las necesidades de la inteligencia artificial.

Distinción entre Aprendizaje supervisado y no supervisado

El aprendizaje supervisado se caracteriza por contar con información que especifica qué conjuntos de datos son satisfactorios para el objetivo del aprendizaje. Un ejemplo podría ser un software que reconoce si una imagen dada es o no la imagen de un rostro: para el aprendizaje del programa tendríamos que proporcionarle diferentes imágenes, especificando en el proceso si se trata o no de rostros.

En el aprendizaje no supervisado, en cambio, el programa no cuenta con datos que definan qué información es satisfactoria o no. El objetivo principal de estos programas suele ser encontrar patrones que permitan separar y clasificar los datos en diferentes grupos, en función de sus atributos. Siguiendo el ejemplo anterior un software de aprendizaje no supervisado no sería capaz de decirnos si una imagen dada es un rostro o no pero sí podría, por ejemplo, clasificar las imágenes entre aquellas que contienen rostros humanos, de animales, o las que no contienen. La información obtenida por un algoritmo de aprendizaje no supervisado debe ser posteriormente interpretada por una persona para darle utilidad.

Aplicaciones

Temas del aprendizaje automático

A continuación se muestran una serie de temas que podrían formar parte del temario de un curso sobre aprendizaje automático.

Historia y relación con otros temas

El aprendizaje automático nació de la búsqueda de inteligencia artificial. Ya en los primeros días de la IA como disciplina académica, algunos investigadores se interesaron en hacer que las máquinas aprendiesen. Trataron de resolver el problema con diversos métodos simbólicos, así como lo que ellos llamaron 'redes neurales' que eran en general perceptrones y otros modelos básicamente basados en modelos lineares generalizados como se conocen en las estadísticas.

Software

Muchos lenguajes de programación pueden usarse para implementar algoritmos de aprendizaje automático. Los más populares para 2015 eran R y Python.[6]​ R es muy usado ante todo en el campo académico, mientras que Python es más popular en la empresa privada.

Entre los paquetes de software que incluyen algoritmos de aprendizaje automatizado, se hallan los siguientes:

Software de código abierto

  • TensorFlow: plataforma multilenguaje y multiplataforma desarrollada por Google y licenciada como Apache 2.
  • Apache Mahout: plataforma de Java de algoritmos escalables de aprendizaje automático, en especial en las áreas de filtro colaborativo, clustering y clasificación
  • dlib: una biblioteca bajo licencia Boost para desarrollar en C++
  • ELKI: una plataforma para Java con licencia AGPLv3
  • Encog
  • H2O
  • KNIME
  • mlpy
  • MLPACK
  • MOA
  • OpenCV
  • Tortilla JS
  • OpenNN
  • R: lenguaje de programación estadístico con numerosas bibliotecas relacionadas al aprendizaje automático (e1071, rpart, nnet, randomForest, entre otras)
  • RapidMiner
  • scikit-learn: biblioteca en Python que interactúa con NumPy y SciPy
  • Spark MLlib: una librería que forma parte de Apache Spark, una plataforma para computación de grupos
  • Weka: una biblioteca en Java

Software comercial

Sesgos

Los algoritmos de aprendizaje automático a menudo pueden verse afectados por el sesgo que puedan tener los datos (Ver sesgo algoritmico). Por ejemplo no se podrán clasificar todos aquellas entradas de las que no se haya recibido ninguna información en la fase de entrenamiento. De hecho cuando el entrenamiento se realiza con datos clasificados por el ser humano el aprendizaje automático tiende a crear los mismos segos que hay en la sociedad. Algunos ejemplos de esto son cuando en 2015 el algoritmo de Google photos identificaba algunas personas negras con gorilas, o en 2016 cuando el bot de Twitter de Microsoft desarrollo comportamientos racistas y machistas a base de observar el tráfico de datos en dicha red social. Por este motivo en los últimos años ha habido una tendencia a desarrollar métodos para aumentar la equidad, es decir, para reducir el sesgo en este tipo algoritmos por parte de los expertos en IA. Citando a Fei-fei Li "La IA no tiene nada de especial. Se inspira en personas, es creada por personas, y lo más importante impacta en las personas. Es una herramienta muy poderosa que tan solo hemos comenzado a entender, y esa es una gran responsabilidad" [7]

Véase también

Referencias

  1. Russell, Stuart; Norvig, Peter (2009). Inteligencia Artificial: Un Enfoque Moderno (3rd edición). p. 229. 
  2. Russell and Norvig (2021). Artificial Intelligence: A Modern Approach (en inglés). Pearson. p. 651. ISBN 9780134610993. 
  3. Flach 2012 Págs. 20-21
  4. Sutton, Richard S., Barto, Andrew G. Reinforcement Learning: An Introduction. The MIT Press. 
  5. Flach 2012 Págs. 155-156
  6. Four main languages for analytics and data mining science (KD Nuggets)
  7. «Fei-Fei Li's Quest to Make Machines Better for Humanity». Wired (en inglés). ISSN 1059-1028. Consultado el 17 de diciembre de 2019. 

Bibliografía

  • Bishop, Christopher (2008) Pattern Recognition and Machine Learning. Springer Verlag. ISBN=978-0-3873-1073-2.
  • Flach, Peter (2012) Machine Learning: The Art and Science of Algorithms that Make Sense of Data. Cambridge University Press. ISBN 978-1-107-42222-3.
  • Gollapudi, Sunila (2016) Practical Machine Learning. Packt Publishing. ISBN=978-1-78439-968-4.
  • Ian H. Witten and Eibe Frank (2011). Data Mining: Practical machine learning tools and techniques Morgan Kaufmann, 664 pág., ISBN 978-0-12-374856-0.
  • Mitchell, T. (1997). Machine Learning, McGraw Hill. ISBN 0-07-042807-7
  • Raschka, Sebastian (2015). Python Machine Learning, Packt Open Source. ISBN 978-1-78355-513-0

Enlaces externos

  • Ejemplos prácticos de Machine Learning en Español
  • Blog sobre Aprendizaje Automático - La biblia del Machine Learning
  • El Machine Learning cambiará el mundo
  • Machine Learning Development with Perl (en inglés)
  • Estudio y aplicación de técnicas de aprendizaje automático orientadas al ámbito médico: estimación y explicación de predicciones individuales. Universidad Autónoma de Madrid
  • AlphaGo
  • Machine Learning explicado (podcast)
  • Machine Learning: Selección de métricas de clasificación (en español)
  •   Datos: Q2539
  •   Multimedia: Machine learning

aprendizaje, automático, aprendizaje, automático, aprendizaje, automatizado, aprendizaje, máquinas, inglés, machine, learning, subcampo, ciencias, computación, rama, inteligencia, artificial, cuyo, objetivo, desarrollar, técnicas, permitan, computadoras, apren. El aprendizaje automatico o aprendizaje automatizado o aprendizaje de maquinas del ingles machine learning es el subcampo de las ciencias de la computacion y una rama de la inteligencia artificial cuyo objetivo es desarrollar tecnicas que permitan que las computadoras aprendan Se dice que un agente aprende cuando su desempeno mejora con la experiencia y mediante el uso de datos es decir cuando la habilidad no estaba presente en su genotipo o rasgos de nacimiento 1 En el aprendizaje de maquinas un computador observa datos construye un modelo basado en esos datos y utiliza ese modelo a la vez como una hipotesis acerca del mundo y una pieza de software que puede resolver problemas 2 En muchas ocasiones el campo de actuacion del aprendizaje automatico se solapa con el de la estadistica inferencial ya que las dos disciplinas se basan en el analisis de datos Sin embargo el aprendizaje automatico incorpora las preocupaciones de la complejidad computacional de los problemas Muchos problemas son de clase NP hard por lo que gran parte de la investigacion realizada en aprendizaje automatico esta enfocada al diseno de soluciones factibles a esos problemas El aprendizaje automatico tambien esta estrechamente relacionado con el reconocimiento de patrones El aprendizaje automatico puede ser visto como un intento de automatizar algunas partes del metodo cientifico mediante metodos matematicos Por lo tanto es un proceso de induccion del conocimiento El aprendizaje automatico tiene una amplia gama de aplicaciones incluyendo motores de busqueda diagnosticos medicos deteccion de fraude en el uso de tarjetas de credito analisis del mercado de valores clasificacion de secuencias de ADN reconocimiento del habla y del lenguaje escrito juegos y robotica Indice 1 Resumen 1 1 Modelos 2 Tipos de algoritmos 3 Tecnicas de clasificacion 3 1 Arboles de decisiones 3 2 Reglas de asociacion 3 3 Algoritmos geneticos 3 4 Redes neuronales artificiales 3 5 Maquinas de vectores de soporte 3 6 Algoritmos de agrupamiento 3 7 Redes bayesianas 4 Conocimiento 5 Distincion entre Aprendizaje supervisado y no supervisado 6 Aplicaciones 7 Temas del aprendizaje automatico 8 Historia y relacion con otros temas 9 Software 9 1 Software de codigo abierto 9 2 Software comercial 10 Sesgos 11 Vease tambien 12 Referencias 13 Bibliografia 14 Enlaces externosResumen EditarAlgunos sistemas de aprendizaje automatico intentan eliminar toda necesidad de intuicion o conocimiento experto de los procesos de analisis de datos mientras otros tratan de establecer un marco de colaboracion entre el experto y la computadora De todas formas la intuicion humana no puede ser reemplazada en su totalidad ya que el disenador del sistema ha de especificar la forma de representacion de los datos y los metodos de manipulacion y caracterizacion de los mismos Sin embargo las computadoras son utilizadas por todo el mundo con fines tecnologicos muy buenos Modelos Editar El aprendizaje automatico tiene como resultado un modelo para resolver una tarea dada Entre los modelos se distinguen 3 Los modelos geometricos construidos en el espacio de instancias y que pueden tener una dos o multiples dimensiones Si hay un borde de decision lineal entre las clases se dice que los datos son linealmente separables Un limite de decision lineal se define como w x t donde w es un vector perpendicular al limite de decision x es un punto arbitrario en el limite de decision y t es el umbral de la decision Los modelos probabilisticos que intentan determinar la distribucion de probabilidades descriptora de la funcion que enlaza a los valores de las caracteristicas con valores determinados Uno de los conceptos claves para desarrollar modelos probabilisticos es la estadistica bayesiana Los modelos logicos que transforman y expresan las probabilidades en reglas organizadas en forma de arboles de decision Los modelos pueden tambien clasificarse como modelos de agrupamiento y modelos de gradiente Los primeros tratan de dividir el espacio de instancias en grupos Los segundos como su nombre lo indican representan un gradiente en el que se puede diferenciar entre cada instancia Clasificadores geometricos como las maquinas de vectores de apoyo son modelos de gradientes Tipos de algoritmos Editar Una maquina de vectores de soporte Los diferentes algoritmos de Aprendizaje Automatico se agrupan en una taxonomia en funcion de la salida de los mismos Algunos tipos de algoritmos son Aprendizaje supervisadoArticulo principal Aprendizaje supervisado El algoritmo produce una funcion que establece una correspondencia entre las entradas y las salidas deseadas del sistema Un ejemplo de este tipo de algoritmo es el problema de clasificacion donde el sistema de aprendizaje trata de etiquetar clasificar una serie de vectores utilizando una entre varias categorias clases La base de conocimiento del sistema esta formada por ejemplos de etiquetados anteriores Este tipo de aprendizaje puede llegar a ser muy util en problemas de investigacion biologica biologia computacional y bioinformatica Aprendizaje no supervisadoArticulo principal Aprendizaje no supervisado Todo el proceso de modelado se lleva a cabo sobre un conjunto de ejemplos formado tan solo por entradas al sistema No se tiene informacion sobre las categorias de esos ejemplos Por lo tanto en este caso el sistema tiene que ser capaz de reconocer patrones para poder etiquetar las nuevas entradas Aprendizaje semisupervisado Este tipo de algoritmos combinan los dos algoritmos anteriores para poder clasificar de manera adecuada Se tiene en cuenta los datos marcados y los no marcados Aprendizaje por refuerzoArticulo principal Aprendizaje por refuerzo El algoritmo aprende observando el mundo que le rodea Su informacion de entrada es el feedback o retroalimentacion que obtiene del mundo exterior como respuesta a sus acciones Por lo tanto el sistema aprende a base de ensayo error El aprendizaje por refuerzo es el mas general entre las tres categorias En vez de que un instructor indique al agente que hacer el agente inteligente debe aprender como se comporta el entorno mediante recompensas refuerzos o castigos derivados del exito o del fracaso respectivamente El objetivo principal es aprender la funcion de valor que le ayude al agente inteligente a maximizar la senal de recompensa y asi optimizar sus politicas de modo a comprender el comportamiento del entorno y a tomar buenas decisiones para el logro de sus objetivos formales Los principales algoritmos de aprendizaje por refuerzo se desarrollan dentro de los metodos de resolucion de problemas de decision finitos de Markov que incorporan las ecuaciones de Bellman y las funciones de valor Los tres metodos principales son la Programacion Dinamica los metodos de Monte Carlo y el aprendizaje de Diferencias Temporales 4 Entre las implementaciones desarrolladas esta AlphaGo un programa de IA desarrollado por Google DeepMind para jugar el juego de mesa Go En marzo de 2016 AlphaGo le gano una partida al jugador profesional Lee Se Dol que tiene la categoria noveno dan y 18 titulos mundiales Entre los algoritmos que utiliza se encuentra el arbol de busqueda Monte Carlo tambien utiliza aprendizaje profundo con redes neuronales Puede ver lo ocurrido en el documental de Netflix AlphaGo Transduccion Similar al aprendizaje supervisado pero no construye de forma explicita una funcion Trata de predecir las categorias de los futuros ejemplos basandose en los ejemplos de entrada sus respectivas categorias y los ejemplos nuevos al sistema Aprendizaje multi tarea Metodos de aprendizaje que usan conocimiento previamente aprendido por el sistema de cara a enfrentarse a problemas parecidos a los ya vistos El analisis computacional y de rendimiento de los algoritmos de aprendizaje automatico es una rama de la estadistica conocida como teoria computacional del aprendizaje El aprendizaje automatico las personas lo llevamos a cabo de manera automatica ya que es un proceso tan sencillo para nosotros que ni nos damos cuenta de como se realiza y todo lo que implica Desde que nacemos hasta que morimos los seres humanos llevamos a cabo diferentes procesos entre ellos encontramos el de aprendizaje por medio del cual adquirimos conocimientos desarrollamos habilidades para analizar y evaluar a traves de metodos y tecnicas asi como tambien por medio de la experiencia propia Sin embargo a las maquinas hay que indicarles como aprender ya que si no se logra que una maquina sea capaz de desarrollar sus habilidades el proceso de aprendizaje no se estara llevando a cabo sino que solo sera una secuencia repetitiva Tecnicas de clasificacion EditarArboles de decisiones Editar Articulo principal Arbol de decision Este tipo de aprendizaje usa un arbol de decisiones como modelo predictivo Se mapean observaciones sobre un objeto con conclusiones sobre el valor final de dicho objeto Los arboles son estructuras basicas en la informatica Los arboles de atributos son la base de las decisiones Una de las dos formas principales de arboles de decisiones es la desarrollada por Quinlan de medir la impureza de la entropia en cada rama algo que primero desarrollo en el algoritmo ID3 y luego en el C4 5 Otra de las estrategias se basa en el indice GINI y fue desarrollada por Breiman Friedman et alia El algoritmo de CART es una implementacion de esta estrategia 5 Reglas de asociacion Editar Articulo principal Reglas de asociacion Los algoritmos de reglas de asociacion procuran descubrir relaciones interesantes entre variables Entre los metodos mas conocidos se hallan el algoritmo a priori el algoritmo Eclat y el algoritmo de Patron Frecuente Algoritmos geneticos Editar Articulo principal Algoritmos geneticos Los algoritmos geneticos son procesos de busqueda heuristica que simulan la seleccion natural Usan metodos tales como la mutacion y el cruzamiento para generar nuevas clases que puedan ofrecer una buena solucion a un problema dado Redes neuronales artificiales Editar Articulo principal Red neuronal artificial Las redes de neuronas artificiales RNA son un paradigma de aprendizaje automatico inspirado en las neuronas de los sistemas nerviosos de los animales Se trata de un sistema de enlaces de neuronas que colaboran entre si para producir un estimulo de salida Las conexiones tienen pesos numericos que se adaptan segun la experiencia De esta manera las redes neurales se adaptan a un impulso y son capaces de aprender La importancia de las redes neurales cayo durante un tiempo con el desarrollo de los vectores de soporte y clasificadores lineales pero volvio a surgir a finales de la decada de 2000 con la llegada del aprendizaje profundo Maquinas de vectores de soporte Editar Articulo principal Maquinas de vectores de soporte Las MVS son una serie de metodos de aprendizaje supervisado usados para clasificacion y regresion Los algoritmos de MVS usan un conjunto de ejemplos de entrenamiento clasificado en dos categorias para construir un modelo que prediga si un nuevo ejemplo pertenece a una u otra de dichas categorias Algoritmos de agrupamiento Editar Articulo principal Algoritmo de agrupamiento El analisis por agrupamiento clustering en ingles es la clasificacion de observaciones en subgrupos clusters para que las observaciones en cada grupo se asemejen entre si segun ciertos criterios Las tecnicas de agrupamiento hacen inferencias diferentes sobre la estructura de los datos se guian usualmente por una medida de similitud especifica y por un nivel de compactamiento interno similitud entre los miembros de un grupo y la separacion entre los diferentes grupos El agrupamiento es un metodo de aprendizaje no supervisado y es una tecnica muy popular de analisis estadistico de datos Redes bayesianas Editar Articulo principal Red bayesiana Una red bayesiana red de creencia o modelo aciclico dirigido es un modelo probabilistico que representa una serie de variables de azar y sus independencias condicionales a traves de un grafo aciclico dirigido Una red bayesiana puede representar por ejemplo las relaciones probabilisticas entre enfermedades y sintomas Dados ciertos sintomas la red puede usarse para calcular las probabilidades de que ciertas enfermedades esten presentes en un organismo Hay algoritmos eficientes que infieren y aprenden usando este tipo de representacion Conocimiento EditarEn el aprendizaje automatico podemos obtener 3 tipos de conocimiento que son 1 Crecimiento Es el que se adquiere de lo que nos rodea el cual guarda la informacion en la memoria como si dejara huellas 2 Reestructuracion Al interpretar los conocimientos el individuo razona y genera nuevo conocimiento al cual se le llama de reestructuracion 3 Ajuste Es el que se obtiene al generalizar varios conceptos o generando los propios Los tres tipos se efectuan durante un proceso de aprendizaje automatico pero la importancia de cada tipo de conocimiento depende de las caracteristicas de lo que se esta tratando de aprender El aprendizaje es mas que una necesidad es un factor primordial para satisfacer las necesidades de la inteligencia artificial Distincion entre Aprendizaje supervisado y no supervisado EditarEl aprendizaje supervisado se caracteriza por contar con informacion que especifica que conjuntos de datos son satisfactorios para el objetivo del aprendizaje Un ejemplo podria ser un software que reconoce si una imagen dada es o no la imagen de un rostro para el aprendizaje del programa tendriamos que proporcionarle diferentes imagenes especificando en el proceso si se trata o no de rostros En el aprendizaje no supervisado en cambio el programa no cuenta con datos que definan que informacion es satisfactoria o no El objetivo principal de estos programas suele ser encontrar patrones que permitan separar y clasificar los datos en diferentes grupos en funcion de sus atributos Siguiendo el ejemplo anterior un software de aprendizaje no supervisado no seria capaz de decirnos si una imagen dada es un rostro o no pero si podria por ejemplo clasificar las imagenes entre aquellas que contienen rostros humanos de animales o las que no contienen La informacion obtenida por un algoritmo de aprendizaje no supervisado debe ser posteriormente interpretada por una persona para darle utilidad Aplicaciones EditarMotores de busqueda Diagnostico medico Deteccion de fraudes con el uso de tarjetas de credito Analisis del mercado de valores Clasificacion de secuencias de ADN Reconocimiento del habla Robotica Mineria de datos Big Data Previsiones de series temporalesTemas del aprendizaje automatico EditarA continuacion se muestran una serie de temas que podrian formar parte del temario de un curso sobre aprendizaje automatico Modelado de funciones de densidad de probabilidad condicionadas clasificacion y regresion Redes neuronales artificiales Arboles de decision El aprendizaje por arboles de decision usa un arbol de decision como modelo predictivo que mapea observaciones a conclusiones sobre el valor de un objeto dado Modelos de regresion multiple no postulados Regresion en procesos Gaussianos Analisis de discriminantes lineales k vecinos mas proximos Perceptron Funciones de base radial Maquinas de soporte vectorial Modelado de funciones de densidad de probabilidad mediante modelos generativos Algoritmo EM Modelos graficos como las redes bayesianas y los campos aleatorios de Markov Mapeado topografico generativo Tecnicas de inferencia aproximada Cadenas de Markov y Metodo de Montecarlo Metodos variacionales Optimizacion La mayoria de los metodos descritos arriba usan algoritmos de optimizacion o son por si mismos instancias de problemas de optimizacion Historia y relacion con otros temas EditarEl aprendizaje automatico nacio de la busqueda de inteligencia artificial Ya en los primeros dias de la IA como disciplina academica algunos investigadores se interesaron en hacer que las maquinas aprendiesen Trataron de resolver el problema con diversos metodos simbolicos asi como lo que ellos llamaron redes neurales que eran en general perceptrones y otros modelos basicamente basados en modelos lineares generalizados como se conocen en las estadisticas Software EditarMuchos lenguajes de programacion pueden usarse para implementar algoritmos de aprendizaje automatico Los mas populares para 2015 eran R y Python 6 R es muy usado ante todo en el campo academico mientras que Python es mas popular en la empresa privada Entre los paquetes de software que incluyen algoritmos de aprendizaje automatizado se hallan los siguientes Software de codigo abierto Editar TensorFlow plataforma multilenguaje y multiplataforma desarrollada por Google y licenciada como Apache 2 Apache Mahout plataforma de Java de algoritmos escalables de aprendizaje automatico en especial en las areas de filtro colaborativo clustering y clasificacion dlib una biblioteca bajo licencia Boost para desarrollar en C ELKI una plataforma para Java con licencia AGPLv3 Encog H2O KNIME mlpy MLPACK MOA OpenCV Tortilla JS OpenNN R lenguaje de programacion estadistico con numerosas bibliotecas relacionadas al aprendizaje automatico e1071 rpart nnet randomForest entre otras RapidMiner scikit learn biblioteca en Python que interactua con NumPy y SciPy Spark MLlib una libreria que forma parte de Apache Spark una plataforma para computacion de grupos Weka una biblioteca en Java Software comercial Editar SPSS Modeler Mathematica MATLAB Microsoft Azure Machine Learning Neural Designer Oracle Data Mining RCASE STATISTICA SASSesgos EditarLos algoritmos de aprendizaje automatico a menudo pueden verse afectados por el sesgo que puedan tener los datos Ver sesgo algoritmico Por ejemplo no se podran clasificar todos aquellas entradas de las que no se haya recibido ninguna informacion en la fase de entrenamiento De hecho cuando el entrenamiento se realiza con datos clasificados por el ser humano el aprendizaje automatico tiende a crear los mismos segos que hay en la sociedad Algunos ejemplos de esto son cuando en 2015 el algoritmo de Google photos identificaba algunas personas negras con gorilas o en 2016 cuando el bot de Twitter de Microsoft desarrollo comportamientos racistas y machistas a base de observar el trafico de datos en dicha red social Por este motivo en los ultimos anos ha habido una tendencia a desarrollar metodos para aumentar la equidad es decir para reducir el sesgo en este tipo algoritmos por parte de los expertos en IA Citando a Fei fei Li La IA no tiene nada de especial Se inspira en personas es creada por personas y lo mas importante impacta en las personas Es una herramienta muy poderosa que tan solo hemos comenzado a entender y esa es una gran responsabilidad 7 Vease tambien EditarAprendizaje profundo Dinamica de sistemas Inteligencia artificial Inteligencia computacional Internet de las cosas Sistema dinamico Reconocimiento de patrones Reglas de asociacion Robot autonomo Equidad aprendizaje automatico Referencias Editar Russell Stuart Norvig Peter 2009 Inteligencia Artificial Un Enfoque Moderno 3rd edicion p 229 Russell and Norvig 2021 Artificial Intelligence A Modern Approach en ingles Pearson p 651 ISBN 9780134610993 Flach 2012 Pags 20 21 Sutton Richard S Barto Andrew G Reinforcement Learning An Introduction The MIT Press Flach 2012 Pags 155 156 Four main languages for analytics and data mining science KD Nuggets Fei Fei Li s Quest to Make Machines Better for Humanity Wired en ingles ISSN 1059 1028 Consultado el 17 de diciembre de 2019 Bibliografia EditarBishop Christopher 2008 Pattern Recognition and Machine Learning Springer Verlag ISBN 978 0 3873 1073 2 Flach Peter 2012 Machine Learning The Art and Science of Algorithms that Make Sense of Data Cambridge University Press ISBN 978 1 107 42222 3 Gollapudi Sunila 2016 Practical Machine Learning Packt Publishing ISBN 978 1 78439 968 4 Ian H Witten and Eibe Frank 2011 Data Mining Practical machine learning tools and techniques Morgan Kaufmann 664 pag ISBN 978 0 12 374856 0 Mitchell T 1997 Machine Learning McGraw Hill ISBN 0 07 042807 7 Raschka Sebastian 2015 Python Machine Learning Packt Open Source ISBN 978 1 78355 513 0Enlaces externos EditarEjemplos practicos de Machine Learning en Espanol Blog sobre Aprendizaje Automatico La biblia del Machine Learning El Machine Learning cambiara el mundo Machine Learning Development with Perl en ingles Estudio y aplicacion de tecnicas de aprendizaje automatico orientadas al ambito medico estimacion y explicacion de predicciones individuales Universidad Autonoma de Madrid AlphaGo Machine Learning explicado podcast Machine Learning Seleccion de metricas de clasificacion en espanol Datos Q2539 Multimedia Machine learning Obtenido de https es wikipedia org w index php title Aprendizaje automatico amp oldid 139365739, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos