fbpx
Wikipedia

Weka (aprendizaje automático)

Weka (Waikato Environment for Knowledge Analysis, en español «entorno para análisis del conocimiento de la Universidad de Waikato») es una plataforma de software para el aprendizaje automático y la minería de datos escrito en Java y desarrollado en la Universidad de Waikato. Weka es software libre distribuido bajo la licencia GNU-GPL.

Weka

Pantalla Weka 3.5.5
Información general
Tipo de programa Aprendizaje automático
Desarrollador Universidad de Waikato (Nueva Zelanda)
Licencia GPL
Información técnica
Programado en Java
Plataformas admitidas máquina virtual Java
Versiones
Última versión estable 3.6.15 (book), 3.8.3 (stable), 3.9 (development) 31 de octubre de 2011
Archivos legibles
Attribute-Relation File Format
Enlaces
Sitio web oficial
Repositorio de código

Breve historia

  • En 1993, la Universidad de Waikato de Nueva Zelanda inició el desarrollo de la versión original de Weka (en TCL/TK y C).
  • En 1997, se decidió reescribir el código en Java incluyendo implementaciones de algoritmos de modelado.[1]
  • En 2005, Weka recibe de SIGKDD[2][3]​ (Special Interest Group on Knowledge Discovery and Data Mining) el galardón "Data Mining and Knowledge Discovery Service".
  • En 2006, Pentaho Corporation adquirió una licencia exclusiva para usar Weka para Inteligencia de negocio (Business Intelligence), dando lugar al componente de minería de datos y análisis predictivo del paquete de software Pentaho Business Intelligence.

Descripción

El paquete Weka[4]​ contiene una colección de herramientas de visualización y algoritmos para análisis de datos y modelado predictivo, unidos a una interfaz gráfica de usuario para acceder fácilmente a sus funcionalidades. La versión original de Weka fue un front-end en TCL/TK para modelar algoritmos implementados en otros lenguajes de programación, más unas utilidades para preprocesamiento de datos desarrolladas en C para hacer experimentos de aprendizaje automático. Esta versión original se diseñó inicialmente como herramienta para analizar datos procedentes del dominio de la agricultura,[5][6]​ pero la versión más reciente basada en Java (WEKA 3), que empezó a desarrollarse en 1997, se utiliza en muchas y muy diferentes áreas, en particular con finalidades docentes y de investigación.

Características de Weka

Las características de Weka son:

  • Está disponible libremente bajo la licencia pública general de GNU.
  • Es muy portable porque está completamente implementado en Java y puede correr en casi cualquier plataforma.
  • Contiene una extensa colección de técnicas para preprocesamiento de datos y modelado.
  • Es fácil de utilizar por un principiante gracias a su interfaz gráfica de usuario.

Weka soporta varias tareas estándar de minería de datos, especialmente, preprocesamiento de datos, clustering, clasificación, regresión, visualización, y selección. Todas las técnicas de Weka se fundamentan en la asunción de que los datos están disponibles en un fichero plano (flat file) o una relación, en la que cada registro de datos está descrito por un número fijo de atributos (normalmente numéricos o nominales, aunque también se soportan otros tipos). Weka también proporciona acceso a bases de datos vía SQL gracias a la conexión JDBC (Java Database Connectivity) y puede procesar el resultado devuelto por una consulta hecha a la base de datos. No puede realizar minería de datos multi-relacional, pero existen aplicaciones que pueden convertir una colección de tablas relacionadas de una base de datos en una única tabla que ya puede ser procesada con Weka.[7]

Un área importante que actualmente no cubren los algoritmos incluidos en Weka es el modelado de secuencias.

La interfaz de usuario

 

Al ejecutar la aplicación nos aparece el selector de interfaz de Weka (Weka GUI Chooser) que da la opción de seleccionar entre cuatro posibles interfaces de usuario para acceder a las funcionalidades del programa, éstas son Simple CLI, Explorer, Experimenter y Knowledge Flow.

Simple CLI

Simple CLI es la abreviatura de Simple Command-Line Interface («interfaz simple de línea de comandos»). Se trata de una consola que permite acceder a todas las opciones de Weka desde línea de comandos.

Explorer

La interfaz Explorer (Explorador) dispone de varios paneles que dan acceso a los componentes principales del banco de trabajo:

  • El panel Preprocess dispone de opciones para importar datos de una base de datos, de un fichero CSV, etc., y para preprocesar estos datos utilizando los denominados algoritmos de filtrado. Estos filtros se pueden utilizar para transformar los datos (por ejemplo convirtiendo datos numéricos en valores discretos) y para eliminar registros o atributos según ciertos criterios previamente especificados.
  • El panel Classify permite al usuario aplicar algoritmos de clasificación estadística y análisis de regresión a los conjuntos de datos resultantes. También permite estimar la exactitud del modelo predictivo resultante, mediante curvas ROC, etc. Finalmente, tiene utilidades para visualizar el propio modelo, en aquellos casos en que esto sea posible, como por ejemplo un árbol de decisión.
  • El panel Associate proporciona acceso a las reglas de asociación aprendidas que intentan identificar todas las interrelaciones importantes entre los atributos de los datos.
  • El panel Selected attributes proporciona algoritmos para identificar los atributos más predictivos en un conjunto de datos.
  • El panel Visualize muestra una matriz de puntos dispersos (scatterplot) donde cada punto individual puede seleccionarse y agrandarse para ser analizados en detalle usando varios operadores de selección.

Experimenter

La interfaz Experimenter («experimentador») permite la comparación sistemática de una ejecución de los algoritmos predictivos de Weka sobre una colección de conjuntos de datos.

Knowledge Flow

Knowledge Flow («flujo de conocimiento») es una interfaz que en esencia implementa las mismas funciones que Explorer, y además permite "arrastrar y soltar". También puede ofrecer aprendizaje incremental.

Aplicaciones relacionadas

Véase también

Referencias

  1. Ian H. Witten; Eibe Frank; Len Trigg; Mark Hall; Geoffrey Holmes; Sally Jo Cunningham (1999). «Weka: Practical Machine Learning Tools and Techniques with Java Implementations». Proceedings of the ICONIP/ANZIIS/ANNES'99 Workshop on Emerging Knowledge Engineering and Connectionist-Based Information Systems. pp. 192-196. Consultado el 26 de junio de 2007. 
  2. Gregory Piatetsky-Shapiro (28 de junio de 2005). «KDnuggets news on SIGKDD Service Award 2005». Consultado el 25 de junio de 2007. 
  3. . 2005. Archivado desde el original el 1 de julio de 2007. Consultado el 25 de junio de 2007. 
  4. Ian H. Witten; Eibe Frank (2005). «Data Mining: Practical machine learning tools and techniques, 2nd Edition». Morgan Kaufmann, San Francisco. Consultado el 25 de junio de 2007. 
  5. G. Holmes; A. Donkin; I.H. Witten (1994). «Weka: A machine learning workbench». Proc Second Australia and New Zealand Conference on Intelligent Information Systems, Brisbane, Australia. Consultado el 25 de junio de 2007. 
  6. S.R. Garner; S.J. Cunningham; G. Holmes; C.G. Nevill-Manning; I.H. Witten (1995). «Applying a machine learning workbench: Experience with agricultural databases». Proc Machine Learning in Practice Workshop, Machine Learning Conference, Tahoe City, CA, USA. pp. 14-21. Consultado el 25 de junio de 2007. 
  7. P. Reutemann; B. Pfahringer; E. Frank (2004). «Proper: A Toolbox for Learning from Relational Data with Propositional and Multi-Instance Learners». 17th Australian Joint Conference on Artificial Intelligence (AI2004). Springer-Verlag. Consultado el 25 de junio de 2007. 

Enlaces externos

Generales

  • Página oficial de Weka en la Universidad de Waikato, Nueva Zelanda
  • Página del proyecto Weka en SourceForge ( by Pentaho in September 2006)
  • WekaDoc Wiki de documentación de Weka
  • Página sobre Weka de Cèsar Ferri (UPV - España)
  • (en español)
  • Comparativa de algoritmos de DM implementados -

Ejemplos de aplicaciones

  • Acronym identification
  • Gene selection from microarray data for cancer classification
  • QSPR of metal complexation
  • of Expressed sequence tag (EST) data from plant/pathogen interface

Versiones extendidas

    •   Datos: Q115494
    •   Multimedia: Weka (machine learning)

    weka, aprendizaje, automático, weka, waikato, environment, knowledge, analysis, español, entorno, para, análisis, conocimiento, universidad, waikato, plataforma, software, para, aprendizaje, automático, minería, datos, escrito, java, desarrollado, universidad,. Weka Waikato Environment for Knowledge Analysis en espanol entorno para analisis del conocimiento de la Universidad de Waikato es una plataforma de software para el aprendizaje automatico y la mineria de datos escrito en Java y desarrollado en la Universidad de Waikato Weka es software libre distribuido bajo la licencia GNU GPL WekaPantalla Weka 3 5 5Informacion generalTipo de programaAprendizaje automaticoDesarrolladorUniversidad de Waikato Nueva Zelanda LicenciaGPLInformacion tecnicaProgramado enJavaPlataformas admitidasmaquina virtual JavaVersionesUltima version estable3 6 15 book 3 8 3 stable 3 9 development 31 de octubre de 2011Archivos legiblesAttribute Relation File FormatEnlacesSitio web oficial Repositorio de codigo editar datos en Wikidata Indice 1 Breve historia 2 Descripcion 2 1 Caracteristicas de Weka 3 La interfaz de usuario 3 1 Simple CLI 3 2 Explorer 3 3 Experimenter 3 4 Knowledge Flow 4 Aplicaciones relacionadas 5 Vease tambien 6 Referencias 7 Enlaces externos 7 1 Generales 7 2 Ejemplos de aplicaciones 7 3 Versiones extendidasBreve historia EditarEn 1993 la Universidad de Waikato de Nueva Zelanda inicio el desarrollo de la version original de Weka en TCL TK y C En 1997 se decidio reescribir el codigo en Java incluyendo implementaciones de algoritmos de modelado 1 En 2005 Weka recibe de SIGKDD 2 3 Special Interest Group on Knowledge Discovery and Data Mining el galardon Data Mining and Knowledge Discovery Service En 2006 Pentaho Corporation adquirio una licencia exclusiva para usar Weka para Inteligencia de negocio Business Intelligence dando lugar al componente de mineria de datos y analisis predictivo del paquete de software Pentaho Business Intelligence Descripcion EditarEl paquete Weka 4 contiene una coleccion de herramientas de visualizacion y algoritmos para analisis de datos y modelado predictivo unidos a una interfaz grafica de usuario para acceder facilmente a sus funcionalidades La version original de Weka fue un front end en TCL TK para modelar algoritmos implementados en otros lenguajes de programacion mas unas utilidades para preprocesamiento de datos desarrolladas en C para hacer experimentos de aprendizaje automatico Esta version original se diseno inicialmente como herramienta para analizar datos procedentes del dominio de la agricultura 5 6 pero la version mas reciente basada en Java WEKA 3 que empezo a desarrollarse en 1997 se utiliza en muchas y muy diferentes areas en particular con finalidades docentes y de investigacion Caracteristicas de Weka Editar Las caracteristicas de Weka son Esta disponible libremente bajo la licencia publica general de GNU Es muy portable porque esta completamente implementado en Java y puede correr en casi cualquier plataforma Contiene una extensa coleccion de tecnicas para preprocesamiento de datos y modelado Es facil de utilizar por un principiante gracias a su interfaz grafica de usuario Weka soporta varias tareas estandar de mineria de datos especialmente preprocesamiento de datos clustering clasificacion regresion visualizacion y seleccion Todas las tecnicas de Weka se fundamentan en la asuncion de que los datos estan disponibles en un fichero plano flat file o una relacion en la que cada registro de datos esta descrito por un numero fijo de atributos normalmente numericos o nominales aunque tambien se soportan otros tipos Weka tambien proporciona acceso a bases de datos via SQL gracias a la conexion JDBC Java Database Connectivity y puede procesar el resultado devuelto por una consulta hecha a la base de datos No puede realizar mineria de datos multi relacional pero existen aplicaciones que pueden convertir una coleccion de tablas relacionadas de una base de datos en una unica tabla que ya puede ser procesada con Weka 7 Un area importante que actualmente no cubren los algoritmos incluidos en Weka es el modelado de secuencias La interfaz de usuario Editar Al ejecutar la aplicacion nos aparece el selector de interfaz de Weka Weka GUI Chooser que da la opcion de seleccionar entre cuatro posibles interfaces de usuario para acceder a las funcionalidades del programa estas son Simple CLI Explorer Experimenter y Knowledge Flow Simple CLI Editar Simple CLI es la abreviatura de Simple Command Line Interface interfaz simple de linea de comandos Se trata de una consola que permite acceder a todas las opciones de Weka desde linea de comandos Explorer Editar La interfaz Explorer Explorador dispone de varios paneles que dan acceso a los componentes principales del banco de trabajo El panel Preprocess dispone de opciones para importar datos de una base de datos de un fichero CSV etc y para preprocesar estos datos utilizando los denominados algoritmos de filtrado Estos filtros se pueden utilizar para transformar los datos por ejemplo convirtiendo datos numericos en valores discretos y para eliminar registros o atributos segun ciertos criterios previamente especificados El panel Classify permite al usuario aplicar algoritmos de clasificacion estadistica y analisis de regresion a los conjuntos de datos resultantes Tambien permite estimar la exactitud del modelo predictivo resultante mediante curvas ROC etc Finalmente tiene utilidades para visualizar el propio modelo en aquellos casos en que esto sea posible como por ejemplo un arbol de decision El panel Associate proporciona acceso a las reglas de asociacion aprendidas que intentan identificar todas las interrelaciones importantes entre los atributos de los datos El panel Cluster da acceso a las tecnicas de clustering o agrupamiento de Weka como por ejemplo el algoritmo K means Este es solo una implementacion del algoritmo expectacion maximizacion para aprender una mezcla de distribuciones normales El panel Selected attributes proporciona algoritmos para identificar los atributos mas predictivos en un conjunto de datos El panel Visualize muestra una matriz de puntos dispersos scatterplot donde cada punto individual puede seleccionarse y agrandarse para ser analizados en detalle usando varios operadores de seleccion Experimenter Editar La interfaz Experimenter experimentador permite la comparacion sistematica de una ejecucion de los algoritmos predictivos de Weka sobre una coleccion de conjuntos de datos Knowledge Flow Editar Knowledge Flow flujo de conocimiento es una interfaz que en esencia implementa las mismas funciones que Explorer y ademas permite arrastrar y soltar Tambien puede ofrecer aprendizaje incremental Aplicaciones relacionadas EditarKNIME una plataforma de mineria de datos programada en Java Neural Designer una herramienta de analisis predictivo basada en tecnicas de aprendizaje profundo RapidMiner un entorno de mineria de datos implementado en Java y que interactua con Weka Vease tambien Editar Portal Software libre Contenido relacionado con Free Software Portal Logo svg Aprendizaje automatico Mineria de datosReferencias Editar Ian H Witten Eibe Frank Len Trigg Mark Hall Geoffrey Holmes Sally Jo Cunningham 1999 Weka Practical Machine Learning Tools and Techniques with Java Implementations Proceedings of the ICONIP ANZIIS ANNES 99 Workshop on Emerging Knowledge Engineering and Connectionist Based Information Systems pp 192 196 Consultado el 26 de junio de 2007 Gregory Piatetsky Shapiro 28 de junio de 2005 KDnuggets news on SIGKDD Service Award 2005 Consultado el 25 de junio de 2007 Overview of SIGKDD Service Award winners 2005 Archivado desde el original el 1 de julio de 2007 Consultado el 25 de junio de 2007 Ian H Witten Eibe Frank 2005 Data Mining Practical machine learning tools and techniques 2nd Edition Morgan Kaufmann San Francisco Consultado el 25 de junio de 2007 G Holmes A Donkin I H Witten 1994 Weka A machine learning workbench Proc Second Australia and New Zealand Conference on Intelligent Information Systems Brisbane Australia Consultado el 25 de junio de 2007 S R Garner S J Cunningham G Holmes C G Nevill Manning I H Witten 1995 Applying a machine learning workbench Experience with agricultural databases Proc Machine Learning in Practice Workshop Machine Learning Conference Tahoe City CA USA pp 14 21 Consultado el 25 de junio de 2007 P Reutemann B Pfahringer E Frank 2004 Proper A Toolbox for Learning from Relational Data with Propositional and Multi Instance Learners 17th Australian Joint Conference on Artificial Intelligence AI2004 Springer Verlag Consultado el 25 de junio de 2007 Enlaces externos EditarGenerales Editar Pagina oficial de Weka en la Universidad de Waikato Nueva Zelanda Pagina del proyecto Weka en SourceForge acquired by Pentaho in September 2006 WekaDoc Wiki de documentacion de Weka Pagina sobre Weka de Cesar Ferri UPV Espana Una introduccion a Weka en espanol Comparativa de algoritmos de DM implementados Via TodoBIEjemplos de aplicaciones Editar Acronym identification Gene selection from microarray data for cancer classification QSPR of metal complexation Classification of Expressed sequence tag EST data from plant pathogen interface Further related projects and applicationsVersiones extendidas Editar Weka4WS a Grid enabled version of Weka developed at University of Calabria Italy Datos Q115494 Multimedia Weka machine learning Obtenido de https es wikipedia org w index php title Weka aprendizaje automatico amp oldid 124073417, wikipedia, wiki, leyendo, leer, libro, biblioteca,

    español

    , española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos