fbpx
Wikipedia

Análisis exploratorio de datos

El análisis exploratorio de datos es una forma de analizar datos definido por John W. Tukey (E.D.A.: Exploratory data analysis) es el tratamiento estadístico al que se someten las muestras recogidas durante un proceso de investigación en cualquier campo científico. Para mayor rapidez y precisión, todo el proceso suele realizarse por medios informáticos, con aplicaciones específicas para el tratamiento estadístico. Los E.D.A., no necesariamente, se llevan a cabo con una base de datos al uso, ni con una hoja de cálculo convencional; no obstante el programa SPSS y los lenguajes de programación R y Python son las aplicaciones más utilizadas, aunque no las únicas.

Por ejemplo, en el campo de la Arqueología el análisis técnico de una pieza puede ser simultáneo a la introducción de los datos, bien porque las fichas estén directamente informatizadas o, bien, porque se usen formularios en papel cuyos datos sean fáciles de introducir en el ordenador o computadora. Es posible, incluso, usar en la propia excavación, una serie de PDAs conectados en red inalámbrica instalada en el yacimiento arqueológico, que envíen numerosos datos de campo a una base de datos central que luego se usarán con fines diversos, entre ellos este. Los pasos seguidos en el E. D. A. son básicamente dos:

  • Medición y descripción de los datos tecnológicos —tipológicos— y dimensiones, por medio de la Estadística descriptiva. Aquí tenemos, por un lado, las medidas de tendencia central (promedios que, en una sola cifra, resumen todos los valores de una muestra: media, mediana y moda son las más habituales) y, por otro, las medidas de dispersión (que calculan hasta qué punto la muestra se agrupa o no en torno a esos promedios). Dentro de este apartado, se ha de procurar, además, calibrar la confianza de las muestras a través de tres estadímetros básicos: la desviación estándar de la muestra, la curtosis y la asimetría.
La siguiente es una tabla de ejemplo:
Número de Mediciones
383
383
383
383
Error estándar
1%
0,7%
0,7%
8,6%
Medición máxima
142 mm
127 mm
94 mm
1025 g
Medición mínima
29 mm
27 mm
12 mm
16 g
Recorrido
115 mm
98 mm
82 mm
1009 g
Moda
82 mm
60 mm
38 mm
236 g
Mediana
75 mm
61 mm
39 mm
219 g
Rango intercuartil
25 mm
18 mm
17 mm
207 g
Media aritmética
77 mm
62 mm
39 mm
247 g
Desviación estándar
19 mm
14 mm
13 mm
167 g
Coeficiente de variación
25 %
23 %
33 %
68 %
Varianza
376,84
198,67
170,96
27 838,44
Simetría
0,53
0,53
0,48
1,32
Curtosis
0,47
0,83
0,43
2,44
Yacimiento 1⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎫ Yacimiento 2⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎫⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎫  ⎬⎯⎯⎯⎯⎯⎯⎯ Yacimiento 3⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎭  ⎬⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎭ Yacimiento 4⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎭ 

Resultados del análisis de mulivariante de conglomerados por el método de Ward efectuado en los ciertos tipos líticos, computando variables tecnológicas. Es un ejemplo real, en él se permite observar la similitud o disparidad de los yacimientos seleccionados en virtud de una serie de parámetros seleccionados por el investigador.

Los cálculos estadísticos orientan sobre la fiabilidad de las muestras usadas, aunque no son infalibles, e indican si los resultados obtenidos al calcular las pruebas inferenciales son aceptables, es lo que llamamos nivel de confianza (se debe procurar que este nunca sea inferior al 95% = 0,95).

Bibliografía

  • García Barbancho, Alfonso (1973). Estadística elemental moderna. Editorial Ariel SA, Málaga. ISBN 84-334-0121-5. 
  • García Pérez, Alfonso (1992). Estadística aplicada: Conceptos básicos. Universidad Nacional de Educación a Distancia, Madrid. ISBN 84-362-2811-1. 
  • Martín Tabernero, Francisca y Delgado Álvarez, María del Carmen (1993). Estadística aplicada. Tratamiento informático con Stat View 512+. Publicaciones de la Universidad Pontificia, Salamanca. ISBN 84-7299-308-6. 
  • Shennan, Stephen (1992). Arqueología cuantitativa. Editorial Crítica, Barcelona. ISBN 84-7423-529-4. 
  • Siegel, Sidney (1985). Estadística no Paramétrica aplicada a las ciencias de la conducta. Editorial Trillas, México DF. ISBN 968-24-0146-1. 


  •   Datos: Q1322871

análisis, exploratorio, datos, análisis, exploratorio, datos, forma, analizar, datos, definido, john, tukey, exploratory, data, analysis, tratamiento, estadístico, someten, muestras, recogidas, durante, proceso, investigación, cualquier, campo, científico, par. El analisis exploratorio de datos es una forma de analizar datos definido por John W Tukey E D A Exploratory data analysis es el tratamiento estadistico al que se someten las muestras recogidas durante un proceso de investigacion en cualquier campo cientifico Para mayor rapidez y precision todo el proceso suele realizarse por medios informaticos con aplicaciones especificas para el tratamiento estadistico Los E D A no necesariamente se llevan a cabo con una base de datos al uso ni con una hoja de calculo convencional no obstante el programa SPSS y los lenguajes de programacion R y Python son las aplicaciones mas utilizadas aunque no las unicas Por ejemplo en el campo de la Arqueologia el analisis tecnico de una pieza puede ser simultaneo a la introduccion de los datos bien porque las fichas esten directamente informatizadas o bien porque se usen formularios en papel cuyos datos sean faciles de introducir en el ordenador o computadora Es posible incluso usar en la propia excavacion una serie de PDAs conectados en red inalambrica instalada en el yacimiento arqueologico que envien numerosos datos de campo a una base de datos central que luego se usaran con fines diversos entre ellos este Los pasos seguidos en el E D A son basicamente dos Medicion y descripcion de los datos tecnologicos tipologicos y dimensiones por medio de la Estadistica descriptiva Aqui tenemos por un lado las medidas de tendencia central promedios que en una sola cifra resumen todos los valores de una muestra media mediana y moda son las mas habituales y por otro las medidas de dispersion que calculan hasta que punto la muestra se agrupa o no en torno a esos promedios Dentro de este apartado se ha de procurar ademas calibrar la confianza de las muestras a traves de tres estadimetros basicos la desviacion estandar de la muestra la curtosis y la asimetria La siguiente es una tabla de ejemplo Estadisticos descriptivos Longitud Anchura Grosor PesoNumero de Mediciones 383 383 383 383Error estandar 1 0 7 0 7 8 6 Medicion maxima 142 mm 127 mm 94 mm 1025 gMedicion minima 29 mm 27 mm 12 mm 16 gRecorrido 115 mm 98 mm 82 mm 1009 gModa 82 mm 60 mm 38 mm 236 gMediana 75 mm 61 mm 39 mm 219 gRango intercuartil 25 mm 18 mm 17 mm 207 gMedia aritmetica 77 mm 62 mm 39 mm 247 gDesviacion estandar 19 mm 14 mm 13 mm 167 gCoeficiente de variacion 25 23 33 68 Varianza 376 84 198 67 170 96 27 838 44Simetria 0 53 0 53 0 48 1 32Curtosis 0 47 0 83 0 43 2 44 Comparacion de los caracteres de una muestra o de varias muestras diferentes por medio de la Estadistica inferencial Las pruebas mas frecuentemente utilizadas comienzan por las mas sencillas comparaciones visuales a traves de graficas como la campana de Gauss nubes de dispersion o diagramas de caja y arbotantes pasando por las socorridas tablas de contingencia incluido la prueba del x2 y por los tipicos Analisis de Varianza que no es mas que una confrontacion muy precisa de los promedios de varias muestras hasta llegar a los mas complejos analisis multivariantes de conglomerados Yacimiento 1 Yacimiento 2 Yacimiento 3 Yacimiento 4 Resultados del analisis de mulivariante de conglomerados por el metodo de Ward efectuado en los ciertos tipos liticos computando variables tecnologicas Es un ejemplo real en el se permite observar la similitud o disparidad de los yacimientos seleccionados en virtud de una serie de parametros seleccionados por el investigador Los calculos estadisticos orientan sobre la fiabilidad de las muestras usadas aunque no son infalibles e indican si los resultados obtenidos al calcular las pruebas inferenciales son aceptables es lo que llamamos nivel de confianza se debe procurar que este nunca sea inferior al 95 0 95 Bibliografia EditarGarcia Barbancho Alfonso 1973 Estadistica elemental moderna Editorial Ariel SA Malaga ISBN 84 334 0121 5 Garcia Perez Alfonso 1992 Estadistica aplicada Conceptos basicos Universidad Nacional de Educacion a Distancia Madrid ISBN 84 362 2811 1 Martin Tabernero Francisca y Delgado Alvarez Maria del Carmen 1993 Estadistica aplicada Tratamiento informatico con Stat View 512 Publicaciones de la Universidad Pontificia Salamanca ISBN 84 7299 308 6 Shennan Stephen 1992 Arqueologia cuantitativa Editorial Critica Barcelona ISBN 84 7423 529 4 Siegel Sidney 1985 Estadistica no Parametrica aplicada a las ciencias de la conducta Editorial Trillas Mexico DF ISBN 968 24 0146 1 Datos Q1322871Obtenido de https es wikipedia org w index php title Analisis exploratorio de datos amp oldid 135085588, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos