fbpx
Wikipedia

Análisis de datos

El análisis de datos es un proceso que consiste en inspeccionar,[1]limpiar y transformar datos con el objetivo de resaltar información útil, para sugerir conclusiones y apoyo en la toma de decisiones. El análisis de datos tiene múltiples facetas y enfoques, que abarca diversas técnicas en una variedad de nombres, en diferentes negocios, la ciencia, y los dominios de las ciencias sociales. Los datos se coleccionan y analizan para indagar en cuestiones, probar conjeturas o refutar teorías.[2]

El análisis de datos es un proceso que consiste en inspeccionar, limpiar y transformar datos con el objetivo de resaltar información útil, para sugerir conclusiones y apoyo en la toma de decisiones.

Se centra en la inferencia estadística, la cual permite tomar una decisión de forma sencilla con un grado de confianza determinado,[3]​ identificando, analizando tanto datos como patrones de comportamiento. Las técnicas de este análisis varían según las necesidades de la organización así como también las soluciones tecnológicas,tales como KNIME , R y tableros de viualización (como Power BI o Qlik View, Tableau o Sas Visual Analytics). Estos proyectan en tiempo real los datos en formato visual.[4][5][6][7][8][9][10]

Antecedentes

El análisis de datos, en su estudio de la estructura de grandes conjuntos, es moderno pero los métodos de análisis son de larga data. Quien introdujo por primera vez el método de análisis de factores fue Ch. Spearman en 1904 (concepto de factor).[11]​La primera definición se remonta al año de 1961, cuando el matemático John Wilder Tukey, predijo el efecto de la computación en el análisis definiéndolo como: "(los) Procedimientos para analizar datos, (las) técnicas para interpretar los resultados de dichos procedimientos, (las) formas de planear la recolección de datos para hacer el análisis más fácil, más preciso o más exacto, y toda la maquinaria y los resultados de las estadísticas (matemáticas) que se aplican al análisis." [12]

Tipos de Análisis

Puede dividirse de acuerdo con el tipo de información que estudia en: análisis cuantitativo y cualitativo. El primero, examina la relación entre información cuantificable; El segundo, examina la relación de información no numérica en contextos situacionales y estructurales. [13]

También puede dividirse de acuerdo al objetivo en: análisis exploratorio (ADE) y análisis confirmatorio (ADC). El primero, busca vínculos y relaciones entre los datos; El segundo, se enfoca en comprobar las hipótesis formuladas respecto a un conjunto de información. [14]

Métodos de análisis

Son varios los enfoques presentados, sin pretender ser una metodología estricta sino más bien inicial o para exploración de campo, podemos mencionar las siguientes.[15]

Análisis factorial lineal

  • Análisis de componentes principales.
  • Análisis de correspondencia binaria.
  • Análisis de correspondencia múltiple.
  • Análisis discriminante.

Análisis no lineal de los datos

  • Basados en núcleos:
  • Análisis de componentes principales del núcleo.
  • Análisis discriminante del núcleo.
  • Basados en redes neuronales.

Se pueden aplicar fórmulas o modelos matemáticos (conocidos como algoritmos) a los datos para identificar relaciones entre las variables; por ejemplo, utilizando correlación o causalidad.[16][17]​ En términos generales, se pueden desarrollar modelos para evaluar una variable específica basada en otras variables contenidas en el conjunto de datos, con algún error residual dependiendo de la precisión del modelo implementado (por ejemplo, Datos = Modelo + Error).[18][19]

La estadística inferencial incluye la utilización de técnicas que miden las relaciones entre variables particulares. Por ejemplo, el análisis de regresión puede utilizarse para modelar si un cambio en la publicidad (variable independiente X) proporciona una explicación de la variación en las ventas (variable dependiente Y). En términos matemáticos, Y (ventas) es una función de X (publicidad). Puede describirse como:

 

donde el modelo está diseñado de manera que   y   minimizan el error cuando el modelo predice   para un rango dado de valores de  . Los analistas también pueden intentar construir modelos que sean descriptivos de los datos, con el objetivo de simplificar el análisis y comunicar los resultados.[20]

Véase también

Referencias

  1. «El proceso de análisis de datos - Marketing Analítico». Marketing Analítico. 1 de marzo de 2017. Consultado el 6 de noviembre de 2018. 
  2. Judd, Charles; McCleland, Gary (1989). Data Analysis. Harcourt Brace Jovanovich. ISBN 0-15-516765-0. 
  3. Hernández Martín-Logroño, Zenaida (2012). Métodos de análisis de datos: apuntes. Métodos estadísticos I. Universidad de la Rioja. Servicio de Publicaciones. ISBN 978-84-615-7579-4. 
  4. Visualización de Datos: Definición, Importancia y Oportunidades
  5. End to End Data Science
  6. Paradis, Emmanuel traducido por Jorge A. Ahumada (2002). «R para Principiantes» (pdf). 
  7. ¿Qué es Power BI?
  8. Diseñado para usos ilimitados
  9. ¿Qué es Tableau?
  10. SAS® Products, Technology & Solutions
  11. Ambapour, Samuel (1 de abril de 2003). (pdf). L'INS Congo (Bureau d'Application des Methodes Statiques et Informatiques) (en francés). Archivado desde el original el 13 de noviembre de 2009. Consultado el 22 de diciembre de 2018. 
  12. John Tukey-The Future of Data Analysis-July 1961 La traducción es del inglés "Procedures for analyzing data, techniques for interpreting the results of such procedures, ways of planning the gathering of data to make its analysis easier, more precise or more accurate, and all the machinery and results of (mathematical) statistics which aply to analysis data."
  13. Fernández, Pita; Díaz, Pértegas. «Investigación cuantitativa y cualitativa». Consultado el 18 de octubre de 2020. 
  14. «Análitica de datos». Consultado el 18 de octubre de 2020. 
  15. Crucianu, Michel; Asselin de Beauville, Jean-Pierre; Boné, Romuald (2004). Hermès - Lavoisier, ed. Méthodes factorielles pour l'analyse des données [Métodos factoriales para el análisis de datos.]. Hermès Science (en francés). p. 288. ISBN 978-2-7462-0921-3. 
  16. Ben-Ari, Mordechai (2012), «First-Order Logic: Formulas, Models, Tableaux», Mathematical Logic for Computer Science (London: Springer London): 131-154, ISBN 978-1-4471-4128-0, doi:10.1007/978-1-4471-4129-7_7, consultado el 31 de mayo de 2021 .
  17. Ernest., Sosa (2011). Causation. Oxford Univ. Press. ISBN 978-0-19-875094-9. OCLC 767569031. 
  18. Data Science from Scratch. First Principles with Python. O'Reilly. 2019. ISBN 9781492041139. 
  19. «Figure 2. Variable importance by permutation, averaged over 25 models.». dx.doi.org. doi:10.7554/elife.22053.004. Consultado el 31 de mayo de 2021. 
  20. Nwabueze, JC (21 de mayo de 2008). «Performances of estimators of linear model with auto-correlated error terms when the independent variable is normal». Journal of the Nigerian Association of Mathematical Physics 9 (1). ISSN 1116-4336. doi:10.4314/jonamp.v9i1.40071. 

Enlaces externos

  • NIST/SEMATEK (2008) Handbook of Statistical Methods,
  • Vance (8 de septiembre de 2011). «Data Analytics: Crunching the Future». Bloomberg Businessweek. Consultado el 26 de septiembre de 2011. 
  • en Wayback Machine (archivado el 22 de junio de 2013). Hair, Joseph (2008). Marketing Research 4th ed. McGraw Hill ISBN 0-07-340470-5.


  •   Datos: Q1988917
  •   Multimedia: Data analysis

análisis, datos, análisis, datos, proceso, consiste, inspeccionar, limpiar, transformar, datos, objetivo, resaltar, información, útil, para, sugerir, conclusiones, apoyo, toma, decisiones, análisis, datos, tiene, múltiples, facetas, enfoques, abarca, diversas,. El analisis de datos es un proceso que consiste en inspeccionar 1 limpiar y transformar datos con el objetivo de resaltar informacion util para sugerir conclusiones y apoyo en la toma de decisiones El analisis de datos tiene multiples facetas y enfoques que abarca diversas tecnicas en una variedad de nombres en diferentes negocios la ciencia y los dominios de las ciencias sociales Los datos se coleccionan y analizan para indagar en cuestiones probar conjeturas o refutar teorias 2 El analisis de datos es un proceso que consiste en inspeccionar limpiar y transformar datos con el objetivo de resaltar informacion util para sugerir conclusiones y apoyo en la toma de decisiones Se centra en la inferencia estadistica la cual permite tomar una decision de forma sencilla con un grado de confianza determinado 3 identificando analizando tanto datos como patrones de comportamiento Las tecnicas de este analisis varian segun las necesidades de la organizacion asi como tambien las soluciones tecnologicas tales como KNIME R y tableros de viualizacion como Power BI o Qlik View Tableau o Sas Visual Analytics Estos proyectan en tiempo real los datos en formato visual 4 5 6 7 8 9 10 Indice 1 Antecedentes 2 Tipos de Analisis 3 Metodos de analisis 3 1 Analisis factorial lineal 3 2 Analisis no lineal de los datos 4 Vease tambien 5 Referencias 6 Enlaces externosAntecedentes EditarEl analisis de datos en su estudio de la estructura de grandes conjuntos es moderno pero los metodos de analisis son de larga data Quien introdujo por primera vez el metodo de analisis de factores fue Ch Spearman en 1904 concepto de factor 11 La primera definicion se remonta al ano de 1961 cuando el matematico John Wilder Tukey predijo el efecto de la computacion en el analisis definiendolo como los Procedimientos para analizar datos las tecnicas para interpretar los resultados de dichos procedimientos las formas de planear la recoleccion de datos para hacer el analisis mas facil mas preciso o mas exacto y toda la maquinaria y los resultados de las estadisticas matematicas que se aplican al analisis 12 Tipos de Analisis EditarPuede dividirse de acuerdo con el tipo de informacion que estudia en analisis cuantitativo y cualitativo El primero examina la relacion entre informacion cuantificable El segundo examina la relacion de informacion no numerica en contextos situacionales y estructurales 13 Tambien puede dividirse de acuerdo al objetivo en analisis exploratorio ADE y analisis confirmatorio ADC El primero busca vinculos y relaciones entre los datos El segundo se enfoca en comprobar las hipotesis formuladas respecto a un conjunto de informacion 14 Metodos de analisis EditarSon varios los enfoques presentados sin pretender ser una metodologia estricta sino mas bien inicial o para exploracion de campo podemos mencionar las siguientes 15 Analisis factorial lineal Editar Analisis de componentes principales Analisis de correspondencia binaria Analisis de correspondencia multiple Analisis discriminante Analisis no lineal de los datos Editar Basados en nucleos Analisis de componentes principales del nucleo Analisis discriminante del nucleo Basados en redes neuronales Se pueden aplicar formulas o modelos matematicos conocidos como algoritmos a los datos para identificar relaciones entre las variables por ejemplo utilizando correlacion o causalidad 16 17 En terminos generales se pueden desarrollar modelos para evaluar una variable especifica basada en otras variables contenidas en el conjunto de datos con algun error residual dependiendo de la precision del modelo implementado por ejemplo Datos Modelo Error 18 19 La estadistica inferencial incluye la utilizacion de tecnicas que miden las relaciones entre variables particulares Por ejemplo el analisis de regresion puede utilizarse para modelar si un cambio en la publicidad variable independiente X proporciona una explicacion de la variacion en las ventas variable dependiente Y En terminos matematicos Y ventas es una funcion de X publicidad Puede describirse como Y a X b e r r o r displaystyle Y a times X b error donde el modelo esta disenado de manera que a displaystyle a y b displaystyle b minimizan el error cuando el modelo predice Y displaystyle Y para un rango dado de valores de X displaystyle X Los analistas tambien pueden intentar construir modelos que sean descriptivos de los datos con el objetivo de simplificar el analisis y comunicar los resultados 20 Vease tambien EditarAnalisis factorial Analisis predictivo Analisis exploratorio de datos Conjunto de datos Contraste de hipotesis Estadisticas Estructura de datos Iconografia de las correlacionesReferencias Editar El proceso de analisis de datos Marketing Analitico Marketing Analitico 1 de marzo de 2017 Consultado el 6 de noviembre de 2018 Judd Charles McCleland Gary 1989 Data Analysis Harcourt Brace Jovanovich ISBN 0 15 516765 0 Hernandez Martin Logrono Zenaida 2012 Metodos de analisis de datos apuntes Metodos estadisticos I Universidad de la Rioja Servicio de Publicaciones ISBN 978 84 615 7579 4 Visualizacion de Datos Definicion Importancia y Oportunidades End to End Data Science Paradis Emmanuel traducido por Jorge A Ahumada 2002 R para Principiantes pdf Que es Power BI Disenado para usos ilimitados Que es Tableau SAS Products Technology amp Solutions Ambapour Samuel 1 de abril de 2003 Introduction a l analyse des donnees pdf L INS Congo Bureau d Application des Methodes Statiques et Informatiques en frances Archivado desde el original el 13 de noviembre de 2009 Consultado el 22 de diciembre de 2018 John Tukey The Future of Data Analysis July 1961 La traduccion es del ingles Procedures for analyzing data techniques for interpreting the results of such procedures ways of planning the gathering of data to make its analysis easier more precise or more accurate and all the machinery and results of mathematical statistics which aply to analysis data Fernandez Pita Diaz Pertegas Investigacion cuantitativa y cualitativa Consultado el 18 de octubre de 2020 Analitica de datos Consultado el 18 de octubre de 2020 Crucianu Michel Asselin de Beauville Jean Pierre Bone Romuald 2004 Hermes Lavoisier ed Methodes factorielles pour l analyse des donnees Metodos factoriales para el analisis de datos Hermes Science en frances p 288 ISBN 978 2 7462 0921 3 Ben Ari Mordechai 2012 First Order Logic Formulas Models Tableaux Mathematical Logic for Computer Science London Springer London 131 154 ISBN 978 1 4471 4128 0 doi 10 1007 978 1 4471 4129 7 7 consultado el 31 de mayo de 2021 Ernest Sosa 2011 Causation Oxford Univ Press ISBN 978 0 19 875094 9 OCLC 767569031 Data Science from Scratch First Principles with Python O Reilly 2019 ISBN 9781492041139 Figure 2 Variable importance by permutation averaged over 25 models dx doi org doi 10 7554 elife 22053 004 Consultado el 31 de mayo de 2021 Nwabueze JC 21 de mayo de 2008 Performances of estimators of linear model with auto correlated error terms when the independent variable is normal Journal of the Nigerian Association of Mathematical Physics 9 1 ISSN 1116 4336 doi 10 4314 jonamp v9i1 40071 Enlaces externos EditarNIST SEMATEK 2008 Handbook of Statistical Methods Vance 8 de septiembre de 2011 Data Analytics Crunching the Future Bloomberg Businessweek Consultado el 26 de septiembre de 2011 Data Analysis Testing for Association en Wayback Machine archivado el 22 de junio de 2013 Hair Joseph 2008 Marketing Research 4th ed McGraw Hill ISBN 0 07 340470 5 Datos Q1988917 Multimedia Data analysis Obtenido de https es wikipedia org w index php title Analisis de datos amp oldid 142335756, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos