fbpx
Wikipedia

Parámetro estadístico

En estadística, un parámetro es un número que resume la gran cantidad de datos que pueden derivarse del estudio de una variable estadística.[1]​ El cálculo de este número está bien definido, usualmente mediante una fórmula aritmética obtenida a partir de datos de la población.[2][3]

La media aritmética como resumen de la vejez de un país.

Los parámetros estadísticos son una consecuencia inevitable del propósito esencial de la estadística: crear un modelo de la realidad.[4]

El estudio de una gran cantidad de datos individuales de una población puede ser farragoso e inoperativo, por lo que se hace necesario realizar un resumen que permita tener una idea global de la población, compararla con otras, comprobar su ajuste a un modelo ideal, realizar estimaciones sobre datos desconocidos de la misma y, en definitiva, tomar decisiones. A estas tareas contribuyen de modo esencial los parámetros estadísticos.

Por ejemplo, suele ofrecerse como resumen de la juventud de una población la media aritmética de las edades de sus miembros, esto es, la suma de todas ellas, dividida por el total de individuos que componen tal población.

Enfoque descriptivo

 
Gráficas de distribuciones normales para distintos valores de sus dos parámetros.

Un parámetro estadístico es una medida poblacional. Este enfoque es el tradicional de la estadística descriptiva.[5][6][7]​ En este sentido, su acepción se acerca a la de medida o valor que se compara con otros, tomando una unidad de una determinada magnitud como referencia.

Por su parte, la facción más formal de la estadística, la estadística matemática y también la inferencia estadística utilizan el concepto de parámetro en su acepción matemática más pura, esto es, como variable que define una familia de objetos matemáticos en determinados modelos. Así se habla, por ejemplo, de una distribución normal de parámetros μ y σ como de una determinada familia de distribuciones con una distribución de probabilidad de expresión conocida, en la que tales parámetros definen aspectos concretos como la esperanza, la varianza, la curtosis, etc. Otro ejemplo común en este sentido es el de la distribución de Poisson, determinada por un parámetro, λ; o la distribución binomial, determinada por dos parámetros, n y p. Desde el punto de vista de la estadística matemática, el hecho de que estas distribuciones describan situaciones reales y los citados parámetros signifiquen un resumen de determinado conjunto de datos es indiferente.

Propiedades deseables en un parámetro

Según Yule[8]​ un parámetro estadístico es deseable que tenga las siguientes propiedades:

  • Se define de manera objetiva, es decir, es posible calcularlo sin ambigüedades, generalmente mediante una fórmula matemática. Por ejemplo, la media aritmética se define como la suma de todos los datos, dividida por el número de datos. No hay ambigüedad: si se realiza ese cálculo, se obtiene la media; si se realiza otro cálculo, se obtiene otra cosa. Sin embargo, la definición de moda como el "valor más frecuente", puede dar lugar a confusión cuando la mayor frecuencia la presentan varios valores distintos.
  • No desperdicia, a priori, ninguna de las observaciones. Con carácter general, un parámetro será más representativo de una determinada población, cuántos más valores de la variable estén implicados en su cálculo. Por ejemplo, para medir la dispersión puede calcularse el recorrido, que solo usa dos valores de la variable objeto de estudio, los extremos; o la desviación típica, en cuyo cálculo intervienen todos los datos del eventual estudio.
  • Es interpretable, significa algo. La mediana, por ejemplo, deja por debajo de su valor a la mitad de los datos, está justo en medio de todos ellos cuando están ordenados. Esta es una interpretación clara de su significado.
  • Es sencillo de calcular y se presta con facilidad a manipulaciones algebraicas. Se verá más abajo que una medida de la dispersión es la desviación media. Sin embargo, al estar definida mediante un valor absoluto, función definida a trozos y no derivable, no es útil para gran parte de los cálculos en los que estuviera implicada, aunque su interpretación sea muy clara.
  • Es poco sensible a las fluctuaciones muestrales. Si pequeñas variaciones en una muestra de datos estadísticos influyen en gran medida en un determinado parámetro, es porque tal parámetro no representa con fiabilidad a la población. Así pues es deseable que el valor de un parámetro con esta propiedad se mantenga estable ante las pequeñas oscilaciones que con frecuencia pueden presentar las distintas muestras estadísticas. Esta propiedad es más interesante en el caso de la estimación de parámetros. Por otra parte, los parámetros que no varían con los cambios de origen y escala o cuya variación está controlada algebraicamente, son apropiados en determinadas circunstancias como la tipificación.

Principales parámetros

Habitualmente se agrupan los parámetros en las siguientes categorías:

Medidas de posición.[9]

Se trata de valores de la variable estadística que se caracterizan por la posición que ocupan dentro del rango de valores posibles de esta. Entre ellos se distinguen:

Medidas de dispersión.[10]

Resumen la heterogeneidad de los datos, lo separados que estos están entre sí. Hay dos tipos, básicamente:

  • Medidas de dispersión absolutas, que vienen dadas en las mismas unidades en las que se mide la variable: recorridos, desviaciones medias, varianza, y desviación típica.
  • Medidas de dispersión relativa, que informan de la dispersión en términos relativos, como un porcentaje. Se incluyen entre estas el coeficiente de variación, el coeficiente de apertura, los recorridos relativos y el índice de desviación respecto de la mediana.
Medidas de forma.[11]

Su valor informa sobre el aspecto que tiene la gráfica de la distribución. Entre ellas están los coeficientes de asimetría y los de curtosis.

Otros parámetros.

Además, y con propósitos más específicos, existen otros parámetros de uso en situaciones muy concretas, como son las proporciones, los números índice, las tasas y el coeficiente de Gini.

Medidas de tendencia central o centralización

Son valores que suelen situarse cerca del centro de la distribución de datos. Los más destacados son las medias o promedios (incluyendo la media aritmética, la media geométrica y la media armónica), la mediana y la moda.

Media aritmética o promedio

 
La estatura media como resumen de una población homogénea (abajo) o heterogénea (arriba).

La media muestral o media aritmética es, probablemente, uno de los parámetros estadísticos más extendidos.[12]​ Sus propiedades son:[13]

  • Su cálculo es muy sencillo y en él intervienen todos los datos.
  • Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos, ya que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor:

 

  • Minimiza las desviaciones cuadráticas de los datos respecto de cualquier valor prefijado, esto es, el valor de   es mínimo cuando  . Este resultado se conoce como Teorema de König. Esta propiedad permite interpretar uno de los parámetros de dispersión más importantes: la varianza.
  entonces  , donde   es la media aritmética de los  , para i = 1, ..., n y a y b números reales.

Este parámetro, aun teniendo múltiples propiedades que aconsejan su uso en situaciones muy diversas, tiene también algunos inconvenientes, como son:

  • Para datos agrupados en intervalos (variables continuas), su valor oscila en función de la cantidad y amplitud de los intervalos que se consideren.
  • Es una medida a cuyo significado afecta sobremanera la dispersión, de modo que cuanto menos homogéneos son los datos, menos información proporciona. Dicho de otro modo, poblaciones muy distintas en su composición pueden tener la misma media.[14]​ Por ejemplo, un equipo de baloncesto con cinco jugadores de igual estatura, 1,95, pongamos por caso, tendría una estatura media de 1,95, evidentemente, valor que representa fielmente a esta homogénea población. Sin embargo, un equipo de estaturas más heterogéneas, 2,20, 2,15, 1,95, 1,75 y 1,70, por ejemplo, tendría también, como puede comprobarse, una estatura media de 1,95, valor que no representa a casi ninguno de sus componentes.
  • Es muy sensible a los valores extremos de la variable. Por ejemplo, en el cálculo del salario medio de una empresa, el salario de un alto directivo que gane 1.000.000 de tiene tanto peso como el de mil empleados "normales" que ganen 1.000 €, siendo la media de aproximadamente 2.000 €.

Moda

La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta.[15]​ En cierto sentido se corresponde su definición matemática con la locución "estar de moda", esto es, ser lo que más se lleva.

Su cálculo es extremadamente sencillo, pues solo necesita de un recuento. En variables continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se recurre a la interpolación.

Sus principales propiedades son:

  • Cálculo sencillo.
  • Interpretación muy clara.
  • Al depender solo de las frecuencias, puede calcularse para variables cualitativas. Es por ello el parámetro más utilizado cuando al resumir una población no es posible realizar otros cálculos, por ejemplo, cuando se enumeran en medios periodísticos las características más frecuentes de determinado sector social. Esto se conoce informalmente como "retrato robot".[16]

Inconvenientes:

  • Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a variaciones muestrales. Por otra parte, en variables agrupadas en intervalos, su valor depende excesivamente del número de intervalos y de su amplitud.
  • Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la moda, no afectan en modo alguno a su valor.
  • No siempre se sitúa hacia el centro de la distribución.
  • Puede haber más de una moda en el caso en que dos o más valores de la variable presenten la misma frecuencia (distribuciones bimodales o multimodales).

Mediana

La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que estos están ordenados de menor a mayor.[17]​ Por ejemplo, la mediana del número de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:

 

En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los anteriores:

 

Se toma como mediana  

 
En este ejemplo basado en una tabla real de percentiles usada en pediatría, puede comprobarse que una niña de 24 meses con un peso de 13 kg estaría en el percentil 75º, esto es, su peso es superior al 75% de las niñas de su edad. La mediana correspondería, aproximadamente, a 12 kg (intersección de la línea curva más oscura con la línea horizontal correspondiente al valor 12 en el eje vertical, para esa misma edad).

Existen métodos de cálculo más rápidos para datos más numerosos (véase el artículo principal dedicado a este parámetro). Del mismo modo, para valores agrupados en intervalos, se halla el "intervalo mediano" y, dentro de este, se obtiene un valor concreto por interpolación.

Propiedades de la mediana como parámetro estadístico:[18]

  • Es menos sensible que la media a oscilaciones de los valores de la variable. Un error de transcripción en la serie del ejemplo anterior en, pongamos por caso, el último número, deja a la mediana inalterada.
  • Como se ha comentado, puede calcularse para datos agrupados en intervalos, incluso cuando alguno de ellos no está acotado.
  • No se ve afectada por la dispersión. De hecho, es más representativa que la media aritmética cuando la población es bastante heterogénea. Suele darse esta circunstancia cuando se resume la información sobre los salarios de un país o una empresa. Hay unos pocos salarios muy altos que elevan la media aritmética haciendo que pierda representatividad respecto al grueso de la población. Sin embargo, alguien con el salario "mediano" sabría que hay tanta gente que gana más dinero que él, como que gana menos.

Sus principales inconvenientes son que en el caso de datos agrupados en intervalos, su valor varía en función de la amplitud de estos. Por otra parte, no se presta a cálculos algebraicos tan bien como la media aritmética.

Medidas de posición no central

Directamente relacionados con la anterior, se encuentran las medidas de posición no central, también conocidas como cuantiles. Se trata de valores de la variable estadística que dejan por debajo de sí determinada cantidad de los datos. Son, en definitiva, una generalización del concepto de la mediana. Mientras que ésta deja por debajo de sí al 50% de la distribución, los cuantiles pueden hacerlo con cualquier otro porcentaje.[19]​ Se denominan medidas de posición porque informan, precisamente, de la posición que ocupa un valor dentro de la distribución de datos.

Tradicionalmente se distingue entre cuartiles, si se divide la cantidad de datos en cuatro partes antes de proceder al cálculo de los valores que ocupan cada posición; deciles, si se divide los datos en diez partes; o percentiles, que dividen la población en cien partes.

Ejemplos: si se dice que una persona, tras un test de inteligencia, ocupa el percentil 75, ello supone que el 75% de la población tiene un cociente intelectual con un valor inferior al de esa persona. Este criterio se usa por las asociaciones de superdotados, que limitan su conjunto de miembros a aquellas que alcanzan determinado percentil (igual o superior a 98 en la mayoría de los casos).

El ejemplo que se muestra en la imagen de la derecha es el correspondiente al cálculo inverso, esto es, cuando se desea conocer el percentil correspondiente a un valor de la variable, en lugar del valor que corresponde a un determinado percentil.

Otras medidas de posición central son la media geométrica y la media armónica que, aunque tienen determinadas propiedades algebraicas que podrían hacerlas útiles en determinadas circunstancias, su interpretación no es tan intuitiva como la de los parámetros anteriores.[20]

Comentarios sobre las medidas de posición

Este tipo de parámetros no tienen por qué coincidir con un valor exacto de la variable y, por tanto, tampoco pueden usarse con carácter general para hacer pronósticos. Por ejemplo, si se dice que la media aritmética de los hijos de las familias de un país es de 1,2, no es posible encontrar familias con ese valor en concreto. Un segundo ejemplo: a ninguna fábrica de zapatos se le ocurriría fabricar los suyos con tallas únicamente correspondientes al valor promedio, ni siquiera tienen por qué ser estas tallas las más fabricadas, pues en tal caso sería más apropiado atender a la moda de la distribución de tallas de los eventuales clientes.

La elección de uno u otro parámetro dependerá de cada caso particular, de los valores de la variable y de los propósitos del estudio. Su uso indiscriminado puede ser deliberadamente tendencioso o involuntariamente sesgado, convirtiéndose, de hecho, en un abuso.[21]​ Puede pensarse, por ejemplo, en la siguiente situación: un empresario publica que el salario medio en su empresa es de 1600 €. A este dato, que en determinadas circunstancias podría considerarse muy bueno, podría llegarse si la empresa tuviese cuatro empleados con salarios de 1.000 € mensuales y el salario del jefe, incluido en la media, fuese de 4.000 € al mes:[22]

 

Con carácter general y a modo de resumen podría decirse que la media aritmética es un parámetro representativo cuando la población sigue una distribución normal o es bastante homogénea; en otras situaciones de fuerte dispersión, habría que decantarse por la mediana. La moda es el último recurso (y el único) cuando de describir variables cualitativas se trata.

Medidas de dispersión

 
Diagrama de caja que muestra la dispersión gráficamente, usando los cuartiles como referencia. Entre Q1 y Q3 (rango intercuartílico) se encuentran el 50% de las observaciones.

Las medidas de posición resumen la distribución de datos, pero resultan insuficientes y simplifican excesivamente la información. Estas medidas adquieren verdadero significado cuando van acompañadas de otras que informen sobre la heterogeneidad de los datos. Los parámetros de dispersión miden eso precisamente, generalmente, calculando en qué medida los datos se agrupan en torno a un valor central. Indican, de un modo bien definido, lo homogéneos que estos datos son. Hay medidas de dispersión absolutas, entre las cuales se encuentran la varianza, la desviación típica o la desviación media, aunque también existen otras menos utilizadas como los recorridos o la meda; y medidas de dispersión relativas, como el coeficiente de variación, el coeficiente de apertura o los recorridos relativos. En muchas ocasiones las medidas de dispersión se ofrecen acompañando a un parámetro de posición central para indicar en qué medida los datos se agrupan en torno de él.[23]

Medidas de dispersión absolutas

Recorridos

El recorrido o rango de una variable estadística es la diferencia entre el mayor y el menor valor que toma la misma. Es la medida de dispersión más sencilla de calcular, aunque es algo burda porque solo toma en consideración un par de observaciones. Basta con que uno de estos dos datos varíe para que el parámetro también lo haga, aunque el resto de la distribución siga siendo, esencialmente, la misma.

Existen otros parámetros dentro de esta categoría, como los recorridos o rangos intercuantílicos, que tienen en cuenta más datos y, por tanto, permiten afinar en la dispersión. Entre los más usados está el rango intercuartílico, que se define como la diferencia entre el cuartil tercero y el cuartil primero. En ese rango están, por la propia definición de los cuartiles, el 50% de las observaciones. Este tipo de medidas también se usa para determinar valores atípicos. En el diagrama de caja que aparece a la derecha se marcan como valores atípicos todos aquellos que caen fuera del intervalo [Li, Ls] = [Q1 - 1,5·Rs, Q3 + 1,5·Rs], donde Q1 y Q3 son los cuartiles 1º y 3º, respectivamente, y Rs representa la mitad del recorrido o rango intercuartílico, también conocido como recorrido semiintercuartílico.[24]

Desviaciones medias

Dada una variable estadística X y un parámetro de tendencia central, c, se llama desviación de un valor de la variable, xi, respecto de c, al número |xi - c|. Este número mide lo lejos que está cada dato del valor central c, por lo que una media de esas medidas podría resumir el conjunto de desviaciones de todos los datos.

Así pues, se denomina desviación media de la variable X respecto de c a la media aritmética de las desviaciones de los valores de la variable respecto de c, esto es, si

  entonces  

De este modo se definen la desviación media respecto de la media (c =  ) o la desviación media respecto de la mediana (c =  ), cuya interpretación es sencilla en virtud del significado de la media aritmética.[23]

Sin embargo, el uso de valores absolutos impide determinados cálculos algebraicos que obligan a desechar estos parámetros, a pesar de su clara interpretación, en favor de los siguientes.

Varianza y desviación típica
 
Conjunto de datos estadísticos de media aritmética 50 (línea azul) y desviación típica 20 (líneas rojas).

Como se vio más arriba, la suma de todas las desviaciones respecto al parámetro más utilizado, la media aritmética, es cero. Por tanto si se desea una medida de la dispersión sin los inconvenientes para el cálculo que tienen las desviaciones medias, una solución es elevar al cuadrado tales desviaciones antes de calcular el promedio. Así, se define la varianza como:[25]

 ,

o sea, la media de los cuadrados de las desviaciones respecto de la media.

La desviación típica, σ, se define como la raíz cuadrada de la varianza, esto es,

 

Para variables agrupadas en intervalos, se usan las marcas de clase (un valor apropiado del interior de cada intervalo) en estos cálculos.

Propiedades:[25]

  • Ambos parámetros no se alteran con los cambios de origen.
  • Si todos los valores de la variable se multiplican por una constante, b, la varianza queda multiplicada por b2.
  • En el intervalo   se encuentran, al menos, el   de las observaciones (véase Desigualdad de Tchebyschev).[26]

Esta última propiedad muestra la potencia del uso conjunto de la media y la desviación típica como parámetros estadísticos, ya que para valores de k iguales a 2 y 3, respectivamente, se obtiene que:

  • En el intervalo   están, al menos, el 75% de los datos.
  • En el intervalo   están, al menos, el 89% de los datos.

Se cumple la siguiente relación entre los parámetros de dispersión:

 

donde  , y   son, respectivamente, la desviación media respecto de la mediana, la desviación media respecto de la media y la desviación típica (véase Desviación media).

La media. Es una medida de dispersión que tiene, por su propia definición, las mismas propiedades que la mediana. Por ejemplo, no se ve afectada por valores extremos o atípicos.[27]

Medidas de dispersión relativa

Son parámetros que miden la dispersión en términos relativos, un porcentaje o una proporción, por ejemplo, de modo que permiten una sencilla comparación entre la dispersión de distintas distribuciones.[28]

Coeficiente de variación de Pearson

Se define como  , donde σ es la desviación típica y   es la media aritmética.

Se interpreta como el número de veces que la media está contenida en la desviación típica. Suele darse su valor en tanto por ciento, multiplicando el resultado anterior por 100. De este modo se obtiene un porcentaje de la variabilidad.

Su principal inconveniente es que en el caso de distribuciones cuya media se acerca a cero, su valor tiende a infinito e incluso resulta imposible de calcular cuando la media es cero. Por ello no puede usarse para variables tipificadas.

Coeficiente de apertura

Se define como el cociente entre los valores extremos de la distribución de datos, esto es, dada una distribución de datos estadísticos x1, x2, ..., xn, su coeficiente de apertura, CA es  

Se usa para comparar salarios de empresas.

Recorridos relativos

Dado Re, el recorrido de una distribución de datos estadísticos, el recorrido relativo, RR es  , donde   es la media aritmética de la distribución.

Dada una distribución de datos estadísticos con cuartiles Q1, Q2 y Q3, el recorrido intercuartílico relativo, RIQR se define como[29] 

Por otra parte, se define el recorrido semiintercuartílico relativo, RSIR, como  

Índice de desviación respecto a la mediana

Se define como  , donde DMe es la desviación media respecto de la mediana y Me es la mediana de una distribución de datos estadísticos dada.

Medidas de forma

 
La campana de Gauss, curva que sirve de modelo para el estudio de la forma de una distribución.

Las medidas de forma caracterizan la forma de la gráfica de una distribución de datos estadísticos. La mayoría de estos parámetros tiene un valor que suele compararse con la campana de Gauss, esto es, la gráfica de la distribución normal, una de las que con más frecuencia se ajusta a fenómenos reales.

Medidas de asimetría

Se dice que una distribución de datos estadísticos es simétrica cuando la línea vertical que pasa por su media, divide a su representación gráfica en dos partes simétricas. Ello equivale a decir que los valores equidistantes de la media, a uno u otro lado, presentan la misma frecuencia.

En las distribuciones simétricas los parámetros media, mediana y moda coinciden, mientras que si una distribución presenta cierta asimetría, de un tipo o de otro, los parámetros se sitúan como muestra el siguiente gráfico:

 

Ello puede demostrarse fácilmente si se tiene en cuenta la atracción que la media aritmética siente por los valores extremos, que ya se ha comentado más arriba y las definiciones de mediana (justo en el centro de la distribución, tomando el eje de abscisas como referencia) y moda (valor que presenta una ordenada más alta).

Por consiguiente, la posición relativa de los parámetros de centralización pueden servir como una primera medida de la simetría de una distribución.

Otras medidas más precisas son el coeficiente de asimetría de Fisher, el coeficiente de asimetría de Bowley y el coeficiente de asimetría de Pearson.

Medidas de apuntamiento o curtosis

 
Tres distribuciones con distintos grados de apuntamiento.

Con estos parámetros se pretende medir cómo se reparten las frecuencias relativas de los datos entre el centro y los extremos, tomando como comparación la campana de Gauss.

El parámetro usado con más frecuencia para esta medida es el coeficiente de curtosis de Fisher, definido como:

 ,

aunque hay otros como el coeficiente de curtosis de Kelley o el coeficiente de curtosis percentílico.

La comparación con la distribución normal permite hablar de distribuciones platicúrticas o más aplastadas que la normal; distribuciones mesocúrticas, con igual apuntamiento que la normal; y distribuciones leptocúrticas, esto es, más apuntadas que la normal.[30]

Por último, existen otras medidas para decidir sobre la forma de una distribución con ajuste a modelos menos usuales como los que se muestran en las siguientes gráficas:

 

Otros parámetros

Se presentan en este apartado otros parámetros que tienen aplicación en situaciones muy concretas, por lo que no se incluyen entre los grupos anteriores, aunque tienen cabida en este artículo por su frecuente uso en medios de comunicación y su facultad de resumir grandes cantidades de datos, como ocurre con las medidas tratadas hasta ahora.

Proporción

La proporción de un dato estadístico es el número de veces que se presenta ese dato respecto al total de datos. Se conoce también como frecuencia relativa y es uno de los parámetros de cálculo más sencillo. Tiene la ventaja de que puede calcularse para variables cualitativas.

Por ejemplo, si se estudia el color de ojos de un grupo de 20 personas, donde 7 de ellas los tienen azules, la proporción de individuos con ojos azules es del 35% (= 7/20).

El dato con mayor proporción se conoce como moda (véase, más arriba).

En inferencia estadística existen intervalos de confianza para la estimación de este parámetro.

Número índice

Un número índice es una medida estadística que permite estudiar las fluctuaciones o variaciones de una magnitud o de más de una en relación al tiempo o al espacio. Los índices más habituales son los que realizan las comparaciones en el tiempo. Algunos ejemplos de uso cotidiano de este parámetro son el índice de precios o el IPC[31]

Tasa

 
Coeficiente de Gini en el mundo (2007-2008)

La tasa es un coeficiente que expresa la relación entre la cantidad y la frecuencia de un fenómeno o un grupo de fenómenos. Se utiliza para indicar la presencia de una situación que no puede ser medida en forma directa.[31]​ Esta razón se utiliza en ámbitos variados, como la demografía o la economía, donde se hace referencia a la tasa de interés.

Algunos de los más usados son: tasa de natalidad, tasa de mortalidad, tasa de crecimiento demográfico, tasa de fertilidad o tasa de desempleo.

Coeficiente de Gini

El índice de Gini o coeficiente de Gini es un parámetro de dispersión usado para medir desigualdades entre los datos de una variable o la mayor o menor concentración de los mismos.

Este coeficiente mide de qué forma está distribuida la suma total de los valores de la variable. Se suele usar para describir salarios. Los casos extremos de concentración serían aquel en los que una sola persona acapara el total del dinero disponible para salarios y aquel en el que este total está igualmente repartido entre todos los asalariados.[32]

Momentos

Los momentos son una forma de generalizar toda la teoría relativa a los parámetros estadísticos y guardan relación con una buena parte de ellos. Dada una distribución de datos estadísticos x1, x2, ..., xn, se define el momento central o momento centrado de orden k como

 

Para variables continuas la definición cambia sumas discretas por integrales (suma continua), aunque la definición es, esencialmente, la misma.[33]​ De esta definición y las propiedades de los parámetros implicados que se han visto más arriba, se deduce inmediatamente que:

 

y que

 [34]

Se llama momento no centrado de orden k a la siguiente expresión:

 

De la definición se deduce que:

 

Usando el binomio de Newton, puede obtenerse la siguiente relación entre los momentos centrados y no centrados:

 

Los momentos de una distribución estadística la caracterizan unívocamente.[35]

Parámetros bidimensionales

En estadística se estudian en ocasiones varias características de una población para compararlas, estudiar su dependencia o correlación o realizar cualquier otro estudio conjunto. El caso más común de dos variables se conoce como estadística bidimensional.[36]

Un ejemplo típico es el de un estudio que recoja la estatura (denotémosla por X) y el peso (sea Y) de los n individuos de una determinada población. En tal caso, fruto de la recogida de datos, se obtendría una serie de parejas de datos (xi, yi), con i = 1, ..., n, cada una de las cuales estaría compuesta por la estatura y el peso del individuo i, respectivamente.

En los estudios bidimensionales, cada una de las dos variables que entran en juego, estudiadas individualmente, pueden resumirse mediante los parámetros que se han visto hasta ahora. Así, tendría sentido hablar de la media de las estaturas ( ) o la desviación típica de los pesos (σY). Incluso para un determinado valor de la primera variable, xk, cabe hacer estudios condicionados. Por ejemplo, la mediana condicionada a la estatura xk sería la mediana de los pesos de todos los individuos que tienen esa estatura. Se denota Me/x=xk.

Sin embargo existen otros parámetros que resumen características de ambas distribuciones en su conjunto. Los más destacados son el centro de gravedad, la covarianza y el coeficiente de correlación lineal.

Centro de gravedad

Dadas dos variables estadísticas X e Y, se define el centro de gravedad como la pareja ( ,  ), donde   y   son, respectivamente, las medias aritméticas de las variables X e Y.

El nombre de este parámetro proviene de que en una representación de las parejas del estudio en una nube de puntos, en la que cada punto tuviese un peso proporcional a su frecuencia absoluta, las coordenadas ( ,  ) corresponderían, precisamente, al centro de gravedad como concepto físico.[37]

Covarianza

La covarianza o varianza conjunta de una distribución bidimensional se define como:

 

La interpretación de este parámetro tiene que ver con la eventual correlación lineal de las dos variables. Una covarianza positiva implica una correlación directa y una negativa, una correlación inversa.[38]​ Por otra parte, es un parámetro imprescindible para el cálculo del coeficiente de correlación lineal o los coeficientes de regresión, como se verá más abajo.

En su contra tiene que se ve excesivamente influenciada, al igual que ocurría con la media aritmética, por los valores extremos de las distribuciones y los cambios de escala.

Coeficiente de correlación lineal

 
Variación del coeficiente de correlación lineal en función de la nube de puntos asociada.

Se trata de un coeficiente que permite determinar la bondad del ajuste de la nube de puntos por una recta.

Se define como:  , donde σxy es la covarianza y σx y σy, las desviaciones típicas respectivas de las distribuciones implicadas.

El coeficiente de correlación lineal toma valores entre -1 y 1. En esa escala, mide la correlación del siguiente modo:

  • La correlación lineal es más fuerte cuanto más cerca esté de -1 o 1.
  • La correlación lineal es más débil cuanto más próximo a cero sea r.[39]

El diagrama de la derecha ilustra cómo puede variar r en función de la nube de puntos asociada:

Otros parámetros bidimensionales son, el coeficiente de correlación de Spearman, los coeficientes de correlación no paramétricos, el coeficiente de determinación o los coeficientes de regresión lineal.

Al igual que con distribuciones unidimensionales, existe una forma equivalente de desarrollar la teoría relativa a los parámetros estadísticos bidimensionales usando los momentos.

Los parámetros en la inferencia estadística

En ocasiones los parámetros de una determinada población no pueden conocerse con certeza. Generalmente esto ocurre porque es imposible el estudio de la población completa por cuestiones como que el proceso sea destructivo (p. e., vida media de una bombilla) o muy caro (p.e., audiencias de televisión). En tales situaciones se recurre a las técnicas de la inferencia estadística para realizar estimaciones de tales parámetros a partir de los valores obtenidos de una muestra de la población.[40]

Se distingue entonces entre parámetros y estadísticos. Mientras que un parámetro es una función de los datos de la población, el estadístico lo es de los datos de una muestra. De este modo pueden definirse la media muestral, la varianza muestral o cualquier otro párametro de los vistos más arriba.

Por ejemplo, dada una muestra estadística de tamaño n,  , de una variable aleatoria X con distribución de probabilidad F(x,θ), donde θ es un conjunto de parámetros de la distribución, se definiría la media muestral n-ésima como:

 

En el caso concreto de la varianza muestral, suele tomarse, por sus mejores propiedades como estimador, la siguiente:

 

donde se ha tomado como denominador n-1, en lugar de n. A este parámetro también se le llama cuasivarianza.[41]

Controversias y malas interpretaciones

Como se ha dicho, los parámetros estadísticos, en el enfoque descriptivo que aquí se adopta, substituyen grandes cantidades de datos por unos pocos valores extraídos de aquellos a través de operaciones simples. Durante este proceso se pierde parte de la información ofrecida originalmente por todos los datos. Es por esta pérdida de datos por lo que la estadística ha sido tildada en ocasiones de una falacia. Por ejemplo, si en un grupo de tres personas una de ellas ingiere tres helados, el parámetro que con más frecuencia se utiliza para resumir datos estadísticos, la media aritmética del número de helados ingeridos por el grupo sería igual a 1 ( ), valor que no parece resumir fielmente la información. Ninguna de las personas se sentiría identificada con la frase resumen: "He ingerido un helado de media".[21]

Un ejemplo menos conocido pero igual de ilustrativo acerca de la claridad de un parámetro es la distribución exponencial, que suele regir los tiempos medios entre determinados tipos de sucesos. Por ejemplo, si la vida media de una bombilla es de 8.000 horas, más del 50 por ciento de las veces no llegará a esa media. Igualmente, si un autobús pasa cada 10 minutos de media, hay una probabilidad mayor del 50 por ciento de que pase menos de 10 minutos entre un autobús y el siguiente.

Otro ejemplo que suele ofrecerse con frecuencia para argumentar en contra de la estadística y sus parámetros es que, estadísticamente hablando, la temperatura media de una persona con los pies en un horno y la cabeza en una nevera es ideal.

 
Benjamín Disraeli, un descreído de las estadísticas.

Quizás por situaciones como éstas, que en general muestran un profundo desconocimiento de lo que los parámetros representan en realidad y de su uso conjunto con otras medidas de centralización o dispersión, el primer ministro británico Benjamín Disraeli sentenció[42]​ primero y Mark Twain popularizó más tarde[43]​ la siguiente afirmación:

Hay mentiras, grandes mentiras, y estadísticas.

Hay otros personajes que también han advertido sobre la simplificación que supone la estadística, como el profesor Aaron Levenstein, quien afirmaba:

Las estadísticas son como los bikinis: lo que muestran es sugerente, pero lo que esconden es vital.
Aaron Levenstein

Por su parte, el escritor y comediante inglés Bernard Shaw sentenció:[44]

La estadística es una ciencia que demuestra que, si mi vecino tiene dos coches y yo ninguno, los dos tenemos uno.

o el personaje ficticio Homer Simpson, de la popular serie de televisión Los Simpson, en una entrevista acerca de las proporciones en uno de sus capítulos:[45]

¡Oh!, la gente sale con estadísticas para probar cualquier cosa, el 14 por ciento del mundo lo sabe.
Guionistas de la serie Los Simpson

Véase también

Referencias

  1. Ross, Sheldon M. (2007). «3. Uso de la Estadística para sintetizar conjuntos de datos.». Introducción a la Estadística. trad. Valdés Sánchez, Teófilo. Reverte. p. 69. ISBN 8429150390. Consultado el 5 de abril de 2009. 
  2. Fernández Gordillo, Juan Carlos (2008). «Parámetros estadísticos». Ditutor, Diccionario de Matemáticas. Consultado el 19 de abril de 2009. 
  3. Serret Moreno-Gil, Jaime (1998). «4. Parámetros Estadísticos». Procedimientos estadísticos. ESIC. p. 71. ISBN 8473561716. Consultado el 19 de abril de 2009. 
  4. Pascual, José; Galbiati, José; González, Gladys; Maulén, Mª Angélica; Arancibia, Rodrigo. «Conceptos básicos: Modelo». . Diseñadora: Galbiati, Paola. Instituto de Estadística. Universidad Católica de Valparaíso. Archivado desde el original el 10 de abril de 2009. Consultado el 16 de abril de 2009. 
  5. . Enciclopedia Microsoft® Encarta® Online 2009. Microsoft Corporation. 2009. Archivado desde el original el 1 de abril de 2009. Consultado el 19 de abril de 2009. «Parámetro estadístico, número que se obtiene a partir de los datos de una distribución estadística y que sirve para sintetizar alguna característica relevante de la misma.» 
  6. Clapham, Christopher (septiembre de 1998). Diccionario de Matemáticas. Traducción: De Sá Madariaga, Juan Mª L (Primera edición). Oxford-Complutense. p. 266. ISBN 84-89784-56-6. «Parámetro (en estadística): Cierta cantidad que caracteriza de alguna forma a la población, como su media o su mediana». 
  7. Serret Moreno-Gil, Jaime (1998). «4. Parámetros Estadísticos». Procedimientos estadísticos. ESIC. p. 71. ISBN 8473561716. Consultado el 19 de abril de 2009. «En estadística descriptiva tenemos una serie de expresiones (...) que permiten disponer de unos valores numéricos que reflejan el comportamiento global del suceso estadístico, calculados a partir de los datos individuales. Estas expresiones son los parámetros estadísticos». 
  8. citado por Calot (1985, pp. 55, 56) y MAD-Eduforma (2006, p. 160)
  9. Romero Villafranca, Rafael; Zúnica Ramajo, Luisa Rosa (2005). «2.6. Parámetros de posición». Métodos estadísticos en Ingeniería. Valencia: Univ. Politéc. Valencia. pp. 39-41. ISBN 8497057279. Consultado el 20 de abril de 2009. 
  10. «Medidas de Dispersión». Enciclopedia Microsoft® Encarta® Online. Microsoft Corporation. 2009. Archivado desde el original el 28 de noviembre de 2015. Consultado el 20 de abril de 2009. 
  11. Serret Moreno-Gil, Jaime (1998). «4.3. Parámetros de forma.». Procedimientos estadísticos. ESIC. p. 81. ISBN 8473561716. Consultado el 20 de abril de 2009. 
  12. Wackerly, Dennis D; Mendenhall, William; Scheaffer, Richard L. (2002). «1.3. Descripción de un conjunto de mediciones: métodos numéricos». Estadística matemática con aplicaciones (6ª edición). Cengage Learning Editores. p. 8. ISBN 9706861947. «La medida central que más se usa en estadística es la media aritmética». 
  13. Rius Díaz, Francisca (octubre de 1997). «2.3.2 La media». . Málaga: Universidad de Málaga. ISBN 84-7496-653-1. Archivado desde el original el 23 de diciembre de 2009. Consultado el 7 de abril de 2009. 
  14. Wackerly, Dennis D; Mendenhall, William; Scheaffer, Richard L. (2002). «1.3. Descripción de un conjunto de mediciones: métodos numéricos». Estadística matemática con aplicaciones (6ª edición). Cengage Learning Editores. p. 8. ISBN 9706861947. «Dos conjuntos de mediciones podrían tener distribuciones de frecuencias muy distintas, pero con la misma media». 
  15. Rius Díaz, Francisca. «2.3.6 La moda». Bioestadística. Métodos y aplicaciones. 
  16. Santos, María José (abril de 2009). «Retrato robot del alcalde metropolitano». El Correo de Andalucía. Consultado el 7 de abril de 2009. 
  17. Serret Moreno-Gil, Jaime (1998). Procedimientos estadísticos. ESIC. p. 75. ISBN 8473561716. Consultado el 17 de abril de 2009. 
  18. Rius Díaz, Francisca. «2.3.4 La mediana». Bioestadística. Métodos y aplicaciones. 
  19. Martín Andrés, Antonio; Luna del Castillo, Juan de Dios (2004). Bioestadística para las ciencias de la Salud. Capitel Editores. p. 28. ISBN 8484510182. Consultado el 17 de abril de 2009. 
  20. Chaves, Bernardo (2004). «La media geométrica y la media armónica». Bioestadística para postgrado. Universidad Nacional de Colombia. Consultado el 7 de abril de 2009.  (enlace roto disponible en Internet Archive; véase el historial, la primera versión y la última).
  21. Huff, Darrel (1965). «2. El promedio bien escogido». Cómo mentir con estadísticas. Acapulco: Sagitario. 
  22. Johnson, Robert; Kuby, Patricia (2003). «2.8. El arte del engaño estadístico». Estadística elemental (3ª edición). Cengage Learning Editores. p. 94. ISBN 9706862870. 
  23. Rius Díaz, Francisca. «2.7. Medidas de variabilidad o dispersión». Bioestadística. Métodos y aplicaciones. Consultado el 17 de abril de 2009. 
  24. Férnandez Fernández, Santiago; Alejandro Córdoba, José María Cordero Sánchez, Alejandro Córdoba (2002). «4.2. Medidas absolutas». Estadística Descriptiva (2ª edición). ESIC Editorial. p. 192. ISBN 8473563069. 
  25. Rius Díaz, Francisca. «2.7.4. Varianza y desviación típica». Bioestadística. Métodos y aplicaciones. Consultado el 7 de abril de 2009. 
  26. Wackerly, Dennis D. «3.11. Teorema de Chebyshev». Estadística matemática con aplicaciones. p. 139. 
  27. Férnandez Fernández, Santiago. «4.2.3.4. Meda o desviación mediana». Estadística Descriptiva. p. 200. 
  28. Férnandez Fernández, Santiago. «4.3. Medidas relativas». Estadística Descriptiva. p. 201. 
  29. Férnandez Fernández, Santiago. «4.3. Medidas relativas». Estadística Descriptiva. p. 202. 
  30. Sotomayor Velasco, Gabriel; Wisniewski, Piotr Marian (2001). «8.7. Momentos y otras características». Probabilidad y estadística para ingeniería y ciencias. Cengage Learning Editores. p. 196. ISBN 970686136X. Consultado el 7 de abril de 2009. 
  31. Malléa, Adriana, Adriana; Herrera, Myriam; Ruiz, Ana María (2003). «3. Parámetros estadísticos no convencionales». Estadística en el nivel polimodal. San Juan: effha. p. 67. ISBN 9872084920. Consultado el 17 de abril de 2009. 
  32. Llorente Galera, Francisco; Staff, VV; Marín Feria, Susana; Torra Porras, Salvador (2000). «2.6. Medidas de concentración». Principios de estadística descriptiva aplicada a la empresa. Ramón Areces. pp. 53-54. ISBN 8480044276. Consultado el 17 de abril de 2009.  (enlace roto disponible en Internet Archive; véase el historial, la primera versión y la última).
  33. Wackerly, Dennis D. «3.9. Momentos y funciones generadoras de momentos». Estadística matemática con aplicaciones. p. 131. 
  34. . Archivado desde el original el 23 de diciembre de 2009. 
  35. Casas Sánchez, J.M; Santos Peña, Julián (2002). «2.6. Momentos». Introducción a la estadística para economía (2 edición). Ramón Areces. p. 95. ISBN 848004523X. «Si los momentos coinciden en dos distribuciones, diremos que son iguales».  (enlace roto disponible en Internet Archive; véase el historial, la primera versión y la última).
  36. Cáceres Hernández, Juan José (2007). «4.1. Variable estadística multidimensional y distribución de frecuencias». Conceptos básicos de Estadística para Ciencias Sociales. Delta Publicaciones. p. 62. ISBN 8496477436. 
  37. Arias Rodríguez, Jose Carlos (2004). «Distribuciones bidimensionales». Proyecto Descartes. Madrid: Ministerio de Educación, Política Social y Deporte. Consultado el 7 de abril de 2009. 
  38. Rius Díaz, Francisca (octubre de 1997). «3.10.2. Una interpretación geométrica de la covarianza». . Málaga: Universidad de Málaga. ISBN 84-7496-653-1. Archivado desde el original el 23 de diciembre de 2009. Consultado el 7 de abril de 2009. 
  39. Barón López, Francisco Javier. «Bioestadística» (Vídeo en Flash). Málaga: Universidad de Málaga. Consultado el 18 de abril de 2009. 
  40. Casas Sánchez, Jose M.; Manzano Arrondo, Vicente; Zamora Sanz, Ana Isabel (1997). «2. Estimación puntual». Inferencia Estadística (2ª, ilustrada edición). Ramón Areces. pp. 89-162. ISBN 848004263X. Consultado el 17 de abril de 2009.  (enlace roto disponible en Internet Archive; véase el historial, la primera versión y la última).
  41. Álvarez Leiva, Juan Antonio (diciembre de 1997). «Medidas de dispersión». Proyecto CICA Thales. Sociedad Andaluza de Educación Matemática "Thales". Consultado el 7 de abril de 2009. 
  42. «Citas de Benjamin Disraeli en Wikiquote». Consultado el 5 de abril de 2009. 
  43. «Mentiras, grandes mentiras y estadísticas en la Wikipedia inglesa» |url= incorrecta con autorreferencia (ayuda). 
  44. Citas de Bernard Shaw
  45. Los Simpsons, temporada 5, episodio Homer, el vigilante

Bibliografía

  • Calot, Gérard (1985). Curso de estadística descriptiva. trad. Francisco José Cano Sevilla (4ª edición). Parainfo. ISBN 8428305633. 
  • Férnandez Fernández, Santiago; Córdoba, Alejandro; Cordero Sánchez, José María (2002). Estadística Descriptiva (2ª edición). ESIC Editorial. ISBN 8473563069. 
  • Huff, Darrel; Geis, Irvin (1993). How to lie with Statistics. W W Norton & Co Inc. ISBN 0393310728. 
  • Rius Díaz, Francisca (1997). Bioestadística. Métodos y aplicaciones (2ª edición). Universidad de Málaga. ISBN 84-7496-653-1. 
  • Velasco Sotomayor, Gabriel; Wisniewski, Piotr Marian (2001). Probabilidad y estadística para ingeniería y ciencias. Cengage Learning Editores. pp. 185-197. ISBN 970686136X. 
  • Técnicos de Administración Del Ministerio de Economía Y Hacienda (instituto Nacional de Estadística). Grupos III Y IV. Temario Específico Y Test Ebook. MAD-Eduforma. 2006. ISBN 9788466552509. 

Enlaces externos

Calculadoras de parámetros estadísticos:

  • Las tres medias Calcula la media aritmética, geométrica y armónica de una serie de 80 datos o menos.
  • La calculadora web descriptiva Calcula media, moda, varianza, desviación típica, coeficiente de variación, coeficientes de forma, índice Gini, media armónica.
  • Calculadora estadística Incluye parámetros bidimensionales y otros cálculos de utilidad en probabilidad.

Cursos completos de estadística descriptiva:

  •   Datos: Q3776487

parámetro, estadístico, estadística, parámetro, número, resume, gran, cantidad, datos, pueden, derivarse, estudio, variable, estadística, cálculo, este, número, está, bien, definido, usualmente, mediante, fórmula, aritmética, obtenida, partir, datos, población. En estadistica un parametro es un numero que resume la gran cantidad de datos que pueden derivarse del estudio de una variable estadistica 1 El calculo de este numero esta bien definido usualmente mediante una formula aritmetica obtenida a partir de datos de la poblacion 2 3 La media aritmetica como resumen de la vejez de un pais Los parametros estadisticos son una consecuencia inevitable del proposito esencial de la estadistica crear un modelo de la realidad 4 El estudio de una gran cantidad de datos individuales de una poblacion puede ser farragoso e inoperativo por lo que se hace necesario realizar un resumen que permita tener una idea global de la poblacion compararla con otras comprobar su ajuste a un modelo ideal realizar estimaciones sobre datos desconocidos de la misma y en definitiva tomar decisiones A estas tareas contribuyen de modo esencial los parametros estadisticos Por ejemplo suele ofrecerse como resumen de la juventud de una poblacion la media aritmetica de las edades de sus miembros esto es la suma de todas ellas dividida por el total de individuos que componen tal poblacion Indice 1 Enfoque descriptivo 2 Propiedades deseables en un parametro 3 Principales parametros 3 1 Medidas de tendencia central o centralizacion 3 1 1 Media aritmetica o promedio 3 1 2 Moda 3 1 3 Mediana 3 2 Medidas de posicion no central 3 3 Comentarios sobre las medidas de posicion 3 4 Medidas de dispersion 3 4 1 Medidas de dispersion absolutas 3 4 1 1 Recorridos 3 4 1 2 Desviaciones medias 3 4 1 3 Varianza y desviacion tipica 3 4 2 Medidas de dispersion relativa 3 4 2 1 Coeficiente de variacion de Pearson 3 4 2 2 Coeficiente de apertura 3 4 2 3 Recorridos relativos 3 4 2 4 Indice de desviacion respecto a la mediana 3 5 Medidas de forma 3 5 1 Medidas de asimetria 3 5 2 Medidas de apuntamiento o curtosis 3 6 Otros parametros 3 6 1 Proporcion 3 6 2 Numero indice 3 6 3 Tasa 3 6 4 Coeficiente de Gini 4 Momentos 5 Parametros bidimensionales 5 1 Centro de gravedad 5 2 Covarianza 5 3 Coeficiente de correlacion lineal 6 Los parametros en la inferencia estadistica 7 Controversias y malas interpretaciones 8 Vease tambien 9 Referencias 9 1 Bibliografia 9 2 Enlaces externosEnfoque descriptivo Editar Graficas de distribuciones normales para distintos valores de sus dos parametros Un parametro estadistico es una medida poblacional Este enfoque es el tradicional de la estadistica descriptiva 5 6 7 En este sentido su acepcion se acerca a la de medida o valor que se compara con otros tomando una unidad de una determinada magnitud como referencia Por su parte la faccion mas formal de la estadistica la estadistica matematica y tambien la inferencia estadistica utilizan el concepto de parametro en su acepcion matematica mas pura esto es como variable que define una familia de objetos matematicos en determinados modelos Asi se habla por ejemplo de una distribucion normal de parametros m y s como de una determinada familia de distribuciones con una distribucion de probabilidad de expresion conocida en la que tales parametros definen aspectos concretos como la esperanza la varianza la curtosis etc Otro ejemplo comun en este sentido es el de la distribucion de Poisson determinada por un parametro l o la distribucion binomial determinada por dos parametros n y p Desde el punto de vista de la estadistica matematica el hecho de que estas distribuciones describan situaciones reales y los citados parametros signifiquen un resumen de determinado conjunto de datos es indiferente Propiedades deseables en un parametro EditarSegun Yule 8 un parametro estadistico es deseable que tenga las siguientes propiedades Se define de manera objetiva es decir es posible calcularlo sin ambiguedades generalmente mediante una formula matematica Por ejemplo la media aritmetica se define como la suma de todos los datos dividida por el numero de datos No hay ambiguedad si se realiza ese calculo se obtiene la media si se realiza otro calculo se obtiene otra cosa Sin embargo la definicion de moda como el valor mas frecuente puede dar lugar a confusion cuando la mayor frecuencia la presentan varios valores distintos No desperdicia a priori ninguna de las observaciones Con caracter general un parametro sera mas representativo de una determinada poblacion cuantos mas valores de la variable esten implicados en su calculo Por ejemplo para medir la dispersion puede calcularse el recorrido que solo usa dos valores de la variable objeto de estudio los extremos o la desviacion tipica en cuyo calculo intervienen todos los datos del eventual estudio Es interpretable significa algo La mediana por ejemplo deja por debajo de su valor a la mitad de los datos esta justo en medio de todos ellos cuando estan ordenados Esta es una interpretacion clara de su significado Es sencillo de calcular y se presta con facilidad a manipulaciones algebraicas Se vera mas abajo que una medida de la dispersion es la desviacion media Sin embargo al estar definida mediante un valor absoluto funcion definida a trozos y no derivable no es util para gran parte de los calculos en los que estuviera implicada aunque su interpretacion sea muy clara Es poco sensible a las fluctuaciones muestrales Si pequenas variaciones en una muestra de datos estadisticos influyen en gran medida en un determinado parametro es porque tal parametro no representa con fiabilidad a la poblacion Asi pues es deseable que el valor de un parametro con esta propiedad se mantenga estable ante las pequenas oscilaciones que con frecuencia pueden presentar las distintas muestras estadisticas Esta propiedad es mas interesante en el caso de la estimacion de parametros Por otra parte los parametros que no varian con los cambios de origen y escala o cuya variacion esta controlada algebraicamente son apropiados en determinadas circunstancias como la tipificacion Principales parametros EditarArticulo principal Estadistico muestral Habitualmente se agrupan los parametros en las siguientes categorias Medidas de posicion 9 Se trata de valores de la variable estadistica que se caracterizan por la posicion que ocupan dentro del rango de valores posibles de esta Entre ellos se distinguen Las medidas de tendencia central medias moda y mediana Las medidas de posicion no central cuantiles cuartiles deciles y percentiles Medidas de dispersion 10 Resumen la heterogeneidad de los datos lo separados que estos estan entre si Hay dos tipos basicamente Medidas de dispersion absolutas que vienen dadas en las mismas unidades en las que se mide la variable recorridos desviaciones medias varianza y desviacion tipica Medidas de dispersion relativa que informan de la dispersion en terminos relativos como un porcentaje Se incluyen entre estas el coeficiente de variacion el coeficiente de apertura los recorridos relativos y el indice de desviacion respecto de la mediana Medidas de forma 11 Su valor informa sobre el aspecto que tiene la grafica de la distribucion Entre ellas estan los coeficientes de asimetria y los de curtosis Otros parametros Ademas y con propositos mas especificos existen otros parametros de uso en situaciones muy concretas como son las proporciones los numeros indice las tasas y el coeficiente de Gini Medidas de tendencia central o centralizacion Editar Articulo principal Medidas de tendencia central Son valores que suelen situarse cerca del centro de la distribucion de datos Los mas destacados son las medias o promedios incluyendo la media aritmetica la media geometrica y la media armonica la mediana y la moda Media aritmetica o promedio Editar La estatura media como resumen de una poblacion homogenea abajo o heterogenea arriba Articulo principal Media aritmetica La media muestral o media aritmetica es probablemente uno de los parametros estadisticos mas extendidos 12 Sus propiedades son 13 Su calculo es muy sencillo y en el intervienen todos los datos Se interpreta como punto de equilibrio o centro de masas del conjunto de datos ya que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor i 1 n x i x n i 1 n x i n i 1 n x n x x 0 displaystyle frac sum i 1 n x i overline x n frac sum i 1 n x i n frac sum i 1 n overline x n overline x overline x 0 Minimiza las desviaciones cuadraticas de los datos respecto de cualquier valor prefijado esto es el valor de i 1 n x i k 2 n displaystyle frac sum i 1 n x i k 2 n es minimo cuando k x displaystyle k overline x Este resultado se conoce como Teorema de Konig Esta propiedad permite interpretar uno de los parametros de dispersion mas importantes la varianza Se ve afectada por transformaciones afines cambios de origen y escala esto es six i a x i b displaystyle x i ax i b entonces x a x b displaystyle overline x a overline x b donde x displaystyle overline x es la media aritmetica de los x i displaystyle x i para i 1 n y a y b numeros reales Este parametro aun teniendo multiples propiedades que aconsejan su uso en situaciones muy diversas tiene tambien algunos inconvenientes como son Para datos agrupados en intervalos variables continuas su valor oscila en funcion de la cantidad y amplitud de los intervalos que se consideren Es una medida a cuyo significado afecta sobremanera la dispersion de modo que cuanto menos homogeneos son los datos menos informacion proporciona Dicho de otro modo poblaciones muy distintas en su composicion pueden tener la misma media 14 Por ejemplo un equipo de baloncesto con cinco jugadores de igual estatura 1 95 pongamos por caso tendria una estatura media de 1 95 evidentemente valor que representa fielmente a esta homogenea poblacion Sin embargo un equipo de estaturas mas heterogeneas 2 20 2 15 1 95 1 75 y 1 70 por ejemplo tendria tambien como puede comprobarse una estatura media de 1 95 valor que no representa a casi ninguno de sus componentes Es muy sensible a los valores extremos de la variable Por ejemplo en el calculo del salario medio de una empresa el salario de un alto directivo que gane 1 000 000 de tiene tanto peso como el de mil empleados normales que ganen 1 000 siendo la media de aproximadamente 2 000 Moda Editar Articulo principal Moda estadistica La moda es el dato mas repetido el valor de la variable con mayor frecuencia absoluta 15 En cierto sentido se corresponde su definicion matematica con la locucion estar de moda esto es ser lo que mas se lleva Su calculo es extremadamente sencillo pues solo necesita de un recuento En variables continuas expresadas en intervalos existe el denominado intervalo modal o en su defecto si es necesario obtener un valor concreto de la variable se recurre a la interpolacion Sus principales propiedades son Calculo sencillo Interpretacion muy clara Al depender solo de las frecuencias puede calcularse para variables cualitativas Es por ello el parametro mas utilizado cuando al resumir una poblacion no es posible realizar otros calculos por ejemplo cuando se enumeran en medios periodisticos las caracteristicas mas frecuentes de determinado sector social Esto se conoce informalmente como retrato robot 16 Inconvenientes Su valor es independiente de la mayor parte de los datos lo que la hace muy sensible a variaciones muestrales Por otra parte en variables agrupadas en intervalos su valor depende excesivamente del numero de intervalos y de su amplitud Usa muy pocas observaciones de tal modo que grandes variaciones en los datos fuera de la moda no afectan en modo alguno a su valor No siempre se situa hacia el centro de la distribucion Puede haber mas de una moda en el caso en que dos o mas valores de la variable presenten la misma frecuencia distribuciones bimodales o multimodales Mediana Editar Articulo principal Mediana estadistica La mediana es un valor de la variable que deja por debajo de si a la mitad de los datos una vez que estos estan ordenados de menor a mayor 17 Por ejemplo la mediana del numero de hijos de un conjunto de trece familias cuyos respectivos hijos son 3 4 2 3 2 1 1 2 1 1 2 1 y 1 es 2 puesto que una vez ordenados los datos 1 1 1 1 1 1 2 2 2 2 3 3 4 el que ocupa la posicion central es 2 1 1 1 1 1 1 M i t a d i n f e r i o r 2 M e d i a n a 2 2 2 3 3 4 M i t a d s u p e r i o r displaystyle underbrace 1 1 1 1 1 1 Mitad inferior underbrace color Red 2 Mediana underbrace 2 2 2 3 3 4 Mitad superior En caso de un numero par de datos la mediana no corresponderia a ningun valor de la variable por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales Por ejemplo en el caso de doce datos como los anteriores 1 1 1 1 1 V a l o r e s i n f e r i o r e s 1 2 V a l o r e s i n t e r m e d i o s 2 2 3 3 4 V a l o r e s s u p e r i o r e s displaystyle underbrace 1 1 1 1 1 Valores inferiores underbrace color Red 1 2 Valores intermedios underbrace 2 2 3 3 4 Valores superiores Se toma como mediana 1 5 1 2 2 displaystyle 1 5 frac color Red 1 color Red 2 2 En este ejemplo basado en una tabla real de percentiles usada en pediatria puede comprobarse que una nina de 24 meses con un peso de 13 kg estaria en el percentil 75º esto es su peso es superior al 75 de las ninas de su edad La mediana corresponderia aproximadamente a 12 kg interseccion de la linea curva mas oscura con la linea horizontal correspondiente al valor 12 en el eje vertical para esa misma edad Existen metodos de calculo mas rapidos para datos mas numerosos vease el articulo principal dedicado a este parametro Del mismo modo para valores agrupados en intervalos se halla el intervalo mediano y dentro de este se obtiene un valor concreto por interpolacion Propiedades de la mediana como parametro estadistico 18 Es menos sensible que la media a oscilaciones de los valores de la variable Un error de transcripcion en la serie del ejemplo anterior en pongamos por caso el ultimo numero deja a la mediana inalterada Como se ha comentado puede calcularse para datos agrupados en intervalos incluso cuando alguno de ellos no esta acotado No se ve afectada por la dispersion De hecho es mas representativa que la media aritmetica cuando la poblacion es bastante heterogenea Suele darse esta circunstancia cuando se resume la informacion sobre los salarios de un pais o una empresa Hay unos pocos salarios muy altos que elevan la media aritmetica haciendo que pierda representatividad respecto al grueso de la poblacion Sin embargo alguien con el salario mediano sabria que hay tanta gente que gana mas dinero que el como que gana menos Sus principales inconvenientes son que en el caso de datos agrupados en intervalos su valor varia en funcion de la amplitud de estos Por otra parte no se presta a calculos algebraicos tan bien como la media aritmetica Medidas de posicion no central Editar Articulo principal Medidas de posicion no central Directamente relacionados con la anterior se encuentran las medidas de posicion no central tambien conocidas como cuantiles Se trata de valores de la variable estadistica que dejan por debajo de si determinada cantidad de los datos Son en definitiva una generalizacion del concepto de la mediana Mientras que esta deja por debajo de si al 50 de la distribucion los cuantiles pueden hacerlo con cualquier otro porcentaje 19 Se denominan medidas de posicion porque informan precisamente de la posicion que ocupa un valor dentro de la distribucion de datos Tradicionalmente se distingue entre cuartiles si se divide la cantidad de datos en cuatro partes antes de proceder al calculo de los valores que ocupan cada posicion deciles si se divide los datos en diez partes o percentiles que dividen la poblacion en cien partes Ejemplos si se dice que una persona tras un test de inteligencia ocupa el percentil 75 ello supone que el 75 de la poblacion tiene un cociente intelectual con un valor inferior al de esa persona Este criterio se usa por las asociaciones de superdotados que limitan su conjunto de miembros a aquellas que alcanzan determinado percentil igual o superior a 98 en la mayoria de los casos El ejemplo que se muestra en la imagen de la derecha es el correspondiente al calculo inverso esto es cuando se desea conocer el percentil correspondiente a un valor de la variable en lugar del valor que corresponde a un determinado percentil Otras medidas de posicion central son la media geometrica y la media armonica que aunque tienen determinadas propiedades algebraicas que podrian hacerlas utiles en determinadas circunstancias su interpretacion no es tan intuitiva como la de los parametros anteriores 20 Comentarios sobre las medidas de posicion Editar Este tipo de parametros no tienen por que coincidir con un valor exacto de la variable y por tanto tampoco pueden usarse con caracter general para hacer pronosticos Por ejemplo si se dice que la media aritmetica de los hijos de las familias de un pais es de 1 2 no es posible encontrar familias con ese valor en concreto Un segundo ejemplo a ninguna fabrica de zapatos se le ocurriria fabricar los suyos con tallas unicamente correspondientes al valor promedio ni siquiera tienen por que ser estas tallas las mas fabricadas pues en tal caso seria mas apropiado atender a la moda de la distribucion de tallas de los eventuales clientes La eleccion de uno u otro parametro dependera de cada caso particular de los valores de la variable y de los propositos del estudio Su uso indiscriminado puede ser deliberadamente tendencioso o involuntariamente sesgado convirtiendose de hecho en un abuso 21 Puede pensarse por ejemplo en la siguiente situacion un empresario publica que el salario medio en su empresa es de 1600 A este dato que en determinadas circunstancias podria considerarse muy bueno podria llegarse si la empresa tuviese cuatro empleados con salarios de 1 000 mensuales y el salario del jefe incluido en la media fuese de 4 000 al mes 22 x 1000 1000 1000 1000 4000 5 1600 displaystyle bar x frac 1000 1000 1000 1000 4000 5 1600 Con caracter general y a modo de resumen podria decirse que la media aritmetica es un parametro representativo cuando la poblacion sigue una distribucion normal o es bastante homogenea en otras situaciones de fuerte dispersion habria que decantarse por la mediana La moda es el ultimo recurso y el unico cuando de describir variables cualitativas se trata Medidas de dispersion Editar Articulo principal Dispersion matematica Diagrama de caja que muestra la dispersion graficamente usando los cuartiles como referencia Entre Q1 y Q3 rango intercuartilico se encuentran el 50 de las observaciones Las medidas de posicion resumen la distribucion de datos pero resultan insuficientes y simplifican excesivamente la informacion Estas medidas adquieren verdadero significado cuando van acompanadas de otras que informen sobre la heterogeneidad de los datos Los parametros de dispersion miden eso precisamente generalmente calculando en que medida los datos se agrupan en torno a un valor central Indican de un modo bien definido lo homogeneos que estos datos son Hay medidas de dispersion absolutas entre las cuales se encuentran la varianza la desviacion tipica o la desviacion media aunque tambien existen otras menos utilizadas como los recorridos o la meda y medidas de dispersion relativas como el coeficiente de variacion el coeficiente de apertura o los recorridos relativos En muchas ocasiones las medidas de dispersion se ofrecen acompanando a un parametro de posicion central para indicar en que medida los datos se agrupan en torno de el 23 Medidas de dispersion absolutas Editar Recorridos Editar El recorrido o rango de una variable estadistica es la diferencia entre el mayor y el menor valor que toma la misma Es la medida de dispersion mas sencilla de calcular aunque es algo burda porque solo toma en consideracion un par de observaciones Basta con que uno de estos dos datos varie para que el parametro tambien lo haga aunque el resto de la distribucion siga siendo esencialmente la misma Existen otros parametros dentro de esta categoria como los recorridos o rangos intercuantilicos que tienen en cuenta mas datos y por tanto permiten afinar en la dispersion Entre los mas usados esta el rango intercuartilico que se define como la diferencia entre el cuartil tercero y el cuartil primero En ese rango estan por la propia definicion de los cuartiles el 50 de las observaciones Este tipo de medidas tambien se usa para determinar valores atipicos En el diagrama de caja que aparece a la derecha se marcan como valores atipicos todos aquellos que caen fuera del intervalo Li Ls Q1 1 5 Rs Q3 1 5 Rs donde Q1 y Q3 son los cuartiles 1º y 3º respectivamente y Rs representa la mitad del recorrido o rango intercuartilico tambien conocido como recorrido semiintercuartilico 24 Desviaciones medias Editar Articulo principal Desviacion media Dada una variable estadistica X y un parametro de tendencia central c se llama desviacion de un valor de la variable xi respecto de c al numero xi c Este numero mide lo lejos que esta cada dato del valor central c por lo que una media de esas medidas podria resumir el conjunto de desviaciones de todos los datos Asi pues se denomina desviacion media de la variable X respecto de c a la media aritmetica de las desviaciones de los valores de la variable respecto de c esto es siX x 1 x 2 x n displaystyle X x 1 x 2 x n entonces D M c i 1 n x i c n displaystyle DM c frac sum i 1 n left x i c right n De este modo se definen la desviacion media respecto de la media c x displaystyle overline x o la desviacion media respecto de la mediana c M e displaystyle overline Me cuya interpretacion es sencilla en virtud del significado de la media aritmetica 23 Sin embargo el uso de valores absolutos impide determinados calculos algebraicos que obligan a desechar estos parametros a pesar de su clara interpretacion en favor de los siguientes Varianza y desviacion tipica Editar Articulo principal Varianza Conjunto de datos estadisticos de media aritmetica 50 linea azul y desviacion tipica 20 lineas rojas Como se vio mas arriba la suma de todas las desviaciones respecto al parametro mas utilizado la media aritmetica es cero Por tanto si se desea una medida de la dispersion sin los inconvenientes para el calculo que tienen las desviaciones medias una solucion es elevar al cuadrado tales desviaciones antes de calcular el promedio Asi se define la varianza como 25 s 2 i 1 n x i x 2 n displaystyle sigma 2 frac sum limits i 1 n left x i overline x right 2 n o sea la media de los cuadrados de las desviaciones respecto de la media La desviacion tipica s se define como la raiz cuadrada de la varianza esto es s s 2 displaystyle sigma sqrt sigma 2 Para variables agrupadas en intervalos se usan las marcas de clase un valor apropiado del interior de cada intervalo en estos calculos Propiedades 25 Ambos parametros no se alteran con los cambios de origen Si todos los valores de la variable se multiplican por una constante b la varianza queda multiplicada por b2 En el intervalo x k s x k s displaystyle overline x k sigma overline x k sigma se encuentran al menos el 100 1 1 k 2 displaystyle 100 1 frac 1 k 2 de las observaciones vease Desigualdad de Tchebyschev 26 Esta ultima propiedad muestra la potencia del uso conjunto de la media y la desviacion tipica como parametros estadisticos ya que para valores de k iguales a 2 y 3 respectivamente se obtiene que En el intervalo x 2 s x 2 s displaystyle overline x 2 sigma overline x 2 sigma estan al menos el 75 de los datos En el intervalo x 3 s x 3 s displaystyle overline x 3 sigma overline x 3 sigma estan al menos el 89 de los datos Se cumple la siguiente relacion entre los parametros de dispersion D M e D x s displaystyle D Me leq D overline x leq sigma donde D M e D x displaystyle D Me D overline x y s displaystyle sigma son respectivamente la desviacion media respecto de la mediana la desviacion media respecto de la media y la desviacion tipica vease Desviacion media La media Es una medida de dispersion que tiene por su propia definicion las mismas propiedades que la mediana Por ejemplo no se ve afectada por valores extremos o atipicos 27 Medidas de dispersion relativa Editar Son parametros que miden la dispersion en terminos relativos un porcentaje o una proporcion por ejemplo de modo que permiten una sencilla comparacion entre la dispersion de distintas distribuciones 28 Coeficiente de variacion de Pearson Editar Articulo principal Coeficiente de variacion Se define como C V s x displaystyle C V frac sigma bar x donde s es la desviacion tipica y x displaystyle bar x es la media aritmetica Se interpreta como el numero de veces que la media esta contenida en la desviacion tipica Suele darse su valor en tanto por ciento multiplicando el resultado anterior por 100 De este modo se obtiene un porcentaje de la variabilidad Su principal inconveniente es que en el caso de distribuciones cuya media se acerca a cero su valor tiende a infinito e incluso resulta imposible de calcular cuando la media es cero Por ello no puede usarse para variables tipificadas Coeficiente de apertura Editar Se define como el cociente entre los valores extremos de la distribucion de datos esto es dada una distribucion de datos estadisticos x1 x2 xn su coeficiente de apertura CA es C A m a x x i m i n x i i 1 n displaystyle C A frac mathrm m acute a x x i mathrm m acute imath n x i i 1 n Se usa para comparar salarios de empresas Recorridos relativos Editar Dado Re el recorrido de una distribucion de datos estadisticos el recorrido relativo RR es R R R e x displaystyle R R frac R e bar x donde x displaystyle bar x es la media aritmetica de la distribucion Dada una distribucion de datos estadisticos con cuartiles Q1 Q2 y Q3 el recorrido intercuartilico relativo RIQR se define como 29 R I Q R Q 3 Q 1 Q 2 displaystyle R IQR frac Q 3 Q 1 Q 2 Por otra parte se define el recorrido semiintercuartilico relativo RSIR como R S I R Q 3 Q 1 Q 3 Q 1 displaystyle R SIR frac Q 3 Q 1 Q 3 Q 1 Indice de desviacion respecto a la mediana Editar Se define como V M e D M e M e displaystyle V Me frac D Me Me donde DMe es la desviacion media respecto de la mediana y Me es la mediana de una distribucion de datos estadisticos dada Medidas de forma Editar La campana de Gauss curva que sirve de modelo para el estudio de la forma de una distribucion Las medidas de forma caracterizan la forma de la grafica de una distribucion de datos estadisticos La mayoria de estos parametros tiene un valor que suele compararse con la campana de Gauss esto es la grafica de la distribucion normal una de las que con mas frecuencia se ajusta a fenomenos reales Medidas de asimetria Editar Articulo principal Asimetria estadistica Se dice que una distribucion de datos estadisticos es simetrica cuando la linea vertical que pasa por su media divide a su representacion grafica en dos partes simetricas Ello equivale a decir que los valores equidistantes de la media a uno u otro lado presentan la misma frecuencia En las distribuciones simetricas los parametros media mediana y moda coinciden mientras que si una distribucion presenta cierta asimetria de un tipo o de otro los parametros se situan como muestra el siguiente grafico Ello puede demostrarse facilmente si se tiene en cuenta la atraccion que la media aritmetica siente por los valores extremos que ya se ha comentado mas arriba y las definiciones de mediana justo en el centro de la distribucion tomando el eje de abscisas como referencia y moda valor que presenta una ordenada mas alta Por consiguiente la posicion relativa de los parametros de centralizacion pueden servir como una primera medida de la simetria de una distribucion Otras medidas mas precisas son el coeficiente de asimetria de Fisher el coeficiente de asimetria de Bowley y el coeficiente de asimetria de Pearson Medidas de apuntamiento o curtosis Editar Tres distribuciones con distintos grados de apuntamiento Articulo principal Curtosis Con estos parametros se pretende medir como se reparten las frecuencias relativas de los datos entre el centro y los extremos tomando como comparacion la campana de Gauss El parametro usado con mas frecuencia para esta medida es el coeficiente de curtosis de Fisher definido como g 2 i 1 n x i x 4 n s 4 3 displaystyle gamma 2 frac sum i 1 n x i bar x 4 n sigma 4 3 aunque hay otros como el coeficiente de curtosis de Kelley o el coeficiente de curtosis percentilico La comparacion con la distribucion normal permite hablar de distribuciones platicurticas o mas aplastadas que la normal distribuciones mesocurticas con igual apuntamiento que la normal y distribuciones leptocurticas esto es mas apuntadas que la normal 30 Por ultimo existen otras medidas para decidir sobre la forma de una distribucion con ajuste a modelos menos usuales como los que se muestran en las siguientes graficas Otros parametros Editar Se presentan en este apartado otros parametros que tienen aplicacion en situaciones muy concretas por lo que no se incluyen entre los grupos anteriores aunque tienen cabida en este articulo por su frecuente uso en medios de comunicacion y su facultad de resumir grandes cantidades de datos como ocurre con las medidas tratadas hasta ahora Proporcion Editar Articulo principal Proporcion La proporcion de un dato estadistico es el numero de veces que se presenta ese dato respecto al total de datos Se conoce tambien como frecuencia relativa y es uno de los parametros de calculo mas sencillo Tiene la ventaja de que puede calcularse para variables cualitativas Por ejemplo si se estudia el color de ojos de un grupo de 20 personas donde 7 de ellas los tienen azules la proporcion de individuos con ojos azules es del 35 7 20 El dato con mayor proporcion se conoce como moda vease mas arriba En inferencia estadistica existen intervalos de confianza para la estimacion de este parametro Numero indice Editar Articulo principal Numero indice Un numero indice es una medida estadistica que permite estudiar las fluctuaciones o variaciones de una magnitud o de mas de una en relacion al tiempo o al espacio Los indices mas habituales son los que realizan las comparaciones en el tiempo Algunos ejemplos de uso cotidiano de este parametro son el indice de precios o el IPC 31 Tasa Editar Articulo principal Tasa indice Coeficiente de Gini en el mundo 2007 2008 La tasa es un coeficiente que expresa la relacion entre la cantidad y la frecuencia de un fenomeno o un grupo de fenomenos Se utiliza para indicar la presencia de una situacion que no puede ser medida en forma directa 31 Esta razon se utiliza en ambitos variados como la demografia o la economia donde se hace referencia a la tasa de interes Algunos de los mas usados son tasa de natalidad tasa de mortalidad tasa de crecimiento demografico tasa de fertilidad o tasa de desempleo Coeficiente de Gini Editar Articulo principal Coeficiente de Gini El indice de Gini o coeficiente de Gini es un parametro de dispersion usado para medir desigualdades entre los datos de una variable o la mayor o menor concentracion de los mismos Este coeficiente mide de que forma esta distribuida la suma total de los valores de la variable Se suele usar para describir salarios Los casos extremos de concentracion serian aquel en los que una sola persona acapara el total del dinero disponible para salarios y aquel en el que este total esta igualmente repartido entre todos los asalariados 32 Momentos EditarArticulos principales Momento estandary Momento centrado Los momentos son una forma de generalizar toda la teoria relativa a los parametros estadisticos y guardan relacion con una buena parte de ellos Dada una distribucion de datos estadisticos x1 x2 xn se define el momento central o momento centrado de orden k como m k i 1 n x i x k n displaystyle mu k frac sum i 1 n x i bar x k n Para variables continuas la definicion cambia sumas discretas por integrales suma continua aunque la definicion es esencialmente la misma 33 De esta definicion y las propiedades de los parametros implicados que se han visto mas arriba se deduce inmediatamente que m 0 1 m 1 0 m 2 s 2 displaystyle mu 0 1 mu 1 0 mu 2 sigma 2 y que g 1 m 3 m 2 3 2 g 2 m 4 m 2 2 displaystyle gamma 1 frac mu 3 mu 2 3 2 gamma 2 frac mu 4 mu 2 2 34 Se llama momento no centrado de orden k a la siguiente expresion m k i 1 n x i k n displaystyle m k frac sum i 1 n x i k n De la definicion se deduce que m 0 1 m 1 x m 2 m 1 2 s 2 displaystyle m 0 1 m 1 bar x m 2 m 1 2 sigma 2 Usando el binomio de Newton puede obtenerse la siguiente relacion entre los momentos centrados y no centrados m k i 0 k 1 i k i m k i m 1 i displaystyle mu k sum i 0 k 1 i k choose i m k i m 1 i Los momentos de una distribucion estadistica la caracterizan univocamente 35 Parametros bidimensionales EditarArticulo principal Estadistica bidimensional En estadistica se estudian en ocasiones varias caracteristicas de una poblacion para compararlas estudiar su dependencia o correlacion o realizar cualquier otro estudio conjunto El caso mas comun de dos variables se conoce como estadistica bidimensional 36 Un ejemplo tipico es el de un estudio que recoja la estatura denotemosla por X y el peso sea Y de los n individuos de una determinada poblacion En tal caso fruto de la recogida de datos se obtendria una serie de parejas de datos xi yi con i 1 n cada una de las cuales estaria compuesta por la estatura y el peso del individuo i respectivamente En los estudios bidimensionales cada una de las dos variables que entran en juego estudiadas individualmente pueden resumirse mediante los parametros que se han visto hasta ahora Asi tendria sentido hablar de la media de las estaturas X displaystyle bar X o la desviacion tipica de los pesos sY Incluso para un determinado valor de la primera variable xk cabe hacer estudios condicionados Por ejemplo la mediana condicionada a la estatura xk seria la mediana de los pesos de todos los individuos que tienen esa estatura Se denota Me x xk Sin embargo existen otros parametros que resumen caracteristicas de ambas distribuciones en su conjunto Los mas destacados son el centro de gravedad la covarianza y el coeficiente de correlacion lineal Centro de gravedad Editar Dadas dos variables estadisticas X e Y se define el centro de gravedad como la pareja X displaystyle bar X Y displaystyle bar Y donde X displaystyle bar X y Y displaystyle bar Y son respectivamente las medias aritmeticas de las variables X e Y El nombre de este parametro proviene de que en una representacion de las parejas del estudio en una nube de puntos en la que cada punto tuviese un peso proporcional a su frecuencia absoluta las coordenadas X displaystyle bar X Y displaystyle bar Y corresponderian precisamente al centro de gravedad como concepto fisico 37 Covarianza Editar Articulo principal Covarianza La covarianza o varianza conjunta de una distribucion bidimensional se define como s x y 1 n i 1 n x i x y i y displaystyle sigma xy frac 1 n sum i 1 n x i overline x y i overline y La interpretacion de este parametro tiene que ver con la eventual correlacion lineal de las dos variables Una covarianza positiva implica una correlacion directa y una negativa una correlacion inversa 38 Por otra parte es un parametro imprescindible para el calculo del coeficiente de correlacion lineal o los coeficientes de regresion como se vera mas abajo En su contra tiene que se ve excesivamente influenciada al igual que ocurria con la media aritmetica por los valores extremos de las distribuciones y los cambios de escala Coeficiente de correlacion lineal Editar Articulo principal Coeficiente de correlacion Variacion del coeficiente de correlacion lineal en funcion de la nube de puntos asociada Se trata de un coeficiente que permite determinar la bondad del ajuste de la nube de puntos por una recta Se define como r s x y s x s y displaystyle r frac sigma xy sigma x sigma y donde sxy es la covarianza y sx y sy las desviaciones tipicas respectivas de las distribuciones implicadas El coeficiente de correlacion lineal toma valores entre 1 y 1 En esa escala mide la correlacion del siguiente modo La correlacion lineal es mas fuerte cuanto mas cerca este de 1 o 1 La correlacion lineal es mas debil cuanto mas proximo a cero sea r 39 El diagrama de la derecha ilustra como puede variar r en funcion de la nube de puntos asociada Otros parametros bidimensionales son el coeficiente de correlacion de Spearman los coeficientes de correlacion no parametricos el coeficiente de determinacion o los coeficientes de regresion lineal Al igual que con distribuciones unidimensionales existe una forma equivalente de desarrollar la teoria relativa a los parametros estadisticos bidimensionales usando los momentos Los parametros en la inferencia estadistica EditarArticulos principales Estimacion estadisticay Estadistico muestral En ocasiones los parametros de una determinada poblacion no pueden conocerse con certeza Generalmente esto ocurre porque es imposible el estudio de la poblacion completa por cuestiones como que el proceso sea destructivo p e vida media de una bombilla o muy caro p e audiencias de television En tales situaciones se recurre a las tecnicas de la inferencia estadistica para realizar estimaciones de tales parametros a partir de los valores obtenidos de una muestra de la poblacion 40 Se distingue entonces entre parametros y estadisticos Mientras que un parametro es una funcion de los datos de la poblacion el estadistico lo es de los datos de una muestra De este modo pueden definirse la media muestral la varianza muestral o cualquier otro parametro de los vistos mas arriba Por ejemplo dada una muestra estadistica de tamano n x 1 x 2 x n displaystyle x 1 x 2 x n de una variable aleatoria X con distribucion de probabilidad F x 8 donde 8 es un conjunto de parametros de la distribucion se definiria la media muestral n esima como X n T x 1 x 2 x n 1 n i 1 n x i x 1 x 2 x n n displaystyle bar X n T x 1 x 2 x n frac 1 n sum i 1 n x i frac x 1 x 2 x n n En el caso concreto de la varianza muestral suele tomarse por sus mejores propiedades como estimador la siguiente S n 2 1 n 1 i 1 n X i X n 2 displaystyle S n 2 frac 1 n 1 sum i 1 n X i bar X n 2 donde se ha tomado como denominador n 1 en lugar de n A este parametro tambien se le llama cuasivarianza 41 Controversias y malas interpretaciones EditarComo se ha dicho los parametros estadisticos en el enfoque descriptivo que aqui se adopta substituyen grandes cantidades de datos por unos pocos valores extraidos de aquellos a traves de operaciones simples Durante este proceso se pierde parte de la informacion ofrecida originalmente por todos los datos Es por esta perdida de datos por lo que la estadistica ha sido tildada en ocasiones de una falacia Por ejemplo si en un grupo de tres personas una de ellas ingiere tres helados el parametro que con mas frecuencia se utiliza para resumir datos estadisticos la media aritmetica del numero de helados ingeridos por el grupo seria igual a 1 0 0 3 3 displaystyle frac 0 0 3 3 valor que no parece resumir fielmente la informacion Ninguna de las personas se sentiria identificada con la frase resumen He ingerido un helado de media 21 Un ejemplo menos conocido pero igual de ilustrativo acerca de la claridad de un parametro es la distribucion exponencial que suele regir los tiempos medios entre determinados tipos de sucesos Por ejemplo si la vida media de una bombilla es de 8 000 horas mas del 50 por ciento de las veces no llegara a esa media Igualmente si un autobus pasa cada 10 minutos de media hay una probabilidad mayor del 50 por ciento de que pase menos de 10 minutos entre un autobus y el siguiente Otro ejemplo que suele ofrecerse con frecuencia para argumentar en contra de la estadistica y sus parametros es que estadisticamente hablando la temperatura media de una persona con los pies en un horno y la cabeza en una nevera es ideal Benjamin Disraeli un descreido de las estadisticas Quizas por situaciones como estas que en general muestran un profundo desconocimiento de lo que los parametros representan en realidad y de su uso conjunto con otras medidas de centralizacion o dispersion el primer ministro britanico Benjamin Disraeli sentencio 42 primero y Mark Twain popularizo mas tarde 43 la siguiente afirmacion Hay mentiras grandes mentiras y estadisticas Benjamin Disraeli Hay otros personajes que tambien han advertido sobre la simplificacion que supone la estadistica como el profesor Aaron Levenstein quien afirmaba Las estadisticas son como los bikinis lo que muestran es sugerente pero lo que esconden es vital Aaron Levenstein Por su parte el escritor y comediante ingles Bernard Shaw sentencio 44 La estadistica es una ciencia que demuestra que si mi vecino tiene dos coches y yo ninguno los dos tenemos uno George Bernard Shaw o el personaje ficticio Homer Simpson de la popular serie de television Los Simpson en una entrevista acerca de las proporciones en uno de sus capitulos 45 Oh la gente sale con estadisticas para probar cualquier cosa el 14 por ciento del mundo lo sabe Guionistas de la serie Los SimpsonVease tambien EditarDesigualdad de Tchebyschev teorema que muestra la cantidad de datos que resumen conjuntamente la media aritmetica y la desviacion tipica Diagrama de caja grafico en el que se aprecian visualmente las caracteristicas de algunos de los parametros de centralizacion posicion y dispersion Dispersion matematica Estadistica descriptiva La teoria estadistica relativa a los parametros tal y como se han expuesto en este articulo pertenece a esta especialidad matematica Estadistica robusta Estadistico concepto equivalente al de parametro cuando se trata de una muestra Estimacion de parametros diversos metodos para predecir el valor real de determinados parametros poblacionales cuando estos no pueden conocerse mediante experiencias Intervalo de confianza metodo para estimar el valor aproximado de un parametro estadistico Parametro como objeto matematico Parametros mas comunes Parametros de centralizacion Media aritmetica media geometrica media armonica Mediana Moda Parametros de dispersion Coeficiente de variacion Desviacion media Desviacion tipica Rango Varianza Medidas de posicion no central Otros parametros Asimetria estadistica Coeficiente de Gini Curtosis Momento estandar Momento centrado Numero indice Proporcion Tasa indice Parametros bidimensionales Correlacion Coeficiente de correlacion de Pearson Coeficiente de correlacion de Spearman Poblacion como concepto estadistico Regresion estadisticaReferencias Editar Ross Sheldon M 2007 3 Uso de la Estadistica para sintetizar conjuntos de datos Introduccion a la Estadistica trad Valdes Sanchez Teofilo Reverte p 69 ISBN 8429150390 Consultado el 5 de abril de 2009 Fernandez Gordillo Juan Carlos 2008 Parametros estadisticos Ditutor Diccionario de Matematicas Consultado el 19 de abril de 2009 Serret Moreno Gil Jaime 1998 4 Parametros Estadisticos Procedimientos estadisticos ESIC p 71 ISBN 8473561716 Consultado el 19 de abril de 2009 Pascual Jose Galbiati Jose Gonzalez Gladys Maulen Mª Angelica Arancibia Rodrigo Conceptos basicos Modelo Exploracion de datos Introduccion a la Estadistica Descriptiva Disenadora Galbiati Paola Instituto de Estadistica Universidad Catolica de Valparaiso Archivado desde el original el 10 de abril de 2009 Consultado el 16 de abril de 2009 Parametro estadistico Enciclopedia Microsoft Encarta Online 2009 Microsoft Corporation 2009 Archivado desde el original el 1 de abril de 2009 Consultado el 19 de abril de 2009 Parametro estadistico numero que se obtiene a partir de los datos de una distribucion estadistica y que sirve para sintetizar alguna caracteristica relevante de la misma Clapham Christopher septiembre de 1998 Diccionario de Matematicas Traduccion De Sa Madariaga Juan Mª L Primera edicion Oxford Complutense p 266 ISBN 84 89784 56 6 Parametro en estadistica Cierta cantidad que caracteriza de alguna forma a la poblacion como su media o su mediana La referencia utiliza el parametro obsoleto mes ayuda Serret Moreno Gil Jaime 1998 4 Parametros Estadisticos Procedimientos estadisticos ESIC p 71 ISBN 8473561716 Consultado el 19 de abril de 2009 En estadistica descriptiva tenemos una serie de expresiones que permiten disponer de unos valores numericos que reflejan el comportamiento global del suceso estadistico calculados a partir de los datos individuales Estas expresiones son los parametros estadisticos citado por Calot 1985 pp 55 56 y MAD Eduforma 2006 p 160 Romero Villafranca Rafael Zunica Ramajo Luisa Rosa 2005 2 6 Parametros de posicion Metodos estadisticos en Ingenieria Valencia Univ Politec Valencia pp 39 41 ISBN 8497057279 Consultado el 20 de abril de 2009 La referencia utiliza el parametro obsoleto coautores ayuda Medidas de Dispersion Enciclopedia Microsoft Encarta Online Microsoft Corporation 2009 Archivado desde el original el 28 de noviembre de 2015 Consultado el 20 de abril de 2009 Serret Moreno Gil Jaime 1998 4 3 Parametros de forma Procedimientos estadisticos ESIC p 81 ISBN 8473561716 Consultado el 20 de abril de 2009 Wackerly Dennis D Mendenhall William Scheaffer Richard L 2002 1 3 Descripcion de un conjunto de mediciones metodos numericos Estadistica matematica con aplicaciones 6ª edicion Cengage Learning Editores p 8 ISBN 9706861947 La medida central que mas se usa en estadistica es la media aritmetica Rius Diaz Francisca octubre de 1997 2 3 2 La media Bioestadistica Metodos y aplicaciones Malaga Universidad de Malaga ISBN 84 7496 653 1 Archivado desde el original el 23 de diciembre de 2009 Consultado el 7 de abril de 2009 La referencia utiliza el parametro obsoleto mes ayuda Wackerly Dennis D Mendenhall William Scheaffer Richard L 2002 1 3 Descripcion de un conjunto de mediciones metodos numericos Estadistica matematica con aplicaciones 6ª edicion Cengage Learning Editores p 8 ISBN 9706861947 Dos conjuntos de mediciones podrian tener distribuciones de frecuencias muy distintas pero con la misma media Rius Diaz Francisca 2 3 6 La moda Bioestadistica Metodos y aplicaciones Santos Maria Jose abril de 2009 Retrato robot del alcalde metropolitano El Correo de Andalucia Consultado el 7 de abril de 2009 La referencia utiliza el parametro obsoleto mes ayuda Serret Moreno Gil Jaime 1998 Procedimientos estadisticos ESIC p 75 ISBN 8473561716 Consultado el 17 de abril de 2009 Rius Diaz Francisca 2 3 4 La mediana Bioestadistica Metodos y aplicaciones Martin Andres Antonio Luna del Castillo Juan de Dios 2004 Bioestadistica para las ciencias de la Salud Capitel Editores p 28 ISBN 8484510182 Consultado el 17 de abril de 2009 La referencia utiliza el parametro obsoleto coautores ayuda Chaves Bernardo 2004 La media geometrica y la media armonica Bioestadistica para postgrado Universidad Nacional de Colombia Consultado el 7 de abril de 2009 enlace roto disponible en Internet Archive vease el historial la primera version y la ultima a b Huff Darrel 1965 2 El promedio bien escogido Como mentir con estadisticas Acapulco Sagitario Johnson Robert Kuby Patricia 2003 2 8 El arte del engano estadistico Estadistica elemental 3ª edicion Cengage Learning Editores p 94 ISBN 9706862870 a b Rius Diaz Francisca 2 7 Medidas de variabilidad o dispersion Bioestadistica Metodos y aplicaciones Consultado el 17 de abril de 2009 Fernandez Fernandez Santiago Alejandro Cordoba Jose Maria Cordero Sanchez Alejandro Cordoba 2002 4 2 Medidas absolutas Estadistica Descriptiva 2ª edicion ESIC Editorial p 192 ISBN 8473563069 La referencia utiliza el parametro obsoleto coautores ayuda a b Rius Diaz Francisca 2 7 4 Varianza y desviacion tipica Bioestadistica Metodos y aplicaciones Consultado el 7 de abril de 2009 Wackerly Dennis D 3 11 Teorema de Chebyshev Estadistica matematica con aplicaciones p 139 Fernandez Fernandez Santiago 4 2 3 4 Meda o desviacion mediana Estadistica Descriptiva p 200 Fernandez Fernandez Santiago 4 3 Medidas relativas Estadistica Descriptiva p 201 Fernandez Fernandez Santiago 4 3 Medidas relativas Estadistica Descriptiva p 202 Sotomayor Velasco Gabriel Wisniewski Piotr Marian 2001 8 7 Momentos y otras caracteristicas Probabilidad y estadistica para ingenieria y ciencias Cengage Learning Editores p 196 ISBN 970686136X Consultado el 7 de abril de 2009 a b Mallea Adriana Adriana Herrera Myriam Ruiz Ana Maria 2003 3 Parametros estadisticos no convencionales Estadistica en el nivel polimodal San Juan effha p 67 ISBN 9872084920 Consultado el 17 de abril de 2009 Llorente Galera Francisco Staff VV Marin Feria Susana Torra Porras Salvador 2000 2 6 Medidas de concentracion Principios de estadistica descriptiva aplicada a la empresa Ramon Areces pp 53 54 ISBN 8480044276 Consultado el 17 de abril de 2009 enlace roto disponible en Internet Archive vease el historial la primera version y la ultima Wackerly Dennis D 3 9 Momentos y funciones generadoras de momentos Estadistica matematica con aplicaciones p 131 Estadisticos de tendencia central Archivado desde el original el 23 de diciembre de 2009 Casas Sanchez J M Santos Pena Julian 2002 2 6 Momentos Introduccion a la estadistica para economia 2 edicion Ramon Areces p 95 ISBN 848004523X Si los momentos coinciden en dos distribuciones diremos que son iguales La referencia utiliza el parametro obsoleto coautores ayuda enlace roto disponible en Internet Archive vease el historial la primera version y la ultima Caceres Hernandez Juan Jose 2007 4 1 Variable estadistica multidimensional y distribucion de frecuencias Conceptos basicos de Estadistica para Ciencias Sociales Delta Publicaciones p 62 ISBN 8496477436 Arias Rodriguez Jose Carlos 2004 Distribuciones bidimensionales Proyecto Descartes Madrid Ministerio de Educacion Politica Social y Deporte Consultado el 7 de abril de 2009 Rius Diaz Francisca octubre de 1997 3 10 2 Una interpretacion geometrica de la covarianza Bioestadistica Metodos y aplicaciones Malaga Universidad de Malaga ISBN 84 7496 653 1 Archivado desde el original el 23 de diciembre de 2009 Consultado el 7 de abril de 2009 La referencia utiliza el parametro obsoleto mes ayuda Baron Lopez Francisco Javier Bioestadistica Video en Flash Malaga Universidad de Malaga Consultado el 18 de abril de 2009 Casas Sanchez Jose M Manzano Arrondo Vicente Zamora Sanz Ana Isabel 1997 2 Estimacion puntual Inferencia Estadistica 2ª ilustrada edicion Ramon Areces pp 89 162 ISBN 848004263X Consultado el 17 de abril de 2009 enlace roto disponible en Internet Archive vease el historial la primera version y la ultima Alvarez Leiva Juan Antonio diciembre de 1997 Medidas de dispersion Proyecto CICA Thales Sociedad Andaluza de Educacion Matematica Thales Consultado el 7 de abril de 2009 La referencia utiliza el parametro obsoleto mes ayuda Citas de Benjamin Disraeli en Wikiquote Consultado el 5 de abril de 2009 Mentiras grandes mentiras y estadisticas en la Wikipedia inglesa url incorrecta con autorreferencia ayuda Citas de Bernard Shaw Los Simpsons temporada 5 episodio Homer el vigilante Bibliografia Editar Calot Gerard 1985 Curso de estadistica descriptiva trad Francisco Jose Cano Sevilla 4ª edicion Parainfo ISBN 8428305633 Fernandez Fernandez Santiago Cordoba Alejandro Cordero Sanchez Jose Maria 2002 Estadistica Descriptiva 2ª edicion ESIC Editorial ISBN 8473563069 Huff Darrel Geis Irvin 1993 How to lie with Statistics W W Norton amp Co Inc ISBN 0393310728 Rius Diaz Francisca 1997 Bioestadistica Metodos y aplicaciones 2ª edicion Universidad de Malaga ISBN 84 7496 653 1 Velasco Sotomayor Gabriel Wisniewski Piotr Marian 2001 Probabilidad y estadistica para ingenieria y ciencias Cengage Learning Editores pp 185 197 ISBN 970686136X Tecnicos de Administracion Del Ministerio de Economia Y Hacienda instituto Nacional de Estadistica Grupos III Y IV Temario Especifico Y Test Ebook MAD Eduforma 2006 ISBN 9788466552509 Enlaces externos Editar Calculadoras de parametros estadisticos Las tres medias Calcula la media aritmetica geometrica y armonica de una serie de 80 datos o menos La calculadora web descriptiva Calcula media moda varianza desviacion tipica coeficiente de variacion coeficientes de forma indice Gini media armonica Calculadora estadistica Incluye parametros bidimensionales y otros calculos de utilidad en probabilidad Cursos completos de estadistica descriptiva Estadistica descriptiva Hecho con Moodle por la Universidad de Antioquia Bioestadistica metodos y aplicaciones por la Universidad de Malaga Datos Q3776487 Obtenido de https es wikipedia org w index php title Parametro estadistico amp oldid 140440624, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos