Intervalo de confianza

requisitos previos: prueba t, prueba z

En términos simples, un intervalo de confianza es un rango dentro del cual estamos seguros de que existe un valor verdadero. La elección de un nivel de confianza para un intervalo determina la probabilidad de que el valor del parámetro sea verdadero en el intervalo de confianza. Este rango de valores generalmente se usa para tratar con datos basados ​​en la población, extrayendo información específica y valiosa con un cierto grado de confianza, de ahí el término ‘Intervalo de confianza’.

Figura 1. Muestra el aspecto general de un intervalo de confianza.

Fig. 1: Diagrama de intervalo de confianza

Nivel de confianza:

El nivel de confianza describe la incertidumbre asociada con un método de muestreo.

Supongamos que usamos el mismo método de muestreo (por ejemplo, una media de muestra) para calcular una estimación de intervalo diferente para cada muestra. Algunas estimaciones de intervalo incluirían el parámetro de población real y otras no.

Un nivel de confianza del 90 % significa que esperaríamos que el 90 % de las estimaciones de intervalo cubrieran el parámetro de población. Un nivel de confianza del 95 % significa que el 95 % de los intervalos incluiría el parámetro de población.

Por ejemplo, suponga que está encuestando la estatura promedio de los hombres en una ciudad en particular. Para encontrar eso, establece un nivel de confianza del 95% y encuentra que el intervalo de confianza del 95% es (168,182). Eso significa que si hicieras esto una y otra vez, el 95 por ciento de las veces la altura de un hombre caería entre 168 cm y 182 cm.

Construcción de un intervalo de confianza:

Hay 4 pasos involucrados en la construcción de un intervalo de confianza.

Step 1: Identify the sample problem. Choose the statistic (like sample mean, etc) that 
    you will use to estimate population parameter.

Step 2: Select a confidence level. (Usually, it is 90%, 95% or 99%)

Step 3: Find the margin of error. (Usually given) If not given, use the following formula:-
    Margin of error = Critical value * Standard deviation 

Step 4: Specify the confidence interval. The uncertainty is denoted by the confidence level. 
    And the range of the confidence interval is defined by Eq-1.

Cada-1

where, 
Sample_Statistic --> Can be any kind of statistic. (eg. sample mean)
Margin_of_Error  --> generally, its (± 2.5)

Cálculo de un intervalo de confianza

El cálculo de IC requiere dos parámetros estadísticos.

  • Media (μ) – La media aritmética es el promedio de los números. Se define como la suma de n números dividida por la cuenta de números hasta n. (Eq-2)

mu=frac{1+2+3+ldots+n}{n} quad {.. eq 2}

  • Desviación estándar (σ) Es la medida de cuán dispersos están los números. Se define como la suma de los cuadrados de la diferencia entre cada número y la media. (Eq-3)

sigma=sqrt{sum frac{left(x_{i}-muright)^{2}}{n}} quad {... eq 3}

a) Usando una distribución

Usamos una distribución cuando el tamaño de la muestra n<30.

Considere el siguiente ejemplo. Se tomó una muestra aleatoria de 10 luchadores de la UFC y se midió su peso. Se encontró que el peso promedio era de 240 kg. Estime un intervalo de confianza del 95% para el peso medio. La desviación estándar de la muestra fue de 25 kg. Encuentre un intervalo de confianza para una muestra del peso promedio real de todos los peleadores de UFC.

Step 1 - Subtract 1 from your sample size.[Eq-4] 
     This gives the degrees of freedom (df), required in Step-3.  

df=n-1 quad {... equivalente a 4}

where, 
df = degree of freedom
n = sample size 

Usando Eq-4, obtenemos gl = 10 – 1 = 9.

Step 2 - Subtract the confidence interval from 1, then divide by two.
 [Eq-5]
     This gives the significance level (α), required in Step-3. 

alpha=frac{1-CL}{2} quad {... equivalente a 5}

α = Significance level
CL = Confidence Level

Usando Eq-5, obtenemos α = (1 – 0,95) / 2 = 0,025

Step 3 - Use the values of α and df in the t-distribution table and find the value of t.  

(df)/(α)0.10.050.025. .

1. 2821. 6451. 960. .

1

3. 0786. 31412. 706. .

2

1. 8862. 9204. 303. .

:

:::. .

8

1. 3971. 8602. 306. .

9

1. 3831. 8332. 262. .

Usando los valores df y α en la tabla de distribución t, obtenemos t = 2,262.

Step 4 - Use the t-value obtained in step 3 in the formula given for Confidence Interval 
      with t-distribution. [Eq-6]

mu pm tleft(frac{sigma}{sqrt{n}}right) quad {...Eq6}

where,
μ = mean
t = chosen t-value from the table above
σ = the standard deviation
n = number of observations

Entonces, poniendo los valores en la Ec-6, obtenemos

begin{array}{l} Rightarrow 240 pm(2.262)^{*}(25 / sqrt{10})  Rightarrow 240 pm 17.883  Rightarrow(240-17.883,240+17.883)   Derecha(222.117,257.883) end{editar}

where,
Lower Limit = 222.117
Upper Limit = 257.883

Por lo tanto, estamos 95% seguros de que el verdadero peso promedio de los peleadores de UFC está entre 222.117 y 257.883.

b) Mediante el uso de distribución z

Usamos la distribución z cuando el tamaño de la muestra es n> 30. La prueba Z es más útil cuando se conoce la desviación estándar.

Considere el siguiente ejemplo. Se toma una muestra aleatoria de 50 hembras adultas y se mide su recuento de glóbulos rojos. La media de la muestra es 4,63 y la desviación estándar del recuento de glóbulos rojos es 0,54. Calcule un intervalo de confianza del 95 % para el verdadero recuento medio de glóbulos rojos en mujeres adultas.

Step 1 - Find the mean. [Eq-2] (If not already given)
Step 2 - Find the standard deviation. [Eq-3] (If not already given)
Step 3 - Determine the z-value for the specified confidence interval. 
     (some common values in the table given below)
Intervalo de confianzavalor z

90%

1. 645

95%

1. 960

99%

2. 576
Step 4 - Use the z-value obtained in step 3 in the formula given for Confidence Interval 
      with z-distribution. [Eq-7]

mu pm zleft(frac{sigma}{sqrt{n}}right) quad {...Eq7}

where,
μ = mean
z = chosen z-value from the table above
σ = the standard deviation
n = number of observations

Poniendo los valores en la Ec-7, obtenemos

begin{array}{l} Rightarrow4.63 pm(1.960)^{*}(0.54 / sqrt{50})  Rightarrow 4.63 pm 0.149  Rightarrow(4.63-0.149,4.63+0.149 )   Derecha(4.480,4.780) end{matriz}

where,
Lower Limit = 4.480
Upper Limit = 4.780

Por lo tanto, estamos seguros en un 95 % de que el recuento de glóbulos rojos verdadero promedio de mujeres adultas está entre 4.480 y 4.780.

Un intervalo de confianza es uno de los conceptos fundamentales de la estadística. Dice una declaración sobre los detalles. Son posibles varios métodos de muestreo, como la media, la mediana, etc. utilizarse en base a los datos presentes. También es posible decidir qué distribución se utilizará para obtener los mejores resultados. Para cualquier duda/consulta, comenta abajo.

Mis notas personales
flecha_caer_arriba

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *