Inferencias para cuantiles

Javier Santibáñez

1 de febrero de 2018

Planteamiento

Cuantiles distribucionales

Ejemplo: cuantiles de la distribución binomial

0 1 2 3 4 5
fmp 0.078 0.259 0.346 0.230 0.077 0.010
fda 0.078 0.337 0.683 0.913 0.990 1.000

La función de cuantiles empírica

Ejemplo: inferencias para cuantiles

Suponer que se tienen las siguientes observaciones \[ \{10.9, \quad 9.9, \quad 12.5, \quad 1.2, \quad 8.3 \} \]

Los estadísticos de orden son \[ x_{(1)} = 1.2, \quad x_{(2)} = 8.3, \quad x_{(3)} = 9.9, \quad x_{(4)} = 10.9, \quad x_{(5)} = 12.5 \]

Pruebas de hipótesis para cuantiles

Prueba de cola izquierda

\[ H_1: \text{el cuantil } p \text{ de } F \text{ es menor a } x^*, \] o en símbolos, \(H_1: p^* < p\).

Prueba de cola derecha

\[ H_1: \text{el cuantil } p \text{ de } F \text{ es mayor a } x^*, \] o en símbolos, \(H_1: p_* > p\).

Prueba de dos colas

Ejemplo: pruebas de hipótesis

Se tiene interés en estudiar el procentaje de alumnos de excelencia en matemáticas en las escuelas de nivel medio superior de la Ciudad de México. Como referencia se toman los resultados de la prueba Enlace 2014. La base con los resultados se puede descargar de aquí. Para este ejemplo se utilizará el porcentaje de alumnos con nivel de desempeño Excelente en matemáticas.

El conjunto de datos tiene información de 423 escuelas de nivel medio superior. A continuación se muestran las primeras siete observaciones y un resumen del conjunto completo:

## [1] 6.0 3.2 5.4 3.4 3.4 3.7 3.4
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.95    5.50   12.66   17.35   98.10

Utilizar la información para realizar los siguientes contrastes

El los tres casos usar un tamaño \(\alpha \approx 0.1\).

Primera prueba

Las hipótesis son: \[ H_0: q_{0.25} \geq 1.5 \qquad \text{y} \qquad H_1: q_{0.25} < 1.5. \] Como la alternativa es de cola izquierda, el estadístico que se usa es \[ T_1 = \sum_{i=1}^{423} I\{X_i \leq 1.5\} \]

T1 <- sum(calif <= 1.5); T1
## [1] 119

\(T_1\) se compara con el cuantil \(0.1\) de la distribución \(Bin(423, 0.25)\). Utilizamos la siguiente línea de código para calcular este cuantil

qbinom(0.1, 423, 0.25)
## [1] 94

Como \(T1 = 119 \geq 94\), se concluye que no hay evidencia suficiente para rechazar que el primer cuartil de la distribución de los porcentajes es al menos 1.5%, con un tamaño de prueba (aproximado) \(\alpha = 0.1\) (el valor exacto es 0.1021668).

Segunda prueba

Las hipótesis son: \[ H_0: q_{0.5} = 5 \qquad \text{vs.} \qquad H_1: q_{0.5} \neq 5. \] Como la alternativa es de dos colas, se utilizan los dos estadísticos \[ T_1 = \sum_{i=1}^{423} I\{X_i \leq 5 \} \qquad \text{y} \qquad T_2 = \sum_{i=1}^{423}I\{X_i < 5\}. \]

T1 <- sum(calif <= 7.5); T1
## [1] 245
T2 <- sum(calif < 7.5); T2
## [1] 245

Como no hay observaciones iguales a 7.5%, \(T_1\) y \(T_2\) son iguales. Se divide el tamaño de la prueba \(\alpha = 0.1\) en \(\alpha_1 = 0.05\) y \(\alpha_2 = 0.05\) y entonces \(T_1\) se compara con el cuantil 0.05 y \(T_2\) con el cuantil 0.95, ambos de la distribución \(Bin(423, 0.5)\).

qbinom(0.05, 423, 0.5)
## [1] 195
qbinom(0.95, 423, 0.5)
## [1] 228

Como \(T_2 = 245 > 228\), aunque \(T_1 = 245 \geq 195\) se concluye rechazar \(H_0\). De lo anterior, se rechaza que la mediana de la distribución de porcentajes de alumnos de excelencia sea igual a 7.5% con un tamaño de prueba aproximado \(\alpha = 0.1\) (el tamaño exacto es 0.1089091).

Tercera prueba

Las hipótesis son: \[ H_0: q_{0.90} \leq 30 \qquad \text{vs.} \qquad H_1: q_{0.90} > 30. \] Como la alternativa es de cola derecha, se utiliza el estadístico \[ T_2 = \sum_{i=1}^{423} I\{X_i < 30 \} \]

T2 <- sum(calif < 30); T2
## [1] 363

\(T_2\) se compara con el cuantil 0.90 de la distribución \(Bin(423, 0.90)\):

qbinom(0.9, 423, 0.9)
## [1] 389

Como \(T_2 = 363 \leq 389\) se concluye no rechazar \(H_0\), esto es, no hay evidencia sufienciente para rechazar que el 90% de las escuelas tengan porcentajes de excelencia menores a 30%, con un tamaño de prueba (aproximado) \(\alpha = 0.1\) (el tamaño exacto es 0.073259).

Intervalos de confianza para cuantiles

Intervalos de confiaza para cuantiles

Ejemplo: intervalos de confianza

La mediana (el cuantil 0.50) de la distribución \(Exp(1)\) es \(\log(2)\). Comprobar la cobertura de los intervalos de confianza obtenidos a partir de los estadísticos de orden usando muestras de tamaño \(n = 25\) y \(m = 5,000\) repeticiones.

##       0       1       2       3       4       5       6       7       8 
## 0.00000 0.00000 0.00001 0.00008 0.00046 0.00204 0.00732 0.02164 0.05388 
##       9      10      11      12      13      14      15      16      17 
## 0.11476 0.21218 0.34502 0.50000 0.65498 0.78782 0.88524 0.94612 0.97836 
##      18      19      20      21      22      23      24      25 
## 0.99268 0.99796 0.99954 0.99992 0.99999 1.00000 1.00000 1.00000
cobertura <- c()
for(j in 1:5000)
{
  muestra <- rexp(25)
  xl <- sort(muestra)[8]
  xu <- sort(muestra)[18]
  cobertura[j] <- (xl <= log(2)) & (log(2) <= xu) + 0
}
pct_cobertura <- 100 * sum(cobertura) / 5000
pct_cobertura
## [1] 96.08